Copyright 2020 The TensorFlow Authors.
张量简介
张量是具有统一类型(称为 dtype
)的多维数组。您可以在 tf.dtypes.DType
中查看所有支持的 dtypes
。
如果您熟悉 NumPy{:.external},就会知道张量与 np.arrays
有一定的相似性。
就像 Python 数值和字符串一样,所有张量都是不可变的:永远无法更新张量的内容,只能创建新的张量。
基础知识
首先,创建一些基本张量。
下面是一个“标量”(或称“0 秩”张量)。标量包含单个值,但没有“轴”。
“向量”(或称“1 秩”张量)就像一个值列表。向量有 1 个轴:
“矩阵”(或称“2 秩”张量)有 2 个轴:
一个标量,形状:[] |
向量,形状:[3] |
矩阵,形状:[3, 2] |
---|---|---|
![]() |


张量的轴可能更多,下面是一个包含 3 个轴的张量:
对于包含 2 个以上的轴的张量,您可以通过多种方式加以呈现。
3 轴张量,形状:[3, 2, 5] |
|
---|---|
![]() |
![]() |

通过使用 np.array
或 tensor.numpy
方法,您可以将张量转换为 NumPy 数组:
张量通常包含浮点型和整型数据,但是还有许多其他数据类型,包括:
复杂的数值
字符串
tf.Tensor
基类要求张量是“矩形”,也就是说,每个轴上的每一个元素大小相同。但是,有可以处理不同形状的特殊类型张量:
不规则张量(请参阅下文中的 RaggedTensor)
稀疏张量(请参阅下文中的 SparseTensor)
您可以对张量执行基本数学运算,包括加法、逐元素乘法和矩阵乘法。
各种运算都可以使用张量。
注:通常,在 TensorFlow 函数需要 Tensor
作为输入的任何地方,该函数也将接受可使用 tf.convert_to_tensor
转换为 Tensor
的任何内容。请参见下面的示例。
形状简介
张量有形状。下面是几个相关术语:
形状:张量的每个轴的长度(元素数量)。
秩:张量轴数。标量的秩为 0,向量的秩为 1,矩阵的秩为 2。
轴或维度:张量的一个特殊维度。
大小:张量的总项数,即形状矢量元素的乘积
注:虽然您可能会看到“二维张量”之类的表述,但 2 秩张量通常并不是用来描述二维空间。
张量和 tf.TensorShape
对象提供了方便的属性来访问:
4 秩张量,形状:[3, 2, 4, 5] |
|
---|---|
![]() |
![]() |
但请注意,Tensor.ndim
和 Tensor.shape
特性不返回 Tensor
对象。如果您需要 Tensor
,请使用 tf.rank
或 tf.shape
函数。这种差异不易察觉,但在构建计算图时(稍后)可能非常重要。
虽然通常用索引来指代轴,但是您始终要记住每个轴的含义。轴一般按照从全局到局部的顺序进行排序:首先是批次轴,随后是空间维度,最后是每个位置的特征。这样,在内存中,特征向量就会位于连续的区域。
典型的轴顺序 |
---|
![]() |
索引编制
单轴索引编制
TensorFlow 遵循标准 Python 索引编制规则(类似于在 Python 中为列表或字符串编制索引{:.external})以及 NumPy 索引编制的基本规则。
索引从
0
开始负索引表示按倒序编制索引
冒号
:
用于切片:start:stop:step
使用标量编制索引会移除轴:
使用 :
切片编制索引会保留轴:
多轴索引编制
更高秩的张量通过传递多个索引来编制索引。
对于高秩张量的每个单独的轴,遵循与单轴情形完全相同的规则。
为每个索引传递一个整数,结果是一个标量。
您可以使用整数与切片的任意组合编制索引:
下面是为一个 3 轴张量的索引编制示例:
选择批次中每个示例的所有位置的最后一个特征 | |
---|---|
![]() |
![]() |
请参阅张量切片指南,了解如何应用索引编制以操作张量中的各个元素。
操作形状
改变张量的形状很有用。
通过重构可以改变张量的形状。tf.reshape
运算的速度很快,资源消耗很低,因为不需要复制底层数据。
数据在内存中的布局保持不变,同时使用请求的形状创建一个指向同一数据的新张量。TensorFlow 采用 C 样式的“行优先”内存访问顺序,即最右侧的索引值递增对应于内存中的单步位移。
如果您展平张量,则可以看到它在内存中的排列顺序。
一般来说,tf.reshape
唯一合理的用途是用于合并或拆分相邻轴(或添加/移除 1
)。
对于 3x2x5 张量,重构为 (3x2)x5 或 3x(2x5) 都合理,因为切片不会混淆:
一些正确的重构示例。 | ||
---|---|---|
![]() |
![]() |
![]() |
重构可以处理总元素个数相同的任何新形状,但是如果不遵从轴的顺序,则不会发挥任何作用。
利用 tf.reshape
无法实现轴的交换,要交换轴,您需要使用 tf.transpose
。
一些错误的重构示例。 | ||
---|---|---|
![]() |
![]() |
![]() |
您可能会遇到非完全指定的形状。要么是形状包含 None
(轴长度未知),要么是整个形状为 None
(张量的秩未知)。
除 tf.RaggedTensor 外,此类形状只会在 TensorFlow 的符号化计算图构建 API 环境中出现:
DTypes
详解
使用 Tensor.dtype
属性可以检查 tf.Tensor
的数据类型。
从 Python 对象创建 tf.Tensor
时,您可以选择指定数据类型。
如果不指定,TensorFlow 会选择一个可以表示您的数据的数据类型。TensorFlow 将 Python 整数转换为 tf.int32
,将 Python 浮点数转换为 tf.float32
。另外,当转换为数组时,TensorFlow 会采用与 NumPy 相同的规则。
数据类型可以相互转换。
广播
广播是从 NumPy 中的等效功能{:.external}借用的一个概念。简而言之,在一定条件下,对一组张量执行组合运算时,为了适应大张量,会对小张量进行“扩展”。
最简单和最常见的例子是尝试将张量与标量相乘或相加。在这种情况下会对标量进行广播,使其变成与其他参数相同的形状。
同样,可以扩展长度为 1 的轴,使其匹配其他参数。在同一个计算中可以同时扩展两个参数。
在本例中,一个 3x1 的矩阵与一个 1x4 进行逐元素乘法运算,从而产生一个 3x4 的矩阵。注意前导 1 是可选的:y 的形状是 [4]
。
广播相加:[3, 1] 乘以 [1, 4] 的结果是 [3,4] |
---|
![]() |
下面是不使用广播的同一运算:
在大多数情况下,广播的时间和空间效率更高,因为广播运算不会在内存中具体化扩展的张量。
使用 tf.broadcast_to
可以了解广播的运算方式。
与数学运算不同,broadcast_to
并不会节省内存。在这个示例中,您将具体化张量。
这可能会变得更复杂。Jake VanderPlas 的 Python 数据科学手册一书中的这一节{:.external}介绍了更多广播技巧(同样使用 NumPy)。
tf.convert_to_tensor
大部分运算(如 tf.matmul
和 tf.reshape
)会使用 tf.Tensor
类的参数。不过,在上面的示例中,您会发现形状类似于张量的 Python 对象也可以接受。
大部分(但并非全部)运算会在非张量参数上调用 convert_to_tensor
。我们提供了一个转换注册表,大多数对象类(如 NumPy 的 ndarray
、TensorShape
、Python 列表和 tf.Variable
)都可以自动转换。
请参阅 tf.register_tensor_conversion_function
以了解详情。如果您有自己的类型,则可能希望自动转换为张量。
不规则张量
如果张量的某个轴上的元素个数可变,则称为“不规则”张量。对于不规则数据,请使用 tf.ragged.RaggedTensor
。
例如,下面的示例无法用规则张量表示:
“tf.RaggedTensor”,形状:[4, None] |
---|
![]() |
应使用 tf.ragged.constant
来创建 tf.RaggedTensor
:
tf.RaggedTensor
的形状将包含一些具有未知长度的轴:
字符串张量
tf.string
是一种 dtype
,也就是说,在张量中,您可以用字符串(可变长度字节数组)来表示数据。
字符串是原子类型,无法像 Python 字符串一样编制索引。字符串的长度并不是张量的一个轴。有关操作字符串的函数,请参阅 tf.strings
。
下面是一个标量字符串张量:
下面是一个字符串向量:
字符串向量,形状:[3,] |
---|
![]() |
在上面的打印输出中,b
前缀表示 tf.string
dtype 不是 Unicode 字符串,而是字节字符串。有关在 TensorFlow 中如何使用 Unicode 文本的详细信息,请参阅 Unicode 教程。
如果传递 Unicode 字符,则会使用 utf-8 编码。
在 tf.strings
中可以找到用于操作字符串的一些基本函数,包括 tf.strings.split
。
三个字符串分割,形状:[3, None] |
---|
![]() |
And tf.strings.to_number
:
虽然不能使用 tf.cast
将字符串张量转换为数值,但是可以先将其转换为字节,然后转换为数值。
tf.string
dtype 可用于 TensorFlow 中的所有原始字节数据。tf.io
模块包含在数据与字节类型之间进行相互转换的函数,包括解码图像和解析 csv 的函数。
稀疏张量
在某些情况下,数据很稀疏,例如在一个非常宽的嵌入向量空间中。为了高效存储稀疏数据,TensorFlow 支持 tf.sparse.SparseTensor
和相关运算。
“tf.SparseTensor”,形状:[3, 4] |
---|
![]() |