Theano tensor 模块：基础

张量是向量在数学上的一种推广，具体内容可以参考维基百科： https://en.wikipedia.org/wiki/Tensor

在 Theano 中有一个专门处理张量变量的模块：theano.tensor （以下简称 T）。

In [1]:

import theano
import theano.tensor as T

Using gpu device 1: Tesla C2075 (CNMeM is disabled)

构造符号变量

可以用 tensor 模块创造符号变量：

In [2]:

x = T.fmatrix()

print type(x)
print type(T.fmatrix)

<class 'theano.tensor.var.TensorVariable'>
<class 'theano.tensor.type.TensorType'>

从上面可以看到，T.fmatrix() 创造出的是一个 TensorVariable 类，而 T.fmatrix 本身是一个 TensorType 类。

除了使用 fmatrix，我们还可以通过指定 matrix 的 dtype 参数来定义，例如下面的三种方式都是产生一个 int32 型的标量：

In [3]:

x = T.scalar('myvar', dtype='int32')
x = T.iscalar('myvar')
x = T.TensorType(dtype='int32', broadcastable=())('myvar')

常用的构造函数有：

T.scalar(name=None, dtype=config.floatX)
T.vector(name=None, dtype=config.floatX)
T.row(name=None, dtype=config.floatX)
T.col(name=None, dtype=config.floatX)
T.matrix(name=None, dtype=config.floatX)
T.tensor3(name=None, dtype=config.floatX)
T.tensor4(name=None, dtype=config.floatX)

还可以使用一个构造多个变量：

T.scalars
T.vectors
T.rows
T.cols
T.matrices

除此之外，我们还可以用 TensorType 类自定义的符号变量：

T.TensorType(dtype, broadcastable, name=None)

dtype: str：对应于 numpy 中的类型
broadcastable: tuple, list, or array of boolean values：如果是 True 表示该维的维度只能为 1；长度表示符号变量的维度。

pattern	interpretation
[]	scalar
[True]	1D scalar (vector of length 1)
[True, True]	2D scalar (1x1 matrix)
[False]	vector
[False, False]	matrix
[False] * n	nD tensor
[True, False]	row (1xN matrix)
[False, True]	column (Mx1 matrix)
[False, True, False]	A Mx1xP tensor (a)
[True, False, False]	A 1xNxP tensor (b)
[False, False, False]	A MxNxP tensor (pattern of a + b)

产生一个五维的变量类型：

In [4]:

dtensor5 = T.TensorType('float64', (False,)*5)

x = dtensor5()

变量方法

.dim

维度：

In [5]:

print x.ndim

.type

类型：

In [6]:

print x.type

TensorType(float64, 5D)

.dtype

包含的变量类型：

In [7]:

print x.dtype

float64

.reshape

传入一个变量对 x 进行 reshape，通常需要指定 shape 的 ndim：

In [8]:

shape = T.ivector("shape")

y = x.reshape(shape, ndim=3)

y 是 x 的一个 view：

In [9]:

print x.ndim, y.ndim

5 3

.dimshuffle

dimshuffle 改变维度的顺序，返回原始变量的一个 view：

输入是一个包含 0,1,...,ndim-1 和任意数目的 'x' 的组合：

例如：

('x')：将标量变成 1 维数组
(0, 1)：与原始的 2 维数组相同
(1, 0)：交换 2 维数组的两个维度，形状从 N × M 变 M × N
('x', 0)：形状从 N 变成 1 × N
(0, 'x')：形状从 N 变成 N × 1
(2, 0, 1)：形状从 A × B × C 变成 C × A × B
(0, 'x', 1)：形状从 A × B 变成 A × 1 × B
(1, 'x', 0)：形状从 A × B 变成 B × 1 × A
(1,)：将第 0 维除去，除去的维度的大小必须为 1。形状从 1 × A 变成 A

In [10]:

z = y.dimshuffle(("x", 1, 2, 0))

print z
print z.ndim

DimShuffle{x,1,2,0}.0
4

.flatten

flatten(ndim=1) 返回原始变量的一个 view，将变量降为 ndim 维：

In [11]:

z = x.flatten(ndim=2)

print z.ndim

.ravel

与 flatten 一样。

.T

转置，注意，一维数组或者变量的转置是其本身，要想将行列向量互相转换，需要使用 reshape 或者 dimshuffle。

其他方法

In [12]:

print filter(lambda t: t.isalpha(), dir(x))

['T', 'all', 'any', 'arccos', 'arccosh', 'arcsin', 'arcsinh', 'arctan', 'arctanh', 'argmax', 'argmin', 'argsort', 'astype', 'broadcastable', 'ceil', 'choose', 'clip', 'clone', 'compress', 'conj', 'conjugate', 'copy', 'cos', 'cosh', 'cumprod', 'cumsum', 'diagonal', 'dimshuffle', 'dot', 'dtype', 'eval', 'exp', 'fill', 'flatten', 'floor', 'imag', 'index', 'log', 'max', 'mean', 'min', 'name', 'ndim', 'nonzero', 'norm', 'owner', 'prod', 'ptp', 'ravel', 'real', 'repeat', 'reshape', 'round', 'shape', 'sin', 'sinh', 'size', 'sort', 'sqrt', 'squeeze', 'std', 'sum', 'swapaxes', 'tag', 'take', 'tan', 'tanh', 'trace', 'transpose', 'trunc', 'type', 'var']

模块函数

为了与 numpy 兼容，tensor

T.shape

shape(x) 返回一个存储变量 x 形状的变量：

In [13]:

print T.shape(x)

Shape.0

T.shape_padleft, T.shape_padright

在最左边/右边加上 n 个大小为 1 的 1 个维度：

In [14]:

x = T.tensor3()

print T.shape_padleft(x)
print T.shape_padright(x)

DimShuffle{x,0,1,2}.0
DimShuffle{0,1,2,x}.0

T.shape_padaxis

在指定位置插入大小为 1 的 1 个维度：

In [15]:

print T.shape_padaxis(x, 1)
print T.shape_padaxis(x, 0)
print T.shape_padaxis(x, -1)

DimShuffle{0,x,1,2}.0
DimShuffle{x,0,1,2}.0
DimShuffle{0,1,2,x}.0

插入这些大小为 1 的维度，主要目的是 broadcast 化。

T.unbroadcast

可以使用 unbroadcast(x, *axes) 使得 x 的某些维度不可 broadcast。

T.tile

tile(x, reps) 按照规则重复 x

产生张量

T.zeros_like(x), T.ones_like(x)

产生一个与 x 形状相同的全 0 或全 1 变量

T.fill(a, b)

使用 b 的值去填充 a，b 是一个数值或者 theano scalar。

T.alloc(value, *shape)

返回指定形状的变量，并初始化为 value

T.eye(n, m=None, k=0, dtype=theano.config.floatX)

单位矩阵

T.basic.choose(a, choices)

a 是一个 index 数组变量，对应于 choices 中的位置。

降维

T.max(x), T.argmax(x), T.max_and_argmax(x)

最大值，最大值位置，最大值和最大值位置。

T.min(x), T.argmin(x)

最小值，最小值位置。

T.sum(x), T.prod(x), T.mean(x), T.var(x), T.std(x)

和，积，均值，方差，标准差

T.all(x), T.any(x)

我们一直在努力

apachecn/AiLearning