row_conv

    api_attr

    声明式编程模式(静态图)

    该接口为行卷积(Row-convolution operator)或称之为超前卷积(lookahead convolution),最早介绍于DeepSpeech2论文中,论文链接:

    双向的RNN在深度语音模型中很有用,它通过对整个序列执行正向和反向传递来学习序列的表示。然而,与单向RNNs不同的是,在线部署和低延迟设置中,双向RNNs具有难度。超前卷积将来自未来子序列的信息以一种高效的方式进行计算,以改进单向递归神经网络。 row convolution operator 与一维序列卷积不同,计算方法如下:

    给定输入序列长度为

    的输入序列

    row_conv - 图1

    和输入维度

    ,以及一个大小为

    的滤波器

    row_conv - 图2

    ,输出序列卷积为:

    公式中:

    • row_conv - 图3

      : 第i行输出变量形为[1, D].

    • row_conv - 图4

      : 第(j-i)行参数,其形状为[1,D]。

    详细请参考 。

    参数:

    • input (Tensor) — 支持输入为LodTensor和Tensor,输入类型可以是[float32, float64],它支持可变时间长度的输入序列。当输入input为LodTensor时,其内部张量是一个具有形状(T x N)的矩阵,其中T是这个mini batch中的总的timestep,N是输入数据维数。当输入input为Tensor时,其形状为(B x T x N)的三维矩阵,B为mini batch大小,T为每个batch输入中的最大timestep,N是输入数据维数。当输入input为LoDTensor,形状为[9, N],LoD信息为[2, 3, 4],等价于输入input为形状是[3, 4, N]的Tensor。

    • param_attr (ParamAttr) — 参数的属性,包括名称、初始化器等。

    • act (str) — 非线性激活函数。

    代码示例