Decoder

    Decoder是dynamic_decode中使用的任何decoder实例的基类。它提供了为每一个时间步生成输出的接口,可用于生成序列。

    Decoder提供的主要抽象为:

    1. (initial_input, initial_state, finished) = initialize(inits), 为第一个解码步生成输入和状态,并给出指示batch中的每个序列是否结束的初始标识。

    2. (output, next_state, next_input, finished) = step(time, input, state), 将输入和状态转换为输出和新的状态,为下一个解码步生成输入,并给出指示batch中的每个序列是否结束的标识。

    3. (final_outputs, final_state) = finalize(outputs, final_state, sequence_lengths), 修改输出(所有时间步输出的堆叠)和最后的状态以做特殊用途。若无需修改堆叠得到的输出和来自最后一个时间步的状态,则无需实现。

    与RNNCell相比,Decoder更为通用,因为返回的 next_inputfinished 使它可以自行决定输入以及结束时机。

    initialize ( inits )

    在解码迭代之前调用一次。

    参数:

    • inits - 调用方提供的参数。

    返回类型:tuple

    ( time, inputs, states, \*kwargs* )

    在解码的每个时间步中被调用的接口

    参数:

    • time (Variable) - 调用者提供的形状为[1]的tensor,表示当前解码的时间步长。其数据类型为int64。。

    • states (Variable) - 单个tensor变量或tensor变量组成的嵌套结构。在第一个解码时间步时与 initialize() 返回的 initial_states 相同,其他时间步与由 step() 返回的 beam_search_state 相同。

    • kwargs - 附加的关键字参数,由调用者提供。

    返回:一个元组 (outputs, next_states, next_inputs, finished)next_states 和 都是单个tensor变量或tensor变量组成的嵌套结构,且结构、形状和数据类型均分别与输入参数中的 statesinputs 相同。 outputs 是单个tensor变量或tensor变量组成的嵌套结构。 finished 是一个bool类型的tensor变量。

    finalize ( self, outputs, final_states, sequence_lengths )

    如果提供了实现,将在整个解码迭代结束后被执行一次。

    参数:

    • final_states (Variable) - 单个tensor变量或tensor变量组成的嵌套结构。 它是 decoder.step 在最后一个解码步返回的 next_states, 因此具有与任何时间步的状态相同的结构,形状和数据类型。

    • kwargs - 命名关键字参数,由提供调用者。

    返回:一个元组 (final_outputs, final_states)final_outputsfinal_states 都是单个tensor变量或tensor变量组成的嵌套结构。