文本匹配

    同样使用LSTM网络,把每个句子抽象成一个向量表示,通过计算这两个向量之间的相似度,就可以快速完成文本相似度计算任务。在实际场景里,我们也通常使用LSTM网络的最后一步hidden结果,将一个句子抽象成一个向量,然后通过向量点积,或者cosine相似度的方式,去衡量两个句子的相似度。

    图9:文本相似度计算

    一般情况下,在训练阶段有point-wise和pair-wise两个常见的训练模式(针对搜索引擎任务,还有一类list-wise的方法,这里不做探讨)。

    if 文本匹配 - 图3 else

    这个损失函数要求对于每个正样本m(A,B)的相似度值至少高于负样本m(A,C)一个阈值

    文本匹配 - 图5