在主题模型中,“主题”通常被定义为一系列语义相关的词。Latent Dirichlet Allocation(LDA)是其中最具代表性的模型。下表中给出了LDA的部分训练结果。其中,每列词是一个主题,每个词后的数值表示该词在主题中的重要程度。

    主题模型在工业界的应用范式可以分为两类:语义表示和语义匹配。我们选取一些成功的应用案例加以介绍。