分数在主题建模中表示什么

What does the score indicate in topic modelling

我按照本教程将 gimsm 用于 LSA https://www.datacamp.com/community/tutorials/discovering-hidden-topics-python

我在 运行 之后得到了以下输出作为文本列表


[(1, '-0.708*"London" + 0.296*"like" + 0.294*"go" + 0.287*"dislike" + 0.268*"great" + 0.200*"romantic" + 0.174*"stress" + 0.099*"lovely" + 0.082*"good" + -0.075*"Tower" + 0.072*"see" + 0.063*"nice" + 0.061*"amazing" + -0.053*"Palace" + 0.053*"walk" + -0.050*"Eye" + 0.046*"eat" + -0.042*"Bridge" + 0.041*"Garden" + 0.040*"Covent" + -0.040*"old" + -0.039*"visit" + 0.039*"really" + 0.035*"spend" + 0.034*"watch" + 0.034*"get" + -0.032*"Buckingham" + 0.032*"Weather" + -0.032*"Museum" + -0.032*"Westminster"')]

-0.708 London 表示什么?

这些是对您的主题贡献最大的词,无论是正面的还是负面的。你的话题的特点之一似乎是,它与伦敦没有任何关系。您可以看到其他 "London-related" 个词对您的主题也有负面影响:Westminster、Tower 和 Eye 对这个主题也有负面影响。

因此,根据您的模型,如果文本中缺少“伦敦”一词,则该文本很可能与该主题有关。