首页 » 博客 » Google 如何结合语义语境分析和其他信号

Google 如何结合语义语境分析和其他信号

 

用外行人的话来说,潜在狄利克雷分配 (LDA) 就是“主题建模”。用搜索极客的话来说,LDA 的公式如下:(你消化了吗?别担心;莫泽尔一边呻吟一边大笑。另外:科学家亨德里克森在午餐后发表了这次演讲!)

LDA 简化– 这是 Ben 解释主题建模的方式:

 

(好吧,我曾经为自己在逻辑 电话号码收集 和组合学(离散数学/集合论)中获得了 A 而感到自豪。然而,与这个公式相比,那门计算机科学课现在感觉就像是基础数学。)

当兰德·菲什金(Rand Fishkin)和本一起上台,托德·弗赖森(Todd Freisen)主持并在问答环节进行解读时,一切都变得清晰起来。 (巴西的曼努埃拉·桑切斯(Manuela Sanches)坐在我旁边,她说本的“演讲需要字幕!”)

从我对希腊文的解读来看

LDA 的目标是理解 来定义主题 如何获得更多参与度? 5 个成功品牌 概念。Google 正是通过 LDA 分析页面上的单词来确定单词所属的“集合”,也就是搜索查询与其数据库中页面的相关程度

例如:Google 如何为页面上的“橙色”一词分配相关性?他们会确定橙色是与水果种类相关,还是与页面上下文设置的颜色相关。

LDA定义:

“潜在狄利克雷分配”(Blei 等人,2003)

是一种强大的学习算法,可以自动将 WhatsApp 数据库印度 单词联合聚类到“主题”中,并将文档联合聚类到主题的混合中。它已成功应用于模拟科学领域随时间的变化(Griffiths 和 Steyver,2004;Hall 等人,2008)。

主题模型大致是一种分层贝叶斯模型,它将每个文档与“主题”的概率分布相关联,而这些概率分布又是单词的分布。

贝叶斯——啊,我认识这个术语!贝叶斯垃圾邮件过滤是一种检测垃圾邮件的方法。它利用数据库并学习单词的含义。当我们将电子邮件标记为垃圾邮件时,它就被我们“训练”了。

 

滚动至顶部