Google发布新(xīn)算法研究
Google Research近发表了一篇研究性论文(wén),这篇论文(wén)详细介绍了一种新(xīn)的搜索结果排序算法。
如果将来这一算法开始实施,将会对传统排名(míng)决定因素的影响造成很(hěn)大改变。短期内,这项研究让我们进一步了解了谷歌所提的提高内容相关性的算法更新(xīn)。
新(xīn)算法简介
Google Research在第六届國(guó)际學(xué)术会议上以通过Twitter发布了这一新(xīn)算法研究论文(wén)。
论文(wén)题目是:正确提出问题:强化學(xué)习 重塑问题【Ask The Right Questions: Active Question Reformulation with Reinforcement Learning】
这篇论文(wén)讨论了一种将查询问题重塑后再提交给搜索引擎的方法。Google其实已经在实施了查询问题的重塑和提炼,这是方法中(zhōng)的一种。
这一算法的创新(xīn)在于这是一强化學(xué)习的机器學(xué)习算法,而且这一算法并不了解排名(míng)系统如何工(gōng)作(zuò)。他(tā)是通过一个黑盒子提出问题并學(xué)习。这一算法通过一个學(xué)习系统重塑用(yòng)户查询,向搜索引擎提出诸多(duō)相关问题,然后在诸多(duō)答(dá)案中(zhōng)选择合适的答(dá)案。
该算法如何工(gōng)作(zuò)
如下是该研究论文(wén)的一个截图,它总结了这个机器學(xué)习算法的工(gōng)作(zuò)原理(lǐ):
用(yòng)户提出问题,然后该机器學(xué)习算法(也就是图中(zhōng)所示:Agent)将这一问题重新(xīn)表述為(wèi)多(duō)个问题并提交给排序算法。排序算法给出结果集,机器學(xué)习算法在众多(duō)结果中(zhōng)选择佳答(dá)案呈现给用(yòng)户。
该研究论文(wén)指出:面对复杂的信息需求,人类通过重塑问题,多(duō)重研究,整合答(dá)案来规避不确定性。受到这一启发,我们通过Agent(代理(lǐ))来执行这一过程,Agent介于用(yòng)户和后端QA系统之间,也就是图中(zhōng)所示:Environment(知识库)。
我们把这一代理(lǐ)称之為(wèi)AQA,它是一个积极回答(dá)问题的策略。AQA旨在通过向知识库发送重塑过的问题以大化获取正确答(dá)案的几率。
Agent通过提出诸多(duō)相关问题和整合诸多(duō)答(dá)案来寻找佳答(dá)案。Environment(知识库)的内部对Agent来说是不可(kě)用(yòng)的,所以它必须使用(yòng)黑盒来探测优问题字符串。
為(wèi)何该算法如此重要
该算法让我们了解了机器學(xué)习方法的一种,称之為(wèi)强化學(xué)习。强化學(xué)习算法已经被用(yòng)于机器學(xué)习如何玩围棋,玩電(diàn)玩,比如Doom(毁灭战士)。
SEO对这一特别算法很(hěn)感兴趣,因為(wèi)它可(kě)以在用(yòng)户和规则排序算法之间插入一个新(xīn)的算法,并终做出决策。因此,不同的是排序算法是决定搜索引擎结果页(yè)显示哪些内容,这一机器學(xué)习算法是决策佳答(dá)案的。
这种排名(míng)是和SEO论坛传统上认為(wèi)的网页(yè)排名(míng)是不同的。传统的理(lǐ)解是,决定搜索结果中(zhōng)排名(míng)1到10的因素有(yǒu)链接,网页(yè)标题,锚文(wén)本等等。
链接对于排名(míng)是一个很(hěn)重要的因素。但是,通过这种算法,链接是有(yǒu)助于网页(yè)的排名(míng),但不再是决定性因素。
这一新(xīn)算法的工(gōng)作(zuò)是决定哪些页(yè)面适合回答(dá)某个问题。
你是否见过一个链接少的网页(yè)排名(míng)高于那些链接多(duō)的网页(yè)?这很(hěn)可(kě)能(néng)是在用(yòng)户和排序算法之间有(yǒu)一个决定哪个网页(yè)提供佳答(dá)案的算法。
排名(míng)因素该如何处理(lǐ)?
排名(míng)算法不再是网站排名(míng)前十的决定性因素,这也是排名(míng)因素研究有(yǒu)数百万结果却并不准确的原因。排名(míng)因素研究认為(wèi)排名(míng)因素对搜索结果前十的网站负有(yǒu)责任。
但排名(míng)因素并不是总能(néng)决定排名(míng)前十的因素。因此排名(míng)因素研究也并不完全可(kě)靠。
虽然这一特定算法目前还没有(yǒu)被使用(yòng),但是已经有(yǒu)其他(tā)的算法通过设置排名(míng)算法的结果来执行类似的功能(néng),并使用(yòng)不是排名(míng)因素的因素来重新(xīn)排序SERPs(搜索结果页(yè))。
重新(xīn)排列搜索结果并不是一个新(xīn)想法。微软在2005年发布过一篇學(xué)术论文(wén),名(míng)為(wèi):【Improving Web Search Results Using Affinity Graph】(利用(yòng)关系图表来改善搜索结果)。这一算法的目的在于為(wèi)用(yòng)户模糊搜索查询提供更准确的答(dá)案。
这一算法对SEO有(yǒu)何影响?
这一算法可(kě)能(néng)会影响SEO的未来,搜索结果会更加强调满足用(yòng)户的搜索意图。这一改进又(yòu)称之為(wèi)提高内容相关性。因此,当Google宣布内容相关性的算法更新(xīn)时,通过研究竞争排名(míng)胜出的网站就会知道一个网站丢失排名(míng)的佳答(dá)案。对于这类更新(xīn),如果只是按照传统简单的研究丢失网页(yè)排名(míng)的网站的内容,是很(hěn)难找到排名(míng)改变的原因的。