现在的位置: 首页 老蛇阅读 >正文

谷歌搜索的透明度以及我们算不上什么秘密的“准则”

最近,欧盟委员会就一系列竞争申诉开始展开初步调查。部分申诉指责谷歌在确定搜索结果排名的方式和原因等问题上不够透明。这一说法让我难以接受。关于如何与网站发布者进行交流,谷歌已经设定过标准。下面让我向您介绍,谷歌如何对搜索结果进行排名及其根据。

关于谷歌“打分”的讨论主要集中在网页排名上。其实,所谓的“秘密准则”其实根本算不上什么秘密。这篇论文对其有详细的介绍。这篇早期的论文不仅介绍了网页排名的规则,同时还提到了谷歌排名的其他标准,其中包括锚文本、词语在文档内的位置、搜索关键词的相关顿、所用字体的字号和类型、页面原始HTML代码以及词语大小写状态等。在过去几年中,谷歌陆续发布了数百篇研究论文。这些论文展现了许多与谷歌运营有关的“秘诀”,以及谷歌所使用的文档基础架构。其中的一些论文不仅促进了开源项目的发展,同时还帮助了很多公司的成长。

学术论文只是其中一个方面,谷歌同时还通过其他方法介绍其经营方式。1999年,谢尔盖.布林参加了首届“网站站长搜索引擎战略大会”。2001年,谷歌成为首批加入“网站站长的世界”这一网络发布商在线论坛的搜索引擎之一。谷歌的的一个代表在论坛上发言2800多次,而另一位代表 AdWords顾问则发言约5000次。

随着网络的发展,谷歌为实现透明化并促进信息交流所做出的努力也随之并进。我们于2004年5月开始发布博客,迄今为止我们已经在官方博客上发布了数以千计的博文。谷歌现有70多个官方博客,其中包括官方网站站长博客,这是一个专门帮助网站站长了解谷歌运作方式并帮助他们在我们的搜索结果中获得期望排名的博客。相比其他任何一个大公司,谷歌发布了更多的博文。同时,我们还使用几十种不同语言,在我们的网站上提供大量公共文档,向发布者提供建议。

作为谷歌“反垃圾网站”团队的主管(我们团队致力于阻止各种违反了谷歌的“网站站长指南”里公开、明确规定的垃圾网站行为),经常有人问我谷歌是如何运作的。这也是我2005年开始撰写个人博客的原因。迄今,我已经发表了数百篇关于谷歌的博文。我的博文话题广泛,从常见的网站错误到博客新手建议。我还有幸在30多个搜索引擎会议上为网站站长做演讲,并对一些公共网站做评论和解析。事实上,这周我还将与10多个谷歌同事一起参加另一个搜索引擎会议,解答相关疑问。

我们实验了各种方式,以帮助网站站长了解谷歌搜索排名的运作。我们举行了多次网站站长现场谈话的在线直播,吸引了数百名参与者实时参加。此外,我们还尝试过发布Twitter消息和播客。而我还想介绍一种我最喜欢的方式,通过它,我们开诚公布地向网络发布商提供建议:去年,我们收集了许多来自公众的问题,并在网站站长视频频道中发布了数百段视频答复。这些视频的播放次数超过150万次!我们还通过在线博客回答公众关于谷歌业务运作的问题。

这样的例子不胜枚举。谷歌还与其他搜索引擎合作,探讨如何让网站站长的工作变得更为轻松。由此产生的一系列行业标准有:指定首选的网站地址url格式以及网站地图,此举将使网站站长能够轻松地告知搜索引擎关于其网页的信息。谷歌还推出了一个网站站长论坛,谷歌员工和一些经验丰富的“超级用户”经常会登陆这一论坛,解答关于某些特定站点的问题。我们还推出了人工服务的“虚拟网站诊所”,为从旧金山到俄罗斯、从印度到西班牙语系的各地用户提供一对一的回复和建议。我们甚至还确认了谷歌算法中并不使用的排名符号,如关键词元标记,因为这样能帮助网站站长省去一些无用功,并帮他们避免不必要的官司纠纷。

令人沮丧的是,即便是谷歌所有的2万名员工全天候回答网站发布商的问题,我们仍然无法解答所有网站站长的问题。原因何在?因为互联网上有超过1.92亿个注册域名。这也是我们推出谷歌网站站长工具的原因,谷歌网站站长工具是一个一站式站点,能提供可扩展的自助式服务信息,网站站长也可通过该工具向我们提供数据。要全面介绍我们向网站站长推出的这些功能强大的免费工具,恐怕需要再写一篇完整的博文,因此在这里我仅列出其中的一些功能:

 

  • 网站站长能够在重复元标记或标题标签缺失等问题上获得建议。

  • 那些我们认为违反了谷歌网站站长指南、并在我们的索引中遭受了谷歌所采取的相应措施的网站的站长可申请复议。

  • 遭受黑客攻击的网站站长可以获得攻击其网站的恶意软件的详细信息。在移除受攻击内容之后,他们可以从网站上取回网页,Googlebot将确认恶意内容已被完全清除。

  • 网站站长可以找出谷歌在抓取其网站时遇到的错误。


最近,一位谷歌员工发表博文,介绍了如何通过这些免费的公共工具来诊断其超过宽带上限的网站空间(webhost) 的问题。数百万网站站长也采取了类似的办法,利用谷歌的免费工具获取与其网站相关的有用信息。

谷歌致力于创建一种尽可能公开的经营方式,甚至帮助用户将数据从谷歌产品中导出。同时,我们并不认为企业有某些特定的商业秘密是不合理的,尤其当我们的保密是为了避免网站垃圾制造者和黑客利用我们的系统。如果那些试图篡改谷歌搜索排名的人了解到了谷歌排名运作的所有细节,那么要将我们的搜索结果“篡改”成毫无关联的内容简直就轻松多了,比如说改成色情内容和恶意站点,而最终蒙受损失的将会是用户。

最后我想说的是,随便批评谷歌的“秘诀”不是什么难事,但这并不是事实。多年来,谷歌一直致力于以一种开放的方式开展业务,它向发布商提供关于谷歌排名规则的信息,并努力解答无论是发布商还是用户的各种问题。如果这就是人们对“秘密”的定义的话,那么,谷歌的秘密无疑是在搜索的世界中保守得最糟糕的秘密。
接下去一段时间,郑晖将会重点研究google的动态,也会把上面的文章转载下来,和大家一起分享。。。