网页信噪比是指一个网页上的文字内容与所有HTML代码的比率,这同样是我们所必须了解的SEO基础知识。从搜索引擎的原理来讲,其抓取系统首先是将整个网页下载下来,然后将里面的文字内容提取出来,经过分析去除HTML格式,清除噪音,然后分词,最后存入索引库。在这个过程中,搜索引擎也会经过去噪的过程,我们很明显地就能知道,网页信噪比越高,搜索引擎蜘蛛抓取的效率越高,搜索蜘蛛每天要处理的文档非常之多,如何能够快速的提取网页的主题信息是个重要任务。
其实信噪比的概念来源于声学,原本是指输出的声讯信号与产生的噪音的比率,应用到网页上实际上不单单是指所有本文与代码的比率,还包括了当前页面文本内容中的有用信息与无用信息的比率。何谓有用信息,就比如我这篇文章的主题是网页信噪比,整篇文章有1000个字,而当前页面所有的文字内容有2000 个文字,而其他文字是与信噪比无关的,那这些无关的信息就是噪音了。所以,提高网页信噪比分为两个方面:包括优化代码和优化内容。
...