FLASH优化可以从以下三个方面来考虑:
1、做一个辅助HTML版本: 保留原有FLASH版本的同时,还可以设计一个HTML格式的版本,这样既可以保持动态美观效果,也可以让搜索引擎通过HTML版本的网页来发现网站。
2、将Flash内嵌HTML文件: 还可以通过改变网页结构进行弥补,即不要将整个网页都设计成Flash动画,而是将Flash内容嵌入到HTML文件中,这样对于用户浏览并不会削弱视觉效果,搜索引擎也可以从HTML代码中发现一些必要的信息,尤其是进入内容页面的链接。 即使首页全部动用了FLASH,也应该将进入内页的关键性按钮/链接置于FLASH文件之外,以独立纯文本链接的方式呈现。上文案例将"中文版"链接置于FLASH文件中,使得蜘蛛程序一无所获,无法抓取到内页信息。
3、付费登录搜索引擎: 如果FLASH网站错过了被免费的技术型搜索引擎自动检索的机会,或者搜索结果排名效果不太理想,可以通过付费登录或做搜索引擎关键词广告,同样被用户搜索到。
总体上,商业网站应尽量少用FLASH,站点间进行广告交换时也要避免采用FLASH广告为上策。
表格使用
表格是网页最重要的排版方式。如果某个网页采用了大段的长篇文本,除了可以将一页文本分成多面,还可以考虑将文本置入不同表格中,这样不仅管理方便,也使得该页加载时每个表格内容依次加载,这样访问者就可以一边看已下载内容一边等待剩余部分加载,而不是等待很久之后才一齐加载出来。
表格之内套嵌太多表格也不利于页面加载,因浏览器是先加载完大表格之后再加载内嵌的小表格,因此内嵌表格会最终降低整页加载速度。
网页减肥
代码设置不妥不仅延长网页加载时间,也严重影响蜘蛛程序对网页内容的抓取。通过对网页代码进行清减(俗称"网页减肥"),去掉臃肿杂乱的代码,减小网页文件大小,能够加快网页加载速度,让蜘蛛快速索引到重要内容。正常情况下一个页面的文件大小在15K左右,最好不要超过50K。网页减肥重点涉及以下几个要点:
CSS样式
网页制作应通过CSS(层叠样式表单)来统一定制字体风格,以使代码标准化,避免大量的字体和格式化标签如< h1 >< /h1 >、< font size=×× color=×× >< /font >充斥页面。通过css可以控制任何HTML标签的风格。例如<td>, <p>, <body>, <table>, <tr>, <th>等。只要在HTML的<head>区内的<style type="text/css">和</style>之间指定对应标签的风格如字体,颜色,大小即可,例如:
<style type="text/css">
<!--
h2 { font-family: "宋体"; font-size: 12pt; color: #333366; background-color: #FFCCCC; font-weight: bold }
h1 { font-family: "Arial"; font-size: 12pt; color: #993300 } -->
</style>
仅通过以上设置,就把文字的字体、字号、颜色、背景色等统一起来,不用对每段文字单独进行格式定义,从而减少大量重复性标签。注意把所有css文件单独存放在命名为css的外部文件中。通过设置CSS样式,也可以提升导航文本的美观度,达到与图片导航同样优美观的效果,这点尤其提醒网页设计师注意,没有必要将导航条用图片呈现。
JavaScript:
正常情况下,网页尽量以<HTML>作为代码的开始端。但采用JavaScript技术的网页往往在页面一开始就堆积大量JAVA代码,以至META及关键字迟迟不能出现,被推至页面底部,对搜索引擎很不友好。有两种方法可以使之得以改善:
1、将脚本移至页面底部
大部分的JAVA代码都可以移到页面结束标签之上,而不影响网站功能。这样就能一开始突出关键词,并加快页面加载时间。
2、将JAVA脚本置入一个.js扩展名的文件。
包含你的JavaScript的.js文件通常在网站访问者的浏览器中被缓存下来,使得下次访问速度加快,也使得网站修改和维护起来更加方便。例:一段JAVA代码正常情况下显示如下:
<script language=JavaScript>
<!-- 此处是你的代码,将它们拷贝到一个.js文件 //-->
</script>
忽略开始及结束标签,将中间的代码单独保存为扩展名为.js的文件,如文件名为"mycode.js"的一个文件,然后将此文件上传到服务器上与该页同样的目录下。最后将上文列举的完整的JavaScript置换为简单的一行:
<script language=JavaScript src=mycode.js></script>
这样,一个"mycode.js"文件就将大段冗长复杂的JAVA代码置换了。
工具推荐:
网页减肥工具:http://202.99.237.33/softdown/softdoc/net_opt.htm 去除网页中多余代码,减小网页
第四部分:SEO指导下的技术支持
对搜索引擎最友好(Search Engine Friendly)的网页是静态网页,但大部分内容丰富或互动型网站都不可避免采用到相关技术语言来实现内容管理和交互功能。SEO思想指导下的技术支持,主要是对特定代码的优化和对动态网页进行静态处理的措施。
Title标签和Meta标签
以.html或.htm为扩展名的HTML文档称为静态网页。Meta称为元标志,用于网页的<head>与</head>中。Meta 标签的用处很多,目前几乎所有的搜索引擎机器人都通过自动查找Meta值来给网页分类,是籍此判断网页内容的基础。其中最重要的是description(网站描述)和keywords(网站关键词)。另外一个基本的属性是Title标签,提示搜索引擎关于本页的主题。Meta和Title的形式在html语言中体现为:
<head>
<title>title标题</title>
<meta name="keywords" content="网页描述">
<meta name="description" content="关键词">
......
</head>
尽管Meta本身不足以解决排名问题,但对Meta标签的书写仍然是搜索引擎优化的基础工作。清晰准确的Meta文字与正文内容的关键词相呼应,是排名加分的重要条件之一。
标题(Title):
网页优化可以说是从Title开始的。在搜索结果中,每个抓取内容的第一行显示的文字就是该页的Title,同样在浏览器中打开一个页面,地址栏上方显示的也是该页的Title。因此,Title可谓一个页面的核心。对Title的书写要注意以下问题:
1、title简短精炼,高度概括,含有关键词,而不是只有一个公司名。但关键词不宜过多,不要超过3个词组。企业网站的title通常以公司名+关键词为内容
2、前几个词对搜索引擎最重要,因此关键词位置尽量靠前。
3、最好将title组织成符合语法结构和阅读习惯的短句或短语,避免无意义的词组罗列式title
关键词(Keywords):
Keywords提示搜索引擎:本网站内容围绕这些词汇展开。因此keywords书写的关键是每个词都能在内容中找到相应的匹配才有利于排名。Meta中的关键词书写技巧见前文的"关键词策略"。
描述(Description):
描述部分用简短的句子告诉搜索引擎和访问者关于本网页的主要内容。用该网站的核心关键词搜索后得到的搜索结果中,描述往往显示为标题后的几行描述文字。Description一般被认为重要性在title和keywords之后。描述的书写要注意以下问题:
1、描述中出现关键词,与正文内容相关
2、同样遵循简短原则,字符数含空格在内不要超过200个字符
3、补充在title和keywords中未能充分表述的说明
其它Meta标签:
为了限制搜索引擎对内容的抓取,可以采用以下几个Robots Meta标签:
<meta name="Robots" content="all|none|index|noindex|follow|nofollow">
其中:
all:文件将被检索,且页面上的链接可以被查询;
none:文件将不被检索,且页面上的链接不可以被查询;
index:文件将被检索;
follow:页面上的链接可以被查询;
noindex:文件将不被检索,但页面上的链接可以被查询;
nofollow:文件将不被检索,页面上的链接可以被查询。
但并不是所有的搜索引擎都支持meta中的robots标签,但是所有搜索引擎都支持一个功能更强的robots.txt的文本文件来达到上述功能(关于robots.txt文件应用的介绍,E书专家平文胜曾专门撰文详细解说"robots.txt和Robots META标签")。其它常用meta标签还有:
<META name author> 网站作者
<META name classification> 网站所属目录类别
<META name copyright> 版权声明
<META name generator> 网站用什么软件做的 ……
首页、重要的内页的title和meta标签最好分别书写,针对栏目主题体现不同的内容。
动态网页优化
动态网站是指网站内容的更新和维护是通过一个带有数据库后台的软件,即内容管理系统(CMS)完成。一般采用ASP,PHP,Cold Fusion,CGI等程序动态生成页面。动态页面在网络空间中实际并不存在,它们的大部分内容通常来自与网站相连的数据库,只有接到用户的请求,在变量区中输入一个值以后才会生成。动态网页扩展名显示为.asp、.php、cfm或.cgi,而不是静态网页的.html或者.htm。其URL中通常出现"?"、"="、"%",以及"&"、"$"等符号。网站使用动态技术的好处,除了增加网站交互功能,还具有容易维护和更新的优点,因此为许多大中型网站采用。
但大多数搜索引擎的蜘蛛程序都无法解读符号"?"后的字符。这就意味着动态网页很难被搜索引擎检索到,因而被用户找到的机会也大为降低。因此,建设网站之前首先要端正思想,即能够采用静态表现的网页尽量不要用动态实现,重要的网页用静态表现。同时使用技术将动态网页转化成静态网页形式,使URL中不再包含"?""="等类似的符号。也可以通过对网站进行一些改动,间接增加动态网页的搜索引擎可见度。即坚持"动静结合,以静制动"的原则。
不同技术的解决方案:
针对不同程序开发的动态网页有着相应的解决方案。以下是作者Karen编译的部分内容:
1、CGI/ Perl
如果你在网站中使用的是CGI或者Perl,可用一个脚本拾取环境变量前的所有字符,再将URL中剩余的字符赋值给一个变量。这样,你就可以在URL中使用该变量了。 不过,对于那些内置了部分SSI(Server-Side Include:服务器端嵌入)内容的网页,主要的搜索引擎都能够提供索引支持。那些以.shtml为后缀名的网页也被解析成SSI文件,相当于通常的.html文件。但如果这些网页在其URL中使用的是cgi-bin路径,则仍有可能不被搜索引擎索引。
2、ASP
ASP(Active Server Pages: Web 服务器端动态网页开发技术)被用于基于微软的网络服务器中。使用ASP开发的网页,一般后缀名为.asp。只要避免在URL中使用符号"?",大多数搜索引擎都能够支持用ASP开发的动态网页。
3、Cold Fusion
如果你使用的是Cold Fusion,那么你就需要在你的服务器端重新对其进行配置,使其能够将一个环境变量中的符号"?"用符号"/"代替,并将替换后的数值传给URL。这样一来,最后到达浏览器端的就是一个静态的URL页。当搜索引擎对该转换后的文件进行检索时,它不会遭遇"?",因而可继续对整个动态页的索引,从而使你的动态网页对搜索引擎仍然具有可读性。
4、Apache 服务器
Apache是最流行的HTTP服务器软件之一。它有一个叫做 mod_rewrite的重写模块,即URL重写转向功能。该模块能够使你将包含环境变量的URL转换为能够为搜索引擎支持的URL类型。对于那些发布后无须多少更新的网页内容如新闻,可采用该重写转向功能。
建立静态入口:
在"静动结合,以静制动"的原则指导下,还可以通过对网站做一些修改,尽可能增加动态网页的搜索引擎可见度。如将动态网页编入静态主页或网站地图的一个链接中,以静态目录的方式呈现该动页面。或者为动态页面建立一个专门的静态入口页面(gateway/entry),链接到动态页面,然后将静态入口页面递交给搜索引擎。
对一些重要的、内容相对固定的页面制作为静态网页,如包含有丰富关键词的网站介绍、用户帮助,以及含有重要页面链接的网站地图等。网站首页尽量全部采用静态形式,并将重要动态内容以文本链接方式全部呈现,虽然增加了维护工作量,但从SEO的角度看是值得的。
也可以考虑为你的重要动态内容创建静态的镜象网站。
付费登录搜索引擎:
当然,对于整个网站都采用与数据库相连的内容管理系统(CMS)发布的动态网站而言,提高搜索引擎可见度的最直接办法就是进行付费登录,直接提交动态网页到搜索引擎目录,或做关键字广告,保证网站被搜索引擎收录。
搜索引擎对动态网站支持的改进
搜索引擎一直在提高自己对于动态页面的支持。到目前为止,GOOGLE、HOTBOT和百度等开始尝试抓取动态网站页面(甚至包括URL带 "?"的页面)。但这些搜索引擎抓取动态页面时,为了避免"搜索机器人陷阱"(spider traps,脚本错误,这种错误会让搜索机器人进行无限循环的抓取,无法退出)",都只抓取从静态页面链接过去的动态页面,而从动态页面链出去的动态页面都不再抓取,即不会对动态页面中的链接进行深入访问。
对于直接使用动态的URL地址,请注意:
· 文件URL中不要有Session Id,同时不要用ID作为参数名称(特别是对于GOOGLE);
如:《网络营销基础与实践》一书,在当当网的介绍页面URL地址是:http://www.dangdang.com/product_detail/product_detail.asp?product_id=493698,该页就无法被读取。
·参数越少越好,尽量不要超过2个;
·尽量不要在URL中使用参数,这样可以增加动态页面被抓取的深度和数量。
附:
Google 向网站管理员提供的信息:www.google.com/webmasters/guidelines.html
百度常见站长问题:http://www.baidu.com/search/guide.html#2
第五部分:搜索引擎优化的重点:链接策略
链接是网站的灵魂。用户通过超级链接获得丰富的网站内容,搜索引擎蜘蛛也是沿着一个网站的页面链接层层跟踪深入,完成对该网站的信息抓取。对搜索引擎尤其是Google来说,决定一个网站排名的关键,是外部有多少高质量的链接指向这个网站。这就是外部链接或反向链接,也称导入链接(Inbound links或backlinks)。而从网站引向其它网站的导出链接以及网站内部页面间的彼此链接也对排名带来或多或少的影响。
搜索引擎分类目录
搜索引擎目录(Directory)即搜索引擎的人工分类目录。今天,登录分类目录是网站建成后非常基础、重要的工作,尤其登录几大主要分类目录,其重要性不在于访问者是否通过目录链接找到你的网站,而主要在于通过这些目录你的网站获得了重要的、高质量的外部链接,这对于你的网站提高排名具有举足轻重的作用。
目前,对于中文网站来说,最重要的分类目录有以下几个:开放式目录ODP,Yahoo!,门户搜索引擎目录搜狐、网易、新浪。可以分为免费登录和付费登录两种情况。无论是免费还是付费,都须通过手工输入登录。
免费登录:
最著名最重要的登录是全球最大的开放式目录库Open Directory Project:www.dmoz.org。
ODP的宗旨是:建立网上最全面最权威的目录,以及建立一个被公众认为高质量的资源库。在这一宗旨下,全球志愿编辑员选择高质量内容的网站核准进入分类目录。
由于Google等重要搜索引擎都采用ODP的数据库,是Google每月一次深度索引的基础,因此向ODP提交网页成为每个网站完成后的首要工作。登录ODP目录是免费的,但要接受较为严格的人工审核和较长时间的等待,并且最后可能网站登录不成功,还要经历反复提交的过程。
由于DMOZ目录在网站排名中举足轻重的作用,使得越来越多良莠不齐的的网站向DMOZ提交或违规提交,而志愿加入的人工编辑队伍中出现以权谋私的现象和素质不高的情况,诸多因素使得现在登陆DMOZ非常困难,没有一个网站敢保证被DMOZ收录。因此,要确保登录成功,唯一的办法是小心谨慎地完全遵守DMOZ登录条款。以下是必须遵守的提交注意事项:
1、确保网站内容是原创而非转载、镜象或复制
如果你的网站内容只是一些会员制产品/服务信息及链接,或是大量拷贝其它站点内容,那么你的网站极有可能被DMOZ拒绝。即使对已经收录的站点,一旦发现它们是镜象、复制或非原创,DMOZ也会将其从目录中剔除。所以务必在网站中加入产品或服务的原创介绍信息。
2、不要采用虚假、作弊和夸张的手段
被搜索机器人反感的做法,同样被目录编辑拒之门外。下文将有专门章节讲到什么是搜索引擎作弊行为。网站说明中任何虚假、夸张的文字都会遭到拒绝。对违法性内容,也是不会收录的。
3、确保网站外观的良好性
如果网站内容出现大量拼写错误、死链接或"正在建设中"的字样,或者下载缓慢,都会阻碍编辑对你的网站的收录。此外,对于来自免费主机的网站,被DMOZ收录的机会很少。
4、确保网站中包含具体联系信息
一个DMOZ编辑称,如果他在网站中找不到实际联系地址或电话号码,他就会认为这个网站不具备可信度。因此,如果你的网站中只有一个Email地址作为联系信息,是极不利于收录成功的。
5、确保网站提交到正确的目录
选择合适的分类目录及子目录是网站提交的核心。很多网站登录失败只是由于提交选择的目录不正确所致。所以在提交网站之前,必须先浏览整个目录,最好也了解一下竞争对手的网站都放在哪个目录下。确认之后,才在该目录页面右上角点击"提交网页"。
6、记下提交日期、目录名和编辑邮箱
向ODP提交完你的网站后,记下提交的日期及目录。如果你提交的那个目录下有编辑员信息,最好把编辑的名字和邮箱也记下来。这些信息,对于你需要询问提交网站的处理状态或再次提交时,非常有用。
7、不要多次重复提交网站
因为编辑是根据网站的提交日期顺序进行处理的,一个目录下往往有很多网站在队列中等候审批。从提交成功到最后收录,最快也要2周时间,最晚的甚至要等到半年以后。因此,你需要耐心等待结果。如果网站非常庞大,且拥有很多不同内容的分支时,你可以尝试将不同内容的网页分别向DMOZ下的相应目录进行提交。
一旦DMOZ收录了你的网站,那很快就可以被Google,Lycos,Netscape,AOL, HotBot,DirectHit等一些大型搜索引擎和门户网站收录。
其它的重要免费目录包括Yahoo目录。Yahoo是最早开始做分类目录的网站,直到今天登录Yahoo目录也是网站推广的重要环节。Google把来自Yahoo目录的链接作为网站排名的重要分值。
工具推荐:
检查网站是否登录多个重要目录:www.123promotion.co.uk/directory/index.php
付费登录(Paid Inclusion):
英文Yahoo实行付费登录商业网站政策,国内的门户搜索引擎目录也对商业网站纷纷采用付费登录。付费登录商业模式包括普通登录和固定排名,一般按年付费,网站在付费之后立即登录目录,无须等待和受到其它因素的影响。门户搜索引擎的搜索程序也比较偏重于对自身付费目录数据的抓取。
总体上,付费登录对于商业网站和采用了大量不利于搜索引擎友好的手段建设的网站来说,还是有必要的。
关于自动登录软件(Submitting Tools):
自从有了B2B商务平台和搜索引擎营销以来,就出现了向这些中间平台和搜索引擎提交供求信息或网站的自动登录软件,并一度在市面上广为流行。搜索引擎自动登录软件的功能是承诺将客户的网站一次性登录到全球N个搜索引擎目录,有的甚至保证可以使网站在搜索引擎中的排名获得极大提升。实际上,已经有诸多营销实践者对此类自动登录软件实际效果提出了质疑:
1、真正为网站带来访问量的搜索引擎主要集中于几大主流搜索引擎,其它的小搜索引擎搜索量极小,即使网站被这些小搜索引擎收录成功,也不能指望通过他们带来什么访问量。
2、今天的主流搜索引擎目录往往采用付费登录或严格的人工审核,这些目录极其反感由自 动登录软件提交的网站,有的明确提出拒绝自动提交方式。
3、在软件自带的几千个搜索引擎中,软件本身提示登录成功的大概有百分之六七十,是否真正登录成功,实际操作中很难一个一个去检验。
4、如果网站有来自其它网站的导入链接,即使不用登录,主流搜索引擎机器人同样会抓取 到你的网页。
5、如果从增加外部导入链接的角度出发,英文网站针对英文搜索引擎的自动提交可以一试,聊胜于无,但不可对其抱有太大的期望。