2016-09-24 分类: 网站建设
有一些网站设计技术对搜索引擎来说很不友好,不利于蜘蛛爬行和抓取,这些技术 被称为蜘蛛陷阱。常见的应该全力避免的蜘蛛陷阱包括如下这些。
在网页的某一小部分使用Flash增强视觉效果是很正常的,比如用Flash做成的广告、 图标等。这种小Flash和图片是一样的,只是HTML代码中的很小一部分,页面上还有 其他以文宇为主的内容,所以对搜索引擎抓取和收录没有影响。
但是有的网站整个首页就是一个大的Flash文件,这就构成了蜘蛛陷阱。搜索引擎 抓取的HTML代码只有一个连向Flash文件的链接,没有其他文字内容。读者可以参考 前面例子的源代码。搜索引擎是无法读取Flash文件屮的文字内容和链接的。这种网站 整个就是一个Flash的网站,可能视觉效果做得精彩异常,可惜搜索引擎看不到,不能 索引出任何文字信息,也就无从判断相关性。
有的网站喜欢在首页放一个Flash动画片头(Flash Intro),用户访问网站看完片头 后被转向到真正的HTML版本的文字网站首页。搜索引笮不能读取Flash, 般也没办法从Flash Intro跟踪到HTML版本页面。
近几年搜索引擎不停尝试读取Flash文件,尤其是里面的文字内容和链接,也取得 了广定进展。站长可以使用SWFObject和sIFR等技术使Flash文件更易于被搜索引擎读 取。不过我的观点是,与其费劲去研究怎么让搜索引擎读取Flash文件,不如做成普通 的HTML版本的网站。如果你的网站除了 Flash外不足以展现公司实力,那么你的公司 应该是世界500强级别的,SEO就不重要了。
整个网站就是一个大Flash文件,从SEO角度来说是万万不n了的„如果Flash效果 是必需的,至少也需要在首页加上一个通往HTML版本的链接。这个链接应该是在Flash 文件之外的HTML代码中,搜索引擎跟踪这个链接可以抓取后面的HTML版木页面。
有些网站使用Session ID (会话ID)跟踪用户访问,每个用户访问网站时都会生成 独特唯一的SessionID,加在URL中。搜索引擎蜘蛛的每一次访问也会被当成一个新的 用户,URL中会加上一个不同的Session ID,这样搜索引擎蜘蛛每次来访问时所得到的 同一个页面的URL将不-样,后面带着一个不一样的Session ID。这也是最常见的蜘蛛 陷阱之一。
搜索引擎遇到这种长长的Session ID,会尝试判断字符串是Session ID还是正常参 数,成功判断出Session ID就可以去掉Session ID,收录正常URL。但也经常判断不出 来,要么不愿意收录,要么收录多个带有不同Session ID的URL,内容却完全一样,形 成大量复制内容,这两种情况对网站优化都不利。
通常建议跟踪用户访问应该使用cookies而不要生成Session ID。或者程序判断访问 者是搜索引擎蜘蛛还是普通用户,如果是搜索引擎蜘蛛,则不生成Session ID。跟踪搜 索引擎蜘蛛访问是没什么意义的,蜘蛛既不会填表,也不会把商品放入购物车。
除了后面会介绍的301转向以外,搜索引擎对其他形式的跳转都比较敏感,如302 跳转、JavaScript 跳转、Flash 跳转、Meta Refresh 跳转。
些网站用户访问首页时会被自动转向到某个0录下的页面。如果是按用户地理位 置转向至最适合的目录,那倒情有可原。但大部分这种首页转向看不出任何理由和0的, 这样的转向能避免则避免。
如果必须转向,301转向是搜索引擎推荐的、用于M址更改的转向,可以把页面权 重从旧M址转移到新网址。其他转向方式都对蜘蛛爬行不利,原因在于后面作弊-章所 要介绍的,黑帽SEO经常使用转向欺骗搜索引擎和用户。所以除非万不得己,尽量不要 使用301转向以外的跳转。
如果作为站长的你不知道什么是框架结构(Frame),那么恭喜你,你己经避免了这 个蜘蛛陷阱,根本没必要知道什么是框架结构。如果你在网站设计中还在使用框架结构, 我的建议是立即取消。
使用框架结构设计页面,在网站诞生初期曾经挺流行,因为对网站的页面更新维护 有一定方便性。不过现在的网站已经很少使用框架r,不利丁•搜索引擎抓取是框架越來 越不流行的重要原因之一。对搜索引擎来说,访问一个使用框架的网址所抓取的HTML 只包含调用其他HTML文件的代码,并不包含任何文字信息,搜索引擎根本无法判断这 个网址的内容是什么。虽然蜘蛛可以跟踪框架中所调用的其他HTML文件,但是这些文 件经常是不完整的页面,比如没有导航只是止文。搜索引擎也无法判断框架中的页面内 容应该属于主框架,还是属于框架调用的文件。
总之,如果你的网站还在使用框架,或者你的老板要使用框架结构,唯一要记住的 是,忘记使用框架这回事。和Flash —样,别浪费时间研究怎么让搜索引擎收录框架结 构网站。
动态URL指的是数据库驱动的网站所生成的、带有问号、等号及参数的网址。一般 来说动态URL不利于搜索引擎蜘蛛爬行,应该尽景避免。下面对动态URL及其静态化 还W更详细的讨论。
由于JavaScript可以创造出很多吸引人的视觉效果,有些网站喜欢使用JavaScript 脚本生成导航系统。这也是比较严重的蛛蛛陷阱之一。虽然搜索引擎都在尝试解析JS 脚本,不过我们不能寄希望于搜索引笮自己去克服困难,而要让搜索引擎跟踪爬行链接 的工作尽量简单容易。
据我观察,虽然有的搜索引擎在技术上可以获得JavaScript脚本中包含的链接,甚 至可以执行脚本并跟踪链接,但对一些权重比较低的N站,搜索引擎觉得没有必要,不 会费那个劲。所以网站上的链接必须使用最简单标准的HTML链接,尤其是导航系统。 用CSS做导航系统一样可以实现很多视觉效果。
JavaScript链接在SEO中也有特殊用途,那就是站长不希望被收录的页面(比如没 有排名意义的页面,重复内容页面等),不希望传递权重的链接,可以使用JavaScript脚 本阻挡搜索引擎爬行。
有些网站内容放在需要用户登录之后才能看到的会员区域,这部分内容搜索引擎无 法看到。蜘蛛不能填写用户名、密码,也不会注册。
有些网站为了实现某种功能,如记住用户登录信息、跟踪用户访问路径等,强制用 户使用Cookies,用户浏览器如果没有启用Cookies,页面M示不正常。搜索引擎蜘蛛就 相当于一个禁用了 Cookies的浏览器,强制使用Cookies只能造成搜索引擎蜘蛛无法正 常访问。
分享题目:成都seo应该避免蜘蛛陷阱
网站URL:/news28/45078.html
成都网站建设公司_创新互联,为您提供响应式网站、网站改版、定制开发、品牌网站建设、自适应网站、企业建站
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联
猜你还喜欢下面的内容