网站结构合理的重要性

2016-11-04    分类: 网站建设

搜索引擎都有自己的“搜索机器人”(ROBOTS),并通过这些ROBOTS在网络上沿着网页上的链接(一般是http和src链接)不断抓取资料建立自己的数据库。 对于网站管理者和内容提供者来说,有时候会有一些站点内容,不希望被ROBOTS抓取而公开。为了解决这个问题,ROBOTS开发界提供了两个办法:一个是robots.txt,另一个是The Robots META标签。
一、robots.txt 1、什么是robots.txt? robots.txt是一个纯文本文件,通过在这个文件中声明该网站中不想被robots访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容。 当一个搜索机器人访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果找到,搜索机器人就会按照该文件中的内容来确定访问的范围,如果该文件不存在,那么搜索机器人就沿着链接抓取。 robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。 网站 URL 相应的 robots.txt的 URL http://www.w3.org/ http://www.w3.org/robots.txt http://www.w3.org:80/ http://www.w3.org:80/robots.txt http://www.w3.org:1234/ http://www.w3.org:1234/robots.txt http://w3.org/ http://w3.org/robots.txt
2、robots.txt的语法 "robots.txt"文件包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL作为结束符),每一条记录的格式如下所示: ":"。 在该文件中可以使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始,后面加上若干Disallow行,详细情况如下: User-agent: 该项的值用于描述搜索引擎robot的名字,在"robots.txt"文件中,如果有多条User-agent记录说明有多个robot会受到该协议的限制,对该文件来说,至少要有一条User-agent记录。如果该项的值设为*,则该协议对任何机器人均有效,在"robots.txt"文件中, "User-agent:*"这样的记录只能有一条。 Disallow : 该项的值用于描述不希望被访问到的一个URL,这个URL可以是一条完整的路径,也可以是部分的,任何以Disallow 开头的URL均不会被robot访问到。例如"Disallow: /help"对/help.html 和/help/index.html都不允许搜索引擎访问,而"Disallow: /help/"则允许robot访问/help.html,而不能访问/help/index.html。 任何一条Disallow记录为空,说明该网站的所有部网站建设中遇到的问题,以及“Web标准”思想的产生、发展和推广。让你明白为什么要采用和推广Web 标准。
第二部分从技术细节上讲解了网站实际制作开发过程中如何向Web标准过渡,如何采用和符合Web标准。通过阅读本书,你可以清楚一些基本问题: Web标准是什么? 网站一定要用标准吗? 用标准和不用标准的区别? 如何采用标准? 如何向标准过渡? 适合什么样的人看这本书适合的读者是:所有的网站设计者、开发者和所有者。 这不是广告词。不论对这一行业的新手还是资深人士,本书都将对你产生深刻影响。它告诉我们怎样做是正确的,以及应该如何做。也许本书介绍的思想和技术你可能不会马上接受或贯彻到工作中,但它是Web发展的趋势,是阻挡不了的发展趋势。它的重要性已经并将继续在Web领域体现。 对我们有什么好处如果你是Web设计师、开发者或所有者,如果你正在困惑自己应该学习什么,怎么做,如果你正在犹豫自己网站的发展方向,如果你正在想如何把自己提高一个层次,如果你正在头疼不断的网站升级问题,本书正是你需要的! 它告诉你Web开发的技术将如何发展,未来的Web将是怎样的。看清楚了这些,如何发展网站,自己如何定位就容易得多。
任何书都有它的价值所在。如果需要一个理由购买这本书,那么我会这样说:你可以不买这本书,但是本书的思想和技术你一定要了解,总有一天你会需要它,这一点是百分之百肯定的。与其被动地、等到迫不得已的时候再来了解和学习,为什么不现在就行动? 译者的感受对于本书的作者Jeffrey Zeldman,国内设计师和开发者可能并不熟悉,但在国外,同行无人不知。他领导的Web标准组织(www.Webstandards.org)帮助终止了Microso ft 与Netscape之间的浏览器之战,使得我们不再需要考虑浏览器不同版本问题。他也是资深的设计师,对网站技术的历史和发展了如指掌。通过翻译本书,我们对Web标准的发展历史、Web标准技术的应用进行了系统而全面的了解。特别是许多技术细节的来龙去脉,常常让我们顿悟:原来如此! 本书不像Flash或者Photoshop教程那么有趣,也不像程序语言教材那样立竿见影,但我们还是决定翻 Disallow: /cgi-bin/

本文题目:网站结构合理的重要性
当前URL:/news14/59364.html

成都网站建设公司_创新互联,为您提供外贸网站建设全网营销推广品牌网站制作做网站关键词优化小程序开发

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联

手机网站建设