电子书简介:搜索引擎要知道网上的新生事物,就得派人出去收集,每天都有新的网站产生,每天都有网站内容的更新,而且这些产生的网站数量、更新的网站内容是爆炸式的,靠人工是不可能完成这个任务的,所以搜索引擎的发明者就设计了计算机程序,派它们来执行这个任务。

探测器有很多叫法,也叫Crawler(爬行器)、spider(蜘蛛)、robot(机器人)。这些形象的叫法是描绘搜索引擎派出的蜘蛛机器人爬行在互联网上探测新的信息,Google把它的探测器叫做Googlebot,百度就叫Baiduspider,Yahoo称为Slurp,无论它们叫什么,它们都是人们编制的计算机程序,由它们不分昼夜的访问各个网站,取回网站的内容、标签、图片等,然后依照搜索引擎的算法给它们定制索引。

电子书在线观看:http://doc.zzbaike.com/b/1/search-engines-work-principle.pdf

百度文档在线观看:http://wenku.baidu.com/view/f2226725ccbff121dd368383.html

电子书在线下载:http://down.zzbaike.com/ebook/search-engines-work-principle-1253.html

, , , , , , , , , , , , , , ,

电子书简介:1994年7月,Lucos推出了基于搜索机器人的数据发现技术,并支持搜索结果相关性排序额,它还第一次让搜索引擎能够使用网页自动摘要. 1995年底,Alta Vista推出,由于它具备大量的新的搜索功能,深受大众好评,Alta Vista是第一个支持自然语言搜索,具备了基于网页内容分析、智能处理的能力,第一个实现高级搜索语法的搜索引擎(如AND,OR,NOR等),同时还能搜索新闻群组中的内容,还能搜索图片。

这一阶段也是yahoo发展的初期阶段,大多数人在这个时候对搜索并不熟悉,也不太知道有搜索引擎这回事,但是对于yahoo,大多数人则有所了解,寻找网站就上Yahoo。所以,将你的网站送到Yahoo是很必要的,在此阶段,只要你的网站基本有个模样,有一定的可看性,一般只要向Yahoo提交地址,72小时内就能出现在Yahoo目录上。Yahoo对所有的网站进行人工归类,一般是按照字母顺序排列网站,自然开头为“A”的网站排到开头为“B”的前面,而有两个A的网站,排在有A和B的网站前面,比如,American Airlines的网站不仅排在Bank of America的前面,而且也排在American Basketball Association前面。所以,大批网站就以追求A字来命名。这是搜索引擎优化的雏形。这个逻辑和黄页电话号码的排名逻辑一样。

电子书在线观看:http://doc.zzbaike.com/b/1/search-engine-development.pdf

百度文档在线观看:http://wenku.baidu.com/view/36976d01bed5b9f3f90f1c8b.html

电子书在线下载:http://down.zzbaike.com/ebook/search-engine-development-1252.html

, , , , , , , , , , , , , , ,
Random Plugin Created By Best Accountant Services