什么是搜索引擎
随着Internet的飞速发展,面对海量而又不断更新的信息库,如何快速准确地找到自己需要的信息已经变得越来越重要了。为了使网民搜索信息的速度更加快捷、准确,专门在Internet上执行信息搜索任务的搜索引擎技术应用而生了。
早期的搜索引擎通过将网络中不同类型的网站进行分门归类的方式出现在人们眼前的,人们可按分类一层层进入,就能很快找到所需的信息。该类搜索引擎优点是信息准确、导航质量高,缺点是需要人工介入、维护量大、信息更新不及时,其中的代表者有雅虎、搜狐、新浪等,这些门户网站大多都收录了数十或者上百万个的Internet站点。如图1所示

图1
这种目录式网站罗列和已经初步含有人工智能的搜索技术,迅速吸引了诸多迫切需要信息的网民眼球!
虽然,这种初期的搜索方式深得用户的喜爱,但时隔不久,庞大的信息搜索需求使得这种早期更新较慢的搜索引擎变得不能再满足需求了,此时依靠“网络蜘蛛”(SPIDE)等程序机器自动抓取超级链接的搜索引擎技术出现了,这种搜索引擎技术可以自动分析、查找出网络中具有一定访问量的网站,并根据网站中提供的“关键词”来自动将其进行分类、收录在本身的数据库中,当用户在其网站中输入一个特定的搜索关键词(Keyword)后,搜索引擎就会自动进入索引清单,将所有与搜索词相匹配的内容找出,并显示一个指向存放这些信息的连接清单供用户选择进入。该类搜索引擎的优点是信息量大、更新及时、无需人工干预,缺点是返回信息过多,可能有很多无关信息,用户必须从结果中进行筛选。如图2所示

图2
虽然在信息更新技术上,这种搜索引擎有了长足的进步,但实际上这种搜索方式仍然显得较为呆板。在提倡时尚的今天,更趋向于智能化搜索的互动式搜索引擎服务慢慢出现了,已经完全可以即时地对用户所输入的搜索关键词进行分析,尝试理解用户可能的查询意图,例如输入关键字的拼音后,搜索引擎就会进行智能匹配并给出匹配结果供参考选择,并给出多个主题的搜索提示(有的搜索引擎还给出了时间段检索功能,这使得搜索的结果更加具有时效性和合理化),引导用户更快速准确定位自己所关注的内容。例如在“一搜”“http://www.yisou.com/”网站中搜索“老家.mp3”关键词时,“一搜”的引擎将会首先给出这首音乐的下载链接,而不是“老家”或是“MP3”的相关页面。如图3所示

图3
虽然搜索引擎在技术上不断进行更新,但以目录方式提供搜索的方法并没有被抛弃,所以现在的搜索引擎一般可以分为目录式搜索和关键词式智能化即时搜索两种。
小贴士:
“一搜”搜索引擎网站是世界著名网站雅虎斥资26亿美元,动用全球顶尖的400多名工程师在中国发布的一个崭新的独立中文本地化搜索引擎门户。 “一搜”发布后仅一个月的时间就冲进全球网站排名前25位,创造了世界纪录。
|