搜索原则

摘要

搜索的原则:1.抓取网页每个独立的搜索引擎都有自己的蜘蛛。Spider跟踪网页中的超链接,并持续抓取网页。由于超链接在互联网上被广泛使用,理论上,

搜索的原则:

1.抓取网页

每个独立的搜索引擎都有自己的蜘蛛。Spider跟踪网页中的超链接,并持续抓取网页。由于超链接在互联网上被广泛使用,理论上,大多数网页可以从一定范围的网页中收集。

2.处理网页

搜索引擎在抓取网页后,必须做大量的预处理工作才能提供检索服务。其中,最重要的是提取关键词和创建索引文档。其他包括删除重复的网页,分析超链接和计算网页的重要性。

3.提供检索服务

用户输入关键词进行搜索,搜索引擎从索引数据库中找到与关键词匹配的网页;为了方便用户,除了网页的标题和网址之外,还将提供网页摘要和其他信息。

目前评论:0 条

发表评论