一.搜索引擎的运行机理
1.收录页面
收录页面是指搜索引擎通过自动化的检索程序按照一定的规则在互联网上抓取相关页面,然后将这些页面储存在相关数据库中的过程,它是搜索引擎开展各项工作的基础。
2.分析页面
搜索引擎在收录页面的基础上,按照一定的要求对收录的原始页面建立索引,实现对收录页面的定位,然后提前和分析收录页面的正文信息,得到关键词,并为之建立索引,从而形成页面和关键词之间的对应关系,最后搜索引擎对关键词进行重组,最终形成关键词与页面间对应关系的反向列表,从而能根据关键词快速链接到相应的页面。
3.排序页面
搜索引擎结合页面的内外因素,根据一定的相关度算法计算出页面与某个关键词的相关程度,并按照相关度数值对页面进行排序,形成与关键词相关的页面排序列表。
4.查询关键词
搜索引擎在接受用户的查询请求后,开始对查询信息进行切词,并与收录页面的关键词进行匹配,再将搜索到的含有链接地址、内容摘要等内容的页面排序返回给用户。
二.搜索引擎的类型
1.按搜索引擎的不同工作方式分
按搜索引擎的不同工作方式,搜索引擎可分为全文搜索引擎、目录索引类搜索引擎和元搜索引擎。
2.按搜索内容的不同分
按搜索内容的不同,可将搜索引擎分为综合型搜索引擎、专业型搜索引擎和特殊型搜索引擎。
3.按包含搜索工具数目的不同分
按包含搜索工具数目的不同,可将搜索引擎分为单独型搜索引擎和集成型搜索引擎。