搜索引擎原理之数据库索引

本文作者:
5年前 (2012-05-21) 沙发

从第一篇株洲SEO介绍的搜索引擎原理的文章中我们知道搜索引擎是非常复杂的技术,但是其基本原理并不复杂,其基本技术包括抓取、索引、排序。所以这篇文章,株洲SEO就介绍搜索引擎的索引。

由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的所有关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。

数据库索引好比是一本书前面的目录,能加快数据库的查询速度。例如这样一个查询:select * from table1 where id=44。如果没有索引,必须遍历整个表,直到ID等于44的这一行被找到为止;有了索引之后(必须是在ID这一列上建立的索引),直接在索引里面找44(也就是在ID这一列找),就可以得知这一行的位置,也就是找到了这一行。可见,索引是用来定位的。

相关文章

发表评论