自动秒收录

搜索引擎核心技术详解1—搜索引擎及其技术架构


文章编号:1989 / 更新时间:2023-04-13 / 浏览:

搜索引擎依托于互联网,互联网的蓬勃发展是搜索引擎产品与技术逐步成熟的大背景。离开互联网,搜索引擎将无从谈起。

20世纪90年代初期是互联网后期获得大规模发展的起爆点,之所以如此,是有其技术背景和社会背景的。

1995年是搜索引擎商业公司发展的重要起点,其对应的背景是:互联网上的Web站点数量首次超过100万,此时普通用户已经无法依赖手工浏览的方式来获得自己想要的信息。在这一年产生了很多风云一时的早期搜索引擎公司。Yahoo、InfoSeek、FastSearch、AltaVista、Excite等曾经非常著名的搜索引擎公司都创建于1995年。

互联网信息量在过去获得了爆炸性增长,信息过载的问题就目前来说非常严重,随着互联网个性化的发展趋势逐步展现,普通用户发布信息的成本越来越低,这个问题将会更加严重。这是搜索引擎相关应用越来越重要的一个基础背景。搜索是目前解决信息过载的相对有效方式,在没有更有效的替代解决方式出来之前,搜索引擎作为互联网网站和应用的入口及处于行业制高点的重要地位只会逐步加强。

对于分类目录式搜索引擎,其重点关注的是信息的可信赖性,因为分类目录内收录的网站经过人工精心筛选,所以具有很强的可信赖性,但是对于用户需求和相关性是不做考虑的,完全靠用户自由浏览来确定。

对于第一代文本检索式搜索引擎,其重点关注的是查询关键词和网页内容的相关性。这种搜索方式假定用户输入的查询关键词就是用户的真实需求,很明显这种假设很难成立。另外,这种搜索方式对于信息的可信度也未做任何识别。

第二代搜索引擎引入链接分析技术,链接关系代表了一种推荐含义,而获得越多推荐的网页其链接分析得分越高,这其实是一种对网页可信度的度量标准。同时,第二代搜索引擎也利用了文本检索模型,来计算查询和网页内容的相关性。所以第二代搜索引擎是综合考虑了信息的相关性和可信性的,但是同样没有对用户需求做关注。

  第三代搜索引擎的重点则是用户的真实需求,其他方面则兼顾了第二代搜索引擎的优点,即第三代搜索引擎同时考虑了3个核心问题。

搜索引擎核心技术详解1—搜索引擎及其技术架构

搜索引擎高级命令

搜索引擎核心技术详解10—网页去重

搜索引擎核心技术详解8—网页反作弊

搜索引擎核心技术详解6—链接分析

搜索引擎核心技术详解5—检索模型与搜索排序

搜索引擎核心技术详解3—搜索引擎索引

搜索引擎核心技术详解2—网络爬虫

搜索引擎工作原理介绍

知识像烛光,能照亮一个人,也能照亮无数人

搜索引擎发展简史

搜索引擎工作原理介绍

搜索引擎核心技术详解5—检索模型与搜索排序


相关标签: 搜索引擎核心技术详解1—搜索引擎及其技术架构SEO教程网

本文地址:https://www.badfl.com/article/a7b8cc3d6964e977ced3.html

上一篇:百度搜索引擎网页质量白皮书...
下一篇:搜索引擎核心技术详解2网络爬虫...

发表评论

温馨提示

做上本站友情链接,在您站上点击一次,即可自动收录并自动排在本站第一位!
<a href="https://www.badfl.com/" target="_blank">自动秒收录</a>