眨眼的瞬间 Google搜索请求的旅程

时间:2022-08-31 06:33:14

眨眼的瞬间 Google搜索请求的旅程

据说,人平均每眨一次眼睛需要0.1秒,爱上一个人仅需要0.2秒钟。同样有一件事情也只要0.2秒钟,并且在一天之内发生超过十亿次:一次Google搜索。在这个简约的页面背后有着怎样的故事?Google的搜索功能到底是怎样实现的?我们与Google搜索产品经理 Jack Hubert(杰克·休伯特)一同探讨了问题的答案。

问:Google的使命是“整合全球信息,使人人皆可访问并从中获益”,那么Google是怎样将复杂网络中的信息加以整合的呢?

答:Google使用搜索软件“网络蜘蛛”访问网络中数十亿的网页,在网页中不断地抓取信息,并把这些信息返回到Google的服务器。我们还会抓取视频、图像等多媒体信息。迄今为止,我们已经在构建索引方面花了100万小时的计算时间,索引量已经远远超过了100百万千兆字节。

问:如果在搜索框中键入一些关键词,比如足球,会得到一些预测结果。这种预测是如何实现的?

答:当你在搜索框中键入第一个字“足”的时候,Google的自动预测功能就开始了。Google依靠大量的信息或者“线索”进行预测。此外,我们的算法还会考虑到其他用户搜索时键入的词语。我们称之为Google Instant,它能在用户输入搜索请求的同时反馈搜索结果。

问:当我们按下回车键后,0.19秒钟内就立刻能得到29,000,000 条搜索结果! 搜索引擎是如何做到如此迅速地提交结果的呢?

答:在用户输入“足球”的0.2秒内Google 就开始通过在互联网中发送数据包来检索结果,不同的搜索请求会寻找最便捷的路线,通过不同的路径沿着光线电缆和其他连接方式到达位于世界各地的Google数据中心。这些数据以接近光速传播,以每小时几亿英里的速度为用户返回答案。

问:Google 如何从网络中数十亿计的网页中判断出与我的搜索请求相关联的信息?

答:Google的搜索结果排名是通过一套“算法”实现的。算法是计算机基于一系列规则所执行的一套操作指令。我们寻找“信号”或线索,通过这种线索确定在网页中哪种请求关联性最大。同时通过搜索请求找到“基本语境”,在综合信息后为你反馈相关度最高的结果。

问:Google的算法会查看哪些类型的信号?

答:我们查看页面中的关键词,词语位置,所在区域,所用语言,网页互相链接的方式,以及许多别的因素。我们对搜索算法的某些方面保密,因为一旦公布这些细节,就会有网站试图篡改搜索排名,损害用户的搜索质量。仅2011年一年我们就对改善搜索功能的检验做了超过50,000个实验,做出超过500处改进。

上一篇:手机搜狐重装上线搜狐移动互联网布局“双子星... 下一篇:极限自做 第25期