未来十年展望之下一代搜索技术

时间:2022-10-23 12:39:51

未来十年展望之下一代搜索技术

总结历史是为了更好地预测未来。IT技术经过多年发展,特别是网络技术的进步,使得IT技术已经深入社会的各个角落,改变了生产力、社会关系、消费理念乃至人们的生活方式。

伴随Web 2.0的发展,人们可以随时随地用任何设备实现信息交互。越来越多的消费者开始频繁使用IT技术,IT应用的普及速度甚至超过了企业IT技术更新的速度。这种趋势将对企业活动及消费行为产生巨大影响,被称为“产消逆转”现象。通过IT手段使企业提升顾客的体验价值,是很多企业在竞争中能够脱颖而出的重要原因。对于企业来说,必须进行合适的IT投资,才能在未来的竞争中取胜。那么如何对现有IT技术进行客观定位,把握未来重要技术的发展趋势,并根据对技术趋势的预测来进行适合的IT投资成为企业非常关心的问题。

我们在此选取了六大重要技术领域,对其未来的发展方向做出判断,希望能对企业决策和个人消费带来有益帮助。本文参考了北京软件与信息服务业促进中心翻译的《IT导航图2009版》一书。该书由日本野村综合研究所技术调查部所著,在全球IT领域具有广泛影响。北京软件与信息服务业促进中心胡青华主任认为,在IT技术没有兴盛以前,我们所处的是工业经济时代。随着IT技术的发展,尤其是互联网的兴盛,我们已经进入光速、无重量的信息经济时代。因此,对未来技术的预判就显得更加重要。

技术趋势

在互联网时代,包括文件、图像、语音、动画、视频、虚拟世界等在内的数据呈指数级增长,搜索技术显得越来越重要。

以往,搜索服务都是依据输入的关键字,列出符合关键字的信息。未来,全新的搜索服务模式将出现。

搜索技术的评测指标主要有两种:适合率和再现率。适合率指搜索结果中符合要求的数据比例,可以通过减少非适合数据提高这一比例。再现率指在所有应该列出的适合数据中,实际检索出的适合数据所占的比例,可以通过减少检索遗漏提高这一比例。

未来,搜索技术将朝着三个方向发展:包括联想在内的语义搜索,检索图像、语音、动画内容的感性搜索,通过传感技术搜索现实世界对象的现实挖掘。

对于语义搜索,各家搜索引擎服务商的定义并不相同。一般来说,语义搜索是指搜索引擎能够“读懂”网民键入的符合语法习惯的句子。2008年8月,微软收购了一家语义搜索服务商Powerset。微软目前正式推出的新型搜索引擎Bing就整合了Powerset的语义搜索技术。

CNNIC 2009年3月公布的调查报告显示,对搜索结果不满意的网友比例为35%,40%的用户会在第一次键入关键词的基础上修正关键词,72%的用户认为搜索结果非常凌乱。用户如果想在互联网海量信息中快速、简便地寻找到自己想要的信息而不受干扰,需要搜索技术对检索者的想法进行臆测。

目前,人们看到的搜索结果都是参考文献,而不是最终的答案。这是现有搜索技术最大的问题。但是,已经有一些产品能够对垃圾信息进行最初级的人为摒除,比如百度知道。当一个人提问之后,经过一个或多个人的回答,此人就可以找到自己所需要的信息。另外,各大厂商也在致力于实现真正的人机对话。以PowerSet和WolframAlpha为代表的问答式精准搜索近来受到广泛关注。

GazoPa是一家成立于2008年的图像搜索引擎供应商。它提供的搜索图像服务的特色在于,可以提取图像中商品的形状、颜色等信息。以往的图像搜索采用的方法是,给图像数据赋予标签等文本数据,当输入的关键字与文本数据相匹配时,图像就会被检索出来。但是,用户使用GazoPa提供的服务,被搜索的图像不具备文本信息,也可能被搜索到。

GazoPa使用的是基于图像内容的检索(Content-based Image Retrieval,CBIR)技术。这种技术能够对图像的颜色、纹理、布局进行分析并检索。CBIR是基于内容检索(CBR)的一种技术。CBR中包括了对动态视频、音频等其他形式多媒体信息的检索技术。

新商机

随着语音识别技术、自然语言处理技术的逐步成熟,搜索服务商通过语音会话形式提供的阶梯型检索服务将逐渐深入生活。例如,人们可以通过手机在移动互联网中搜索附近的饭店,而人工合成的声音会问“你喜欢吃什么”或“意大利菜怎么样”之类的问题。

新商机

随着云计算的日益发展,以云计算为中心的产业链也在逐渐成熟。在云计算这个大平台下,汇集了软硬件厂商、解决方案提供商、基础设施和平台提供商等。

硬件领域的绝大多数传统制造商已经在某种形式上支持虚拟化和云计算,其中最重要的两个公司是英特尔和AMD。

云计算解决方案提供商是指为客户建立公共云或私有云提供软件和方案的企业。该市场在2008年末才开始形成。云计算解决方案主要以虚拟化管理软件为基础,参与者多为虚拟化管理软件厂商,主要包括IBM、微软、思杰(Citrix)、VirtualIron、3Tera等。

基础设施即服务是指向客户出售服务器、存储、网络设备、带宽等基础设施资源。该市场的主要参与者有亚马逊AWS(Amazon Web Services)、Rackspace、Gogrid、Gridlayer。平台即服务是指利用一个完整的基础设施平台,包括应用设计、应用开发、应用测试和应用托管,并将这些资源作为一种服务提供给客户。该市场的参与者主要有谷歌App Engine、微软Azure等。软件即服务和一切即服务是指提供面向各种具体应用的服务。该市场参与者众多,包括、Zoho、谷歌等。

在中国,云计算市场还在孕育之中。2008年,阿里巴巴公司首期投资逾1亿元的云计算中心落户南京,但至今没有提供服务。已经有一些中国企业进入了SaaS市场,IaaS市场正在孕育之中,但没有中国公司涉足PaaS市场。

2011~2012年是云计算市场的发展期,支持云计算服务的厂商逐渐增加。围绕云计算服务产生了许多新型商业模式,预计将有更多的周边商业在此时期出现。软件厂商可以在云计算平台上开发软件,然后以托管服务的形式提供给用户。另外,外包方式将从现在的入驻、托管、SaaS向业务流程外包方向发展,并将创造大量的商业机会。

2013年以后是云计算的普及期,各种IT资源将作为服务交付。在此阶段,包括HaaS(硬件即服务)、PaaS(平台即服务)、SaaS、IaaS(基础设施即服务)和DaaS(数据库即服务)等在内的各种形式的云计算服务不断涌现,最终实现一切皆服务的目标。

技术趋势

2009年,IT行业的流行语之一是云计算。

2006年,时任谷歌公司首席执行官的埃里克•施密特最早提出了云计算的概念。人们用图形的方式表示网络时,经常会使用云状图,云计算的云即源于此。所谓云计算,是指通过连接网络,将可扩展、抽象化的巨大IT资源作为一种服务加以提供的计算机形态。

CPU的处理能力、存储器、数据库、应用程序、软件等正从买向借的阶段发展,巨大的计算机群正像云一样飘浮在网络上,为用户提供各种各样的IT资源。

云计算提供的IT资源呈现两大特征,即高度可扩展性和虚拟化。高扩展性是指根据业务量的增加以及用户的各种变化,系统可以迅速、灵活地调整计算机资源。例如,每年圣诞节前后,访问亚马逊网上商店的消费者人数剧增,网站服务器的负荷加重,但亚马逊公司通过云计算技术成功地分散了负荷,保证服务质量不下降。

虚拟化是指用户不需要清楚地知道具体的计算处理是在哪台计算机上进行的,也不需要知道该计算机位于数据中心的什么地方。正如平时使用谷歌的搜索引擎一样,用户不必关心输入关键词后进行的搜索处理是由哪台计算机完成的,只要关心能否迅速获得准确的搜索结果即可。这种思维方式即为云计算的基本理念。

借助虚拟化技术,用户可以实现服务器整合,从而显著降低投资成本,并可以通过构建内部云和外部云,节省大量的运营成本。因此,虚拟化已成为众多企业应对国际金融危机挑战的首选策略,并在2009年获得了快速发展。

实现云计算的关键技术包括两种:虚拟化技术和集群中的分散处理技术。借助虚拟化技术,同一台物理服务器可以兼容多个子操作系统,从而提高服务器的利用率,降低硬件成本和维修费用,同时降低服务费用。支持云计算的另外一项重要技术是新型分散处理编程技术,早期产品包括谷歌公司开发的MapReduce以及开源软件Hadoop。这些产品是集群中进行大规模数据处理的框架,可将应用程序分割为几百个甚至几千个细小的工作任务,并分配到多个节点上,然后再收集、整理从各个节点上返回的信息,并最终做出解答。

需要解决的问题

我们即将迎来IT资源以服务方式进行交付的一切皆服务的时代。但是,企业所有的信息系统都转向云计算平台是不现实的。对于企业用户而言,虽然使用外部服务可以节省成本,但在安全性、适用性以及对性能的控制等方面将面临诸多问题。企业必须明确,哪些应用能在云计算平台上运行,哪些应用只能在企业内部的计算平台上运行,并且在成本和控制能力之间找到平衡点。只有这样,企业才能成为云计算时代的胜利者。

上一篇:山东省审计厅:五项措施确保OA与AO交互 下一篇:防地震从机柜做起