谁是中国Siri?

时间:2022-07-27 01:30:12

谁是中国Siri?

本质上来说,语音也是一种入口,就像浏览器、搜索引擎、微信一样。互联网大佬们都深信一点,既然在PC端发了财的都是把握住入口的公司,那么把这一点移植到移动互联网上一定也行得通。

在做游戏语音工具的YY成功上市,并且股价一路飙升的情况下,语音的重要性就是傻子都知道的了。以前认为语音没必要做的人算错了一点:在某些特定的情境下,语音是比文字或视频更方便的沟通方式。比如当用户醉心于游戏时,再比如在移动互联网世界。

触摸屏的广泛普及让在手机上打字变得不舒服,而移动网络带宽的拓展又让实时信息传输速度变得更快,两相比较之下,语音的效率确实比文字更高。

而作为一个入口,语音识别技术也是必不可少的。信息真正的价值在它被服务器解析之后,计算机显然是无法直接理解音频的,这时将声音变成文字再转化成代码就是必不可少的一步。

再者,单独的语音技术可能没有太多可用之处。但当它与LBS、人工智能、广告结合起来的时候,就像发生了化学反应一样,会突然成为新技术中不可或缺的一环。相信微信的成功已经让用户感受到了语音的力量。

跟搜索结合之后,就是语音搜索;跟LBS结合,就可能做成车载语音导航;跟广告结合就成了VoiceAds。其巨大的想象空间在未来有多大发展令人神往。

单说其中的车载语音导航,因为解放了用户的手和眼,又可以将数据实时转化成文字,一旦连入移动互联网,那么将为未来的汽车行业带来巨大革命性创新可能。

这就是所谓的兵家必争之地。目前国内主要的玩家是科大讯飞的灵犀、搜狗语音助手、智能360、虫洞、盛大前不久刚的“百灵语音助手”。

科大讯飞的主营业务其实是to B的,营收的主要来源是国家安全应用等业务。难怪科大讯飞董事长刘庆峰在接受采访时笑称,工信部对于微信中的一些信息有安全方面的担心,要马化腾联系科大讯飞。其旗下的软件“讯飞语点”与“讯飞语音助手”、和中移动联合的“灵犀”隶属于科大讯飞的“移动互联网事业部”。该事业部是科大讯飞旗下六大事业部中唯一参与To C业务的,也是科大讯飞最年轻的事业部。

这样半官方的背景使得科大讯飞一直被认为是“慢吞吞”的科技公司,科大讯飞主攻语音识别和语义处理,缺乏人工智能分析能力。

百度和搜狗则是后起之秀。语音识别是一项难度非常大,对技术积累要求很高的技术。但两者凭着多年的搜索数据积累以及服务数据积累建立了自己的优势:搜索引擎起家的语音识别技术能够引入许多开放的数据,比如天气预报、航班信息、美食数据等。再者,多年对用户使用习惯的分析能够使厂商建立自己的知识图谱系统,做到精准演化推算。这一点连Siri也做不到。

而冲动、智能360和盛大语音、云知声则是完全的新秀。

盛大语音和云知声更多投入在前端的语音识别上,罗永浩的锤子ROM演示时使用的就是云知声的技术,从演示效果来看,虽然受到ROM不稳定造成的干扰,但其表现仍然亮眼。而虫洞和智能360则更多在后端发力。

纵观这几家语音识别技术公司,科大讯飞虽然凭借多年的技术优势取得了一定优势,但互联网各大公司都颇不愿意将这么重要的新业务假手外人。腾讯之前就曾澄清,为微信提供技术支持的并不是科大讯飞。

搜狗和百度熟悉用户市场,长期面向一线用户的经验让他们更容易开发出直接面向用户的产品。再者,百度地图和语音识别技术的结合已经开始,后续能够产生多大能量还有待时间验证。

上一篇:白宫“好基友”:基辛格&罗斯福 下一篇:决战浏览器“红海”