寻找下一只AI独角兽

时间:2022-07-21 03:01:24

5月27日,乌镇人机大战,柯洁不敌AlphaGo,0:3战败,却让毫不意外。无论是职业棋手,还是人工智能的业界专家,大都在赛前给出了一边倒的预测,大家也已坦然接受机器超越人类的事实。

仅在一年前,被誉为“世纪之战”的李世石对战AlphaGo令人工智能(AI)进入公众视野。彼时,VR市场颓势已现,渐入谷底。AI概念的及时出现拯救了寥落许久的资本市场,凛冽的“资本寒冬”一度回暖。根据CBInsights的数据,2016年,全球人工智能领域的投资数量达到698笔,是2012年的近5倍。而在国内,BAT带头布局,创业项目四起,一时间全民AI,2016年也因此被称为“人工智能元年”。

潮水退去,才展现出行业的本来面目。“有一些泡沫,但没有‘百团大战’、O2O那会儿那么多。”创新工场技术副总裁、人工智能工程院副院长王咏刚告诉《21CBR》记者。

“扎实”、“踏实”是众多投资人谈及人工智能时提到的关键词。对创业者而言,技术的重大突破、庞大的用户市场以及多方政策的利好,似乎预示着人工智能的商业春天才刚刚开始。然而,要想站在下一波浪潮的潮头,成为这场堪比工业革命的时代获益者,既要比拼硬实力的突破,也依仗对行业的理解,二者缺一不可。在人工智能的商业化进程中,脆弱的科学家式创业将难以冲破重重阻碍。

李开复重仓

当下提及人工智能,不能不关联至创新工场。2016年,这家专注于Pre-A到C轮的早期投资机构重仓人工智能,投资相关领域创业公司超过30家。早年研究语音识别的创始人李开复身体力行,一举一动不离人工智能:演讲、出书、为投资公司站台、成立人工智能工程院。直到今年初,李开复公开表示:“能投的已经不多了。”

王咏刚告诉《21CBR》记者,人工智能尚处在行业发展的早期阶段,“我们看好整体的发展趋势,但现阶段项目的绝对数量是少的,找好项目相对来说也就困难一些。”对创新工场而言,好项目各有各的好,不投的项目归结起来则离不开三个方面:技术、团队和模式。

第一类是技术令人难以信服的概念炒作式项目。“开复就是搞人工智能出身的,我之前在谷歌工作,接触的项目比较多。有的创业公司说得天花乱坠,实际技术上是做不到的。”对于技术本身的发展趋势、在哪个领域能够解决哪些问题,创新工场自信在国内VC界的判断是较为准确的。

其次,对于纯科学家团队创业,由于不具备足够的商务落地渠道,“我们也会非常谨慎。当然不排除有的科学家确实技术很好,我们就帮他做孵化”。至于商业模式,在当下的国内互联网企业中,阿里、腾讯纷纷成立人工智能实验室,百度索性称自己是一家“人工智能公司”。那些巧妙避开了巨头现有业务冲击,自身具备不可复制和可持续性的创业项目,成功几率自然更高。

元Z资本合伙人陈洪亮认为,在人工智能这一强技术领域,图像和语音是已被验证的两个赛道。过去10年间,得益于深度学习算法和GPU等计算设备的发展,计算机视觉技术快速落地金融、安防、医疗等B2B领域。相比之下,语音技术偏重在客服、车载、智能家居等消费端领域,背后也有赖于语音识别、声纹识别等工业级算法的日趋成熟,“未来在这两块,将会出来一批比较扎实的成果。”

2014年底创立的Rokid(若琪)是元Z资本在语音赛道的代表项目,从天使轮到B轮一路跟进。5月15日,Rokid旗下第二款产品、名为Pebble(月石)的智能音箱在天猫开售。用户运用语音指令可以操控音箱播放音乐、报告天气,甚至控制家中的照明、电视等智能家居设备。Pebble意在通过日复一日的“自我学习”,无限趋近用户的偏好习惯。

相比用智能家居APP开关灯,一条语音指令显然要简单得多。无论是手机还是PC,都需要人去适应机器,声音似乎是人与机器更自然的交流方式。从天气到音乐,从新闻播报到童话朗读,元Z资本相信,声音将作为一种人机交互的无形界面,成为下一个平台级入口。而新入口的诞生,将带来变革性的机会。

不过,在陈洪亮眼中,对领域知识的依附使得创业初期的技术优势正在减弱,“行业细分,客户分散,即便有强悍的技术背景,过了一年左右的时间窗口,最后比拼的还是对商业的理解。”从这个角度而言,人工智能更以行业为导向,而非纯技术项目。“是行业+,不是AI+。”陈洪亮称。

这也是创新工场成立人工智能工程院的目的之一:源源不断向创业者推送产业项目,挖掘适合团队技术的商业模式并加以验证,为创业科学家寻觅商业合伙人,从而帮助团队尽快步入创业正轨。王咏刚表示,“商业合伙人具备的行业经验,必须令其懂得如何在行业里面拿到项目,纯科学家式的B2B创业很难。”

4月,在一次企业家公开活动上,北极光创投创始人邓锋面对两位业界人士发问:“讲究强关系的B2B行业会否影响人工智能的游戏规则?”依图科技CEO朱珑当时回应:“(关系)是现状,但产品真的能打动人。”或许可以这么理解,“关系”在某种程度上也代表着,你比别人更了解行业。

对于AI创业者,B2B意味着赚钱的难度和门槛更高了。不过,收费的价值也因此体现。在陈洪亮看来,一旦客户为此买单,其在组织机构内部能够被更高效地推行,避免沦为乏人问津的免费试用。王咏刚也相信,移动互联网的免费打法在人工智能时代将难以延续。

尽管业内少有公司公布自己的营收情况,但投资人大都表示,人工智能正在加速变现,“有些2B的项目,盈利已经很好了。”对于投资人和创业者而言,变现不仅仅代表了财务模型的转正,也意味着终于赢得了市场与用户的认可。

四家独角兽

拥有大数据支持的金融、安防和医疗,被视为是人工智能的下一个机会,也成为过去一年资本聚集的行业。国内计算C视觉赛道的创业公司接近30 家,人脸识别领域更是出现4 个独角兽――旷视(Face++)、商汤、依图、云从科技,纷纷完成融资。2017年,在工信部的“独角兽”企业榜单中,旷视的市场估值突破20亿美元。

旷视市场部副总裁谢忆楠告诉《21CBR》记者,2013年,旷视开始专注于人脸视觉的产品通用化。“当时主攻三方面的算法――人脸检测、关键点标注和人脸识别,团队基于行业做了很多技术上的研究。”2013-2014年,旷视拿下3项世界计算机视觉竞赛的第一名。2015年,在德国汉诺威IT博览会上,马云向德国总理默克尔演示Smile to Pay扫脸技术,就是由旷视提供核心算法,将刷脸支付模块内置到支付宝客户端中。

目前,旷视的Face++人工智能开放平台面向中小银行、地产园区、IT企业及独立开发者开放人脸、图像、文字等识别能力。其中,人脸识别API的日均调用量超过2400万次,是目前世界最大的人脸技术平台。旷视方面声称,其人脸识别技术在国内互联网金融领域拥有80%以上的份额。

旷视的快速崛起得益于技术和市场的多重利好。一方面,深度学习算法在过去10年间取得重要突破,给计算机视觉的大规模应用奠定了基础。另一方面,2014年,国家实名制工作相继在网络、电信和金融领域全面铺开。2015年,互联网金融雨后春笋般涌现,通过人脸识别技术完成远程开户和身份验证,成为各方普遍采用的技术手段。计算机视觉创业公司步入商业化时期。

谢忆楠表示,公司在商业化前期关键性地走通了“数据―算法―产品―技术”这一循环,面向行业的通用服务乃至更为深度的定制化方案得以落地。

而另一家独角兽公司――依图科技则啃下了安防这块骨头,其“蜻蜓眼”人像大平台服务于全国上百个地市的公安系统,是全国唯一拥有十亿级人像库比对能力的公司。

利用技g优势,快速切入一两个行业,从而形成深度合作,是上述独角兽公司早期脱颖而出的共同原因。在现有技术已然成熟、各家准确率纷纷达标的情况下,如何基于真实痛点挖掘场景,提供定制化且可复制的解决方案,成为打破传统行业壁垒、快速拿下市场的关键。

而在语音赛道,技术成熟也意味着消费级机器人市场的打开。Rokid并非头一个玩家,却自带网红体质。其迄今为止的两款产品,在未设独立展位的情况下,连续两年获得CES(国际消费电子展)创新类奖项。创始人Misa(祝铭明)在江湖上见首不见尾,研究团队的阵容却堪称强大:位于北京和旧金山的两个实验室由数十名全职博士科学家组成,来自中科院、哈佛、斯坦福、伯克利等一批海内外顶尖院校。

Rokid北京实验室负责人高鹏告诉《21CBR》记者,智能音箱Pebble的核心功能体验分为三类:音乐、儿童读物等内容服务,天气、闹钟等工具类服务,以及智能家居控制服务。凭借600万首320K码率高品质曲库和喜马拉雅FM等对接资源,Pebble向用户提供的内容涵盖音乐、新闻、电台、相声、戏曲和脱口秀等。一切体验从用户对其说出激活词“若琪”的一刻开启。

激活词“若琪”的设计和打磨用了将近一年时间。高鹏介绍,激活词的识别错误率随着音节的加长而降低。目前国内外同类产品的激活词大多设置在3-4个音节,而双音节的高激活率很难成功。在经历“若小琪”、“Hi,若琪”的反反复复后,研究团队还是通过算法验证实现了双音节。在公开的试用报告中,Pebble多个维度的人机交互体验超过了谷歌推出的业内首款产品Google Home。

而在声音定位上,祝铭明早年从威尔・史密斯主演的科幻电影《我,机器人》中的机器人女声获得灵感。高鹏坦言:“当时根本没有那样的现成声音。”团队开始在市场上寻觅适合的音色,同时自主研发TTS(Textto-Speech)语音合成技术,并由专门团队对声音处理和内容反馈进行设计,“若琪”最终被定位为一个温柔、幽默、聪明且不失个性的女声。

通过开放基于网络协议的API标准,Rokid还将飞利浦、小米、lifesmart等品牌纳入到其智能家居生态链中。在几乎未做投放、线下推广的情况下,开售三个星期的Pebble在天猫官网的销量逼近千台。祝铭明对媒体表示:“产品日活跃用户数量超过50%,用户使用时长平均超过1小时。”6月8日,Rokid宣布开通全渠道销售,Pebble登陆全国500多家经销商门店。

在Rokid的品牌文案中,“自然”是多次出现的一个词。产品负责人向文杰对此表示,语言、视觉和触摸是人类最自然的交流方式,“未来的产品方向就是向用户提供最自然的交互体验,希望让用户感受到,我们的产品是有温度的家庭成员,而不是一台冷冰冰的机器。”

智能的未来

人工智能的商业春天才刚刚开始。

埃森哲的研究结果显示,到2035年,人工智能将有望令包括美国、日本在内的12个发达国家的经济增长率翻番,劳动生产率增长40%。在谢忆楠看来,目前国内人工智能市场仍处在存量消化阶段,保守估计仍有七成左右的垂直行业尚待开发,在教育、交通、社保等领域潜力巨大。朱珑则表示,过去一年间,性能成倍提升的人工智能技术不断解锁应用场景,人类的想象力已经跟不上人工智能的发展速度。

机器的迷人之处在于智能未来。业内普遍认为,无人驾驶将是未来人工智能的重要落点。在创新工场的投资策略里,未来5-10年的投资项目中有相当一部分投给了无人驾驶。“机会太大了,将是万亿级的市场,且很难被个别巨头垄断。”王咏刚表示,无人驾驶是一个完整的产业链,从感知、决策、控制等多个模块的算法,再到各类传感器,乃至汽车共享和交通改造,有着巨大的想象空间,远未到技术收敛的阶段。

另一个充满未来感的方向则是沉浮数年的消费级智能硬件。亚马逊在6月初宣布,旗下智能音箱Echo的年出货量预期突破1000万台;苹果则被传即将在年度开发者大会中一款由语音助手Siri控制的智能音箱。国内方面则早有叮咚、小智者激起的浪花,“千箱之年”的说法因此在业内盛行开来。

Rokid将自身定位为一家科技公司而非硬件厂商,著眼于更宏大的语音技能生态建设。高鹏表示,Rokid将在近期推出开放平台,有望接入外卖、快递、叫车等来自第三方开发者的扩展功能,为用户提供更为丰富的语言技能应用。

人工智能从来就不是一场轻巧肆意的游戏,参与者面临的仍将是重重阻碍。

首先是巨大的人才缺口。陈洪亮称,未来很长一段时间,人工智能的马太效应将体现在人才方面。李开复提过一组数字,全球当下的人工智能专家不超过7000人,在中国这个数字可能是700个,且大多被BAT收入囊中。这也是创新工场成立人工智能工程院的一大使命:通过人才招聘和高校共建,同时加强与政府部门、国内外高科技公司的合作,培育和孵化高水准的人工智能技术团队。

数据壁垒则是人工智能创业打破大公司垄断、完成行业深度融合的另一项难题,一大原因在于数据安全泄露和用户隐私破坏。王咏刚认为,人工智能的发展与数据安全不是相互撕裂的关系,而是博弈均衡。

而最大的困难还是来源于技术本身。深度学习理论沿革每隔10年左右就会经历巨大变化,每一次的技术递进也推动着人工智能的工业化进程,新商业模式因此而生。“前沿技术当然对一线业务开展有着指导意义。”王咏刚说。

人工智能始终是强技术驱动的领域。谢忆楠称:“从算法、软件、硬件到解决方案,每一步都要靠硬实力说话。纯商业模式的东西,天花板很明显。”计算机视觉领域的四个独角兽之一云从科技CEO周曦也公开宣称:“人工智能是有门槛的,短期之内只要自己保持足够快的进步速度,别人很难对你构成威胁。”

王咏刚强调,深度学习不等于人工智能。强化学习技术由于新版AlphaGo的使用而为外界所知,由于不需要大量训练样本,而是直接从实验和错误中学习,强化学习相对而言更接近人类的思维模式。此外,谷歌、阿里等企业的内部团队也开始测试深度对抗网络技术。作为人工智能发展的新热点,王咏刚看好这些技术从实验室阶段向工业级场景的发展走向。

人工智能之所以令人着迷,在于其正向的资本模型、可预见的商业化成果,以及关乎未来的无限想象力。王咏刚表示,人工智能能改善当前优质医疗资源不足的现状,“即便有层层的阻力和壁垒,人工智能哪怕能够前进一点,都将是人类极大的福音。”

上一篇:天津市养老院智慧养老进程中的障碍及对策 下一篇:贾跃亭必会“复辟”