技术控,来自百度视频

时间:2022-09-21 11:10:17

技术控,来自百度视频

4月1日,百度给我们讲了一个高大上的愚人节玩笑,一鼓作气了四项“神技”:能甄别食材安全,帮助用户掌握食品信息的“筷子”――百度“筷搜”;能可视化还原梦境的百度dulife手环;对着手机吹一口气,就能检测出身体健康状况并得到专家诊断和健康指导的百度iBreath;以及能模拟触觉、嗅觉等感觉的百度视频4D触感技术――在介绍这项技术的视频里,姑娘因为通过屏幕“摸”到了都教授的脸而兴奋不已。而天真的网友在发现根本无法下载到“百度视频4D版APP”后,愤而在“百度知道”里留言道――“你,们,骗,我!”

有人说,四项神技的是百度工程师患上了集体臆想症。也有人觉得,这是个认真的玩笑,其中暗示了百度的发展大计。

百度当然是认真的――至少“百度视频4D”在这一天的玩笑中收获了百万级的点击和关注。

百度视频PC端搜索于2007年上线,百度视频移动客户端(百度视频App)于2011年。截至目前,百度视频App累计用户突破2亿,日均搜索播放量超过1亿次。但一般用户只把它看作是百度搜索框上方众多标签中的一个,或手机里众多视频APP应用工具中的一个――而实际上百度视频搜索是技术圈的产物,严格意义上来说,并非视频圈的玩家。

但在百度“大数据引擎驱动未来”的发展战略下,作为高冷技术控的百度视频搜索,如今有了更强的动力,“让用户在搜索视频时感受到技术带来的神奇变化”,也有了更强的欲望,通过大数据的挖掘来与娱乐行业深度互动。

我们有大数据,你知道吗'

“通过用户的搜索、浏览、观看等行为,我们可以知道任何影视内容在任何时候的受欢迎程度。”胡一川说。

作为百度视频技术负责人,胡一川在阐释百度视频的技术创新成果时提到,“用户每天在百度视频会进行数亿次的搜索、浏览和观看请求。借助搜索聚合技术,百度视频能打通百度贴吧、百度知道等平台,实现对大数据的全面汇聚。我们不仅可以知道任何影视内容在任何时候的受欢迎程度,而且,我们可以分析看这些影视内容的用户的特征,例如:用户性别、年龄、学历,包括这个群体中男女的比例、年龄的分布等等。在对视频用户的观看趋势以及行为轨迹清晰把控的基础上,借助大数据分析进行影视作品的市场决策、用户挖掘、营销推广,能够实现事半功倍的效果。”

直到今天,影视圈内外的许多人仍在津津乐道Netflix是如何利用大数据成就了《纸牌屋》――虽然也早有人指出,那不过是Netflix利用《纸牌屋》的成功包装出来的一个美丽故事。但不管大数据与《纸牌屋》的制作有无关系,2013年,大数据技术的崛起与其热情洋溢的自我宣扬,确实令中国影视行业对数据的认识有了一次“”般的进步,并且极大地提升了这个行业对大数据应用前景的期待。

虽然百度暂时还没有向影视行业提供数据,但大数据未来将如何发展,很多人都把殷殷期待投向了百度。同时,技术和人才也都在涌向百度。

在加入百度前,胡一川是“今晚看啥”的联合创始人兼CTO。“今晚看啥”于2012年6月上线,定位为电影搜索及个性化推荐引擎。2012年11月下旬,“今晚看啥”由百度收购,并入百度垂直搜索业务体系。胡一川则开始全面负责百度视频的数据挖掘与个性化推荐相关项目的规划、设计与实施。而“今晚看啥”所做的事情,与百度视频搜索如今正在做的事情,颇有共通之处。当然,后者的格局、野心都更大。

极速,低流量,并且知道你想看什么'

在4月份的技术分享会上,百度视频了几项能够提升用户体验的创新技术成果,包括极速视频搜索技术、视频连环画播放技术、百度视频影视基因库及其钻研已久的个性化推送技术等。

百度视频想告诉大家,在你点击搜索按钮之前,搜索行为其实就已经开始了。极速搜索技术能够通过百度的大数据计算能力预测用户的搜索结果,请求和获取相关信息。在保证搜索的可靠性和稳定性的基础上,极速搜索系统可将用户的视频搜索请求时间缩短至原来的十分之一,并且拥有非常高的预测准确率。

受网络环境限制,用户观看视频时经常会出现缓冲不及时的卡顿情况,影响用户的观影体验。针对这一现象,百度视频开发了“连环画模式”技术,这项技术会根据当前视频的信息截取视频的关键画面,对关键画面进行排序,生成图片库。在因视频缓冲不及时、无法正常观影的时间段,百度视频会根据播放请求,从画面库中读取对应的关键画面进行播放 ,以“连环画”的形式展现视频内容,让用户在消耗最少流量的情况下可以用最短的时间获取视频的基本信息。据悉这项技术已申请专利,预计很快将正式上线。

百度视频“影视基因库”的建立,则类似于Netflix对电影作品所做的“微类型”分类。但百度视频的操作方式与Netflix迥然不同。据悉Netflix 为旗下所有电影作品共计配置了七万多种标签组合,并雇佣了大量人力经过训练之后来为每一部作品贴标签。百度视频则是首先咨询了影视行业内的研究人士及深度用户,了解并确定了有哪些标签可以用于描述视频内容,然后再采用技术算法来给视频贴标签。

比如,当用户搜索某个类型的视频时,百度视频的初期反馈结果不一定能够满足用户的需求。比如用户搜索“高智商科幻电影”,百度反馈的结果可能只是那些描述中带有“高智商”或“科幻”的电影。但搜索了这个关键词的用户,最终还是会得到某些搜索结果。如果某个结果是错误的,那么用户在点开视频后就不会完整观看视频(很快就会关掉),这一动作就证明了这部电影肯定不符合“高智商”、“科幻”这两个标签中的一个。

通过建立完整的“影视基因库”,结合百度的自然语言处理技术,百度视频就能够智能理解用户的需求。比如用户搜索“和动物有关的电影”时,系统会智能推荐《忠犬八公的故事》、《驯龙高手》等获得海量用户好评的动物相关影片。甚至当用户不知道想看什么影片时,都可以搜索“好看的电影”,系统将从观影人数、评分高低等维度给用户推荐优质影片。

同时,用户的搜索行为分析证明,很多用户会通过不断增加关键词的方式来寻找自己想要看的视频。例如,用户会先搜索“郑多燕”(韩国健身明星,减肥操辣妈),然后再搜索“郑多燕 甩油操”、“郑多燕 丰胸收腹”等关键词的组合,来寻找想看的视频。同时,从数据中发现,对于一个给定的关键词,用户会对某几个特定关键词组合特别感兴趣。基于此,百度视频可以事先将这些特定的关键词组合挖掘出来,将视频进行结构化的标记和分类。在用户搜索一个关键词时,百度视频会将与其相关的关键词组合展现出来,令用户更加便捷地发现想看的视频。数据显示,经过智能推荐,视频列表的点击率高于传统列表页3倍以上。

此外,百度视频App通过分析用户在手机、平板上的搜索、观看视频的行为,还为用户自动发送个性化的消息推送。例如:当用户最常观看的电视剧有最新集时,百度视频App会自动给用户同步推送;如果用户经常观看新闻类短视频,百度视频App会及时提示国内外的重点新闻;而对于体育迷来说,百度视频App则会将重大赛事第一时间呈现给用户。百度视频期望运用大数据技术,为每位用户打造出属于自己的个性化视频观看平台。

百度开放数据合作'

如今,百度已将大数据升级为公司战略。

在4月24日的百度技术开放日上,李彦宏为百度大数据引擎站台,百度将用数据合作的方式来帮助和改造传统行业。对此,互联网观察者罗超解读称,“百度将大数据引擎做成一个开放平台,形成标准的接口,让每个行业不同企业可以根据自身需求各取所需。而它的首要目的是获取数据,然后是考虑变现。变现方式可能是增值服务、收费云、数据分析结果、技术咨询等方式,这将改变百度盈利模式过渡依赖‘搜索广告’的现状”。

罗超指出:“大数据已经给Google每天带来2300万美元的收入,一年约为82亿美元。这已经远远超过百度2013年51亿美金的年收入了。因此,如果百度大数据引擎能够成功,很可能会为之带来源源不断的数据以及现金流。”

凭借在大数据方面的长期积累和沉淀,如今,百度终于决意开辟新的战场。

作为百度系的一员,百度视频的大数据也将为用户/客户提供从智能推荐到数据分析的多面服务。百度视频未来产生的数据,对于影视产业链各个环节的市场行为,也必将产生重要影响。但前提是,“百度视频能在未来充分利用好百度的大数据资源,恰到好处地运用到用户体验的改善上去,让用户习惯于把百度视频当作入口,精准找到自己想要的影视内容,甚至精准找到UGC内容”。互联网分析师葛甲认为,“这个目标实现起来任重而道远,但却是百度视频唯一的正确方向,也是大数据从漂浮状态落地的为数不多的落脚点”。

据悉,百度近期已低调上线了一款新的大数据产品“百度预测”(http:///),目前可提供景点舒适度预测、城市旅游预测、流行感冒预测等信息查询,未来则有望推出电影票房预测等服务。可以肯定的是,未来互联网的发展必将极大地改变影视内容的制作、观赏和视频消费市场的分享。大数据在其中的作为则更加令人期待。

上一篇:在婚礼绽放专属爱情梦想 下一篇:3D电影:冰火两重天