5月14日,新一届百度技术沙龙在上海举行。这一次,数百位观众迎来了百度“智能语音和大数据护航车联网解决方案”的主题分享。然而在感受了互联网为汽车行业带来的全新动力之后,会议现场的小伙伴们也近距离的感受到了百度语音技术这一超级“黑科技”——它不但能够助力搭建车联网系统,成为支撑下一个时代汽车控制的基础技术,还展示了全方位改造所有电子设备与人类交互的逻辑,堪称通过技术驱动未来加速到来。
在百度技术沙龙的交流中,有开发者表示以往接触的车联网系统虽然理论前景很美妙,但实际的打开率很低,最根本的问题在于“操作入口不简单、不流畅”。无论是通过手机打开还是进入车载终端,功能上已经做到了相对丰富,但继承自手机的用户交互逻辑对双手依赖太高,用户对语音输入的准确率还有疑问,无法满足对安全性要求超高的行车环境。
而这正是百度语音技术“黑科技”的用武之地:百度车联网研发及产品之所以能够在国内处于领先位置,除了百度丰富的大数据资源、以及与车生活相关的诸多强势应用外,其在语音技术、尤其是中文语音识别领域独领风骚,才是其取得成功的关键。
2011年时,百度语音引入深度学习技术,错误率降低20%-30%,成为语音技术领域的一个具有标志性意义的重要进展;2014年,著名人工智能专家、百度首席科学家吴恩达及其团队发表论文,通过双向循环神经网络建立起的百度Deep Speech系统,在语音识别的准确率上超越了Google和苹果等硅谷巨头;2015年,百度研发出基于多层单向LSTM(长短时记忆模型)的汉语声韵母整体建模技术,并成功把连接时序分类(CTC)训练技术嵌入到语音识别传统技术建模框架中,使语音识别相对错误率降低15%,使汉语安静环境普通话语音识别的准确率接近97%。
产品上的不断进步,带来的是用户对百度语音技术的认可,应用到百度搜索、度秘、百度地图等产品中的百度语音频繁被用户调用。2012年初时,百度语音技术流量仅为6位数,但在2015年起百度语音流量迎来爆发式发展,截至2015年12月百度语音流量过6000万,而到2016年4月10日,百度语音流量第一次单日过亿。这历史性的一刻表明,使用语音操作软件、调用信息,已经成为中国网民的一种习惯,互联网与用户的交互模式正在发生根本性转变。
而语音技术的更大魅力,在于像VR一样的天生“未来属性”。就如同iPhone对非智能手机的彻底颠覆一样,VR和语音输入毫无疑问将会彻底改变用户与设备的交互模式,摆脱对双手的依赖,转而采取声音输入、输出信息。
为了将语音技术以更快的速度、更多的场景、更丰富的形式走近用户,百度于近期上线了百度语音广播开放平台,使语音这一原本高门槛、高技术含量的“商业产品”改头换面,成为了能够供任何媒体甚至任何用户自由使用的“用户产品”。通过百度语音广播开放平台,任何人都可以将原本晦涩的文字转换成语音,将“阅读”改变为“聆听”,极大的扩大媒体、自媒体等的受众群体,还能够增加用户获取信息的场景。原本只能在案头完成的阅读工作,通过百度语音广播开放平台就可以利用在公交车、地铁、出租车、自驾、步行等等碎片时间来收听,再也不用将视线完全投在手机屏幕上面。
截至目前,百度语音广播开放平台已经广泛应用在微信、今日头条、喜马拉雅等第三方媒体平台中,而抢先合作的媒体类型也多种多样。新闻、笑话、IT资讯、糗事、小说、故事、股评、技术等原本无法通过语音展现、或语音展现成本很高的媒体,都通过百度语音广播开放平台获取了“语音”的全新能力。
据统计,参与测试的数十个微信公众账号加入语音播放模块后,平均阅读量增长了30%,阅读场景的扩大,使得读者增长速度也有了显著增长;在喜马拉雅上,已经出现了数十个由普通媒体工作者运营的“公众账号”,总订阅量在一星期的体验时间内就已过万。
在历史的长河中,技术的突破会造成一个又一个巨大的变革,但对于几十年的人生来说,技术的突破往往却会像普通的日子一样不易察觉。如今,百度已经握住了通往未来的“技术之钥”,这家巨头将在不经意之间,让属于全世界的未来更快到来。