您所在的位置:福建记协> 聚焦 > 正文

人工智能把"黑科技"变成现实 聊着天连通全世界

2016-12-13 10:42:53  来源: 经济日报  作者: 若 瑜  
视频加载中...

原标题:人工智能:聊着天连通全世界

上图百度语音的特点是为合成语音“加入情感”。《读者》杂志使用百度的情感语音开发“听书”功能,为农村的留守儿童、老人以及不便阅读的残障人士提供近似真人朗读的听书体验。

下图科大讯飞已经连续11年获得全球语音合成大赛冠军,语音合成的普通话比大多数人都要标准自然。除了能跟汽车无障碍沟通的“飞鱼助手”,讯飞的电视机操作系统也已经广泛应用。本报记者 佘 颖摄

想象一下,你坐在车里,对着空气说,“我想在附近找个地方吃饭”。你的车会立即回应说“已为您找到附近10个餐厅”。你接着说:“我想吃火锅,还想看场电影。”汽车会筛选出周边有电影院的海底捞大钟寺店。如果你说现在前往,导航就会立即开始线路规划。

注意,整个过程,你不需要说类似“嘿,siri”这样的唤醒词,也不需要动手进行任何操作。对于开车过程中经常冒险调整导航线路的司机来说,这套名为“飞鱼助手”的语音操作系统简直是梦寐以求的行车神器。

现在,讯飞、百度等企业的人工智能已经把科幻片一样的黑科技变成了现实。不仅汽车,电视机、电冰箱、电灯,任何你能想到的电器都能跟你愉快地聊天,并按照语音指令完成各种操作。

所听即所见

世界第一的智能语音是什么样

计算机时代,输入的主要工具是键盘。人工智能时代,语音输入成为主流。而在这方面,中国走在了世界前列——科大讯飞公司已经连续11年获得全球语音合成大赛冠军,百度语音也在今年被MIT科技评为2016年十大突破性技术之一。

目前,两家公司对外公布的语音识别率都是97%。这意味着什么呢?

百度首席科学家吴恩达讲一口软糯的美式中文,记者注意到,当他说到“长段语句”时,最开始系统误听成了“长男语句”。但是经过两三句话后,结合上下文的“音频切分”“切成短的去识别”等内容,系统自动将“长男语句”更正为“长段语句”。

讯飞的语音识别同样达到了高精度。当讯飞集团董事长刘庆峰用带着浓重口音的普通话快速演讲时,显示屏不仅实时出现了中文,还能同步翻译成英语、维吾尔语、日语、韩语等十几个语种。

毫无疑问,新技术已经为人工智能装上了一对堪比真人的“耳朵”。不过机器能听人说话只是第一步,要实现无障碍的语音交流,还需要系统会说话,而且要像真人一样说话。

讯飞的普通话语音合成系统达到了4.5分。也就是说,讯飞语音合成的普通话,比大多数人都要标准、自然。公司在此基础上发展了特殊音色,想让机器给你模仿一段郭德纲的声音或者模仿一段林志玲的声音都没有问题。

百度语音主要聚焦在为合成语音“加入情感”,目前可接近真人发声效果。现场测试表明,57%的用户无法区分真人语音与合成语音,基本可代替真人讲故事。《读者》杂志使用百度的情感语音开发“听书”功能,为农村的留守儿童、老人以及不便阅读的残障人士提供近似真人朗读的听书体验。