新华社北京12月11日电题:识别精确度超过95%智能语音技术让生活更简单
新华社记者胡喆
多部门合力打造国家级专家库,百度、阿里云、腾讯、科大讯飞等分别启动建设“自动驾驶、城市大脑、医疗影像、智能语音”4家国家新一代人工智能开放创新平台……近日,随着我国新一代人工智能发展规划暨重大科技项目的启动实施,我国在人工智能领域频频发力、引发社会高度关注。
作为在这四大领域当中走在前列的一隅,我国的智能语音识别技术有何“长处”?识别精确度超过95%的智能语音新技术又将怎样改变生活?
从60.2%提升到95%以上:语音识别已经“准出新高度”
连珠的妙语、闪烁的字幕……科大讯飞董事长刘庆峰在一次演讲中,向人们展示了智能语音识别技术和其应用所具备的“魔力”。刘庆峰在演讲的同时使用着最新的智能语音识别技术——可以让他演讲的内容实时以中英文双字幕的形式呈现在大屏幕上,反应迅速、几乎没错。
“基于‘讯飞超脑计划’,科大讯飞开启了一场以语音和语言为入口的‘认知革命’。”刘庆峰介绍,过去6年中,他们的语音识别技术准确率从60.2%提升到95%以上,已全球领先。
6年前,科大讯飞推出了全球首个语音云开放平台。目前,该平台的日处理次数达到40亿次。“在语音合成方面,中国已是国际上的领先者。”科大讯飞副总裁胡郁介绍。
刘庆峰认为,人工智能面临前所未有发展机遇,科大讯飞如果只做技术提供方,会处于一个相对被动和弱势的地位,所以提出了“平台+赛道”发展路径,将人工智能技术赋能给广大开发者,加快推广应用。
导航、医疗、公检法:多的是你不知道的“智能语音”
“我是罗永浩,你镇定一下,我要开始导航了。”这是高德地图罗永浩版本的导航声音片段。高德地图2014年首次使用语音合成技术实现明星导航,林志玲语音上线即引发轰动。随后,先后推出罗永浩等明星导航音。
近年来,随着人工智能热潮的袭来,以智能语音为代表的各类应用也层出不穷。如QQ阅读调用讯飞语音合成技术推出有声听书;虾米音乐使用讯飞语音识别技术,推出哼唱检索……
科大讯飞通过与公检法系统开展创新合作,使智能语音技术不断拓展着应用的新疆域。2016年在安徽开展的测试显示,人工智能判断诈骗电话的准确率极高;人工智能还充当起法庭书记员,经测试,智能语音识别参与庭审取得实际效果,庭审时长缩短30%。
在中部某省立医院门诊大厅,两台机器人格外吸引人。“您好,我是导诊机器人‘晓医’,很高兴为您服务。关于科室位置在哪,去哪个科室,还有就诊遇到的问题,这些都可以问我哦。”熟悉219个常见病和症状对应的科室信息,“晓医”可通过智能语音识别技术,每天服务近5000次。
“人工智能的关键是把复杂的世界简单化。”百度公司董事长兼首席执行官李彦宏表示,未来30年至50年,人工智能将成为推动人类历史进步的强大动力。
让未来充满“意想不到”:人工智能会否成“脱缰野马”?
按照业内人士的预估,未来不仅在我们已知的领域,在一些未知领域,“智能语音”技术也会带给人们许多“意想不到”的突破。
人工智能在“改卷子”方面的能力,就超乎了人们的想象。在江苏省的高考智能阅卷验证中,两个不同的人工智能语文作文阅卷分差小于7分,一致率达92.82%,比两位老师的阅卷评分的一致率高出5%以上;在湖南省研究生考试的智能阅卷验证中,两个不同的人工智能分别对英语作文进行阅卷评分,分差小于6分的一致率竟高达99.83%,比两位老师的阅卷评分一致率高出了4%以上。
据悉,教育部考试中心正联合科大讯飞建设人工智能联合实验室,在教育领域酝酿着更多“黑科技”的诞生。
自平台开放以来,科大讯飞基于这一平台的各类开发者数量由去年同期的20.2万增至45万,增长123%,语音云日均使用次数由25.7亿次增至超过40亿次。开发者们在平台将语音技术快速集成到产品中,让产品具备“能听会说会思考会预测”的功能。
专家指出,一方面要构建开放协同的人工智能科技创新体系,加强关键共性技术攻坚,增加人工智能创新的源头供给。另一方面,要培育高端高效的智能经济,围绕教育、医疗、养老等民生需求和热点难点,加快创新应用,促进人工智能与各产业领域深度融合,积极培育新兴业态,布局产业链高端,全面提升质量和效益。(完)
(责任编辑:张云文)