语音播报
日前,科技部办公厅印发了通知文件,正式启动认知智能国家重点实验室的建设工作,批准依托科大讯飞股份有限公司(以下简称科大讯飞)建设认知智能国家重点实验室。科大讯飞官方公告称,这是我国首个在人工智能高级阶段——“认知智能”领域的国家级重点实验室。
“认知智能包括语义理解、知识表示、逻辑推理等一系列相关的工作。”科大讯飞研究院院长胡国平在接受《中国科学报》记者采访时解释说,语音、语言不分家,讯飞在做语音识别的过程中“自然而然更早地”开展了很多关于认知智能方面的研究。“无论在医疗和教育、司法及人机交互,仅有语音识别是不够的,语言的理解、知识的‘活学活用’都会涉及到。”
早于11月15日科技部召开的新一代人工智能发展规划暨重大科技项目启动会上,就传出科大讯飞将承建智能语音国家新一代人工智能开放创新平台。仅仅一个月后,“认知智能国家重点实验室”也获批建设,这一方面彰显了科大讯飞在智能语音技术上的深厚积淀,另一方面,也预示着科大讯飞将引领和推动移动互联网时代下输入与交互模式的变革。
智能语音的“金字招牌”
今年,科大讯飞迎来了自己十八岁生日。十八年来,科大讯飞坚守在智能语音及人工智能领域,坚持源头技术创新,目前已发展成为亚太地区最大的智能语音及人工智能上市公司。科大讯飞执行总裁胡郁告诉《中国科学报》记者,从创业之初,科大讯飞就致力于让机器“能听会说”“能理解会思考”,已经先后有多项核心技术处于全球领先地位。
在科大讯飞公开发布的资讯显示,自2008年至今,科大讯飞连续在说话人识别、语种识别评测国际大赛中名列前茅,近几年来的成绩尤其让人眼前一亮:2014年,科大讯飞首次参加国际口语机器翻译评测比赛,即在中英和英中互译方向中以显著优势获得第一;2015年,在中英机器翻译评测大赛(2015 NIST)中,科大讯飞获得“人工评价翻译结果可用性比例最高”的成绩;2016年,科大讯飞在国际语音识别大赛(CHiME)上取得全部指标第一。
不仅在智能语音方面,科大讯飞在认知智能领域也早有斩获。2016年,相继获得国际认知智能测试(WSC)全球第一、国际知识图谱构建大赛核心任务全球第一;2017年,哈工大讯飞实验室(HFL)获得斯坦福大学发起的机器阅读理解挑战赛(SQuAD)第一名,这也是中国本土研究机构首次取得该赛事榜首;8月,在国际医学影像领域的权威评测(LUNA测试)上,科大讯飞获得平均召回率92.3%的检测效果,刷新了该评测的世界纪录。
通过多年的积累,讯飞在智能语音方面技术的领先性已经获得认可,成为这一领域的“金字招牌”。“这不仅体现在国际比赛中的领先,在应用方面,亿万用户的使用效果和体验也说明着一切。”胡国平对记者说,这也使讯飞赢得了科技部的信任:“依托科大讯飞能够把智能语音开放创新平台建得最好,能够为国家的人工智能发展助力。”
构建开放的产业生态
在智能语音产业生态构建方面,科大讯飞也一马当先。胡郁介绍说,科大讯飞率先发布了全球首个提供移动互联网智能语音交互能力的“讯飞开放平台”,并持续升级优化。截至2017年11月,讯飞开放平台的累计终端数已达到15亿,日均交互次数达到40亿,开发者团队数已达46万多个。
“基于讯飞开放平台,科大讯飞相继推出了讯飞输入法、灵犀语音助手等示范性应用,并与广大合作伙伴携手推动各类语音应用深入到教育、医疗、司法、智慧城市、客服等各个领域,引领和推动着移动互联网时代大潮下输入和交互模式的变革。”胡郁表示,在承建智能语音国家新一代人工智能开放创新平台的过程中,科大讯飞将通过“一个开放创新研究平台、五大开放创新服务平台”的建设路径,助力我国的智能语音及人工智能技术及应用达到国际领先水平。
记者了解到,胡郁所说的“1+5”包括建立人工智能产学研用开放创新研究平台,构建面向海量训练数据建设的基础数据资源平台,打造面向语音交互的“云+端”软硬件一体化开发平台,建设面向行业定制的人工智能定制优化平台,创建面向智能语音开发者的一站式服务社区,打造智能语音及人工智能的专业化众创孵化空间。
“开放创新平台首先是‘开放’——有想法的人或团队都会在平台上实施他们的各种思想、应用和创新。”胡国平向记者表示,从应用价值和技术成熟度角度而言,智能语音技术在人机交互、客服、智能家居、车载、玩具等领域都有非常广泛的应用场景。
胡郁告诉记者,开放创新平台的建设形成了“源头核心技术系统创新+应用创新+产品创新+微创新”的机制,将有利于我国“既取得人工智能技术集群上的突破,又有可能让AI技术落地应用、落在细小的各个领域上”。
进一步打开天花板
值得一提的是,跑在语音技术最前面的科大讯飞,也最早发现了智能语音技术落地的问题。
“在利用语音技术推动输入和交互模式变革的过程中,仍面临一些阻碍。比如多人对话等场景下的语音识别率虽然很高,但距离实际应用还有一些差距;语音识别技术在质检、安全等方面有很好的应用,但是对于人类所希望达到100%的识别率来说,从科研角度看肯定还有很多需要继续努力的地方。”胡国平还提到,这其中还有方言识别的难题:“特别是普通话人群难以听懂的方言,一定程度上会涉及投入产出比不高问题。”
科大讯飞目前推出了22种方言相关的语音识别系统,但对于那些音素体系与汉语不同的方言或外国语种,在成本问题上还没有很好的办法。
此外,胡国平还提到,认知智能是未来人工智能技术和产业化发展的方向:“科技部支持科大讯飞继续开拓在认知智能领域内的重大研究任务,体现了科学性和前瞻性。”他告诉记者,“认知智能有没有真正的突破,是这一轮人工智能热潮——包括产业化热潮——能不能进一步打开天花板、进一步形成更大规模的产业的关键技术所在。”
© 1996 - 澳门赌场 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002
地址:北京市西城区三里河路52号 邮编:100864
电话: 86 10 68597114(总机) 86 10 68597289(总值班室)
编辑部邮箱:casweb@cashq.ac.cn
© 1996 - 澳门赌场 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002
地址:北京市西城区三里河路52号 邮编:100864
电话: 86 10 68597114(总机) 86 10 68597289(总值班室)
编辑部邮箱:casweb@cashq.ac.cn
© 1996 - 澳门赌场 版权所有
京ICP备05002857号-1
京公网安备110402500047号
网站标识码bm48000002
地址:北京市西城区三里河路52号 邮编:100864
电话:86 10 68597114(总机)
86 10 68597289(总值班室)
编辑部邮箱:casweb@cashq.ac.cn