在刚刚结束的 Voice Conversion Challenge2020 国际音色转换大赛中,科大讯飞与中科大语音及语言信息处理国家工程实验室联合提交的系统,在「同语种转换」与「跨语种转换」两项任务上,摘下 8 项指标 7 项第一,成功卫冕。这个系统也是本次比赛在「相似度」和「自然度」上,受日语、英语两组测听人共同认可、唯一一家超过 4.0MOS 分的系统,即达到真人说话水平。

5213088a876b4d93a60925eb36beb4bd.jpg

今年的比赛由日本国立情报学研究所(NII)发起,吸引了东京大学、名古屋大学、中国科学技术大学等学界、业界上百家单位报名。与以往不同,本次比赛除了传统的同语种转换任务,还第一次包含了跨语种转换的任务。同语种转换是机器通过语料训练,模拟出发声人的声音特点和神韵,达到所谓的 “变声”效果;而跨语种转换可以说将难度提升了不止一个台阶,简单来说是机器通过非平行的语料训练,模拟出发声人 “说”其他国家语言的声音,是 “变声”的更高阶展示。针对本次比赛的不同任务,科大讯飞专门研发了不同的技术路线,以保证系统优势,均取得了优异成绩。

据悉,这项 “声音复刻”技术可以用在变声、多语种虚拟主播、虚拟偶像等各个领域。

无独有偶,在国际比赛摘得桂冠的科大讯飞,最近提出的 A.I. 数据质量国际标准项目《人工智能 - 分析和机器学习的数据质量 - 第 4 部分:数据质量过程框架》顺利通过 ISO/IEC 国际标准化组织立项,将助力人工智能数据标准化建设,提升人工智能数据质量,推动全球人工智能产业高质量发展。这也是中国首个 ISO/IEC 人工智能国际标准项目获批立项。

该标准将由科大讯飞专家作为项目负责人与全球各国专家共同制定,这也是中国首个牵头制定的 ISO/IEC 人工智能国际标准项目。此前,由 ISO/IEC 批复立项,科大讯飞专家任项目负责人的中国首个牵头制定的 ISO/IEC 人工智能国际标准技术报告 ISO/IEC TR 24372《人工智能 - 人工智能系统计算方法概述》也正在制定中。

321df4ff80094bb6970bba1b5fb2c2eb.jpg

701a27917b844925bb20bb94b62b0d6b.jpg

此次科大讯飞提出的 ISO/IEC 5259-4《人工智能 - 分析和机器学习的数据质量 - 第 4 部分:数据质量过程框架》经过与各国专家近一年半的研讨交流和历时三个月的国家成员体投票,成功成为 ISO/IEC 人工智能数据质量标准体系中的一部分,将联合德国、美国、日本、韩国等国家共同为全球人工智能产业打造数据质量的标准依据。

人工智能的落地与进阶在于深入行业,而行业大数据作为直接影响 A.I. 模型和系统的因素,其质量在很大程度上也决定了人工智能发展的质量。当前,数据已经被认为是新一代人工智能,特别是基于深度学习的人工智能系统中最重要和最关键的基础要素之一。对于不同学习方法和不同应用领域,在构建、训练、评估和迭代人工智能系统的过程中,数据质量将是人工智能开发者、使用者、评估者和监管者首要考虑的问题之一。

21dc64ee2c404441b90c463f70489688.jpg

未来,A.I. 赋能各行各业并深刻改变世界的生产和生活方式的条件之一,是需要源头技术、行业大数据和产业生态的融合,这对于面向 A.I. 的数据质量提出了更高的要求。一直以来,科大讯飞在 A.I. 技术创新和应用落地过程中,坚持将高质量数据作为大规模应用的重要驱动之一,促进 A.I. 产品和服务更可用、更可靠、更可信,为社会创造更多价值。