科大讯飞正建立起智能应用生态圈

作 者:钱丽娜 来 源:商学院发表日期:2017-07-17

  在中国,要证明“我妈是我妈”可是个解不开的死结。若是子女与父母不在同一户口簿上,简直不知道从哪里下手。科大讯飞在智慧城市的解决方案中利用声纹和人脸识别技术,尝试打通公安、民政、社保、教育等58个部门781类数据,只要刷脸听音,就能证明你和你妈之间具有血缘关系。6月2日,《商学院》杂志、中国经营者俱乐部带领企业家会员走进科大讯飞,全方位地感受人工智能在各领域的应用和突破。企业家们在惊讶之余,猛然意识到未来已来,再不跟上人工智能的脚步,即将面临被淘汰的风险。
  《伪装者》中曾经有这么一句话,如果一个特工的背影和声音被人记住,你不是让对方消失就要让自己消失。
  每个人的声音是如此独特而又有趣,这促使科大讯飞创始人刘庆峰从1999年开始带领团队攻克声纹难题。
  今天,当你走入科大讯飞位于合肥的园区,在展厅随时可以听到奥巴马说中文、罗振宇播新闻。你真以为高德地图中林志玲和郭德纲的声音导航来自本人?错,那是采用了科大讯飞的语音合成技术。只要采集到足够的语音样本,后台根据声纹特征,经过机器学习后便可以模拟任何当事人的声音特征,并达到以假乱真的程度。
  2000年以前,中文语音产业被微软、IBM等一众国际IT巨头垄断。科大讯飞自进入这一领域后发展迅速,2016年,科大讯飞在国际语音合成比赛中的中文语音合成分为4.5分,英文为4.2分,印地语为3.9分。在非常关键的自然度指标上,科大讯飞是4.2分,科大是唯一得分超过4.0的语音参赛系统。
  这是什么概念呢?5分是国家播音员的水平,4.5分达到省级播音员的水平。达到这一分值时,人耳已经无法分辨是机器发音还是真人发音。而4.2分的英文合成语音也战胜了微软、IBM、MIT等一众世界一流的高科技公司和研究机构。
  光有语音合成技术,也许人们尚无法深切感受语音智能是如何改变、影响我们生活的。在“走进名企”活动中,科大讯飞首次系统地向企业家们展示了人工智能技术在各个产业的落地实施情况。
  人工智能已经像互联网、像空气、像水那样潜移默化地成为我们生活中的一部分。
  一切源于语言
  《人类简史》一书中提到,人类认知革命起源于语言。而要让机器具备人类的语言能力,这一技术分为三个要点。
  一是语音合成。将任意文字信息转化为自然流畅的语言,给机器装上了人工嘴巴。
  二是语音识别。将语言中内容、说话人、语种等信息识别出来,给机器装上了人工耳朵。
  三是自然语言理解。对自然语言进行语义理解,给出适合的指令集合,给机器赋予人工大脑。
  试试这两句话:
  “爸爸没法举起他的儿子,因为他很重。”问:谁重?答:儿子。
  “爸爸没法举起他的儿子,因为他很虚弱。”问:谁虚弱?答:爸爸。
  科大讯飞市场总监任萍萍说,单这两句话中对“他”一词是谁的理解就相当于六岁孩子的认知水平。这是公司正在攻坚的“六龄童计划”,即让机器达到六岁孩子的语言认知推理能力。科大讯飞要实现的目标是让机器像人一样,不仅能听会说,还能理解思考,具备人类的思维能力。正是在认知智能领域的突破,科大讯飞获得Winograd Schema Challenge2016年比赛第一名。
  2014年8月,科大讯飞在传统人工智能(即感知智能)领域取得突破的基础上,结合承担的863类人智能重点攻关项目,正式启动“讯飞超脑计划”,研发基于类人神经网络的认知智能系统。通过对海量知识库的学习,建立语言理解能力、知识表示能力、联想推理能力以及自主学习能力。这里最难的是对自然语言的理解,国际上以通过各个国家的高考来判断人工智能的先进性。美国华盛顿大学图灵中心的目标是通过美国的生物学考试,日本则希望考上东京大学。目前科大讯飞的第一目标是达到“一本”的成绩,下一个目标是达到进入北大、清华的成绩。
  人工智能+大数据+产业=无限可能
  说到智能语音的应用,人们最熟悉的莫过于地图语音导航、智能汽车驾驶中的语音秘书服务,随时随地通过语音指挥车载智能系统完成各种指令,避免司机驾驶过程中分心。
  2013年前后,宝马、奔驰在中国发起中文语音输入系统的供应商PK。在车速60码的相对安静的车内环境下,三家语音供应商中文语音输出的准确率分值均在90分以上,科大讯飞则高达97分;而当车速达到140码,车内噪音激增时,科大讯飞依然保持90分以上的高分,而另两家则跌到六七十分。为此,科大讯飞一举拿下中文语音供应商的资质,并且还为全国一百多款车型提供语音智能服务。
  在教育领域,科大讯飞的多语种智能口语评测系统开始一展身手。系统可以分析用户的语音特征,对口语发音的标准程度进行智能评分;精确指出用户发音的错误和缺陷,并给出改进指导。这对于学生语言学习、矫正发音起到巨大的帮助,未来国家重大考试中的口语评分也将按照这一系统来评测。
  在医疗领域,有医院开始尝试在医生椅子上配备智能语音采集设备,问诊对话全部自动转为文字病历,减少了医生边问诊边输入病历的麻烦,即使医生有地方口音,设备依然能够准确识别;在医疗影像领域,公司根据合作医院提供的医疗影像数据,肺部结节诊断的准确率达到75%,堪比县级医院大夫的诊断水平。未来只要给系统提供更多的数据,准确率还将进一步提高,并且这一技术还可应用到其他器官的检查。
  面对学生苦不堪言的题海训练,科大讯飞推出了智学网,这是人工智能针对精准教学提出的解决方案。只要将学生的试卷输入系统,评判试卷后,系统能就每一个学生、每道题的得分与班级和地区的平均分进行比较,找出知识薄弱点,从题库中匹配相应的训练题,进行有针对性的训练。单这一改进就能减少40%的无效做题时间。2015年,科大讯飞在合肥一中尝试精准教学,在对比实验中,接受“因材施教”的学生成绩明显提升,与此同时,教师的教学效率平均提升30%。如今,智学网已在全国31个省级行政区超过1万所学校使用,全国超过半数“百强”名校全面应用智学网,受益师生超过1500万人,成为中国数据规模最大、智能程度最高、产品体系最全、应用效果最显著的个性化教与学的系统。另外,科大讯飞智慧教育系列产品在全国31个省、市、自治区、直辖市及新加坡等海外市场广泛应用,服务师生超过8000万人。人工智能正在改变传统的教学模式。
  此外在智能家居、互动娱乐、智慧城市、智能客服、金融等领域,人工智能也在改变着原有的生态,创造全新的商机。科大讯飞通过发展核心技术、内部创业以及与第三方合作伙伴共赢的方式来扩大核心技术的应用场景,建立起智能应用生态圈。
  “人工智能比我们想象的来得更快”任萍萍说。未来已来,有远见者已经在蓝海中找到独一无二的机会。

本文关键字:人工智能


重要提示

1、报名前,应认真阅读中国人民大学网络教育入学指南,充分了解我校网络教育的办学模式,并愿意遵守学校的各项规定和要求,努力完成学业。
2、报名表一经确认,将随成绩等进入学生档案,你需要对本报名表所填写内容的真实性负责。
3、如同时报读学历教育和非学历教育,须分别填写学历教育报名表和非学历教育报名表。

学历教育报名 非学历教育报名