NLP黄金十年开启!一文了解最全产业图谱

Posted 机器人文明

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了NLP黄金十年开启!一文了解最全产业图谱相关的知识,希望对你有一定的参考价值。


阅读关键词:NLP、芯片、算法、平台、应用 

自从AI在上世纪三四十年代萌芽,NLP也差不多在同一时间诞生,或者可以说NLP本身就是AI的最重要研究领域。几十年来,NLP的主要研究思想在各个时代不停切换,直到进入与深度学习相结合的黄金时代。

 


思维导图

十个特性全面了解NLP

 

与人工智能的关系:在AI的核心技术组成中,自然语言是最不可或缺的部分。它是获取知识的钥匙,而获取和处理知识是AI的终极目标。像人类获取知识一样,人工智能也需要“读懂”和“听懂”才能真正学习到知识,达成这两项职能的关键技术就是NLP。

 

NLP黄金十年开启!一文了解最全产业图谱

图一:NLP在人工智能产业链中所处位置(“机器人文明”制图)

 

NLP的构成广义上,NLP包含了语音处理;狭义来看,仅指处理及理解文本,大体可以分为自然语言理解(NLU)和自然语言生成(NLG)两部分。 

 

NLP黄金十年开启!一文了解最全产业图谱

 图二:NLP的组成(“机器人文明”制图)

 

NLP语义分析方法:主要分为分布式、框架式、理论式,以及交互式。

  

NLP黄金十年开启!一文了解最全产业图谱

图三:语义的主要分析方法(“机器人文明”制图)

 

NLP的指导思想和主要技术:作为重要技术,NLP也遵循着人工智能的发展思想(具体可参看)。大体来说,分为基于规则的理性主义,以及基于统计的经验主义。事实上,理性主义和经验主义是西方哲学的两大分支,早期的人工智能学者在研究NLP的时候,也因循了这两大路径。而在两个路径的基础上,又分别形成了不同的技术体系。

 

NLP黄金十年开启!一文了解最全产业图谱图四:主流思潮下的NLP模型和衍生技术(“机器人文明”制图)

 

NLP的基础层架构:近年来,智能语音赋能各个行业,在基础层,做NLP的厂商也纷纷推出针对终端的端侧芯片和应用平台。

 

NLP黄金十年开启!一文了解最全产业图谱

图五:基础层芯片和平台厂商、产品(“机器人文明”制图)

 

与深度学习的结合:近年来,随着神经网络向深度学习的发展,许多NLP的进展也是由深度学习领域的进步驱动,包括网络层、拓扑结构,以及训练范式等方面的拓展。经深度学习赋能,NLP具备了可表达性、可训练性,以及可泛化性。

 

NLP黄金十年开启!一文了解最全产业图谱

图六:基于深度学习的NLP研究(“机器人文明”制图)

 

NLP的开源框架:NLP不仅仅需要数学和机器学习,还需要熟悉关键的语言概念,所以在过去,只有受过语言教育的专家才能从事自然语言处理的工作。但现在,每个人都可以使用已经开源的框架,文本预处理得以简化,从而可以专注于构建机器学习模型和超参数微调。

 

NLP黄金十年开启!一文了解最全产业图谱

 图七:NLP的底层开源框架(“机器人文明”制图)

 

NLP的主要研究内容:目前NLP的主要研究内容与能否实现商业化密切相关,能够实现商业化,是NLP的研究取向。

 

NLP黄金十年开启!一文了解最全产业图谱

图八:目前NLP的内容研究取向(“机器人文明”制图)

 

结合应用的落地场景:NLP的应用场景非常宽阔,只要是与语言相关的领域都可以用到。目前,最为火热的语音助手,包括亚马逊、百度等巨头公司都推出了自家的智能语音形象。此外,还有与IOT相结合的AIoT、翻译机、智慧教育,以及AI创作等领域。

 

NLP黄金十年开启!一文了解最全产业图谱

图九:NLP主要落地场景(“机器人文明”制图)

 

NLP的未来趋势:未来,知识图谱、情感分析、意图分析三个主要方向的应用比较值得关注。虽然深度学习为NLP发展提供了十足动力,但深度学习的神经网络有“黑盒”的弊病,缺少直观和鲁棒性,减少这些影响需要融入人类的先验知识。

 

NLP黄金十年开启!一文了解最全产业图谱

 图十:NLP未来主要应用趋势(“机器人文明”制图)

 

下面,机器人文明将为您盘点NLP在基础层和应用层的重要厂商。


 

基础层

云知声、出门问问、英特尔、百度


当基础层与NLP相结合,就形成了自然语言处理的专用芯片、算法和平台。趋势上,NLP与IoT结合的智能音箱、智能家居趋势越来越明确,这就对基础层架构提出了全新的要求。

 

NLP黄金十年开启!一文了解最全产业图谱


云知声:推出全球首款面向IoT的AI芯片UniOne

 

作为语音方案供应商,云知声在语音交互能力上进行了从芯片到机器算法,再到落地产品的全部局。

 

今年5月,云知声推出全球首款面向IoT的AI芯片UniOne,在一系列芯片设计中,雨燕是第一代产品,也是第一款面向物联网人机交互场景的AI芯片,适用于智能家居和智能音箱领域;在“雨燕”之后,公司表示还将推出面向智能车载领域的第二代芯片“雪豹”,以及用于构建智慧城市的第三代“旗鱼”,两款产品预计将分别于明、后年面世。

 

NLP黄金十年开启!一文了解最全产业图谱

 

对于自家芯片性能,云知声副总裁康恒表示说:“我们把语音交互的逻辑在芯片上得到实现。云知声有专门面向AI的加速器DeepNet,包括面向语音交互、麦克风阵列降噪和处理的数字信号处理器DSP,以及内置通用ARM核。同时,也在通用CPU上实现了8倍的性能提升。”


NLP黄金十年开启!一文了解最全产业图谱

 

出门问问:“问芯Mobvoi”成国内最早量产语音芯片模组

 

出门问问是谷歌投资的中国人工智能公司,拥有自主研发的语音识别、语义分析、垂直搜索、基于视觉的ADAS和机器人SLAM等核心技术。


NLP黄金十年开启!一文了解最全产业图谱


今年5月,出门问问一次性发布了5款AI硬件,其中包括AI芯片产品“问芯”。这款产品与杭州国芯合作,集成麦克风阵列信号处理技术,语音交互SDK与可定制语义技能,其中包括回声消除、声源定位、波束成形、语音降噪、语音唤醒、语音识别、语义理解与语音合成等AI语音交互核心技术。据了解,“问芯”已于今年5月正式量产,官宣是国内最早量产的语音芯片模组。

 

出门问问创始人兼CEO李志飞日前表示:“出门问问已经从起步时的纯软件算法公司,逐渐跨到另一个阶段,在做AI的同时又做了软件和硬件的结合。未来,用语音交互解放大家的双手,是出门问问的总体目标。”

  

NLP黄金十年开启!一文了解最全产业图谱

 

英特尔:推出代号为“NLP Architect”自然语言处理开源库

 

今年上半年,英特尔宣布推出开源库NLP Architect,是一个用于NLP的库,帮助开发人员为聊天机器人和虚拟助手等会话应用提供所必需的功能,比如名称实体识别,意图提取和语义分析等,帮助智能体从对话中理解人类的行动。


NLP黄金十年开启!一文了解最全产业图谱


它的特性包括:

 

· NLP核心模型,能对NLP工作流的语言特性进行鲁棒性语音特征的提取,例如依存句法;


· 分析器(BIST)和NP chunker;


· 性能最佳的NLU模块,例如,意图提取(IE)和命名实体识别(NER);


· 处理语义理解的模块:例如colocations,NP嵌入表示(例如NP2V)等;


· 用于会话人工智能的组件:聊天机器人应用程序就是恰当的例子,包括对话框系统、序列组块和IE;


· 使用新拓扑结构的的端到端DL应用程序:比如Q&A和机器阅读理解等;

 

此外,英特尔人工智能产品事业部数据科学主任刘茵茵曾表示说:“自然语言处理方面和增强学习方面还是有很大的发展空间,英特尔在NLP上积累了大量经验,能够把不同组件组合在一起,可以通过英特尔的直接优化或者nGraph,以开源库的形式返回给公众。无论是机器翻译、命名实体识别还是主题分析,都能够通过开源的框架,以平台的形式进行示范。”

 

NLP黄金十年开启!一文了解最全产业图谱

 

百度:DuerOS3.0版本实现语音多轮纠错

 

DuerOS建立在语音识别、图像识别、自然语言处理、用户画像等技术能力上,语音识别准确率97%以上。目前该平台已进入智能家居、智能穿戴、车载、移动通讯等多个场景。

 

NLP黄金十年开启!一文了解最全产业图谱

 

今年7月,DuerOS3.0版本上线,能够实现语音多轮纠错,进行复杂的递进意图识别与带逻辑的条件意图识别,从而更加准确判断用户意图,最终实现功能升维——利用扩展特征理解用户行为。


在日前召开的第六届WISE大会上,百度智能生活事业群组总经理景鲲透露了关于智能语音平台DuerOS的一组应用数据:“今年1月份,搭载DuerOS对话式语音智能的设备超过5000万台。7月份,可以语音对话的设备超过了1亿台。10月份,中国市场有超过1.5亿的智能设备搭载了DuerOS系统。”



应用层

华为、优必选、松鼠AI、小i


NLP的终端应用非常丰富,但和基础层一样,目前比较火的应用领域主要是与智能家居、智慧城市等相关的AIoT领域。另外,一些进入该领域较早的解决方案公司,实现了通信、金融、政务、商务、交通等多领域布局。


NLP黄金十年开启!一文了解最全产业图谱

 

华为:发布语音指令、声纹识别智能音箱

 

智能音箱目前的市场特征是入局者众,竞争惨烈(更多厂商可参看)。即便如此,也还有新近进入者,比如华为。

 

NLP黄金十年开启!一文了解最全产业图谱


10月26日,华为在上海发布了首款智能AI音箱。相较其它厂商的产品亮点是,首次搭载声纹识别技术,通过录制声音,即可将该声纹与个人华为账号绑定。用户通过语音发出指令,告知日程安排,便可将日程安排同步到该用户的华为手机日历中。


NLP黄金十年开启!一文了解最全产业图谱

 

优必选:语音语义是主控系统之一

 

语音语义是智能音箱的核心技术,相较来说,智能机器人的核心技术还包括计算机视觉、自动化等技术,但NLP仍然是重要且不可或缺的。

 

NLP黄金十年开启!一文了解最全产业图谱

 

 

NLP黄金十年开启!一文了解最全产业图谱

 

松鼠AI:智适应学习和启发式人机对话

 

松鼠AI原名乂学教育,今年6月更名。是一个以高级算法为核心的人工智能自适应学习引擎,简称“智适应学习引擎”。

 

NLP黄金十年开启!一文了解最全产业图谱

 

其中,与NLP相关的技术包括对知识的智能结构化系统支持,通过算法对中文文本下的数理化、语文等学科知识点进行纳米级拆分,并重构知识地图,找到非关联性知识点。而启发式的人机对话通过NLP的语义理解,知道学生的反馈是哪个层面的问题,从而给到精确的问题回答。

 

NLP黄金十年开启!一文了解最全产业图谱

 

小i机器人:最早推出中文智能客服机器人

 

小i机器人目前形成了智能客服、智能知识库、智能微应用和智能语音交互等语音语义解决方案,业务涉及通信金融电子政务电子商务智能家电和汽车交通等多个行业。

 

NLP黄金十年开启!一文了解最全产业图谱


目前,小i机器人的核心技术包括自然语音处理、语音识别、深度语音、图像处理、机器学习和大数据,自然语言处理是公司的起家技术。2006年9月,成功推出上海科委客服机器人,成为中国第一个政府领域的中文智能客服机器人。

 

本文由“机器人文明”出品

转载请注明出处


NLP黄金十年开启!一文了解最全产业图谱


NLP黄金十年开启!一文了解最全产业图谱


往 期 精 选 





 

我是广告:欢迎给“机器人文明”投稿~

好文请投:tougao@gsi24.com

— 完 —


机器人文明 服 务 内 容


广告投放 | 政府招商 | 产业报告

投融资 | 专家咨询 | 人才服务 | 论坛策划

↙合作需求,请点击“阅读原文”联系我们


以上是关于NLP黄金十年开启!一文了解最全产业图谱的主要内容,如果未能解决你的问题,请参考以下文章

自然语言处理: 知识图谱的十年

Go 语言发展史及史上最全 Go 语言知识图谱!

推荐5GAIoT区块链产业图谱

一文 Get 汽车知识的语义网络及图谱构建

转: 作者 李艳鹏: 史上最全的架构师图谱

2021边缘计算产业图谱