探秘人工智能 | 自然语言处理
Posted 信息力量
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了探秘人工智能 | 自然语言处理相关的知识,希望对你有一定的参考价值。
什么是自然语言处理
自然语言是人类智慧的独特表现。自然语言处理(NLP)是计算机科学领域与人工智能领域的一个重要研究方向,旨在研究人机之间用自然语言进行有效通信的理论和方法。
自然语言处理的发展历史
最早的自然语言理解方面的研究工作是机器翻译。1949年美国人威弗首先提出了机器翻译设计方案。其发展主要分为三个阶段。
01
早期自然语言处理
第一阶段(60~80年代):基于规则来建立词汇、句法语义分析、问答、聊天和机器翻译系统。好处是规则可以利用人类的内省知识,不依赖数据,可以快速起步;问题是覆盖面不足,像个玩具系统,规则管理和可扩展一直未解决。
02
统计自然语言处理
第二阶段(90年代开始):基于统计的机器学习(ML)开始流行,很多NLP开始用基于统计的方法来做。主要思路是利用带标注的数据,基于人工定义的特征建立机器学习系统,并利用数据经过学习确定机器学习系统的参数。运行时利用这些学习得到的参数,对输入数据进行解码,得到输出。机器翻译、搜索引擎都是利用统计方法。
03
神经网络自然语言处理
第三阶段(2008年之后):深度学习开始在语音和图像发挥威力。NLP研究者开始把目光转向深度学习。先是把深度学习用于特征计算或者建立一个新的特征,然后在原有的统计学习框架下体验效果。比如,搜索引擎加入了深度学习的检索词和文档的相似度计算,以提升搜索的相关度。自2014年以来,人们尝试直接通过深度学习建模,进行端对端的训练。目前已在机器翻译、问答、阅读理解等领域取得进展,出现了深度学习的热潮。
之后,2018年自然语言处理研究领域最令人惊艳的成果是预训练语言模型,这包括基于RNN的Elmo和基于Transformer的GPT和Bert。预训练语言模型的成功充分证明了我们可以从海量的无标注文本中学到大量潜在的知识,而无需为每一项自然语言处理任务都标注大量的数据。
自然语言处理的几个常见应用
Part 01
机器翻译
随着通信技术与互联网技术的飞速发展、信息的急剧增加以及国际联系愈加紧密,让世界上所有人都能跨越语言障碍获取信息的挑战已经超出了人类翻译的能力范围。
机器翻译因其效率高、成本低满足了全球各国多语言信息快速翻译的需求。机器翻译属于自然语言信息处理的一个分支,能够将一种自然语言自动生成另一种自然语言又无需人类帮助的计算机系统。目前,谷歌翻译、百度翻译、搜狗翻译等人工智能行业巨头推出的翻译平台逐渐凭借其翻译过程的高效性和准确性占据了翻译行业的主导地位。
Part 02
信息提取
金融市场中的许多重要决策正日益脱离人类的监督和控制。算法交易正变得越来越流行,这是一种完全由技术控制的金融投资形式。这些财务决策中的许多都受到新闻的影响。因此,自然语言处理的一个主要任务是获取这些明文公告,并以一种可被纳入算法交易决策的格式提取相关信息。例如,公司之间合并的消息可能会对交易决策产生重大影响,将合并细节纳入到交易算法中,这或将带来数百万美元利润的影响。
Part 03
文本情感分析
在数字时代,信息过载是一个现实的问题,我们获取知识和信息的能力已经远远超过了我们理解它的能力。并且,这一趋势丝毫没有放缓的迹象,因此总结文档和信息含义的能力变得越来越重要。情感分析作为一种常见的自然语言处理方法,可以让我们能够从大量数据中识别和吸收相关信息,而且还可以理解更深层次的含义。比如,企业分析消费者对产品的反馈信息,或者检测在线评论中的差评信息等。
信息力量|即刻出发
文案 | 人工智能协会
编辑 | 江金迅
审核 | 应楷
以上是关于探秘人工智能 | 自然语言处理的主要内容,如果未能解决你的问题,请参考以下文章