怎么学自然语言处理这门学科呢?

Posted 星空研梦

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了怎么学自然语言处理这门学科呢?相关的知识,希望对你有一定的参考价值。

自然语言处理是一门交叉学科,包括计算机科学,人工智能和语言学

目标:让计算机去处理或“理解”自然语言, 完成一些有用的任务例如问答系统,机器翻译

自然语言处理(简称NLP),是研究计算机处理人类语言的一门技术,包括:

1.句法语义分析:对于给定的句子,进行分词、词性标记、命名实体识别和链接、句法分析、语义角色识别和多义词消歧。

2.信息抽取:从给定文本中抽取重要的信息,比如,时间、地点、人物、事件、原因、结果、数字、日期、货币、专有名词等等。通俗说来,就是要了解谁在什么时候、什么原因、对谁、做了什么事、有什么结果。涉及到实体识别、时间抽取、因果关系抽取等关键技术。

3.文本挖掘(或者文本数据挖掘):包括文本聚类、分类、信息抽取、摘要、情感分析以及对挖掘的信息和知识的可视化、交互式的表达界面。目前主流的技术都是基于统计机器学习的。

4.机器翻译:把输入的源语言文本通过自动翻译获得另外一种语言的文本。根据输入媒介不同,可以细分为文本翻译、语音翻译、手语翻译、图形翻译等。机器翻译从最早的基于规则的方法到二十年前的基于统计的方法,再到今天的基于神经网络(编码-解码)的方法,逐渐形成了一套比较严谨的方法体系。

5.信息检索:对大规模的文档进行索引。可简单对文档中的词汇,赋之以不同的权重来建立索引,也可利用1,2,3的技术来建立更加深层的索引。在查询的时候,对输入的查询表达式比如一个检索词或者一个句子进行分析,然后在索引里面查找匹配的候选文档,再根据一个排序机制把候选文档排序,最后输出排序得分最高的文档。

6.问答系统: 对一个自然语言表达的问题,由问答系统给出一个精准的答案。需要对自然语言查询语句进行某种程度的语义分析,包括实体链接、关系识别,形成逻辑表达式,然后到知识库中查找可能的候选答案并通过一个排序机制找出最佳的答案。

7.对话系统:系统通过一系列的对话,跟用户进行聊天、回答、完成某一项任务。涉及到用户意图理解、通用聊天引擎、问答引擎、对话管理等技术。此外,为了体现上下文相关,要具备多轮对话能力。同时,为了体现个性化,要开发用户画像以及基于用户画像的个性化回复。

自然语言处理的应用

应用范围从简单到复杂

拼写检查, 关键词提取&搜索,同义词查找&替换

分类,例如对教科书的文本进行分级,对长文本进行正负情绪判断

机器翻译

口语对话系统

复杂的问答系统

 

工业届里的NLP应用

搜索引擎

在线广告

自动的或辅助的翻译技术

市场营销或者金融交易领域的情感分析

语音识别 

 

基础理论

自动机

形式逻辑

统计机器学习

汉语语言学

形式语法理论

 

推荐相关书籍

数学之美(吴军)

python自然语言处理

统计学习方法(李航)

统计自然语言处理(宗成庆)


以上是关于怎么学自然语言处理这门学科呢?的主要内容,如果未能解决你的问题,请参考以下文章

软件工程想法随笔一

自然语言处理简介

我的软件工程目标

c语言(快快快!)

报告 | 自然语言处理到底哪家强?这些企业上榜了

在自然语言处理领域,哪些企业的发展遥遥领先?