我们的研究方向——自然语言处理（NLP）

Posted 2021-04-12 西邮NLP

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了我们的研究方向——自然语言处理（NLP）相关的知识，希望对你有一定的参考价值。

自然语言处理（NLP）

自然语言处理（natural language processing，简称NLP），是计算机科学领域与人工智能领域中的一个重要方向，也是我们实验室的主要研究方向。

我们可以把自然语言处理分成两部分来看，“自然语言”和“处理”。“处理”就是需要用到计算机来处理。那什么又是“自然语言”？

因为我们实验室属于计算机学院，大家会情不自禁的联想到C语言、C++、JAVA、Python、php、R语言、汇编语言（以上语言排名不分先后）等等。

Wrong！“自然语言”通常是指一种自然地随文化演化的语言，是人类交流和思维的主要工具。也就是世界上所有的语种语言，都属于自然语言，比如：汉语、英语和法语等。

那么是不是有很多“小白”开始认为我们是不是单纯研究语言学的呢？

别急~百度百科会给你一个答案。

我是百度百科分割线

自然语言处理是一门融语言学、计算机科学、数学于一体的科学。

它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。因此，这一领域的研究将涉及自然语言，即人们日常使用的语言，所以它与语言学的研究有着密切的联系，但又有重要的区别。

自然语言处理并不是一般地研究自然语言，而在于研制能有效地实现自然语言通信的计算机系统，特别是其中的软件系统。因而它是计算机科学的一部分。

简单来说，自然语言处理就是让机器来处理、理解以及运用人类语言（如中文、英文等）。目的是让计算机在理解语言上像人类一样智能。用计算机代替人来处理大规模的自然语言的信息。

关键技术

依存句法分析

命名实体识别

词性标注

分词

……

应用系统

文本分类和聚类

知识图谱

推荐系统

问答系统

情感分析

……

但在做自然语言处理的过程中需要大量的数据集，所以要在网络上利用爬虫的知识来爬取相关的信息。爬取下来的数据通常为xml格式，需要进一步解析并在其中按需提取出相应的文本内容。有些本身是非结构化的数据，需要进一步使用自然语言处理的方法来提取非结构化文本的有效信息。

而大量的数据集往往需要使用支持并行与分布式计算的算法来处理，常见的有Hadoop分布式框架、Hbase数据库等。云端数据的计算则基于Linux系统，所以也需要同学掌握一些Linux的基础操作。

1.分词

如果想要进行文本分类，那么在处理数据集之前需要把文本进行分词。

例如：“今天我真开心啊！”这句话分词之后变成：今天/我/真/开心/啊/！

2.依存句法分析

3.词义相似度

4.推荐系统

淘宝的猜你喜欢

5.情感分析

比如在微博上一条新闻下的众多评论中，分析哪些人的评论是积极的，哪些人的评论是消极的

6.问答系统

Siri，小爱同学……

7.知识图谱

知识图谱是用来描述实体的概念，并以可视化的形式显示出各种实体之间的相互关系

自然语言处理和大数据、人工智能、机器学习、深度学习……有着密不可分的关系。

具体是什么关系呢？

自然语言处理是如何做到这些的呢？

如果你对此感兴趣，并且想更加深入的了解它，请来西安邮电大学东区教学楼FF104寻找答案吧！

固定布局
工具条上设置固定宽高
背景可以设置被包含
可以完美对齐背景图和文字
以及制作自己的模板

以上是关于我们的研究方向——自然语言处理（NLP）的主要内容，如果未能解决你的问题，请参考以下文章