Python | 自然语言处理

Posted virtual-z

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python | 自然语言处理 相关的知识,希望对你有一定的参考价值。

小白博主最近想参加一个关于NLP的比赛,于是入坑自然语言处理,想借博客一边学习,一边整理

首先安装库nltk,直接pip install nltk即可

1 from nltk.book import *
*** Introductory Examples for the NLTK Book ***
Loading text1, ..., text9 and sent1, ..., sent9
Type the name of the text or sentence to view it.
Type: ‘texts()‘ or ‘sents()‘ to list the materials.
text1: Moby Dick by Herman Melville 1851
text2: Sense and Sensibility by Jane Austen 1811
text3: The Book of Genesis
text4: Inaugural Address Corpus
text5: Chat Corpus
text6: Monty Python and the Holy Grail
text7: Wall Street Journal
text8: Personals Corpus
text9: The Man Who Was Thursday by G . K . Chesterton 1908

这样,证明库已安装,接下来便可以开始我们的学习了:

技术分享图片

搜索文本

1.关键词索引:text1.concordance("words")  从文中找到该word

技术分享图片

 2.用离散图表示词语出现的位置及频繁程度:

技术分享图片

 

计算语言:简单的统计

1.频率分布

技术分享图片

从输出结果来看,可以得知fdist为字典类型,键为字符,值为出现的次数

 

至此,我们先了解了一下ntlk库,和一些基础函数~

继续加油!

 

以上是关于Python | 自然语言处理 的主要内容,如果未能解决你的问题,请参考以下文章

你如何在 python 中处理 graphql 查询和片段?

译文:18个实用的JavaScript代码片段,助你快速处理日常编程任务

常用python日期日志获取内容循环的代码片段

python+spark程序代码片段

Python 自动化 - 浏览器chrome打开F12开发者工具自动Paused in debugger调试导致无法查看网站资源问题原因及解决方法,javascript反调试问题处理实例演示(代码片段

在python 3.6中处理自定义编码时遇到类型错误