立即下载google colaboratory中的所有nltk软件包

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了立即下载google colaboratory中的所有nltk软件包相关的知识,希望对你有一定的参考价值。

我想在google colab上的代码中使用停用词,当我导入关于nltk的东西时没有错误但是当我在我的代码中使用停用词时google colab给出了这个错误: -

Resource 'corpora/stopwords.zip/stopwords/' not found.  Please
use the NLTK Downloader to obtain the resource:  >>>
nltk.download()

但当我这样做时: -

 import nltk
 nltk.download()

它给了我所有的包列表,所以我必须选择1下载,在终端我可以做“全部”下载所有包但但我如何在谷歌colab?我不想每次都添加一个名字来下载东西。当我做“nltk.download()”时,这是colab给我看的: -

NLTK下载器

d)下载l)列表u)更新c)配置h)帮助q)退出

 Downloader> d

 Download which package (l=list; x=cancel)?

有什么办法可以一次性将所有nltk软件包下载到google colab的项目中吗?

答案

当我遇到同样的问题时,我到达了这个页面。 我可以在google colab上使用此代码的“热门”。

import nltk
nltk.download("popular")
另一答案

您还有其他几种选择:

all-corpora......... All the corpora
all-nltk............ All packages available on nltk_data gh-pages
                           branch
all................. All packages
book................ Everything used in the NLTK Book
popular............. Popular packages
tests............... Packages for running tests

您可以将它们用作:

import nltk
nltk.download('book')
#or
nltk.download('tests')
#or
nltk.download('all-corpora')# not recommended as it download huge amount of data.

以上是关于立即下载google colaboratory中的所有nltk软件包的主要内容,如果未能解决你的问题,请参考以下文章

google colab [google-colaboratory] ​​中的 conda 环境

无法从 google-colaboratory 打开 google-storage 中的文件

将数据导入 Google Colaboratory

从Google Colaboratory访问Google Team Drive中的数据

Google Colaboratory matplotlib 图表中的自定义字体

02google Colab |pytorch Dataset类代码实战 免费GPU google Colaboratory 使用教程