立即下载google colaboratory中的所有nltk软件包
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了立即下载google colaboratory中的所有nltk软件包相关的知识,希望对你有一定的参考价值。
我想在google colab上的代码中使用停用词,当我导入关于nltk的东西时没有错误但是当我在我的代码中使用停用词时google colab给出了这个错误: -
Resource 'corpora/stopwords.zip/stopwords/' not found. Please
use the NLTK Downloader to obtain the resource: >>>
nltk.download()
但当我这样做时: -
import nltk
nltk.download()
它给了我所有的包列表,所以我必须选择1下载,在终端我可以做“全部”下载所有包但但我如何在谷歌colab?我不想每次都添加一个名字来下载东西。当我做“nltk.download()”时,这是colab给我看的: -
NLTK下载器
d)下载l)列表u)更新c)配置h)帮助q)退出
Downloader> d
Download which package (l=list; x=cancel)?
有什么办法可以一次性将所有nltk软件包下载到google colab的项目中吗?
答案
当我遇到同样的问题时,我到达了这个页面。 我可以在google colab上使用此代码的“热门”。
import nltk
nltk.download("popular")
另一答案
您还有其他几种选择:
all-corpora......... All the corpora
all-nltk............ All packages available on nltk_data gh-pages
branch
all................. All packages
book................ Everything used in the NLTK Book
popular............. Popular packages
tests............... Packages for running tests
您可以将它们用作:
import nltk
nltk.download('book')
#or
nltk.download('tests')
#or
nltk.download('all-corpora')# not recommended as it download huge amount of data.
以上是关于立即下载google colaboratory中的所有nltk软件包的主要内容,如果未能解决你的问题,请参考以下文章
google colab [google-colaboratory] 中的 conda 环境
无法从 google-colaboratory 打开 google-storage 中的文件
从Google Colaboratory访问Google Team Drive中的数据
Google Colaboratory matplotlib 图表中的自定义字体
02google Colab |pytorch Dataset类代码实战 免费GPU google Colaboratory 使用教程