小酌一下:Win10 解决fetch_20newsgroups下载速度巨慢

Posted lowkeyao

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了小酌一下:Win10 解决fetch_20newsgroups下载速度巨慢相关的知识,希望对你有一定的参考价值。

仅为个人查阅使用,如有错误还请指正。

最近在学机器学习,试着用朴素贝叶斯做一个分类问题,数据就用sklearn新闻数据集。

但是下载巨慢,没耐心等。接下去就是一波操作,上篮成功。

因为版本之间可能存在差异,所以就不发数据集的安装包了。

1)当你在运行程序的时候,控制台是这么输出的

Downloading 20news dataset. This may take a few minutes.
Downloading dataset from https://ndownloader.figshare.com/files/5975967 (14 MB)

2)默认在当前用户下生成文件

cd C:\\Users\\73107\\scikit_learn_data
可以看到20news_home这个文件,里面是20news-bydate.tar.gz这么一个安装包。
请记住它的名字20news-bydate.tar.gz。
可以把这个安装包删除,程序也可以停止了。

3)打开运行时下载链接

https://ndownloader.figshare.com/files/5975967
下载安装包,下载完毕之后。
该安装包的名字改成上面说的那个名字(20news-bydate.tar.gz)。
并且把这个安装包放到 C:\\Users\\73107\\scikit_learn_data\\20news_home里面。

4)打开运行程序的Python环境

Python环境别搞错了,特别是用虚拟环境的。别乱搞。
cd \\site-packages\\sklearn\\datasets
打开twenty_newsgroups.py文件
把第一个红框注释(其实就是原本用来下载的代码)。
写上第二个红框,也就是下载安装包的路径。

技术图片

5)运行程序,完美解决。
程序会自动解压20news-bydate.tar.gz。
然后删除,最后生成一个缓存文件20news-bydate.pkz。

以上是关于小酌一下:Win10 解决fetch_20newsgroups下载速度巨慢的主要内容,如果未能解决你的问题,请参考以下文章

机器学习:如何解决fetch_20newsgroups下载速度巨慢的问题?

解决win10 报错 git pull error: cannot open .git/FETCH_HEAD: Permission denied

win10系统下cmd输入一下安装的软件命令提示拒绝访问解决办法

小酌重构系列[20]——用条件判断代替异常

以下代码中的 .from(20).fetch(10) 是啥?

win10安装vmware15.5,为啥安装界面只是闪了一下后就不见了,也没有后续了?