Python 爬取 热词并进行分类数据分析-[云图制作(+)]

Posted 初等变换不改变矩阵的秩

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python 爬取 热词并进行分类数据分析-[云图制作(+)]相关的知识,希望对你有一定的参考价值。

日期:2020.01.28

博客期:136

星期二

 

   【本博客的代码如若要使用,请在下方评论区留言,之后再用(就是跟我说一声)】

  所有相关跳转:

  a.【简单准备

  b.【云图制作+数据导入】(本期博客)

  c.【拓扑数据

  d.【数据修复

  e.【解释修复+热词引用

   f.【JSP演示+页面跳转

  g.【热词分类+目录生成

  h.【热词关系图+报告生成

  i . 【App制作

  j . 【安全性改造


  今天主要是在网上找学习网站,爬取方面就参照之前爬到的数据做了一个简单的云图信息展示(Java Web),但是老师要求最好是用APP或者微信小程序(你认真的吗?),我目前就知道使用 Android Studio 开发App 项目,使用官方的软件开发微信小程序。但已经有半年不动这方面的东西了。还有就是那个文档生成...这大数据的数据量要用来生成的doc文档大小我不敢想!!!究竟要怎样的完成需求呢?我还要花一段时间思考,可能还是要进一步咨询老师的需求... ...

  1、使用Navicat导入文件数据或者使用Java编写代码使其自动生成sql语句再添加

  

 

  建表语句:

1 Create Table data
2 (
3  name varchar(255) ,
4  num int,
5  Primary Key (name)
6 )
CREATE

  数据插入语句:(超长行数提醒!!!)

  1 Insert into data VALUES (\'技术\',304);
  2 Insert into data VALUES (\'开发\',237);
  3 Insert into data VALUES (\'人工智能\',197);
  4 Insert into data VALUES (\'数据\',165);
  5 Insert into data VALUES (\'代码\',160);
  6 Insert into data VALUES (\'开发者\',149);
  7 Insert into data VALUES (\'程序员\',139);
  8 Insert into data VALUES (\'开源\',115);
  9 Insert into data VALUES (\'AI\',110);
 10 Insert into data VALUES (\'云计算\',110);
 11 Insert into data VALUES (\'工具\',105);
 12 Insert into data VALUES (\'Python\',99);
 13 Insert into data VALUES (\'技能\',99);
 14 Insert into data VALUES (\'Windows\',91);
 15 Insert into data VALUES (\'微软\',90);
 16 Insert into data VALUES (\'华为\',90);
 17 Insert into data VALUES (\'Java\',85);
 18 Insert into data VALUES (\'编程语言\',85);
 19 Insert into data VALUES (\'系统\',79);
 20 Insert into data VALUES (\'互联网\',71);
 21 Insert into data VALUES (\'操作系统\',70);
 22 Insert into data VALUES (\'GitHub\',67);
 23 Insert into data VALUES (\'5G\',66);
 24 Insert into data VALUES (\'Linux\',65);
 25 Insert into data VALUES (\'架构\',64);
 26 Insert into data VALUES (\'机器学习\',63);
 27 Insert into data VALUES (\'谷歌\',58);
 28 Insert into data VALUES (\'苹果\',57);
 29 Insert into data VALUES (\'数据库\',53);
 30 Insert into data VALUES (\'软件\',51);
 31 Insert into data VALUES (\'Android\',46);
 32 Insert into data VALUES (\'芯片\',41);
 33 Insert into data VALUES (\'网络\',39);
 34 Insert into data VALUES (\'浏览器\',38);
 35 Insert into data VALUES (\'大数据\',37);
 36 Insert into data VALUES (\'Google\',36);
 37 Insert into data VALUES (\'计算机\',34);
 38 Insert into data VALUES (\'编程\',34);
 39 Insert into data VALUES (\'趋势\',33);
 40 Insert into data VALUES (\'研发\',33);
 41 Insert into data VALUES (\'网络安全\',31);
 42 Insert into data VALUES (\'功能\',30);
 43 Insert into data VALUES (\'禁令\',26);
 44 Insert into data VALUES (\'运营商\',25);
 45 Insert into data VALUES (\'运维\',24);
 46 Insert into data VALUES (\'JavaScript\',20);
 47 Insert into data VALUES (\'IT\',19);
 48 Insert into data VALUES (\'指标\',18);
 49 Insert into data VALUES (\'企业\',18);
 50 Insert into data VALUES (\'人生第一份工作\',18);
 51 Insert into data VALUES (\'区块链\',17);
 52 Insert into data VALUES (\'机器人\',17);
 53 Insert into data VALUES (\'微信\',17);
 54 Insert into data VALUES (\'iOS\',17);
 55 Insert into data VALUES (\'服务器\',17);
 56 Insert into data VALUES (\'微信半月刊\',17);
 57 Insert into data VALUES (\'技术栈\',17);
 58 Insert into data VALUES (\'科技\',16);
 59 Insert into data VALUES (\'安全\',16);
 60 Insert into data VALUES (\'设计\',16);
 61 Insert into data VALUES (\'漏洞\',15);
 62 Insert into data VALUES (\'腾讯\',15);
 63 Insert into data VALUES (\'iPhone\',15);
 64 Insert into data VALUES (\'行业\',15);
 65 Insert into data VALUES (\'Web\',14);
 66 Insert into data VALUES (\'手机\',14);
 67 Insert into data VALUES (\'Oracle\',14);
 68 Insert into data VALUES (\'多云\',14);
 69 Insert into data VALUES (\'容器\',13);
 70 Insert into data VALUES (\'算法\',13);
 71 Insert into data VALUES (\'框架\',12);
 72 Insert into data VALUES (\'混合云\',12);
 73 Insert into data VALUES (\'标准\',12);
 74 Insert into data VALUES (\'语言\',12);
 75 Insert into data VALUES (\'裁员\',12);
 76 Insert into data VALUES (\'智能\',11);
 77 Insert into data VALUES (\'量子\',11);
 78 Insert into data VALUES (\'Windows10\',11);
 79 Insert into data VALUES (\'物联网\',11);
 80 Insert into data VALUES (\'甲骨文\',11);
 81 Insert into data VALUES (\'MySQL\',11);
 82 Insert into data VALUES (\'CIO\',11);
 83 Insert into data VALUES (\'深度学习\',11);
 84 Insert into data VALUES (\'面试\',11);
 85 Insert into data VALUES (\'Docker\',11);
 86 Insert into data VALUES (\'工程师\',10);
 87 Insert into data VALUES (\'App\',10);
 88 Insert into data VALUES (\'前端\',10);
 89 Insert into data VALUES (\'存储\',10);
 90 Insert into data VALUES (\'SaaS\',10);
 91 Insert into data VALUES (\'数据中心\',10);
 92 Insert into data VALUES (\'工信部\',10);
 93 Insert into data VALUES (\'PostgreSQL\',10);
 94 Insert into data VALUES (\'亚马逊\',10);
 95 Insert into data VALUES (\'SQL\',9);
 96 Insert into data VALUES (\'Chrome\',9);
 97 Insert into data VALUES (\'阿里\',9);
 98 Insert into data VALUES (\'AWS\',9);
 99 Insert into data VALUES (\'半导体\',9);
100 Insert into data VALUES (\'Redis\',9);
101 Insert into data VALUES (\'\',9);
102 Insert into data VALUES (\'携号转网\',9);
103 Insert into data VALUES (\'应用程序\',9);
104 Insert into data VALUES (\'FaceBook\',9);
105 Insert into data VALUES (\'云平台\',9);
106 Insert into data VALUES (\'员工\',9);
107 Insert into data VALUES (\'跳槽那些事儿\',9);
108 Insert into data VALUES (\'Windows7\',8);
109 Insert into data VALUES (\'技巧\',8);
110 Insert into data VALUES (\'流量\',8);
111 Insert into data VALUES (\'数据科学\',8);
112 Insert into data VALUES (\'鸿蒙\',8);
113 Insert into data VALUES (\'超算\',8);
114 Insert into data VALUES (\'信息安全\',7);
115 Insert into data VALUES (\'安卓\',7);
116 Insert into data VALUES (\'智能手机\',7);
117 Insert into data VALUES (\'UOS\',7);
118 Insert into data VALUES (\'IBM\',7);
119 Insert into data VALUES (\'Gartner\',7);
120 Insert into data VALUES (\'量子计算机\',7);
121 Insert into data VALUES (\'移动系统\',6);
122 Insert into data VALUES (\'库克\',6);
123 Insert into data VALUES (\'隐私\',6);
124 Insert into data VALUES (\'公共云\',6);
125 Insert into data VALUES (\'Nginx\',6);
126 Insert into data VALUES (以上是关于Python 爬取 热词并进行分类数据分析-[云图制作(+)]的主要内容,如果未能解决你的问题,请参考以下文章

Python 爬取 热词并进行分类数据分析-[安全性修复]

Python 爬取 热词并进行分类数据分析-[简单准备] (2020年寒假小目标05)

11 信息化领域热词分类分析及解释 第五步按目录爬取热词

利用词云图分析热词

用Python写网络爬虫-云图

08 信息化领域热词分类分析及解释 第二步 将爬取的数据使用jieba分词处理并清洗