自从我学会了数据挖掘MatplotlibNumpyPandasTa-Lib等一系列库,我把领导开除了

Posted 程序猿中的BUG

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了自从我学会了数据挖掘MatplotlibNumpyPandasTa-Lib等一系列库,我把领导开除了相关的知识,希望对你有一定的参考价值。

库的安装

整个数据挖掘基础阶段会用到Matplotlib、Numpy、Pandas、Ta-Lib等库,为了统一版本号在环境中使用,将所有的库及其版本放到了文件requirements.txt当中,然后统一安装

新建一个用于人工智能环境的虚拟环境

mkvirtualenv -p /user/local/bin/python3 ai
matplotlib==2.0.2
numpy==1.14.2
pandas==0.20.3
TA-Lib==0.4.16
tables==3.4.2
jupyter==1.0.0

使用pip命令安装

pip install -r requirements.txt

Jupyter notebook使用

学习目标

理解
应用Jupyter编写运行代码
应用
创建文件
操作cell
运行操作

一、介绍

Jupyter项目是一个非盈利的开源项目,源于2014年的ipython项目,因为它逐渐发展为支持跨所有编程语言的交互式数据科学和科学计算

  • Jupyter Notebook,原名IPython Notbook,是IPython的加强网页版,一个开源Web应用程序
  • 名字源自Julia、Python 和 R(数据科学的三种开源语言)
  • 是一款程序员和科学工作者的编程/文档/笔记/展示软件
  • .ipynb文件格式是用于计算型叙述的JSON文档格式的正式规范
    jupyternotebook

二、为什么使用Jupyter?

1、传统软件开发:工程/目标明确

  • 需求分析,设计架构,开发模块,测试

2、数据挖掘:艺术/目标不明确

  • 目的是具体的洞察目标,而不是机械的完成任务

  • 通过执行代码来理解问题

  • 迭代式地改进代码来改进解决方法

实时运行的代码、叙事性的文本和可视化被整合在一起,方便使用代码和数据来讲述故事

三、Jupyter使用

1、界面启动、新建

  • 界面启动

本机打开

按照环境搭建课件安装Python notebook库完成后,本机输入命令,会自动弹出浏览器窗口打开notebook

# 进入虚拟环境
workon ml
# 输入命令
jupyter notebook
  • 本地notebook的默认URL为:http://localhost:8888
  • 想让notebook打开指定目录,只要进入此目录后执行命令即可

在这里插入图片描述

  • 新建notebook文档

  • notebook的文档格式是.ipynb
    在这里插入图片描述

  • 内容界面操作
    在这里插入图片描述

  • 标题栏:点击标题(如Untitled)修改文档名

  • 菜单栏

    • 导航-File-Download as,另存为其他格式

    • 导航-Kernel

  • Interrupt,中断代码执行(程序卡死时)

  • Restart,重启Python内核(执行太慢时重置全部资源)

  • Restart & Clear Output,重启并清除所有输出

  • Restart & Run All,重启并重新运行所有代码

2、cell

2.1cell操作
cell:一对In Out会话被视作一个代码单元,称为cell

Jupyter支持两种模式:

  • 编辑模式(Enter)
    - 命令模式下回车Enter或鼠标双击cell进入编辑模式
    - 可以操作cell内文本或代码,剪切/复制/粘贴移动等操作

  • 命令模式(Esc)
    - 按Esc退出编辑,进入命令模式
    - 可以操作cell单元本身进行剪切/复制/粘贴/移动等操作
    ![在这里插入图片描述](https://img-blog.csdnimg.cn/20210625140315841.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0FfNzg3ODUyMA==,size_16,color_FFFFFF,t_70

2.2快捷键操作cell

  • 两种模式通用快捷键

    • Shift+Enter,执行本单元代码,并跳转到下一单元

    • Ctrl+Enter,执行本单元代码,留在本单元

cell行号前的 * ,表示代码正在运行

  • 命令模式:按ESC进入

    • Y,cell切换到Code模式
  • M,cell切换到Markdown模式

  • A,在当前cell的上面添加cell

  • B,在当前cell的下面添加cell

  • 双击D:删除当前cell

  • Z,回退

  • L,为当前cell加上行号 <!–

  • Ctrl+Shift+P,对话框输入命令直接运行

  • 快速跳转到首个cell,Crtl+Home

  • 快速跳转到最后一个cell,Crtl+End -->

- 编辑模式:按Enter进入

  • 多光标操作:Ctrl键点击鼠标(Mac:CMD+点击鼠标)

  • 回退:Ctrl+Z(Mac:CMD+Z)

  • 重做:Ctrl+Y(Mac:CMD+Y)

  • 补全代码:变量、方法后跟Tab键

  • 为一行或多行代码添加/取消注释:Ctrl+/(Mac:CMD+/)

  • 屏蔽自动输出信息:可在最后一条语句之后加一个分号

❀微信扫一扫关注公众号加入学习交流,技术解答【欢迎小哥哥。小姐姐】❀

在这里插入图片描述

以上是关于自从我学会了数据挖掘MatplotlibNumpyPandasTa-Lib等一系列库,我把领导开除了的主要内容,如果未能解决你的问题,请参考以下文章

自从学会了VBA字典,VLOOKUP都不那么香了

自从学会用Python做数据分析,工作效率提升了3倍,薪资也节节攀升;隔壁同事气愤又羡慕:你是想卷死我吗

Windows系统中python3.7安装数据可视化模块Matplotlibnumpy的各种方法汇总

自从教学弟学会了Python,他每天都爬一些好不正经的图片!

自从学会了csv格式可以直接txt文本里面逗号分隔之后,现在文本转excel太方便了

Python2.7安装matplotlibnumpy