数据分析(Numpy基础)

Posted lennie-luo

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据分析(Numpy基础)相关的知识,希望对你有一定的参考价值。

数据分析(Numpy基础)

1.什么是数据分析?

数据分析是指,用适当的统计分析方法,对收集来的大量数据进行分析,提取有用信息并形成结论,从而实现对数据的详细研究和概括总结的过程。

2.python做数据分析的常用库

1. numpy        基础数值算法
2. scipy        科学计算
3. matplotlib   数据可视化
4. pandas       序列高级函数

 

一、numpy概述

1.什么是numpy?

1. Numerical Python,数字的Python,弥补了Python语言所欠缺的数值计算能力。
2. Numpy是其它数据分析及机器学习库的底层库。
3. Numpy完全标准C语言实现,运行效率充分优化。
4. Numpy开源免费。

2.numpy发展历史

1. 1995年,Numeric,Python语言数值计算扩充。
2. 2001年,Scipy->Numarray,多维数组运算。
3. 2005年,Numeric+Numarray->Numpy。
4. 2006年,Numpy脱离Scipy成为独立的项目。

3.numpy的性能

1. 代码简洁:减少Python代码中的循环。
2. 底层实现:厚内核(C)+薄接口(Python),保证性能。

二、numpy基础

1.ndarray数组

1.Numpy中的数组是numpy.ndarray类实例化的对象,其中包括:

元数据(metadata)存储对目标数组的描述信息,如:shape、dtype、size、data等,

实际数据完整的数组数据

将实际数据与元数据分开存放,一方面提高了内存空间的使用效率,另一方面大部分对数组的操作仅仅是对元数据的操作,从而减少对实际数据的访问频率,提高性能。

2.ndarray数组的特点:

1. Numpy数组是同质数组,即所有元素的数据类型必须相同
2. Numpy数组的下标从0开始,最后一个元素的下标为数组长度减1
 1 import numpy
 2 
 3 #numpy.ndarray类的对象表示数组
 4 ary=numpy.array([1,2,3,4,5,6])
 5 print(ary,type(ary)) #[1 2 3 4 5 6] <class ‘numpy.ndarray‘>
 6 
 7 #ndarray的运算规则:数组一个矩阵
 8 ary=ary+10
 9 print(ary) #[11 12 13 14 15 16]
10 
11 ary=ary+ary  #个数对应才能运算
12 print(ary)#[22 24 26 28 30 32]
13 
14 ary=ary>30  #比较运算
15 print(ary) #[False False False False False  True]

2.数组的4种创建方式

(1)numpy.array(任何可被解释为Numpy数组的逻辑结构)

(2)numpy.arange(起始值(0),终止值,步长(1))

(3)numpy.zeros(数组元素个数, dtype=‘类型‘)

(4)numpy.ones(数组元素个数, dtype=‘类型‘)

 1 import numpy
 2 
 3 #1.numpy.array()
 4 a1=numpy.array([[1,2,3],[4,5,6]])
 5 print(a1,type(a1))  #[[1 2 3][4 5 6]]
 6 
 7 #2.numpy.arange()
 8 a2=numpy.arange(0,10,2)
 9 print(a2,type(a2))  #[0 2 4 6 8]
10 
11 #3.numpy.zeros()
12 a3=numpy.zeros((10,),dtype=float32)
13 print(a3,type(a3))  #[0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
14 
15 #4.numpy.ones()
16 a4=numpy.ones((2,3),dtype=int32)
17 print(a4,type(a4))  #[[1 1 1][1 1 1]]
18 
19 #numpy.ones_like()  numpy.zeros_like()
20 #构建一个结构与a1相同的全1数组
21 print(numpy.ones_like(a1))  #[[1 1 1][1 1 1]]

3.数组的属性

(1)数组维度:np.ndarray.shape

(2)数组元素的数据类型:np.ndarray.dtype

(3)数组元素的个数:np.ndarray.size

(4)数组元素的索引(下标)

(5)数组属性汇总

4.数组的组合和拆分

以上是关于数据分析(Numpy基础)的主要内容,如果未能解决你的问题,请参考以下文章

python numpy片段

分享《Python数据分析基础教程:NumPy学习指南(第2版)》高清中文PDF+英文PDF+源代码

Python大数据分析学习基础篇——Spyder和Numpy

Python大数据分析学习基础篇——Spyder和Numpy

对数据进行去均值并转换为 numpy 数组

Python基础 | Numpy详细教程