数据分析大赛考纲:Python数据分析应会部分

Posted jackyhdf

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据分析大赛考纲:Python数据分析应会部分相关的知识,希望对你有一定的参考价值。

1.1. Numpy库的使用

1.1.1. Numpy数组的创建

1. 了解Numpy中ndarray数组对象的性质和特点;
1. 掌握通过array()函数创建Numpy数组的方法,会将Python中的列表、元组等序列型数据转化为Numpy数组;
2. 了解通过ones()、ones_like()、zeros()、zeros_like()、eye()、identity()、empty()、empty_like()等方法创建特殊的Numpy数组;
3. 掌握由函数arange()、linspace()等函数创建Numpy数组的方法;
4. 了解利用numpy.random模块中的rand()、randint()、randn()、uniform()等函数创建随机数组的方法.

1.1.2. Numpy数组的常用操作

1. 了解ndarray数组对象的属性:ndim、shape、size、dtype等的含义和用法;
5. 了解Numpy数据的数据类型及其相互转化方法;
6. 掌握利用reshape()、resize()、flatten()、ravel()等函数改变数组形状的方法;
7. 了解通过concatenate()、stack()、hstack()、vstack()等函数连接数组的方法;
8. 了解通过split()、hsplit()、vsplit()等函数分割数组的方法;
9. 掌握通过append()、insert()、delete()等方法进行数组元素的添加与删除.

1.1.3. Numpy数组的索引和切片

1. 了解Numpy数组索引与切片的基本规则;
1. 掌握Numpy数组的整数下标索引与切片方法;
2. 了解Numpy数组的布尔下标索引与切片方法;
3. 了解Numpy数组的花式索引.

1.1.4. Numpy数组的运算

1. 掌握Numpy数组与标量的运算;
2. 了解Numpy中的数学函数fabs()、sqrt()、exp()、sin()、cos()等的用法;
3. 了解Numpy数组数组运算中的广播规则;
4. 了解Numpy中unique()、intersectld()、unionld()、inld()等集合运算函数;
5. 掌握Numpy中sum()、mean()、std()、var()等基本统计函数的用法;
6. 了解Numpy中的sort()排序及where()搜索等函数的使用.

1.1.5. Numpy中的线性代数运算

1. 掌握Numpy中的dot()、vdot()等数组相乘函数;
4. 会利用numpy.linalg模块下的det()函数求矩阵的行列式;
5. 会利用numpy.linalg模块下的inv()函数求矩阵的逆矩阵;
6. 会利用numpy.linalg模块下的solve()函数求解线性方程组;
7. 会利用numpy.linalg模块下的eigvals()及eig()函数求矩阵的特征值与特征向量.

1.2. Matplotlib数据可视化

1.2.1. 线形图

1. 掌握plot()函数绘制线形图的基本方法;
8. 了解matplotlib库的颜色设置方法;
9. 了解matplotlib库的线型设置方法;
10. 了解matplotlib库中点的形状设置方法;
11. 了解matplotlib库中的线宽设置方法.

1.2.2. 其他平面图形

1. 了解利用scatter()函数绘制散点图的方法;
12. 了解利用bar()函数绘制柱状图的方法;
13. 了解利用barh()函数绘制条形图的方法;
14. 了解利用pie()函数绘制饼图的方法;
15. 了解利用hist()函数绘制直方图的方法;
16. 了解利用boxplot()函数绘制箱线图的方法.

1.2.3. Matplotlib的自定义设置

1. 了解利用legend()函数进行图例设置的方法;
17. 了解利用grid()函数对图形设置网格的方法;
18. 掌握利用title()函数为图形设置标题的方法;
19. 掌握利用xlabel()与ylabel()添加x轴、y轴名称的方法;
20. 了解利用xlim()与ylim()函数指定坐标轴范围的方法;
21. 了解利用text()与annotate()函数为图形添加文本注解的方法.
22. 掌握利用subplot()函数创建子图对象的方法;
23. 了解matplotlib中的图形嵌套.

1.2.4. 绘制三维图形

1. 了解利用plot3D()函数绘制三维曲线图的方法;
24. 了解利用scatter()函数绘制三维散点图的方法;
25. 了解利用plot_surface()函数绘制三维曲面图的方法;
26. 了解利用contour()函数绘制等高线图的方法.

 

1.3. Pandas库的使用

1.3.1. Series数据结构

1. 了解Pandas中Series数据结构的基本特点;
27. 掌握Series的创建方法;
28. 掌握Series数组的索引与切片方法.

1.3.2. DataFrame数据结构

1. 了解Pandas中DataFrame数据结构的基本特点;
2. 掌握DataFrame的创建方法;
3. 掌握DataFrame的索引与切片方法;
4. 掌握DataFrame的head()、tail()函数查看数据的方法;
5. 了解DataFrame数据结构的ndim、shape、size、dtype等属性的含义及使用;
6. 了解del、append()、drop()、reindex()、rename()等DataFrame操作函数的使用.

1.3.3. 利用Pandas读取外部数据

1. 掌握利用read_csv()函数读取csv格式数据;
7. 掌握利用to_csv()函数将DataFrame数据保存到csv文件;
8. 掌握利用read_excel()函数读取excel数据;
9. 掌握利用to_excel()函数将DataFrame数据保存到Excel文件;
10. 了解利用read_sql()函数读取SQL数据库数据的方法;
11. 了解利用to_sql()函数将DataFrame数据保存至SQL数据库的方法.

1.3.4. Pandas数据的运算

1. 掌握Series与DataFrame数据结构基本的算术运算规则;
12. 了解apply()、pipe()、map()、applymap()等函数的作用及其操作;
13. 了解sort_index()函数的按标签排序方法;
14. 了解sort_values()函数的按值排序方法;
15. 了解unique()函数及value_counts()函数的功能及使用.

1.3.5. Pandas统计函数

1. 了解Pandas中的count()、sum()、mean()、median()、mode()、std()、min()、max()、describe()等基本统计函数的使用;
16. 掌握利用cov()函数计算两个Series或DataFrame之间协方差的方法;
17. 掌握利用corr()函数计算两个Series或DataFrame之间相关系数的方法;
18. 了解利用rank()函数对数据进行排序的方法;
19. 了解利用groupby()函数对数据进行分组统计的方法;
20. 了解聚合函数agg()、apply()及Transform()的使用;
21. 了解利用filter()函数过滤数据的方法;
22. 了解利用pivot_table()生成数据透视表的方法;
23. 了解利用crosstab()函数生成物数据交叉表的方法.
24. Python数据预处理

1.3.6. 处理重复值

1. 掌握利用duplicated()函数检测重复值的方法;
25. 掌握利用drop_duplicated()函数去除重复值的方法.

1.3.7. 处理缺失值

1. 掌握利用isnull()或notnull()函数检测缺失值的方法;
26. 掌握利用dropna()函数删除缺失值的方法;
27. 了解利用replace()方法替换缺失值NaN的方法;
28. 了解利用fillna()函数填充缺失值NaN的方法.

1.3.8. 处理异常值

1. 了解利用绘制箱线图或散点图等方法发现异常值的方法;
29. 了解删除、平均值修正等处理异常值的方法.

1.3.9. 数据的合并与变换

1. 了解利用merge()函数合并DataFrame的方法;
30. 了解利用join()函数合并数据的方法;
31. 了解利用concat()函数合并数据的方法;
32. 了解利用get_dummies()函数将类别型变量转换为哑变量的方法;
33. 了解利用cut()函数将连续属性等宽离散化的方法;
34. 了解利用qcut()函数将连续属性等频离散化的方法.

1.3.10. 时间序列数据的处理与变换

1. 了解利用Pandas的Timestamp对象获取当前时间的方法;
35. 了解Timestamp对象下的tz_localize()及tz_convert()进行时间和时区转换的方法;
36. 了解利用Pandas的Period对象获取时间段的方法;
37. 了解Pandas的Timedelta对象表示时间间隔的属性;
38. 了解Pandas中DatetimeIndex对象的shift()、normalize()函数对时间变量的变换和处理.

以上是关于数据分析大赛考纲:Python数据分析应会部分的主要内容,如果未能解决你的问题,请参考以下文章

MySQL必知应会-第19章-插入数据

MySQL必知应会-第15章-联结表

MySQL必知应会-第6章-过滤数据

MySQL必知应会-第13章-分组数据

MySQL必知应会-第5章-排序检索数据

MySQL必知应会-第12章-汇总数据