数据科学:待学习的内容

Posted volcao

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据科学:待学习的内容相关的知识,希望对你有一定的参考价值。

  1. plt.subplots():将 plt.figure 创建的画板,分割成多个子图(clos——列、rows——行);
  2. plt.figure(figsize=(15,5)):创建一个图形实例,俗称话本,在这个画板上绘制几行几列的图;figsize 表示图形的(宽,高);
  3. figure、subplot 的使用,参考:https://blog.csdn.net/claroja/article/details/70841382
  4. pd.concat(df1, df2):连接两个DataFrame 数据集;
  5. df1.loc[[0, 2, 3], :]:删除数据 df1的第0、2、3 行;
  6. df1.loc[:, [0, 2, 3]]:删除数据 df1的第0、2、3 列;
  7. df2 = df1.reset_index():将 df1 的每行的引索(Id)保留,以列名做为新的 index,生成新的数据 df2;(一般默认以行做引索)
  8. df3 = df1.reset_index(drop=True):drp = True,删除 df1 的行引索,一列名作为新的 index,生成新的数据 df3;
  9. df1.dtypes(include=None, exclude=None):按类型查看数据 df1 中的其它数据;
  10. df1.dtypes[df1.dtypes == ‘object‘]:查看 df1 数据中,类型为 ‘object‘ 类型的数据;
  11. df1.index:返回数据 df1 的引索对象;
  12. df1.index.values:以 array 的形式返回 df1 的引索的值;(多用于获取所有的特征,也就是 df1 的所有列名)
  13. stats.probplot():
  14. DataFrame 中 sort_values():
  15. Seaborn 中的箱型图:
  16. 方差齐次验证:如何理解线性回归中的方差齐性
  17. 方差分析:统计学知识;参考百科自学
  18. scipy.stats 模块:
  19. f, p = scipy.stats.f_oneway(sample1, sample2, ...):单向方差分析,入参是分好组的多个 array;
  20. 单向方差分析:计算各组数据间的差异性,统计学知识,参考百科;
  21. df1.isnull():判断 df1 的数据是否为 np.NaN 类型;返回 bool 类型,是则为 True,不是返回 False;

 

以上是关于数据科学:待学习的内容的主要内容,如果未能解决你的问题,请参考以下文章

学习《深入浅出数据科学》高清中文PDF+英文PDF+源代码

数据科学与大数据

(数据科学学习手札47)基于Python的网络数据采集实战

云计算与数据科学:Microsoft Azure 机器学习与R 简介

计算机科学与技术专业主要学些啥 开设课程都有哪些

《数据科学家访谈录》读书笔记