数据分析可视化利器:python pandas-profiling 一行代码EDA 探索性数据分析
Posted shiter
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据分析可视化利器:python pandas-profiling 一行代码EDA 探索性数据分析相关的知识,希望对你有一定的参考价值。
文章大纲
1. 探索性数据分析
数据的筛选、重组、结构化、预处理等都属于探索性数据分析的范畴,探索性数据分析是帮助数据分析师掌握数据结构的重要工具,也是奠定后续工作的成功基石。
在数据的分析项目中,数据的收集和预处理往往占据整个项目工作量的十之八九,正式这些简单的工作决定了整个项目的成败。
在数据分析进行之前,了解原始数据的分布,缺失值情况,数据的相关性等非常重要,今天介绍的python 库就可以非常便利而且炫酷的解决这个问题。
Generates profile reports from a pandas DataFrame. The pandas df.describe() function is great but a little basic for serious exploratory data analysis. pandas_profiling extends the pandas DataFrame with df.profile_report() for quick data analysis.
For each column the following statistics - if relevant for the column type - are presented in an interactive html report:
Essentials: type, unique values
以上是关于数据分析可视化利器:python pandas-profiling 一行代码EDA 探索性数据分析的主要内容,如果未能解决你的问题,请参考以下文章
数据分析可视化利器:python pandas-profiling 一行代码EDA 探索性数据分析