Python自动化探索性数据分析
无论是数分还是建模,都离不开探索性数据分析(EDA),但是探索性数据分析非常耗时耗力,那我们可以借助第三方包来更高效地实现。本文就简单介绍下 Python自动化探索性数据分析 的2个常用的第三方包:pandas-profiling 和 sweetviz 。
1. 安装:2个包的安装可能会比较麻烦,如果安装过程中遇到问题,就在网上多查查,如果解决不了,可以给我评论留言。
2. 使用:2个包的使用和呈现结果可以阅读这个Jupyter Notebook——利用Python进行探索性数据分析 和 SWEETVIZ_REPORT 。
3. 总结:能够看出来2个包的功能还是很强大的,自动生成的EDA报告中既有单变量分析,也有相关性分析,同时还有可视化图表,能够显著提升我们探索性数据分析的效率。
原创文章,转载请务必注明出处并留下原文链接。