无论是数分还是建模,都离不开探索性数据分析(EDA),但是探索性数据分析非常耗时耗力,那我们可以借助第三方包来更高效地实现。本文就简单介绍下 Python自动化探索性数据分析 的2个常用的第三方包:pandas-profilingsweetviz

1. 安装:2个包的安装可能会比较麻烦,如果安装过程中遇到问题,就在网上多查查,如果解决不了,可以给我评论留言。
2. 使用:2个包的使用和呈现结果可以阅读这个Jupyter Notebook——利用Python进行探索性数据分析SWEETVIZ_REPORT
3. 总结:能够看出来2个包的功能还是很强大的,自动生成的EDA报告中既有单变量分析,也有相关性分析,同时还有可视化图表,能够显著提升我们探索性数据分析的效率。


原创文章,转载请务必注明出处并留下原文链接。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注