实战数据分析: 开源的自动化数据探索神器 Rath
引子
探索性数据分析(Exploratory Data Analysis,EDA)是数据分析师或数据科学家面对数据集(Dataset)时经常需要完成的任务。利用 Pandas、Seaborn 之类的 Python 工具可以很轻松的完成单变量分析(Univariate Analysis)、双变量分析(Bi-variate Analysis)、多变量分析(Multi-variate Analysis),但使用这些它们做数据探索不仅有一定技术门槛,而且还需要人工编写脚本来进行数据操作和分析。本篇文章将介绍一个非常酷的自动化数据探索开源工具 Rath,可以自动化的完成 EDA,成为数据分析界的 Autopilot 或 Copilot。
安装 Rath
由于 Rath 还在高速迭代中,文档也不是很齐全,要较快的体验只能到官网提供的演示网址。
不过,如果会一些前端技术的话,还是可以本地安装,只是步骤稍微繁琐一些。
在开始之前,保证你安装了 Node.js 16 以及 Yarn。