先声明一下本人是python党!!!!!!
个人觉得好用的数据挖掘分析、数据可视化软件:python + jupyter notebook + scrapy + numpy + scipy + pandas + matplotlib, seaborn + scikit-learn
作为一名数据爱好者,Python能在相对比较短的时间内较快的实现自己的想法。Python的库非常的多那样就不需要重复造轮子了,我在jupyter-notebook上敲代码,用scrapy爬取数据(目前还不怎么熟练,以前用Python的requests搭配bs4使用爬取数据),用pandas进行数据清洗规整,用scikit-learn进行机器学习算法分析,用matplotlib,seaborn进行数据可视化。而这些库在ipython-notebook上都是浑然天成,自成一体。
(这些库的安装可以google,当然也可以问我嘻嘻)
数据可视化库seaborn是建立在matplotlib之上的,更精简、方便,下面以图片的方式简要的介绍seaborn库到底能画什么样的图形(多图,多图, 多图)
拟合两个变量之间的线性回归直线
第一种方式的变形
分析四个变量两两之间的关系
对颜色和图例风格进行调整
以上所有的图形只需要一行代码就能够画出来! |