这些都不是一个东西呢,但是如果你是想学数据分析的话,可以参考这个学习路线学习
数据分析分为以下几个阶段:
阶段一:业务数据分析
Excel
Excel基本操作, Excel公式, Excel函数:常用函数、统计函数、文本函数、日期和时间函数等, Excel图表和使用技巧介绍,Excel数据透视表,Excel零售数据分析案例
SQL
MySQL数据库基本使用,SQL库操作,SQL表操作,SQL数据操作,索引,事物,SQL案例练习
BI可视化
Tableau公司和产品介绍,使用Tableau连接多源数据:本地和数据库,Tableau可视化界面介绍 初级图表制作:条形图、折线图、饼图、文字云、散点图、地图、树形图、气泡图、图表组合 图表制作:子弹图、环形图、瀑布图、Bump Chart、Table Formatting 使用Tableau制作仪表板与故事、数据分析报告PPT等制作技巧
市场价值 : 具备初级数据分析师,数据运营等岗位用人需求。
阶段二:爬虫和数据可视化
Python基础
Python基础语法, 条件控制语句和循环语句, 容器类型,函数,文件操作,面向对象,异常处理,模块和包
爬虫
HTML、css、js入门,爬虫的基本原理,发送请求和网页抓取,数据解析-Xpath,selenium动态渲染页面抓取,pymysql/pymongo保存数据,豆瓣电影爬虫案例,新闻爬虫案例
可视化工程常用库
数据可视化概述,数据可视化设计基础,canvas、svg绘图,echarts、D3.js等开源可视化组件详解
Flask框架
Flask基础,Flask 视图和路由,Flask 模板的基本使用,Flask ORM
阶段综合项目:娱乐数据可视化大屏项目
爬虫、echarts、DataV、D3.js、Flask融会贯通
市场价值 : 爬虫和数据可视化是数据分析中的重要技能,掌握后可胜任初中级数据分析师/可视化工程师的工作。
阶段三:机器学习建模分析
数学和统计学基础
统计学基础、数学基础、检验分析、降维分析
Python科学计算和可视化库
科学计算库:Pandas、Numpy, 可视化库:Matplotlib、Seaborn, 应用市场探索性数据分析
机器学习常用算法
Sklearn、Knn、Kmeans、线性回归、逻辑回归,集成学习、XGBoost、LightGBM 算法案例:智能用户运营(RFM分群,流失用户预警)
阶段综合项目:金融风控项目
金融风控与反欺诈业务知识,特征工程,逻辑回归评分卡,集成学习评分卡,模型评估与优化,平衡学习与迁移学习,金融风控大赛Top 实现方案详解
阶段四:大数据挖掘
Hadoop、Hive、数据仓库
Hadoop,HDFS,YARN,MapReduce,Hive基本原理,Hive的组件,HQL基本操作,Hive分区和分桶
Spark分布式计算框架和用户画像
Spark-Core,Spark-SQL,Spark-Streaming
以上就可以完全满足你的日常所需 |