[编程开发] python、数据分析、编程都是啥?

[复制链接]
tzjj 发表于 2023-10-4 18:59:41|来自:北京 | 显示全部楼层 |阅读模式
各位大神大牛们 请问人工智能、编程、数据分析和python是一个东西吗? 本人想学数据分析(*☻-☻*)商科要用的那种 相关知识希望帮助拓展(大数据、人工智能相关的话题)
全部回复5 显示全部楼层
scrollll 发表于 2023-10-4 19:00:38|来自:北京 | 显示全部楼层
都是卖课的营销号
muziyi0208 发表于 2023-10-4 19:01:26|来自:北京 | 显示全部楼层
这个我懂,我自己是计算机专业的博士生,也教过计算机零基础的本科生,在这个回答里,我尽量用0背景的人也能看得懂的表述。
比如你有一块地,它有很多种类的农活,比如松土、施肥或者播种。比如我们现在需要播种,那么就需要选择播种的工具是大型机械,小型机械还是人工,其次还得制定一个播种的策略,是先一字长蛇阵还是八面玲珑阵。
那么这就对应了数据分析(其中的一种农活),Python(播种的一种工具),编程(播种的一种策略)
如果再详细一点儿的话,那么这三个部分其实都可以被同类内容替换掉。
数据分析(农活)
农活的种类有很多,就跟数据分析只是一个方向而已。比如说人工智能,机器人,软件研发等等。只不过这次的农活我们选的就是数据分析,那么为了做数据分析这个农活,肯定就得针对性的准备需要的工具和策略,而对于Python来说,它是一个非常适合做数据分析的工具。


Python(工具)
在这里,Python就像是你用来播种的一种“工具”。你可以选择使用大型机械、小型机械或人工来播种。Python在这里就是一种编程语言,而可以办到一样事情的语言有很多,比如C++,Java,R等等。这里选择Python是因为它用来做数据分析(播种)很方便,并不代表着只有Python可以做这件事。R语言也是数据分析的一个选项,它跟Python在数据分析方面其实各有千秋,只不过对于大多数人的入门难度来看,Python要简单一点儿。
编程(策略)
最后,编程就像是你制定的“播种策略”。根据数据分析的结果,你可能会决定采用一字长蛇阵还是八面玲珑阵的播种模式。编程就是实现这个决策的具体步骤。你会编写一段代码,指定机械如何移动、何时播种、以及如何优化这一过程以达到最佳效果。
其实这一段就是数据分析的思维,比如给你一块地,你得分析下它的土质如何,适合什么样的农作物。跟数据处理是一样的,比如你拿到数据,你得先看看这个数据质量怎么样,有没有空值,适合什么样的可视化方法等等。
这其实都是有讲究的,有些数据是按时间序列收集的,那么它的时间这个属性就显得非常重要,那么在可视化的时候,曲线图就非常的合适,这样可以很直观的显示时间尺度上的变化。


其实对于数据分析来说,python就是一个备选的编程语言,别的语言也可以做。最重要的其实「数据分析思想」。
其实这也可以用「种地」来解释,因为对于一块地,有经验的人可以手把手告诉你这一块适合种什么,怎么种。
你可以在这块地上种的很好,每年都有好的收成。
但如果给你换一块地呢,甚至说让你种完全不一定的农作物,这时候考验的是你的思考能力。
换到数据分析也一样,你回碰到各种各样的数据,以及连带的各种各样不同的需求,它需要你灵活的转变自己的思路,因为数据分析最后是要出一个结果的,而这个结果要为你的目的服务。
如果大家对于上述几个概念还是很模糊,这里我非常建议大家跟着系统的课程来进行理解,比如知乎知学堂旗下研职在线数据分析课程,它的好处就是会带你过一遍这些基础的知识,让你对数据分析有一个基本的了解,然后你才可以去系统的,科学的进行数据分析。
这个课程还会通过一些案例来教你怎么做分析, 这对于任何行业的人来说都是很有帮助的,毕竟现在是一个大数据的时代,数据无时无刻不在产生,掌握这项技能对于未来的发展无疑是非常有帮助的。
接着我们继续说,总的来说,数据分析就可以分为两部分:数据和分析。


数据部分

对于数据来说,包括了数据收集、数据清洗&整理和数据存储三个关键的步骤;分析也是三个关键步骤:探索性的数据分析(也可以叫统计数据分析)、深入分析和结果解释&呈现。


数据部分也分为几个子部分,具体来分析每个部分:
数据收集

来源

这是从哪里找到数据的问题。可能是从图书馆的书里,或者是从互联网上,甚至是通过做调查问卷收集的。比如可以用python写的爬虫,从网络上自动的爬取数据。


工具与技术

现在的科技让我们更容易收集数据。比如,有一些自动化工具,可以从网上快速抓取信息。
伦理与合规

收集数据的时候,要确保不侵犯别人的隐私,遵守法律规定,不能随便抓取和使用别人的个人信息。
数据清洗与整理

数据质量检查

想象一下,如果你得到的数据里有很多重复的信息,或者有些信息是错的,这会影响你的分析结果。所以要先检查并清理这些数据。
数据转换

有时候,收集到的数据并不是立刻可以用的。可能需要改变它的形式或者单位,让它适合分析。
特征工程

这一步是从收集到的数据中找出对你的分析最有用的部分。这就像是从一堆杂乱的信息中,挑出最重要的部分。
数据存储

数据库管理

收集到的数据要储存在一个安全的地方,方便以后使用。常见的存储方式有用电脑的数据库软件,像SQL、NoSQL等。
数据安全

保护数据的安全就像保护自己的钱包一样重要。要确保别人不能随便访问或者篡改你的数据。
对于数据部分来说,占比最大的环节是数据的清洗与整理,因为对于数据的收集和存储来说,基本上都是自动爬虫或者从数据库中获取或者直接调用接口进行操作,前者对于数据质量的要求不是那么高,后者处理的数据已经是很标准的数据了,所以很简单。
而清洗和整理这一步反而是最麻烦的,因为这一步包含了很多繁琐但必要的步骤,比如说你要去掉重复的数据,错误的数据以及缺失的数据。
对于缺失的数据还得分不同情况进行讨论,比如有些缺失的数据直接删掉完事,但有些数据不能删,你只能通过统计的方法或者其他的方法进行补足。
网上有些分析了数据分析花费的时间占比,可以看到清洗和整理数据占了最大的一部分,高达60%,一般多的时候都花在了清洗数据。


数据清洗和整理虽然繁琐,但在整个数据分析过程中起着关键作用。作为占据最大部分的环节,它对整个分析过程的质量和效率有着决定性的影响。有了正确清洗和整理的数据,分析师可以准确地揭示数据背后的洞察,从而为决策提供有力的支持。因此,即使这一阶段耗时较长,投入的时间和努力都是非常值得的。
在掌握了基本的理论后,最应该做的就是通过系统的带有实践的课程进行整体的把握,还是刚刚提到的知乎知学堂开设的数据分析课程,非常建议去了解一下。
<a data-draft-node="block" data-draft-type="edu-card" data-edu-card-id="1682090941387788288">分析部分

分析步骤的主要原料来自于数据部分,只有数据部分的处理的好,分析的速度、准确度以及价值才会高。
在这部分,基本上是由浅入深的顺序,首先是简单的探索性数据分析,也可以称之为描述性数据分析,主要就是计算一下平均数,中位数,最大值最小值这些耳熟能详的统计数值,以及一些简单的可视化,如果是时间序列的话,还会做一些趋势分析,看一下滑动平均数之类的;
进一步分析会用到机器学习和统计学的知识,比如机器学习建模来进行分析预测,或者是统计学习的假设检验等等。
最后一步就是结果输出了,在商业分析中,一般叫decision-making,也就是负责输出商业决策或者为商业决策提供数据分析结果支持。


具体分析每一个步骤的话,
探索性数据分析(EDA)

在商业环境中,我们经常要研究和理解数据。探索性数据分析就是一种让我们更好地了解数据特点的方法。
统计描述

这部分就像是给数据做一个体检。计算像平均值、中位数(所有数据中间的那个数字)、标准差(数据间的波动程度)等,可以让我们快速了解数据的“健康状况”。


数据可视化

有时候,一张图胜过千言万语。通过图表,我们可以直观地看到数据的分布、变化趋势或者不同数据之间的关系。


初步观察

这里我们要当个侦探,寻找数据中可能的趋势和异常值,看看是否有什么不寻常或者特别有趣的地方。
深入分析

深入分析就像挖掘宝藏,有时候可能需要挖得更深才能发现真正有价值的信息。
建模与预测

通过建立一些模型,我们可以预测未来可能的趋势。就像气象预报一样,虽然不一定完全准确,但大致方向通常是对的。
假设检验

这部分可以看作是我们对某个观点的验证。例如,我们可能想验证新的销售策略是否真的提高了销售额。
模式识别

这是寻找数据中隐藏的模式和关联。就像找到不同商品之间的购买关联,以便进行更好的产品推荐。
结果解释与呈现

这一部分是将我们的发现和分析转化为实际可用的信息。
数据故事

人们喜欢故事,将分析结果构建成一个引人入胜的故事,可以让复杂的数据更容易被理解。
报告编写

报告是商业中常用的沟通方式,通过专业报告,我们可以与同事、上级甚至客户分享我们的分析结果。
商业战略

最终目的是将这些分析结果用于商业决策,帮助公司制定更好的战略和计划。
所以总的来说,数据分析的工作内容就是数据和分析,两个部分相辅相成,对于一个数据分析项目,这些基本上都是必须项。
zhang1694 发表于 2023-10-4 19:01:35|来自:北京 | 显示全部楼层
这些都不是一个东西呢,但是如果你是想学数据分析的话,可以参考这个学习路线学习
数据分析分为以下几个阶段:


阶段一:业务数据分析


Excel

Excel基本操作, Excel公式, Excel函数:常用函数、统计函数、文本函数、日期和时间函数等, Excel图表和使用技巧介绍,Excel数据透视表,Excel零售数据分析案例
SQL

MySQL数据库基本使用,SQL库操作,SQL表操作,SQL数据操作,索引,事物,SQL案例练习
BI可视化

Tableau公司和产品介绍,使用Tableau连接多源数据:本地和数据库,Tableau可视化界面介绍 初级图表制作:条形图、折线图、饼图、文字云、散点图、地图、树形图、气泡图、图表组合 图表制作:子弹图、环形图、瀑布图、Bump Chart、Table Formatting 使用Tableau制作仪表板与故事、数据分析报告PPT等制作技巧

市场价值 : 具备初级数据分析师,数据运营等岗位用人需求。


阶段二:爬虫和数据可视化



Python基础

Python基础语法, 条件控制语句和循环语句, 容器类型,函数,文件操作,面向对象,异常处理,模块和包
爬虫

HTML、css、js入门,爬虫的基本原理,发送请求和网页抓取,数据解析-Xpath,selenium动态渲染页面抓取,pymysql/pymongo保存数据,豆瓣电影爬虫案例,新闻爬虫案例
可视化工程常用库

数据可视化概述,数据可视化设计基础,canvas、svg绘图,echarts、D3.js等开源可视化组件详解
Flask框架

Flask基础,Flask 视图和路由,Flask 模板的基本使用,Flask ORM
阶段综合项目:娱乐数据可视化大屏项目

爬虫、echarts、DataV、D3.js、Flask融会贯通

市场价值 : 爬虫和数据可视化是数据分析中的重要技能,掌握后可胜任初中级数据分析师/可视化工程师的工作。


阶段三:机器学习建模分析



数学和统计学基础

统计学基础、数学基础、检验分析、降维分析
Python科学计算和可视化库

科学计算库:Pandas、Numpy, 可视化库:Matplotlib、Seaborn, 应用市场探索性数据分析

机器学习常用算法

Sklearn、Knn、Kmeans、线性回归、逻辑回归,集成学习、XGBoost、LightGBM 算法案例:智能用户运营(RFM分群,流失用户预警)
阶段综合项目:金融风控项目

金融风控与反欺诈业务知识,特征工程,逻辑回归评分卡,集成学习评分卡,模型评估与优化,平衡学习与迁移学习,金融风控大赛Top 实现方案详解
阶段四:大数据挖掘


Hadoop、Hive、数据仓库

Hadoop,HDFS,YARN,MapReduce,Hive基本原理,Hive的组件,HQL基本操作,Hive分区和分桶

Spark分布式计算框架和用户画像

Spark-Core,Spark-SQL,Spark-Streaming
以上就可以完全满足你的日常所需
he59195 发表于 2023-10-4 19:02:33|来自:北京 | 显示全部楼层
Python是一种高级编程语言,具有简洁、易读、易学习等特点,被广泛应用于各种领域的开发。Python的应用范围非常广泛,包括但不限于:Web开发、数据科学、机器学习、人工智能、自动化测试、游戏开发等。
数据分析是指利用各种统计学和计算机技术,对大量数据进行收集、处理、分析和展示,从而得出有用的信息和结论。数据分析常常被用于市场调研、商业分析、社会科学研究等领域。
编程是指使用计算机语言编写程序的过程,编程语言可以是Python、C、Java、JavaScript等等。编程可以帮助我们实现各种自动化任务,从简单的批量处理数据到复杂的机器学习算法实现。
一、想要学习数据分析,需要掌握


  • 数据采集和清洗:学习如何从不同的数据源获取数据,并对数据进行清洗和转换,以便进行分析。



数分析流程


  • 数据分析方法和工具:了解常见的数据分析方法和工具,如统计分析、可视化、机器学习、Python编程等。例如,可以学习一些数据分析工具和库,如Pandas、Numpy、Scikit-learn、Matplotlib、Seaborn等。
  • 商业理解和沟通技能:了解商业模式、市场趋势、商业战略等商业知识,以便将数据分析结果转化为商业洞察和行动计划。此外,也需要具备良好的沟通技能,能够将数据分析结果和商业洞察以简单明了的方式传达。
  • 数据安全和隐私保护:了解数据隐私和安全的重要性,以及如何保护敏感数据。
  • 实践经验:通过实践项目或者参与实际商业数据分析工作,将所学知识应用到实际场景中,提升实践经验。
二、Python大数据学习路线


  • 开发入门:Linux入门 → MySQL数据库
  • 核心基础: Hadoop
  • 数仓技术: Hive数仓项目
  • PB内存计算: Python入门 → Python进阶→ pyspark框架 → Hive+Spark项目
黑马程序员Python:2023年Python+大数据学习路线图

三、数据分析和人工智能的联系

数据分析是人工智能的重要应用之一:人工智能需要大量的数据作为基础,数据分析则可以提供数据的预处理和清洗、特征提取和选择等技术,为人工智能算法提供可靠的数据基础。
人工智能可以提高数据分析的效率和精度:人工智能算法可以自动化执行数据分析任务,包括数据挖掘、预测和分类等,从而提高数据分析的效率和精度。
数据分析可以支持人工智能的决策和优化:数据分析可以为人工智能算法提供数据支持,进而进行优化和决策。
数据分析和人工智能都需要数学和统计知识:数据分析和人工智能都需要数学和统计知识作为基础,如概率论、线性代数、统计推断等,这些知识对于理解和应用机器学习算法和数据分析技术非常重要。
——统计学

统计学是一种利用数学理论来进行数据分析的技术,通过统计学我们可以用更富有信息驱动力和针对性的方式对数据进行操作。
在数据分析工作中,利用统计学,我们可以更深入、更细致地观察数据是如何进行精确组织的,并且基于这种组织结构确定数据分析的方法,来获取更多的信息。
毫不夸张的说统计学是整个数据分析的灵魂。判别一个数据分析师强弱的一个重要方法就是,看他对统计规律的敏感度。
这里我们需要从基础的统计理论(描述性统计、区间估计、假设检验等)出发,到基本的统计分析(T 检验、方差分析等),最后到商业常用的模型(回归分析、方差分析等),学习数据分析背后的逻辑,掌握实用统计学的概念和会利用统计的思维去思考问题。
——机器学习

对于想要进阶成为高级数据分析师的朋友来说,就要掌握机器学习相关的知识:

  • 特征工程的基础:如何统计数据特征、选用不同的特征,做模型的优化;
  • 基本的分类算法:决策树、随机森林等;
  • 基本的聚类算法、数据挖掘、常见的机器学习算法的了解等等
机器学习相关的知识学习成本会比较高,对某些同学来说可能会有一定难度,但对于业务型数据分析师来说,一般不会要求你去推导算法公式,能做到明白不同算法的适用场景、优缺点、原理大概懂就基本可以了。
lovess217 发表于 2023-10-4 19:02:50|来自:北京 | 显示全部楼层
如果你用过Excel,就能看懂我的回答:
Python可以实现Excel处理表格的功能;
数据分析是从一堆数据表格中寻找规律;
人工智能是让计算机辅助甚至代替人类,完成上述所有工作。

快速回帖

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则