[IT技术] 机器学习需要哪些基础?

[复制链接]
阿强123 发表于 2023-10-4 20:04:18|来自:北京 | 显示全部楼层 |阅读模式
大专生具备什么基础才能开始学机器学习这一门知识 纯爱好学
全部回复5 显示全部楼层
diyaxu88 发表于 2023-10-4 20:05:10|来自:北京 | 显示全部楼层
不多说直接上干货,这些书籍和视频是很好的入门基础资料,希望有所帮助:
1.书籍


  • 2012-《统计学习方法》第一版-李航.pdf
  • 2014-机器学习个人笔记完整版v4-中文斯坦福大学.41.pdf
  • 2015-《机器学习》-西瓜书中文-周志华.pdf
  • 2015-《机器学习算法原理与编程实践》-中文-邓捷.pdf
  • 2018-《MachineLearningYearning-Draft》机器学习训练秘籍-中文-吴恩达.pdf
  • 2018-《MachineLearningYearning-Draft》机器学习训练秘籍-英文-吴恩达.pdf
  • 2019-《统计学习方法》第二版-李航.pdf
电子书的路径:Deeplearning-Machinelearning-Algorithm-books


《统计学习方法》可以说是机器学习的入门宝典,许多机器学习培训班、互联网企业的面试、笔试题目,很多都参考这本书。
啃书视频:李航《统计学习方法》啃书指导
《机器学习》(西瓜书)周志华老师的这本书是机器学习领域的经典入门教材之一,周老师为了使尽可能多的读者通过西瓜书对机器学习有所了解, 所以在书中对部分公式的推导细节没有详述。
啃书视频:深度学习“花书”啃书指导视频!独家讲解+笔记
《Machine Learning Yearning》是吴恩达历时两年,根据自己多年实践经验整理出来的一本机器学习、深度学习实践经验宝典。作为一本 AI 实战圣经,本书主要教你如何在实践中使机器学习算法的实战经验。
相关的视频:【机器学习】吴恩达教授机器学习最新课程CS229
2.视频

台湾大学》李宏毅老师的机器学习课程,非常的好,也是众多学习ML,DL的一些必备课程,视频非常多。可以看一下老师的课程主页,对应的slide和作业都在上面公开了。机器学习和深度学习都有。
课程视频:李宏毅2020机器学习深度学习(完整版)国语
学习笔记:李宏毅机器学习笔记
《清华大学》袁春老师的《大数据机器学习》课程是面向信息学科的高年级本科生或研究生开设的基础理论课,目的是培养学生深入理解大数据机器学习理论基础,牢固掌握大数据机器学习方法,并能够解决实际问题等综合能力。
课程视频:【THU深圳研究院】大数据机器学习 (袁老师)
台湾大学》林轩田老师曾在coursera上开设了两门机器学习经典课程:《机器学习基石》和《机器学习技法》。《机器学习基石》课程由浅入深、内容全面,基本涵盖了机器学习领域的很多方面。其作为机器学习的入门和进阶资料非常适合。
课程视频:(附课件代码)林轩田公认最好的【机器学习基石+技法】教程,全130集
学习笔记:https://github.com/RedstoneWill/HsuanTienLin_MachineLearning
《斯坦福大学》李飞飞老师拥有众多头衔,毫无疑问是Ai领域的大牛。她在斯坦福开设的机器视觉课程 CS231n 一直以来都是王牌课程,惠及数十万的人工智能爱好者。
课程视频:【公开课】最新斯坦福李飞飞cs231n计算机视觉课程【附中文字幕
学习笔记:李飞飞 CS231n 最全学霸笔记精炼版来了
《斯坦福大学》吴恩达老师的机器学习课程,可以说是机器学习入门的第一课和最热门课程,也是比较基础的课程。
课程视频:[中英字幕]吴恩达机器学习系列课程,machine-learning
学习笔记:Coursera-ML-AndrewNg-Notes

不要一下子吃太多,慢慢消化。
关于基础的话,理工科相关专业,有一定的数学基础和代码能力,勤动手,多思考。
3.社区交流&学习平台


  • 极市开发者平台-计算机视觉算法开发落地平台-极市科技
  • 开源专区 - OSCHINA - 中文开源技术交流社区
  • 百度AI开发者社区
  • 开源项目 - 飞桨AI Studio星河社区-人工智能学习与实训社区
  • 阿里云开发者社区
  • Hugging Face – The AI community building the future.
  • Papers with Code - The latest in Machine Learning
  • AI研习社 - 研习AI产学研新知,助力AI学术开发者成长
  • Machine Learning & Data Science Forum Discussions | Kaggle
学习的过程中避免不了有很多疑问可以去这些社区和一些同行进行交流
也可以关注 @FUNNY AI 我也会定期分享一些算法相关的资料及Ai工具
shzlq 发表于 2023-10-4 20:05:57|来自:北京 | 显示全部楼层
本文主要收集作者在学习《机器学习》过程中读过的一些好文章,用作记录,也是一些非常好的学习材料供大家使用。
本文章将持续更新,欢迎收藏~
<hr/>【机器学习基础】熵、KL散度、交叉熵 - wuliytTaotao - 博客园
hyq6 发表于 2023-10-4 20:06:41|来自:北京 | 显示全部楼层
Notes的集合在这里,大家自取:

机器学习Cheat Sheet
<hr/>抛开吴恩达不谈,那可能其他的姿势可能就不怎么灵,咳咳。。。
正经的,还是给想要入门机器学习的同学推荐一下学习的路径吧。

总的来说,
第一步:基础的线性代数、微积分、概率论的知识:

划重点:
线性代数:
掌握矩阵的相乘、转置、矩阵的逆,



掌握向量的模长计算
掌握掌握计算矩阵的特征值和特征向量,以及矩阵分解



微积分:
掌握矩阵的求偏导


概率论:
组合学
条件概率(贝叶斯法则)
独立事件的理解
PDF 和 CDF
期望和方差


协方差矩阵
相关性矩阵
分布概型
中心极限定理



第二步:有监督类机器学习

Discriminative Model VS Generative Model
损失函数
梯度下降
似然


线性回归
支持向量机模型
树模型与集成算法
Learning Theory






第三步:无监督类机器学习


最大似然
K-Means算法
递归聚类



主要元素分析
独立元素分析



第四步:深度神经网络

神经网络
激活函数
反向传播



卷积神经网络
循环神经网络
强化学习


第五步:掌握“调参”等模型优化技巧

模型选择
交叉验证
正则化
Bias 和 Variance 的trade-off
过拟合和次拟合的诊断



第六步:掌握机器学习的任务指标

混淆矩阵
分类任务:Accuracy、Precision、Recall、F1 Score、ROC、AUC等指标
回归任务:MSE



<hr/>广告时间:

我目前在微软担任主力面试官,也是目前我们部门的算法面试出题人,同时也向技术社区输出了不少改编题,也通过组织求职群帮在过去的五年中帮助了三千多位同学成功进入FLAG等顶尖科技公司。






关于我们的干货分享群:大家可以加助教Andy的微信进群:MSBZ1019,也可以加我的个人微信:MSFT_Justin




在我们群里吸收干货的同学,即便是在Hiring Freeze的去年和大裁员的今年,也有不少上岸了大厂。我们的求职群帮在过去的五年中帮助了三千多位同学成功进入FLAG等顶尖科技公司。更多内容可以访问我们大牛学院的网站:


大牛学院


关于我们的课程和项目指导:
关于职业规划四节课


老贾:关于职业规划四节课
关于算法突击班与算法面试的常见问题

老贾:关于算法突击班与算法面试的常见问题

北美求职Timeline以及保offer项目介绍


老贾:北美求职Timeline以及保offer项目介绍





夏天的小夜曲 发表于 2023-10-4 20:07:15|来自:北京 | 显示全部楼层
现在无论是计算机专业还是其他的实体行业(机械、制造等等)对于人工智能的需求都还是蛮大的。所以现在也有很多人想入门人工智能,或者转行人工智能。其实人工智能是一个很大的方向,现在提到的人工智能基本上都默认以深度学习为主导的方法,但其实人工智能和深度学习的关系是:深度学习是机器学习的一个子集,机器学习是人工智能的一个子集。
那么现在深度学习这么火,答主就简单的出深度学习的角度来回答一下这个问题。
其实对于深度学习这个日新月异,每年爆发式更新模型的方向来说,学习路线的最尽头肯定是阅读你这个方向最新的论文,无论是科研人员还是已经走上工作岗位打算转行的打工人。阅读论文的来源一般是各种顶会(CVPR、ECCV、ICCV)、顶刊(TPAMI)。如果你嫌麻烦可以直接去谷歌学术或者 arXiv 上搜索你关注的内容,在搜索的时候最好把时间设定在最近几年。
说完学习路线的尽头,我们来看看入门的一些要求。对于入门深学习而言,你是必须掌握 Python 这门语言的,主要的原因是很多模型开源的代码都是基于 Python 实现的,而且目前针对深度学习的两个主流框架 pytorch 和 TensorFlow 都是支持 Python 开发的,也就是说深度学习的生态很大一部分是依赖 Python 的。所以说学习和掌握 Python 是入门深度学习必须的步骤,如果你不会也不用担心,入门 Python 还是非常简单的,目前知乎推出了一个基于 Python 的数据开发课程,如果你感兴趣的话可以购买学习一下,现在也不是很贵才一毛钱,以后可能就不好说了,所以直接买就完事了,也算是薅羊毛了。
好当你掌握了 Python,那么下一步就是去学习一些基础的数学知识了,因为如果一点数学知识都不知道的话后面论文中的公式你可能都看不懂,更不用提推导复现模型了。但你也没必要害怕,主要的就是基本的线性代数知识,也就是本科大一下学期学的,以及一些高等数学中的微积分知识。因为深度学习说的通俗一点就是大量的线代中矩阵运算和微积分中偏微分用于梯度下降。


当你掌握 Python 编程和基本的线代知识以及微积分以后,你现在就可以去看看最基本的深度学习网络模型了。虽然说现在深度学习日新月异,但是目前的很多新模型都是基于这些基础模型上进一步创新和跨领域应用的。这些基本的模型不仅能带你理解深度学习,也能帮你打下坚实的基础,这对于你后面去理解新模型和创新是非常重要的
下面就从计算机视觉(二维图片处理、三维点云数据处理)、自然语言处理列举几个最基本的模型。
深度学习网络基础知识:正向传播、梯度下降、反向传播、常见的几个 LOSS 函数(损失函数)
开山鼻祖:FCN 网络(全连接神经网络)


计算机视觉(2D 图片任务):
1.CNN(这个就不过多介绍了,已经是如雷贯耳了)
2.FCN(膨胀卷积,是分割任务中祖师爷般的存在)
3.RCNN 系列(目标检测任务霸主,现在很多下游任务还是会把 faster rcnn 当做骨干网络)
计算机视觉(3D 视觉点云或者体素任务):
1.PointNet/PointNet++(在三维视觉中基于点数据流派的开山之作)
2.VoteNet(何凯明在三维目标检测的力作)
自然语言处理方向:
    RNN(这个模型年纪虽然可能比你都大(1982 年)但这并不影响他在 NLP 领域的影响力)LSTM(1997 年,是对 RNN 的一个改进版本)transform(这个不多说,现在真的是 transform 及其子孙模型大行其道的时代,光在自然语言领域卷还不够,现在都跑到计算机视觉领域来卷了)
当你读完上面论文,你就可以去专门的看你自己方向的论文了,希望这篇回答对你有所帮助。
原文作者:数学建模钉子户
使用 App 查看完整内容目前,该付费内容的完整版仅支持在 App 中查看
<a href="http://oia.zhihu.com/answer/2831099208/" class="internal" style="color: #0084FF;text-decoration:none;border-bottom:none;">🔗App 内查看
linkwan 发表于 2023-10-4 20:07:23|来自:北京 | 显示全部楼层
我就是纯兴趣学的机器学习和深度学习等人工智能知识。
如果只是做简单的程序的话,python,R语言学好,然后深入到机器学习就可以。
如果想更深层次的学习的话,需要数学和统计学基础。数学中主要是微积分和行列式的理解。再就是统计学会被用到很多地方。
下面的链接,是我整理出来的,机器学习的基础和需要的数学和统计学的知识,可以参考一下。

机器学习的超级入门篇
机器学习(人工智能)中所需要的最主要的数学知识整理

快速回帖

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则