[IT技术] 为什么机器学习大牛很少有数学专业,甚至应用数学专业的都少见?

[复制链接]
tylz2008 发表于 2023-10-4 20:02:47|来自:北京 | 显示全部楼层 |阅读模式
这是一个纯开放问题,希望听听大家根据各自从业、学习经历、站在不同角度谈谈各自的看法。所以请各位老师尽量简介一下自己的学习经历,从业历程。小马过河,听各位介绍水位时也可以知道各位是大象?还是狮子?:))))
关联问题推荐:从事机器学习不同层面的工作对数学的掌握分别要深入到什么程度?如何找边界?
     看了一下吴恩达,周志华,李飞飞的学历北京都是工科专业(偏计算机),不是数学,甚之不是应用数学专业背景。看了一下机器学习,神经网络都是以数学为基础的(当然实现是靠代码)。那么为什么少见数学专业背景的人成为这个领域的大牛呢?
       那么是不是具有深厚的数学知识,不足以让一个人在机器学习领域的研究具有优势。就如同“计算机科学”专业在算法也用到离散数学的知识。但是那只是数学大海中的一碗水。数学专业的主要是探索海洋的,用这碗水去做点什么并不一定比非数学专业的人更强。同理,物理,金融,各个专业都用到数学,但都是用一碗水。所以数学专业的人在这些专业也不具备优势。
      进一步说,哪些基础知识扎实的人更容易在人工智能领域取得成就呢?机器学习很多大牛都是偏计算机专业的应该也不是巧合吧。
<hr/>补充一下:不是说做机器学习的人数学不厉害,而是看跟谁比较。跟一般人比,数学厉害,不等于和搞纯数学或应用数学的人比也厉害。
全部回复5 显示全部楼层
空气的影子 发表于 2023-10-4 20:03:30|来自:北京 | 显示全部楼层
你看kaggle之类的机器学习比赛,谁他妈的推导一百个公式?都是各种数据处理的杂技。
本就是一个侧重实验的东西,数据集的分布影响极大,甚至可以说是最重要的。你搁那研究推导公式。那能行吗?重点都没抓住。
一抹白云 发表于 2023-10-4 20:04:22|来自:北京 | 显示全部楼层
纯数学的发展实际是非常超前的。很多前沿数学可能50年内都找不到任何实际的应用。
数学PhD会学习很多屠龙术般的数学工具。


但尴尬的是,对前沿的机器学习/深度学习来说,我们还是非常缺乏数学工具。教材最常用的还就是那些大学里最基础的数学课。
因为数学界前沿的数学工具不是为深度学习服务的。所以,这些数学PhD的屠龙术其实没办法像很多人以为得那样——在机器学习/深度学习理论领域可以一阵乱杀。当对象不是龙的时候,要用屠龙术就不是个简单的应用题了。


这个和物理界的情况也有一定相似之处。
牛顿那个时代,物理学家几乎都是数学家。两百年前,横跨数学、物理的大家也还比较多。
但一百年前情况就大不一样了。随着数学、物理的分化,前沿数学对物理学的直接帮助就越来越少。
为了物理学研究,物理学家必须独立发展为物理服务的数学工具。
物理里面的很多数学方法都是近似的、不严谨的,但却是非常有用的。
特别是和统计学、信息论联系紧密的统计物理里,这个现象很显著。


我觉得机器学习学术界面对的挑战是很相似的。
机器学习同样是和统计学、信息论联系非常紧密的领域。
机器学习这个新兴领域的学者整体数量和水平必须充足到、聪明到像物理学家群体一样,可以独立发展为机器学习服务的数学工具。
(对于现在计算机方向有差不多一半人想搞AI这件事,我个人一直觉得理所当然。;)


我感觉,这件事是很难指望数学家来完成。
数学界有自己的学术传统和惯性,未必对发展机器学习的工具有兴趣,也未必适合做机器学习的理论。
可能只有很少一部分应用数学家会认真对待机器学习的数学事业。

&lt;hr/&gt;最后推荐一下我的深度学习专栏:  深度学习原理101
dybb 发表于 2023-10-4 20:04:40|来自:北京 | 显示全部楼层
本人数学专业分支非常接近强化学习
我是做stochastic optimization的
水平很一般老师很强大
简单讲就是
数学模型搞的很牛逼
计算机算不出来
很多算法早就有了
当时我们在实验室是用matlab
这么说吧 我觉得只会数学搞这些就像产品经理完全不懂技术提需求
计算机是研发 数学是产品
你要懂计算机的边界
我以前喜欢数学很讨厌计算机 我现在乖乖在学分布式计算概念
ps我已经转产品了
然后我以前做机器学习深度学习技术产品
我觉得数学理解AI概念比较有优势 但我觉得这块数学太naive了 有时候回答刁钻的学数学客户问题是我在证明和算复杂度不是技术同学
然后我现在去做强化了
复习了一下大三的课程 然后定睛一看 强化学习在我们课程的最后一章ppt上 supplemental reading上
捡回了stochastic optimization的脑子
然后两天 看着ppt不太理解的稍微看看视频 上完了David的课
basically 计算机做实验的我们要证明
计算机计算的我们要手算。。。
做算法产品倒是合适
cdlzguo 发表于 2023-10-4 20:05:23|来自:北京 | 显示全部楼层
首先我觉得大多数情况下机器学习用不到那么多的高等数学。那些调參做实验的同学自不必说:加上证明只是锦上添花,好让结果看起来更扎实,但最后基本上还是只看performance。而即使是搞理论的,需要的也基本上就是数学分析、线性代数、优化里的基本知识。我记得曾经有人将ml调侃为应用线性代数,哈哈。
并且老实说,很多时候机器学习领域里的人说的数学好和我们的定义不太一样。数学领域出身的人说一个人数学好基本上是说他有好的直觉,一下子能够看到问题的核心,而机器学习领域的人眼中的数学好大概是能坐的住,耐着性子去推几页几页的公式。
还有,目前机器学习领域的风气其实对数学出身的人不太友好。我有一个老师甚至用appalling(耸人听闻)来形容。机器学习的领域节奏太快了,恨不得一年赶出来十篇论文。这种情况下很难弄出好的结果。于是,在截稿日的催促下,你只能开始凑各种各样稀奇古怪的假设。这种事情对于一个受过严谨数学训练的人真是刮骨般的痛苦,会产生一种要是证明写成这样我宁愿不写的抵触情绪。我当年就是这么过来的,也因此没有在机器学习领域坚持下去。
希望有一天机器学习能够更好地和数学结合起来。
yy8yy 发表于 2023-10-4 20:06:02|来自:北京 | 显示全部楼层
以前一个数学专业的同学问过我为什么看机器学习论文,公式写的很清楚,他都看得懂,他也知道按照这么去操作效果好,但是看完以后更不懂了。。。。。
当前的机器学习论文超过一半都是应用型论文,其实并没有很多数学理论的创新和探索,之前没人用过B理论,我现在拿B理论过来试试看看效果怎么样,大部分机器学习的工作目前都还是自上而下的,出发点就是什么没做过,我拿过来试试,成功了我去解释它为什么成功,很好,果然符合我的预期,失败了就再去找几个能自圆其说的理由解释为什么不好。当然在这一点上,数学专业的同学优势肯定是要比其它专业同学优势大,就和看论文一样,你的理论池更丰富,自然有更多的”理论“来搭积木去试验。

实际上目前阶段的机器学习用到的数学专业知识和整个数学领域知识范围比,是很小的,而且大多也只是把数学领域现有理论直接拿过来使用,一个学过概率论高数复变线代的工科生,加上一点不错的编程基础和试验型精神,都可以很容易入门甚至发篇不错的论文。剩下的就是看谁脑子更灵活,谁鬼点子更多了。
机器学习很多小tips看似从数学角度分析,其实还是把很多数学理论拿过来用,去实验看效果,没有任何人敢在实验前就拍着胸脯说,这个一定好。

当然实际原因肯定还有很多,包括同行氛围,你周边的大环境什么时候开始找工作开始申请博士开始做哪些事情,都会对自己有影响,计算机是固定节奏,别的专业要过来那就得有途径提前知道并适应这个节奏。

快速回帖

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则