dinying 发表于 2023-10-31 13:02:44

机器学习的本质是什么?

机器学习的本质是什么?

huanhuanlala 发表于 2023-10-31 13:03:02

http://picx.zhimg.com/v2-b49f3081b3af32c79174ac534d6c530c_r.jpg?source=1940ef5c

http://picx.zhimg.com/v2-cf66c71bdcb7f324b9666bdc93c08b94_r.jpg?source=1940ef5c

http://pic1.zhimg.com/v2-9cc0130dc4d7d35de8ff054a6baf215a_r.jpg?source=1940ef5c

wsb000763 发表于 2023-10-31 13:03:27

一个人的经历越丰富,学习的知识钺多,是不是总结的模型越可信越可靠?
类似的,机器学习的数据量越大,模型是不是越稳定、越收敛呢?
你看,不管人的成长,还是机器学习,都有一个前提:数据。当然,这里我们把人的经历、知识抽象成数据了。
一、宏观——哲学

宏观看,机器学习的本质是:经验认识观。
机器学习是经验认识观的一种。
因为机器学必须依赖数据,如果哪天机器学习完全是演绎逻辑,自主化学习,那我的观点肯定是错的。
二、中观——抽象

中观看,机器学习的本质是:学习思维模型。

http://picx.zhimg.com/v2-7bc654bc6f8be5039937b5eefcb96cbc_r.jpg?source=1940ef5c

机器学习的本质是学习思维模型

思维模型可分归纳型思维模型和演绎型思维模型。

[*]归纳型思维模型比如:金字塔模型、AARRR模型等;
[*]演绎型思维模型比如:自然选择 、相对论等。
当前,机器学习的本质上是归纳法,即首先从具体的事实归纳出一般性规律,然后利用规律去做预测。
这个一般性规律类似人们工作、生活、学习中归纳总结的思维模型,只是这个思维模型是归纳类型的,而不是演绎类型的。
由于现阶段的机器学习还是归纳型的,哪一天机器学习可以演绎推理了,那可能才是真正的人工智能。这里用思维模型揭示机器学习的本质,而不加限定条件,不区分归纳还是演绎,是希望能适用未来的机器学习。
所以,机器学习本质上是让机器学习到一种思维模型。即机器基于数据,学习到一个抽象模型,然后在某个场景做出预测。
每个思维模型有它的假设、边界,适用场景,同样的机器学习模型也有它的假设、边界、适用场景。
三、微观——具体

微观看,机器学习的本质是:数学量化数据关系。
机器学习是基于数学,量化数据特征与目标的关系。
关系可以是相似度、相关度、最优等。
总结:

因为宏观太大,抓不住;微观太小,门槛高。
所以,基于中观视角看,机器学习的本质是:学习思维模型。

eyou121 发表于 2023-10-31 13:03:58

现实生活中,我们会碰到两类问题:
1.一类问题,是给定输入,通过施加一定条件(或算法),得到最终的输出。就像下图这样:

http://picx.zhimg.com/v2-54d6d16fdc669f5d56f149f633c68d12_r.jpg?source=1940ef5c
典型的例子,在用计算机解决问题的时候很常见,比如给定一个数的集合(输入),通过编写算法实现数组从小到大排序。输出是一个有序列表。
对于这类问题,人类能够自己设定一种模式(函数),把输入映射成想要的输出。

2.另一类问题,人类找不到这样的模式。以OCR字符识别为例,输入是手写体(数字)图片,输出是0-9字符串,我们并不知道怎么把输入转换成输出,因为手写体因人而异,随机性很大。
换句话说,这个时候,我们缺的是知识(如何映射),不过幸运的是,我们有(实例)数据。
而把这个知识通过机器(计算机)学出来的过程,叫做机器学习。
这个学出来的知识(或经验),可以用于新的输入,产生新的输出。

http://pica.zhimg.com/v2-a494f589eec79a8fa6cc9226fbab16ea_r.jpg?source=1940ef5c

无论哪种问题,产生我们想要的输出才是目的,机器学习或计算机程序只是手段。

zk839y 发表于 2023-10-31 13:04:56

机器学习的本质,这问的其实是个哲学问题啊,有幸学过一些机器学习的皮毛,了解哲学的各个流派,先写出结论:机器学习的本质就是“重现人认识世界的过程”,具体到哲学中是“认识论”讨论的范畴,而贯穿十六世纪到十八世纪各位哲学大师关于认识论的大讨论,真的是很好的解答了机器学习的本质问题。
无论你使用哪个机器学习模型,无非要经历“建立模型”,“训练模型”,“反馈”,“应用”的过程。而这个过程,跟一个婴儿认识世界,获取知识的过程是一样的。模型训练集的标注需要引入人的知识,而婴儿对世界的认识也是由父母、老师等不断教授知识。更唯心一点,这个世界的对错,这个世界中“苹果”之所以被叫做“苹果”,天空的颜色之所以被定义成“蓝色”,这都是人的认识和定义。而培养机器建立人的认识的过程,就是“机器学习”。
说回十六世纪展开的那场“认识论”大论战,欧洲几乎所有哲学大师都加入其中,分为两大流派,“经验主义”这边有培根、大卫休谟、洛克;理性主义那边有笛卡尔、莱布尼茨、斯宾诺莎,真可谓大师云集。认识了这场论战,我想对机器学习的认识就会更深一层了。
经验派认为一切正确的科学知识都必须起源于经验,即“真理”的获取必须以自然事物的观察和实验为出发点;
理性派认为只有经过人的理性检验、清楚明白的观念才被认为是“真理”。
更形象来说,
经验派认为人最开始是一张“白板”,知识均是通过后天外界的感受与经验形成的,
理性派认为“真理”是上帝在一开始就赋予人心中的,需要通过人类的演绎得出,那些没有发现的知识则以潜在的形式藏于心中。
这就很有意思了,计算机系的同学们联系自己上过的课,经验派的观点明显是目前主流机器学习的过程啊,而理性派就是我们学过的数理逻辑等一系列离散数学啊。而这些成果恰恰跟当初的那场论战息息相关,因为两个学科的祖师爷恰恰就是当初“经验派”和“理性派”的主要成员。
我们再谈谈自然语言处理,很多人都知道自然语言处理曾经有过基于规则和基于统计两大流派的激烈争夺,谈起基于规则,我们就想起语义分析,想起演绎推理,这正是“理性派”的主张,因为他们认为真理就在于这些经典的推理过程,只有真正探求了真理,我们才能知道这个世界是怎么生成的。后来,基于统计的自然语言处理模型成了主流,PLSA,LDA大行其道,我们不再纠结于清晰的规则,而是给这些模型一大堆训练集,让他们自己学出我们自己可能都解释不了的模型,这其实就是“经验派”的主张。我们不必知道一个系统内部清晰的规则,我们只要让这个模型对世界的最终认识跟我们一致就可以了。但未来,“理性派”会不会再次占上风呢?随着对脑内部结构的逐渐认知,我们是不是真能用极简的规则认识这个世界呢?让我们拭目以待吧。
谈了这么多,还得切题啊,也许我们还在纠结机器学习的本质是什么?但只要初步读一本哲学的书籍,我们就可能知道,机器学习就是研究“人自己认识这个世界的过程”,探求这个认识的过程,不就是机器学习研究本身吗!

yhc8325 发表于 2023-10-31 13:05:07

概率加自适应
页: [1]
查看完整版本: 机器学习的本质是什么?