lywylwl 发表于 2023-10-4 20:02:26

一刷吴恩达机器学习

最近在同事的推荐下,花了7天时间在bilibili听完了吴恩达的机器学习课程。机器学习虽然以微积分、线性代数和概率论等数学知识为基础,但是这门课绕过了复杂的数学知识,把各种机器学习算法的流程、特性、应用和调优介绍得清清楚楚。
机器学习分为监督学习和无监督学习。整个课程听下来,感觉监督学习运用的场景更多一些。所有的监督学习都是通过一组输入和输出的样本,训练出模型,再用模型预测新的输入可能产生的输出。如果输入和输出是有意义的,那么它们的对应关系会符合某种规律,机器学习的目标就是找出这种潜在的规律。这就像识人一样,交往的人越多,我们就越容易看懂他人的行为。
从数学的角度上讲,模型和规律就是函数。最常见的函数是线性函数,可以表示成θ0+θ1*x1+…+θn*xn,与之对应的机器学习算法是线性回归。线性回归的输入是n维特征向量x(x1, x2,…, xn ),输出是数值y,需要训练的是线性函数的参数向量θ(θ0, θ1,…, θn)。得到参数向量θ后,给定任意一个输入x,都可以计算出结果y。常见的监督学习算法,比如线性回归、逻辑回归、神经网络,核心思想都是如此。不同算法之间的差异在于,采用的函数不同。
找出最优的参数向量θ的方法有很多种,最常用的方法是梯度下降。梯度下降就是沿着最优的方向,向前尝试一小步,再计算新的最优方向,继续向前尝试,直到找到一个最优解,整个过程就像下楼梯。这里有两个关键点,第一,如何计算最优的方向,这需要借助微积分的偏导数,第二,如何确定每一步的长度,尝试次数越多,越有可能接近最优解,越接近最优解,步幅应该越小,也就是需要从粗调到精调。这种寻找最优解的方法,多少有点碰运气的成分,所以有时候能找到全局最优解,有时候找到的是局部最优解。这让我想到了游戏中的Astar启发式寻路算法,都是通过试探来求解问题,但大部分时候都能得到不错的结果。
评价机器学习算法的好坏,就是用训练出来的模型预测新的数据,看预测结果和实际结果的偏差。由于机器学习的机制有碰运气的成分,所以调试机器学习算法变得很重要。不同的算法、不同的参数、不同的数据量和不同的特征工程,都会影响到结果的准确性。应该先尝试哪一种方法,还得靠数据说话。快速搭建机器学习算法原型,观察随着训练次数和数据量的增加,结果准确性发生了什么样的变化,才能决定下一步做什么最有效。

gzfarmer 发表于 2023-10-4 20:02:50

纯好奇,老哥不做笔记的吗?我一节课得花3-4小时才能完成。
有什么学习方法能讲一下吗?

sasa516 发表于 2023-10-4 20:03:12

你好,我一般听完一两章再回顾ppt,全部学完再整体回顾一遍。不求全部都懂,根据需要在补充其他知识。你可以看看我的人工智能试炼场专栏,我在一点一点打基础[大笑]

空城 发表于 2023-10-4 20:03:19

噢噢,好的。老哥现在能做机器学习的题吗?

南京电信 发表于 2023-10-4 20:04:01

我还没开始做,还在学数学

czp820401 发表于 2023-10-4 20:04:12

好的好的,谢谢老哥

0nwn0 发表于 2023-10-4 20:04:59

你看的好快,我视频带笔记看了一个多月没看完~看完准备二刷

dfo2545 发表于 2023-10-4 20:05:49

我们看的真的是一个视频吗 你说的一堂课是一整个章节吗 bilibili的视频是一小节就几分钟的那个吧

IT货郎 发表于 2023-10-4 20:06:05

请问参考书用什么呀

bochin 发表于 2023-10-4 20:07:01

课程有ppt,这个课程挺简单的,不用额外参考书
页: [1]
查看完整版本: 一刷吴恩达机器学习