yizhou 发表于 2023-10-4 20:05:21

研0如何入门机器学习?

今年材料跨考计算机研究生成功上岸,导师让我学周志华的机器学习,学了两章感觉非常吃力,特别是涉及到公式推导的时候要用到不少没学过的数学知识,各位大佬们可以给我一些建议吗?

Ike 发表于 2023-10-4 20:06:14

先熟悉一门语言,比如MATLAB/Python,首先先过一遍MATLAB/Python最基本的知识:变量、数据结构、语法等;然后尝试使用这个知识点写一小段代码;入门后配合算法视频教程,进行自己机器学习/深度学习领域的研究,学习相关的机器学习/深度学习模块,能有效避免从入门到劝退。
matlab机器学习/深度学习
MATLAB环境下可视化卷积神经网络CNN的激活图 - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/572124574
MATLAB环境下基于AlexNet网络的Deep Dream图像生成 - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/572024788
MATLAB环境下基于深度学习的人体动作识别(Sequence-to-Sequence分类) - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/571972497
自动驾驶之-MATLAB环境下基于深度学习的目标检测(停车标志检测) - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/571678000
自动驾驶之-MATLAB环境下基于深度学习的语义分割 - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/571631690
MATLAB环境下基于深度学习的JPEG图像去块(Image Deblocking) - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/571375086
MATLAB环境下基于深度学习VDSR的单图像超分辨率重建 - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/571327223
MATLAB环境下基于RUSBoost算法的不平衡样本分类 - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/570553392
MATLAB环境下基于支持向量机、孤立森林和LSTM自编码器的三轴振动数据的机械异常检测 - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/570485383
深度学习故障诊断之-使用条件生成对抗网络CGAN生成泵流量信号 - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/569306077
MATLAB环境下基于深度学习的语音降噪方法 - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/569211023
基于小波分析和深度学习的时间序列分类并可视化相关特征 - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/557922791
python机器学习/深度学习
Python环境下基于机器学习(多层感知机,决策树,随机森林,高斯过程,AdaBoost,朴素贝叶斯)的往复式压缩机故障识别(出口阀泄漏,止逆阀泄露,轴承损伤,惯性轮损伤,活塞损伤,皮带损伤等) - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/566923531
哥廷根数学学派:基于1D-CNN、2D-CNN,LSTM和SVM的一维信号分类
使用1D CNN对智能手表采集的少量心率振动信号进行分类 - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/556643969
基于自编码器的语音信号降噪 - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/556513015
基于小波包特征提取和随机森林的CWRU轴承数据集故障识别 - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/556172942
基于麦克风信号与随机森林的机器轴承运行状态识别 - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/552366393
关于现代信号处理
多分辨分析在信号处理中的应用-第1篇 - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/558590604
基于小波区间相关(Interval-Dependent)的信号降噪方法 - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/558132966
多元小波降噪方法 - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/558075972
简单的基于小波分解的心电信号ECG降噪 - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/555997110
基于小波分析的打鼾(阻塞性睡眠呼吸暂停)检测 - 哥廷根数学学派的文章 - 知乎 https://zhuanlan.zhihu.com/p/55

lusys 发表于 2023-10-4 20:07:09

回答

不建议先看 周志华的机器学习,太多学术和数学公式基本上不方便入门。(当然,如果是数学功底特别好,看这个就认为比较有趣)
入门基础如下:
1)GPU可以在网上租用算力平台
Pascal算法摆渡人: 二次元人物识别(一) - 算力平台揽睿星舟2)阅读相关内容的综述文献
Pascal算法摆渡人:5月月报-算法学习路线图 - 数学(Math)、计算机视觉(CV)、自然语言处理(NLP)和机器人(Robot)(持续更新中)3)找到相关内容中自己感兴趣方向
4)运行代码
5)找公开数据集
前提是:
1)具备数学基础知识OK (大一水平)
2)计算机基础水平ok(至少会python语言)
3)具有自学未知知识能力
<hr/>实战项目
(一)

Pascal算法摆渡人: 二次元人物识别(一) - 算力平台揽睿星舟<hr/>类似的遇到问题:
研一打算搞深度学习目标检测方向,无 GPU ,无指导,请问可行吗?

<hr/>[Pascal算法摆渡人]公众号、知乎、小红书等感谢关注。Hi,大家好!我是Pascal_M。

[*]不知道如何入门算法 ,对于初学者这里有完整的学习路径图(历史中经典模型文献和论文复现),完成后将成为合格初级算法工程师。
[*]不知道行业解决方案,对于算法工程师这里有具体的行业中落地方案和呈现出商业价值,阅读后提供新想法和成为算法专家。
蓦然回首,自己从算法(数学)专业学习以及工作已十年有余。同时希望大家成为算法经历者、分享者和创造者。
我们一起动起来!!!了解过往历史文献的方法和不足之处,展望最新的文献和技术。
当然,大家对感兴趣文献可以留言哦。说不定下期就出现了。
月报会越来越长,大家可以看左边的目录挑选自己感兴趣的领域。
<hr/>☆ 应用领域

1)自动驾驶

Pascal算法摆渡人:自动驾驶 - 全景驾驶感知系统 YOLOPv1模型
Pascal算法摆渡人:自动驾驶 - 全景驾驶感知系统 YOLOPv2模型
期待中。。。。

2)医学

CV
综述
Pascal: 医学图像分割U-Net网络应用综述(上)
Pascal: 医学图像分割U-Net网络应用综述(下)
3D数据
Pascal: 医学3D计算机视觉(上)
期待中。。。。
分类
Pascal: 生物医学图像分类- 识别COVID-19
语义分割
Pascal:生物医学图像语义分割 U-Net模型
Pascal:语义分割U-Net++模型 - 生物医学图像语义分割
Pascal:图像分割U-Net3+模型 - 生物医学图像语义分割
Pascal:生物医学立体图像分割3D U-Net模型
Pascal:生物医学图像语义分割 Swin-Unet模型
期待中。。。。
NLP
Pascal算法摆渡人:中文电子病历命名实体识别的研究与进展(一)- 遇到问题
Pascal算法摆渡人:中文电子病历命名实体识别的研究与进展(二) - 数据集和评价指标
Pascal算法摆渡人:中文电子病历命名实体识别的研究与进展(三) - 解决方案
3)农业

Pascal算法摆渡人: 县域农业大脑AI挑战赛 - 农作物遥感图像语义分割
4)偏微分方程(AI for science)


http://pic1.zhimg.com/v2-add041e47ed139599d54f9400d8e8315_r.jpg?source=1940ef5c
Pascal算法摆渡人: 偏微分方程求解方法研究(一) - 遇到问题
Pascal算法摆渡人: 偏微分方程求解方法研究(二)- 物理约束
Pascal算法摆渡人: 偏微分方程求解方法研究(三)- 数据驱动
Pascal算法摆渡人: 偏微分方程求解方法研究(四)- 物理驱动
Pascal算法摆渡人: 偏微分方程求解方法研究(全)
Pascal算法摆渡人:DeepCFD模型 - 基于CNN/U-Net模型的流场预测

5)2022足球世界杯

Pascal算法摆渡人: 冠军队伍算法模型预测结果-1
Pascal算法摆渡人: 冠军队伍算法模型预测结果-2
Pascal算法摆渡人: 冠军队伍算法模型预测结果-3
Pascal算法摆渡人: 半自动越位识别技术
6)ChatGPT

Pascal算法摆渡人: ChatGPT 相关数据集(一)
Pascal算法摆渡人: ChatGPT 相关数据集(二)
Pascal算法摆渡人: ChatGPT 相关核心算法(一)
Pascal算法摆渡人: ChatGPT 相关核心算法(二)
Pascal算法摆渡人: ChatGPT 相关核心算法(三)
Pascal算法摆渡人: ChatGPT 的应用前景
Pascal算法摆渡人: 自然语言处理的发展历史
Pascal算法摆渡人: 大模型评价方法(一)

Pascal算法摆渡人:大模型训练与部署(一)
Pascal算法摆渡人:大模型训练与部署(二)
<hr/>1. 数学(Math)


http://pica.zhimg.com/v2-bdc6d1c7365d8fc6ad562f2ae729dcde_r.jpg?source=1940ef5c
1)AI

Pascal:深度学习-数学之流形结构(上)
预告:期待(下)。。(备注:尽快更新下期)
2)Robot

预告:李群和李代数在机器人领域应用
3)访谈

吴恩达访谈
Pascal:IEEE Spectrum专访吴恩达(一) - In AI,Small is the New Big
Pascal:IEEE Spectrum专访吴恩达(二) - In AI,Small is the New Big
Pascal:IEEE Spectrum专访吴恩达(三) - In AI,Small is the New Big
文献阅读方法
Pascal算法摆渡人:[ 读论文 - 写论文 - 2023 ] 如何读论文? - 三遍阅读法
视频
如何读论文? - 三遍阅读法
4)数学家

Pascal算法摆渡人:高斯 - Gauss
Pascal算法摆渡人:帕斯卡 - Pascal
Pascal算法摆渡人:费马 - Fermat
Pascal算法摆渡人:笛卡尔 René Descartes
2. 计算机视觉(CV)


http://pic1.zhimg.com/v2-c44d3f31b03294ea0eceb5794e34f656_r.jpg?source=1940ef5c
1)图像分类 (Image Classification)

1)文献阅读

综述:
Pascal:图像分类卷积神经网络模型综述(上)
Pascal:图像分类卷积神经网络模型综述(下)
Pascal:图像分类卷积神经网络模型综述(全)
解决方案:
CNN机制
Pascal算法摆渡人:图像分类AlexNet网络 - 开启深度学习重大事件
Pascal算法摆渡人:AlexNet 论文 - NeurIPS 2022 时间考验奖
Pascal算法摆渡人:图像分类 VGG模型 - 2014 年ILSVRC图像分类任务亚军
Pascal算法摆渡人:ResNet模型 - 有效避免网络深度带来的问题

Pascal:图像分类 VGG模型 - 2014 年ILSVRC图像分类任务亚军
Pascal:ResNet模型 -- Deep Residual Learning for Image Recognition
Pascal:图像分类 MobileNetV1模型 - 轻量化网络
Pascal:图像分类 MobileNetV2模型 - 轻量化网络MobileNet系列
Pascal:图像分类 DenseNet模型 - 2017 年 CVPR获得最佳论文奖的论文
Pascal: 图像分类RepVGG使得VGG卷积网络风格再次伟大 - 目标检测YOLOv6的Backbone
期待中。。。。
Transformer机制
Pascal:ViT模型----An Image Is Worth 16X16 Words: Transformers for Image Recognition at Scale
Pascal:ViT - Vision Transformer 应用展示
Pascal:图像分类 MoblieViT模型 - 混合CNN和Transformer的轻量化网络
Pascal:ViT的复仇 - DeiT III: Revenge of the ViT
Pascal:MAE模型 - Masked Autoencoders Are Scalable Vision Learners
Pascal: Swin Transformer模型
期待中。。。。

数据增强:
Pascal:图像分类之数据增强Mixup方法 - 超越经验风险最小化
Pascal:图像分类之数据增强Cutout方法 - 改善的卷积神经网络正则化
Pascal:图像分类之数据增强CutMix方法 - 正则化策略
激活函数:
Pascal:图像分类之激活函数SiLU - YOLOv7使用的激活函数
细粒度分类:
Pascal:细粒度图像识别综述(上)
期待(下)
应用:
Pascal: 生物医学图像分类- 识别COVID-19
2)代码复现

总流程
Pascal算法摆渡人: 工作流程(总)- 图像分类经典模型 - MMClassification
每一步流程
Pascal算法摆渡人: 深度学习之图像分类经典模型 - MMClassification(一)-安装环境
Pascal算法摆渡人: 深度学习之图像分类经典模型 - MMClassification(二)- 初步认识
Pascal算法摆渡人: 深度学习之图像分类经典模型 - MMClassification(三)- 构建数据集
Pascal算法摆渡人: 深度学习之图像分类经典模型 - MMClassification(四)- 编写配置文件
Pascal算法摆渡人: 深度学习之图像分类经典模型 - MMClassification(五)- 算法部
改进版
Pascal算法摆渡人: (改进版)图像分类经典模型 - MMClassification(一)-安装环境
Pascal算法摆渡人: (改进版)图像分类经典模型 - MMClassification(二)- 初步认识
Pascal算法摆渡人: (改进版)图像分类经典模型 - MMClassification(三)- 数据集格式
Pascal算法摆渡人:(改进版)图像分类经典模型 - MMClassification(五)- 算法云端/服务端部署
2)目标检测(Object Detection)

1)文献阅读

综述:
Pascal:目标检测综述(1)- 目标检测开发流程
Pascal:目标检测综述(2)- 单目视觉目标检测
Pascal:目标检测综述(4)- 数据集和应用场景
Pascal:目标检测YOLO系列综述(上)
Pascal:目标检测YOLO系列综述(下)
Pascal:目标检测YOLO系列综述(全)
Pascal:目标检测综述(一) - 从20世纪90年代至2019年
Pascal:目标检测综述(二) - 从20世纪90年代至2019年
Pascal:目标检测综述(三) - 从20世纪90年代至2019年
Pascal:目标检测综述(四) - 从20世纪90年代至2019年
Pascal:目标检测综述(五) - 从20世纪90年代至2019年
Pascal:目标检测综述(六) - 从20世纪90年代至2019年
。。。
Pascal算法摆渡人:目标检测系列 - 网络结构设计和优化技巧
解决方案:
CNN机制
Pascal:目标检测 - SSD模型
Pascal算法摆渡人:目标检测YOLO系列 - YOLOv1开启一阶段新方向
Pascal:目标检测YOLO系列 -YOLOv1
Pascal:目标检测YOLO系列 - YOLOV2
Pascal:目标检测YOLO系列 - YOLOV3
Pascal:目标检测之后处理NMS算法 - Pytorch代码解析
Pascal:目标检测YOLO系列 - YOLOv4(上)网络结构设计和优化技巧
Pascal:目标检测YOLO系列 - YOLOv4(下)
Pascal:目标检测YOLO系列 - YOLOv5第一阶段工作(1)- 成功运行预测代码
Pascal:目标检测YOLO系列 - YOLOv5第二阶段工作(2)- 运行训练代码
Pascal:目标检测YOLO系列 - YOLOv5第三阶段工作(3)- 制作数据集
Pascal:目标检测YOLO系列 - YOLOv5
Pascal:目标检测YOLO系列 - 2022.09官方正式授命YOLOv6
Pascal:MS COCO2017数据集目标检测 - 解决方案YOLOv6(Anchor free)
Pascal:目标检测YOLO系列 - 22.07最新一版YOLOV7
Pascal算法摆渡人: YOLOv8走来了,先看看效果再说!!!
。。。
Transformer机制
Pascal:DETR模型- End-to-End Object Detection with Transformers
数据增强:
Pascal:目标检测YOLO系列 - YOLOv4目标检测数据增强Mosaic方法
竞赛方案:
Pascal:智慧城市目标检测算法竞赛 - 沿街晾晒识别冠军方案
Pascal:智慧环保目标检测算法竞赛 - 街道垃圾识别冠军方案
Pascal:智慧城管目标检测算法竞赛 - 户外违规广告牌识别冠军方案
2)代码复现

Pascal:目标检测YOLO系列 - YOLOv5第一阶段工作(1)- 成功运行预测代码
Pascal:目标检测YOLO系列 - YOLOv5第二阶段工作(2)- 运行训练代码
Pascal:目标检测YOLO系列 - YOLOv5第三阶段工作(3)- 制作数据集
3)图像分割(Image Segmentation)

1)文献阅读

综述:
Pascal: 医学图像分割U-Net网络应用综述(上)
Pascal: 医学图像分割U-Net网络应用综述(下)
解决方法:
Pascal:图像分割FCN模型 - 语义分割端对端开篇之作
Pascal:生物医学图像语义分割 U-Net模型
Pascal:生物医学立体图像分割3D U-Net模型
Pascal:场景解析PSPNet模型 - ILSVRC 2016 语义分割/场景解析获胜者
Pascal:生物医学图像语义分割 Swin-Unet模型
Pascal:语义分割U-Net++模型 - 生物医学图像语义分割
Pascal:图像分割U-Net3+模型 - 生物医学图像语义分割
竞赛方案:
Pascal算法摆渡人: 县域农业大脑AI挑战赛 - 农作物遥感图像语义分割
2)代码复现

期待中。。。
4)生成模型(Generative Model)

生成对抗网络(GAN)
Pascal算法摆渡人:生成对抗网络GAN网络 - 大牛们的开篇之作
扩散模型(Diffusion Models)
Pascal算法摆渡人:(泛读)扩散模型Diffusion Models - DDPM模型
Pascal算法摆渡人:生成模型的评价指标 - IS 和FID
5)目标跟踪

期待中。。。
6)人体关键点检测

期待中。。。
7)场景文字识别OCR

期待中。。。
3 模型压缩(model compression)


http://pic1.zhimg.com/v2-4a482f6bfd3ecc34fcf90525dd65ebb7_r.jpg?source=1940ef5c
1)轻量化模型

Pascal:图像分类 MobileNetV1模型 - 轻量化网络
Pascal:图像分类 MobileNetV2模型 - 轻量化网络MobileNet系列
Pascal:图像分类 MoblieViT模型 - 混合CNN和Transformer的轻量化网络
2)知识蒸馏(Knowledge Distillation)

综述:
Pascal:知识蒸馏综述(一)-- 遇到困难
Pascal:知识蒸馏综述(二)-- 知识传递的形式
Pascal:知识蒸馏综述(三)-- 蒸馏的方式
Pascal:知识蒸馏综述(四)-- 蒸馏学习目的
Pascal:知识蒸馏综述(五)-- 交叉领域
Pascal:知识蒸馏综述(六)-- 应用领域
文献:
Pascal:在神经网络中提取知识(图像分类)- 知识蒸馏开篇之作( Hinton)
3)剪枝

期待中。。。
4)量化

期待中。。。
5)低秩分解

期待中。。。
4. 自然语言处理(NLP)


http://picx.zhimg.com/v2-6120bdc4d6a83ad59b6000c85c7ad787_r.jpg?source=1940ef5c
1. 核心模型

1)RNN

期待中。。。
2)Transformer和BERT

文献
Pascal算法摆渡人:ChatGPT核心技术 - transformer算法(上)

Pascal:Transformer模型系列(1)
Pascal:Transformer模型(2)
Pascal:Transformer模型(3)- Input Embedding
Pascal:Transformer模型(4)- Positional Encoding
Pascal:计算机视觉领域(CV):Transformer机制
。。。
Pascal: BERT模型(上) - 开启NLP新篇章预训练模型
Pascal: BERT模型(中) - 开启NLP新篇章预训练模型
Pascal: BERT模型(下) - 开启NLP任务新篇章预训练模型
Pascal: BERT模型 - 开启NLP新篇章预训练模型
Pascal:BERT- Bidirectional Encoder Representations from Transformers
2. 单句分类

1)文本分类(Text Classification)

综述
Pascal:文本分类综述(上)- 1961~2020年从传统算法到深度学习
Pascal:文本分类综述(中-传统算法)- 1961~2020年从传统算法到深度学习
Pascal:文本分类综述(中-深度学习)- 1961~2020年从传统算法到深度学习
Pascal:文本分类综述(下)- 1961~2020年从传统算法到深度学习
Pascal:文本分类综述(全)- 1961~2020年从传统算法到深度学习算法
文献
(期待中。。。)
竞赛方案
Pascal:基于BERT意图识别和槽位填充的联合模型--BERT for Joint Intent Classification and Slot Filling
3. 序列标注

1)命名实体识别(NER)

总结
Pascal:NER任务-综述、中文数据集、NLP算法竞赛项目
综述
Pascal:NER综述(上)- A Survey on Deep Learning for Named Entity Recognition
Pascal:NER综述(下)- A Survey on Deep Learning for Named Entity Recognition
Pascal:NER综述 - A Survey on Deep Learning for Named Entity Recognition
Pascal算法摆渡人:中文电子病历命名实体识别的研究与进展(一)- 遇到问题
Pascal算法摆渡人:中文电子病历命名实体识别的研究与进展(二) - 数据集和评价指标
Pascal算法摆渡人:中文电子病历命名实体识别的研究与进展(三) - 解决方案
数据集
Pascal:NER-中文数据集CLUENER2020
竞赛方案
Pascal:NLP-NER算法竞赛 - 产品评论观点提取(第一名)
Pascal:NLP-NER算法竞赛 - 产品评论观点提取(第二名)
Pascal:NLP-NER算法竞赛 - 产品评论观点提取(第三名)
Pascal:NLP-NER算法竞赛 - 产品评论观点提取(第四名)
4. 问答任务

期待中。。。
5. 句对分类

期待中。。。
5. 多模态

Pascal:多模态在计算机视觉领域的应用综述(一) - 遇到问题
Pascal:多模态在计算机视觉领域的应用综述(二) - 数据集和应用
Pascal算法摆渡人:多模态在计算机视觉领域的应用综述(三) - 解决方案
Pascal算法摆渡人:多模态在计算机视觉领域的应用综述(四) - 解决方案

6. 机器人(Robot)


http://picx.zhimg.com/v2-015598028536480ff1964fcc40f8679b_r.jpg?source=1940ef5c
1)SLAM

Pascal:激光SLAM综述(上)
预告:期待(下)
2)Navigation

期待中。。。。。

xiongdamao 发表于 2023-10-4 20:08:04

机器学习包括传统机器学习(如SVM、贝叶斯网络等)和深度学习(如CNN、RNN等),而传统机器学习又是机器学习入门必学的。一般传统机器学习入门是需要一点统计学统计学和概率论的相关知识的。
友情提示:机器学习的理论基础还是建议刚入门的同学一定要去理解透,因为亲身体会过:如果前面一个知识点理解的有问题或者没有理解清楚,后面有的知识点就没办法学了;最后你可能会躺平。理论基础学习推荐
(书籍推荐:西瓜书+南瓜书 / 统计学习方法)
我自己入门的时候是直接看的周志华老师的《机器学习》(俗称“西瓜书”)。一开始,前面还能看得懂,到后面就看的云里雾里,有些公式没有推导过程都看不懂,这里推荐大家结合“南瓜书”一起看效果更好。
要是觉得自己基础不怎么好的同学,建议大家直接看李航老师的《统计学习方法》。
视频学习推荐
目前,行业内最火的两位机器学习的老师应该属吴恩达和李宏毅两位老师。
两位老师各有千秋:吴恩达老师的视频我认为讲的比较透彻,内容比较有深度,一般都会举例子进行二次讲解,这样更容易理解;虽然是英文讲的,但B站上很多视频都是有字幕的。
李宏毅老师的视频我认为相对于吴恩达老师的视频更为全面,内容比较有广度。但就是台湾腔的英语有时候真的挺着难受。       
代码实践
在理论基础的学习过程中,如果大家有一个知识点不懂,搜了很多博客和视频还是不能理解。这时候建议大家找相关知识点的代码去敲一下,基本上就可以理解了。
代码实践的视频或者书籍网上也是五花八门,根据我的个人入坑经验,我觉得李沐老师的《动手深度学习》这本书应该是我目前看的最好的代码书了。这本书有书籍版本,网上也有PDF版本。

Lx7159 发表于 2023-10-4 20:08:59

这是一个很多同学都比较关心的问题,我结合自己的课程要求来回答一下。
我目前就在给研究生同学上机器学习这门课程,在课程开始之前需要学生自主完成经典机器学习算法、深度学习基础和框架工具等内容的学习。
在课程进行的过程中,我会重点关注机器学习领域的一些经典和前沿的创新成果,所以如果机器学习基础没有打好,上课过程中会遇到一些困难,后续开展分组活动时压力会更大。
对于跨考生同学来说,要想入门机器学习,应该先奠定一个编程基础,比如重点学习一下Python语言,这门语言的学习成本比较低,一周左右就能够掌握其基本的编程语法,接下来就可以开始学习经典机器学习算法了。
学习经典机器学习算法对于数学基础的要求并不高,考研上岸的同学基本上不会遇到什么障碍,后续随着算法复杂度逐渐提升,也可以同步学习相应的数学知识,我并不建议在脱离实践的情况下去学习数学知识,这样很难有一个较好的学习体验,也容易走弯路。
经典机器学习算法包括K近邻、决策树、朴素贝叶斯、支持向量机等,这些算法本身并不难理解,而且算法实现过程也相对比较简单,完全可以通过自学来掌握,这个过程也会了解机器学习的流程,包括数据的收集、预处理、算法设计、算法实现、算法训练、算法验证和算法应用等环节。
从经典机器学习算法入手最大的好处之一就是能够尽快获得学习的成就感,对于基础薄弱的跨考生同学来说,我并不建议上来就学习偏重理论的书籍,我更建议通过实验来为抽象的机器学习概念建立画面感,这会尽快形成一个正向的驱动力,从而提升自己的学习信心。
在开展经典机器学习算法实践的过程中,再拿出一定的时间来同步学习机器学习理论基础,把不清楚的地方不断细化,一直细化到可以理解的地步,然后再逐步整合,这是比较务实的学习方法,而且建议这个过程写一下总结,为后续撰写自己的第一篇综述奠定基础。
目前机器学习的实践门槛也比较低了,可以从Pytorch入手,复现一些经典的案例,这个过程也会提升对于机器学习的认知能力,毕竟计算机是一门工科专业,很多内容需要从实践当中学习。
我目前联合多所大学的导师和互联网大厂的企业导师,共同搭建了一个技术论坛,在持续开展大数据、人工智能相关方向的科研活动,其中机器学习方向就陆续开展了多期实践活动,感兴趣的同学可以联系我申请参与,相信一定会有所收获。
最后,如果有计算机专业读研、科研相关的问题,欢迎与我交流。

落日的孤单 发表于 2023-10-4 20:09:17

入门机器学习最好先对整个AI有个初步概念,现在火热的机器学习分为剑气两宗。气宗也即统计学派主张正面专业建模,需要扎实的数学基础特别是统计学,而深度学习也即神经学派主张通用建模,对数学的要求较低。
无论是统计学派的西瓜书还是神经学派的花书都不适合初学者,它们不但对读者有较高的数学要求,而且内容有些过时。我的推荐是Andrew Glassner的深度学习从基础到实践《深度学习:从基础到实践(上下册)揭示AI与chatgpt背后的奥秘!(异步图书出品)》(安德鲁·格拉斯纳(Andrew Glassner))【摘要 书评 试读】- 京东图书 (jd.com)。这本书的特点是完全略过数学推导,而是通过图文让读者建立机器学习的各种概念,内容涵盖最新的Transformer和RL等热门内容。通过这本书建立机器学习的扎实基础,再深入了解其后的数学原理可以事半功倍。
页: [1]
查看完整版本: 研0如何入门机器学习?