一、课程亮点:
本次“机器学习及R应用”五天现场班将面向所有行业与学科的人士、老师与学生(包含经管社科、医学卫生等领域)。本课程的大特色在于“一站式服务”,从机器学习的原理、数学推导,到R语言命令与经典案例,无不精心设计、丝丝入扣,理论联系实操,让学员们迅速理解机器学习的精髓,并掌握为流行的数据科学软件R语言操作。
二、学习目标:
迅速理解机器学习的精髓,并掌握为流行的数据科学软件R语言操作。
三、课程内容:
01章机器学习引论
01-01什么是机器学习
01-02机器学习的分类与术语
01-03案例:垃圾邮件过滤;手写体数字识别;图像识别;自动驾驶
02章R语言入门
02-01Why R?
02-02安装R与RStudio
02-03R的对象(vector, matrix, data frame,list)
02-04面向对象的函数式语言
02-05R语言画图
03章惩罚回归
03-01OLS
03-02RidgeRegression
03-03Lasso
03-04ElasticNet
03-05交叉验证 (Cross-validation)
03-06PostDouble Lasso and IV Lasso
03-07R案例
04章线性分类
04-01Logit
04-02多项Logit
04-03贝叶斯决策理论
04-04线性判别分析
04-05二次判别分析
04-06ROC/AUC
04-07R案例
05章朴素贝叶斯
05-01朴素贝叶斯
05-02拉普拉斯修正
05-03R案例
06章K近邻法
06-01KNN forRegression
06-02KNN forClassification
06-03偏差与方差的权衡
06-04维度灾难
06-05R案例
07章决策树
07-01分类树
07-02分裂准则(错分率、基尼指数、信息熵)
07-03修枝与交叉验证
07-04回归树
07-05R案例
08章装袋法与随机森林
08-01集成学习(Ensemble Learning)
08-02装袋法(Bagging)
08-03随机森林(Random Forest)
08-04变量重要性(Variable Importance)
08-05偏依赖图(Partial Dependence Plot)
08-06R案例
09章提升法
09-01自适应提升法 (AdaBoost)
09-02AdaBoost的统计解释
09-03梯度提升法 (Gradient Boosting Machine)
09-04R案例
10章支持向量机
10-01MaximalMargin Classifier
10-02SoftMargin
10-03SupportVector Machine
10-04KernelTrick
10-05R案例
11章前馈神经网络
11-01前馈神经网络
11-02反向传播算法(Back-propagation Algorithm)
11-03随机梯度下降(Stochastic Gradient Descent)
11-04神经网络的过拟合
11-05深度学习的发展
11-06R案例
12章 卷积神经网络
12-01计算机视觉
12-02卷积运算(Convolution Operation)
12-03卷积神经网络(卷积层、汇聚层)
12-04R案例
13章循环神经网络
13-01文本数据与词嵌套(WordingEmbedding)
13-02循环神经网络(RecurrentNeural Network)
13-03长短期记忆模型(LSTM)
13-04门控循环单元(GRU)
13-05R案例
14章主成分分析
14-01总体中的主成分分析
14-02样本中的主成分分析
14-03 方差分解与降维
14-04主成分回归
14-05R案例
15章聚类分析
15-01K-均值聚类(K-meansClustering)
15-02分层聚类(Hierarchical Clustering)
15-03树状图
15-04R案例
16章机器学习在经管社科的应用
16-01精读几篇在经管社科顶刊发表的经典机器学习论文
温馨提示
温馨提示