七、机器/统计学习基础
32
线性与非线性特征
R4DS-读书笔记
Introduction
一、数据科学的whole game
1
数据可视化
2
数据变换
3
整洁数据
4
数据导入
二、可视化
5
图层
6
EDA
7
ggplot2的其他元素-解释性图表
三、变量类型和变量操作工具
8
逻辑变量
9
数值数字变量
10
字符串和正则表达式
11
因子
12
日期和时间
13
缺失值
14
数据连接
四、数据导入
15
电子表格数据读取
16
数据库
17
箭头-Arrow
18
分层数据-Hierarchical data
19
网络爬虫
五、编程基础
20
函数
21
迭代
22
base R 简介
六、统计学基础
23
统计学基础-描述性统计
24
Bootstrapping算法和置信区间
25
假设检验
26
统计结果报告
七、机器/统计学习基础
27
机器学习概览
28
初始数据划分
29
缺失值处理
30
数值变量转换
31
分类变量处理
32
线性与非线性特征
33
过拟合
34
重采样
35
网格搜索
36
迭代搜索
37
特征选择
38
模型比较
八、ML模型的选择与算法-单个模型
39
预测数值型数据-回归方法
40
K-最邻近算法
41
lasso回归
42
非线性模型
43
分而治之-应用决策树和规则进行分类
44
黑箱方法-神经网络和支持向量机
45
寻找数据的分组-k均值聚类
46
主成分分析
九、ML模型的选择与算法-集成算法
47
集成算法简介
48
随机森林
49
梯度提升机-GBM
50
XGBoost
51
lightGBM
52
catboost
十、Other topics in Data Science
53
空间数据处理
54
空间数据计算
55
拥抱大数据
参考文献
附录
A
算法思维
B
函数式编程
C
ggplot2 styling 设置
D
假设检验实例
E
easystats:用于轻松进行统计建模、可视化和报告的 R 框架
F
gt包-整洁的建立表格
G
其它有趣的包
七、机器/统计学习基础
32
线性与非线性特征
32
线性与非线性特征
31
分类变量处理
33
过拟合