* 获取数据的方式有哪些?
* 爬虫
* 已有数据
* 网上获取相关数据
* 特征工程有哪些内容?
* 特征获取
* 特征预处理
* 归一化
* 定义
* 是将值通过线性变换映射(0,1)的范围内
* API
* MinMaxScaler()
* 标准化
* 定义
* 是将值映射到均值为0,标准差为1的标准正态分布上
* API
* StandardScaler()
* 异常值处理
* 特征组合
* 将几个特征组合形成一个新的特征
* 特征选择
* 选择有意义的特征
* 特征降维
* 定义
* 降低数据特征的个数
* 分类
* 低方差过滤法
* 定义
* 删除方差低于th