Skip to content

## 数据挖掘流程 **(一)数据读取** - 读取数据,并进行展示 - 统计数据各项指标 - 明确数据规模与要完成的任务 **(二)特征理解分析** - 单特征分析,逐个变量分析其对结果的影响 - 多变量统计分析,综合考虑多种情况影响 - 统计绘图得出结论 **(三)数据清洗与预处理** - 对缺失值进行填充 - 特征标准化/归一化 - 筛选有价值的特征 - 分析特征之间的相关性 **(四)建立模型** - 特征数据与标签准备 - 数据集切分 - 多种建模算法对比 - 集成策略等方案改进

Notifications You must be signed in to change notification settings

Rossichan/Titanic-data-mining

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Titanic-data-mining

数据挖掘流程

(一)数据读取

  • 读取数据,并进行展示
  • 统计数据各项指标
  • 明确数据规模与要完成的任务
    (二)特征理解分析
  • 单特征分析,逐个变量分析其对结果的影响
  • 多变量统计分析,综合考虑多种情况影响
  • 统计绘图得出结论
    (三)数据清洗与预处理
  • 对缺失值进行填充
  • 特征标准化/归一化
  • 筛选有价值的特征
  • 分析特征之间的相关性
    (四)建立模型
  • 特征数据与标签准备
  • 数据集切分
  • 多种建模算法对比
  • 集成策略等方案改进

About

## 数据挖掘流程 **(一)数据读取** - 读取数据,并进行展示 - 统计数据各项指标 - 明确数据规模与要完成的任务 **(二)特征理解分析** - 单特征分析,逐个变量分析其对结果的影响 - 多变量统计分析,综合考虑多种情况影响 - 统计绘图得出结论 **(三)数据清洗与预处理** - 对缺失值进行填充 - 特征标准化/归一化 - 筛选有价值的特征 - 分析特征之间的相关性 **(四)建立模型** - 特征数据与标签准备 - 数据集切分 - 多种建模算法对比 - 集成策略等方案改进

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published