admin管理员组

文章数量:1536025

CRIP-DM+SEMMA

CRISP-DM (cross-industry standard process for data mining),即为“跨行业数据挖掘过程标准"。

 

长期以来,随着数据挖掘市场的发展和成熟,由不同的组织机构提出过很多的方法论,如CRISP-DM、SEMMA、5A等,其中CRISP-DM、SEMMA是应用最为广泛。CRISP-DM (cross-industry standard process for data mining),即为“跨行业数据挖掘过程标准"。此KDD过程模型于1999年欧盟机构联合起草. 通过近几年的发展,CRISP-DM 模型在各种KDD过程模型中占据领先位置,采用量达到近60%。排在其后的是由SAS公司提出的SEMMA。SEMMA更偏重于数据挖掘的建模过程,与SAS的EM工具进行整合,其模型管理部署部分则体现在另外的工具套件中。CRISP-DM是从一个数据挖掘项目执行的角度谈方法论,CRISP- DM的考虑的范围比SEMMA 要大。CRISP-DM强调,数据挖掘不单是数据的组织或者呈现,也不仅是数据分析和统计建模,而是一个从理解业务需求、寻求解决方案到接受实践检验的完整过程。因此,从一个项目的管理实施完整流程来说,CRISP-DM更适用一些,本文后续主要以CRISP-DM为主进行详细介绍。

 

 

在过去几年,随着信息化技术的高速发展,数据逐渐变为

本文标签: 数据挖掘过程标准Crossindustry