CRISP-DM的应用与理解

诗林  高级会员 | 2024-8-30 14:45:29 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 227|帖子 227|积分 681

本文分享自天翼云开发者社区《CRISP-DM的应用与理解》,作者:吴****嫄
CRISP-DM是一个数据发掘项目规划的开放尺度流程框架模子,主要分为业务理解、数据理解、数据准备、建模、评估、部署六个阶段。
业务理解
从业务的角度理解项目的目的和需求,将业务的目的转换为一个数据发掘的题目,制定一个初步的实现计划计划。
贸易理解是明确要达到的业务目的,并将其转化为数据发掘主题。要从贸易角度对业务部门的需求进行理解,并把业务需求的理解转化为数据发掘的定义,拟定达成业务目的的初步方案。具包括贸易配景分析、贸易乐成尺度的确定、形势评估、获得企业资源清单、获得企业的要求和想、评估本钱和收益、评估风险和意外、初步理解行业术语,并确定数据发掘的目的和制定数发掘计划。
在整个CRISP-DM的过程当中,围绕数据为核心,项目大概会在各个阶段之间跳跃,由于数据分析一定是一个不停迭代的过程。是否可以继续进行下一个阶段取决于是否有达到最初的业务目的,如果业务目的没有达到,那么就要考虑是否是数据不够充分或算法需要调解,一切都以业务目的为导向。
数据理解
初步收集数据,相识、熟悉数据。关注数据质量,进行探索性的分析。数据理解是找出大概的影响主题的因素,确定这些影响因素的数据载体、数据体现形式和数据存储位置。数据理解从数据收集开始,然后熟悉数据,具体包括以下工作内容:检测数据质量,对数据进行初步理解,简单描述数据,探测数据意义,并对数据中潜藏的信息和知识提出拟用数据加以验证的假设。
数据准备
准备最终输入到模子中的数据,数据的选择,数据清楚等。
数据准备是将前面找到的数据进行变更、组合,创建数据发掘工具软件要求格式和内容的宽表。数据准备阶段要从原始数据中形成作为建模分析对象的最终数据集。数据准备阶段的具体工作主要包括数据制表、记录处理、变量选择、数据转换、数据格式化和数据清理等,各项工作并不需要预先规定好执行序次,而且数据准备工作尚有大概多次执行。
建模
一样平常利用多种技术进行建模,将模子调解到最佳状态。
创建模子是应用软件工具,选择合适的建模方法,处理准备好的数据宽表,找出数据中隐藏的规律。在创建模子阶段,将选择和利用各种建模方法,并将模子参数进行优化。对同样的业务问和数据准备,大概有多种数据发掘技术方法可供选用,此时可优选提升度高、置信度高、简单而易于总毕业务政策和发起的数据发掘技术方法。在建模过程中,还大概会发现一些潜在的数据题目,要求回到数据准备阶段。创建模子阶段的具体工作包括:选择合适的建模技术、进行检验设计、制作模子。
评估
到这个阶段一样平常已经有从数据角度来看满足要求的模子。重点是评估是否有业务题目还没有考虑到,是否已经完全满足业务要求。评估数据发掘结果的利用大概性。
模子评估是要从业务角度和统计角度进行模子结论的评估。要求查抄建模的整个过程,以确保型没有巨大错误,并查抄是否遗漏重要的业务题目。当模子评估阶段竣事时,应对数据发掘结果的发布计划达成一致。
部署
数据分析完成了但是还不是末了一步。末了一步的部署大概是天生一个陈诉,也大概是需要创建一个整个公司层面的新的体系,这是看业务的需求来定。要保证数据分析的结果被正确的利用。
模子发布又称为模子部署,创建模子本身并不是数据发掘的目的,虽然模子使数据背后隐藏的作息和知识显现出来,但数据发掘的根本目的是将信息和知识以某种方式构造和呈现出来,并用来改善运营和提高效率。当然,在实际的数据发掘工作中,根据不同的企业业务需求,模子发布具体工作大概简单到提交数据发掘陈诉,也大概复杂到将模子集成到企业的核心运营体系中去。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

正序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

诗林

高级会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表