发布网友 发布时间:2022-04-22 05:16
共2个回答
热心网友 时间:2024-03-26 04:14
第一、是商业理解,在我看来,这个商业理解就是要把业务问题转换成数据挖掘问题,目前数据挖掘的理论概念中,一般都包括分类,聚类,回归,关联规则这几类,这需要对这几类方法有一定的理解,才能有效地转换。
第二、数据理解,数据描述了我们的业务,在这一步,我们必须找准对应关系,所面临的业务问题,有哪些数据可以用,我们做的是定量分析,没有数据显然是得不到模型的,知道哪里数据和业务关系紧密,也能让我们的分析事半功倍。
第三、数据准备,实际上数据挖掘的大部分工作都在这一步,往往到了这一步就发现理想很美好,但现实很骨感,数据质量令人堪忧,缺失值,异常值接踵而来,这是数据的错误,还有为了适应算法,需要将数据去量纲化,类型转换,去相关性,降维等等操作,这一步将消耗分析人员大量精力。
第四、建模,这一步需要对算法理解透彻,要了解数据特征和算法特点,才能选择最优算法,以及最优参数,很多算法的使用是有假设条件的,必须仔细掌握,得到的模型才会合理,另外,还要考虑业务需要,如果模型必须能解释,那就要选择生成式模型算法。
第五、评价,就是模型评估了,各种评估指标的侧重点是不一样的,要以最能反应业务的指标为准,另外,评估数据的选择也很关键,要尽可能的模拟实际生产环境,才能评估模型的性能。
热心网友 时间:2024-03-26 04:15
数据挖掘工作咋开展?记住这六步:定义商业问题、数据准备、数据理解、建立模型、评估模型、应用部署模型。
简单来讲,数据挖掘,就是把数据找出来,数据分析呢,就是针对挖掘出来的数据进行处理。数据中台是集数据挖掘和数据分析、数据呈现为一体,打破了传统的数仓还有数据中心,并且在数仓模型的设计上也是一脉传承,之所以我们现在处处推崇数据中台建设及应用,一个是因为数据中台确实有过人之处,数据中台策略中的几个过人之处。
数据业务在企业中应当是一个完整业务,是企业的战略业务。所以数据中台策略应当对应企业的数据战略,并提供更有力的支撑,而不是仅仅停留在是把数据找到,把数据清洗了,把数据算出来。
想要学习了解更多数据挖掘的信息,推荐CDA数据分析师课程。CDA 数据分析师系列丛书依照 CDA 规范化学习体系而定,以读者需求为出发点,结合企业实际案例和业务场景来谈大数据思维和分析,满足了 CDA 数据分析师等级认证的学习需要,也兼顾了大数据的热点动态。点击预约免费试听课。