数据挖掘指南,将原始数据转化为业务洞察的过程

数据挖掘的过程

数据挖掘有时被认为是用词不当,因为您实际上并不是在挖掘数据,而是在挖掘数据以寻找可以帮助为业务决策提供信息的模式、趋势和异常情况。此外,数据挖掘并不类似于分析师在没有整体计划的情况下审查数据的钓鱼探险。当数据挖掘与严格定义的目标一起使用时,它是最成功的。

数据挖掘的跨行业标准流程 (CRISP-DM) 是数据挖掘的主要方法之一。这个过程可以分为六个步骤。

  1. 业务理解:这是定义主要业务目标以及项目参数和成功标准的阶段。
  2. 数据理解:分析师确定需要哪些数据来解决业务理解中确定的问题。
  3. 数据准备:通常需要准备数据 – 需要对其进行格式化和清理,修复诸如删除损坏数据、不相关数据和重复数据等问题。
  4. 建模:开发算法来识别数据中的模式。
  5. 评估:在此阶段,分析师审查结果以评估它是否正在解决业务理解中确定的目标。流程可能需要迭代重复,调整算法和数据,直到结果符合预期。
  6. 部署:在最后阶段,将结果提供给业务领导或决策者。

数据挖掘功能和概念

有许多与数据挖掘相关的行业特定术语。以下是在此过程中发挥作用的关键概念和功能。

  • 人工智能 (AI): AI 是一种计算机系统,可以模仿人类智能的某些方面,例如计划、学习、推理、解决问题,有时还可以模仿社交智能或创造力。
    f03bde11d261f18-273
    人工智能是一种在数据挖掘过程中用于提取数据模式和趋势的工具;他们经常一起工作。
  • 关联规则学习:这是一种分析技术,其中系统搜索数据中变量之间的关系。这方面的一个例子被称为购物篮分析,亚马逊使用它来确定通常一起购买哪些产品以提出建议。
  • 聚类:这种技术将数据划分为有意义的组或类。它帮助人们和系统了解数据应该如何自然或有机地构建。
  • 数据分析:将数据评估为的整个过程商业智能.
  • 数据清理:用于数据准备阶段,即通过消除不正确、不完整或不相关的数据,将原始数据置于适合分析的格式中。
  • 机器学习:这是一种人工智能,它使计算机系统能够在没有给出明确算法的情况下解决问题。机器学习系统可以进行训练,也可以根据示例进行自我训练,而软件为解决问题而开发的确切算法通常是未知的。
  • 回归:一种用于基于数据进行预测的常用技术。

用于数据挖掘

数据挖掘有丰富的应用。它通常用于获取客户、增加收入、改进交叉销售和追加销售、提高客户忠诚度、检测欺诈以及提高运营绩效和效率。以下是一些经常使用数据挖掘的行业。

  • 银行业:银行业依靠数据挖掘来检测欺诈、评估市场和投资趋势以及管理监管和合规问题。
  • 教育:教育工作者使用数据挖掘来预测学生的表现,并在学生未达到预期水平时制定干预策略。
  • 制造:数据挖掘在检测问题和确保操作车间的质量以及预测设备维护需求和预测客户需求方面发挥着重要作用。
  • 零售:该业务部门在数据挖掘方面投入了大量资金,以揭示客户洞察,帮助企业提高销售、更好地定位营销活动并预测未来的销售趋势。

事实上,我们被现实世界的数据挖掘应用程序所包围。

例如,亚马逊拥有关于其用户及其购买的大量数据,零售商挖掘这些数据来为其推荐引擎提供动力,无论何时您在该网站上,该引擎都会提供针对性很强的购买建议。

f03bde11d261f18-274
亚马逊使用其客户的数据来挖掘结果,为他们网站广受欢迎的推荐系统提供信息。

未经允许不得转载:表盘吧 » 数据挖掘指南,将原始数据转化为业务洞察的过程