山野悍农txt三个层级。其中数据底层负责管理数据,包括数据采集、数据 ETL、数据仓库构建等环节,为前端报表查询和决策分析提供数据基础;数据分析主要是利用查询、OLAP 分析、数据挖掘以及可视化等方法抽取数据仓库中的数据,并进行分析,形成数据结论,将数据转化为信息和知识;最终通过数据展示层呈现报表和可视化图表等数据见解,辅助用户决策。
具体地,对应到企业的决策与经营环节,BI 的运作流程如下图所示。首先从来自 ERP、OA、财务等不同业务系统以及外部的数据中提取出有价值的部分。接着进行数据的处理与存储,经过 ETL、数据清洗等过程,合并到企业级的数据仓库里,从而得到企业数据的全局视图。最后在此基础上利用合适的查询和分析工具、OLAP 工具等对其进行分析和处理,将数据信息转变为管理驾驶舱、中国式复杂报表、自助分析、多维分析等数据应用,从而为企业管理者和运营人员的决策过程提供支持。
数据可视化旨在借助于图形化手段,清晰有效地传达与沟通信息。其基本思想是将数据库中每一个数据项作为单个图元素表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。例如柱形图、折线图和饼图等一些基础的图表就可以直观地展示出数据。当数据较为复杂时,可以通过复杂图表搭配多样的交互效果来将数据直观化。
数据挖掘技术需要一定数据量的支撑,而企业不一定要等到数据量足够大时才能应用 BI,结合我国企业的信息化现状,数据挖掘目前并不是 BI 系统的关键技术需求。联机分析处理(OLAP,Online Analytical Processing)主要关注多维数据库和多维分析。OLAP 委员会对联机分析处理的定义为:使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、一致、交互的存取,从而获得对数据更深入了解的一类软件技术。
数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。数据仓库的出现,并不是要取代数据库。大部分数据仓库还是用关系数据库管理系统来管理的,数据库、数据仓库相辅相成、各有千秋。ETL 是 Extract-Transform-Load 的缩写,用来描述将数据从来源端 经 过抽取(Extract)、交互转换(Transform)、加载(Load)至目的端的过程。它是构建数据仓库的关键环节,数据仓库主要是为决策分析提供数据,所涉及的操作主要是数据的查询,所以 ETL 过程在很大程度上受企业对源数据的理解程度的影响,也就是说从业务的角度看数据集成非常重要。
大数据(Big Data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。顾名思义,大数据技术就是收集、存储、处理、分析大数据的相关技术。当前大部分企业已满足大数据的 5V特征,因此,BI 引入大数据技术,旨在从大数据中快速获取价值。
元数据(Metadata)又称中介数据、中继数据,用于描述数据属性的信息,是描述数据的数据(Data about data)。其使用价值主要在于在识别资源、评价资源、追踪资源在使用过程中的变化、实现简单高效地管理大量网络化数据、实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理。由于元数据也是数据,因此可以用类似数据的方法在数据库中进行存储和获取。
本文节选自《商业智能(BI)白皮书 3.0》,本白皮书详细阐述了BI的概念(包括
价值、功能、技术、类型)、应用(包括蓝图、工具选型、应用场景)和趋势(包括行业市场、产品方向、功能技术),感兴趣的可以下载~
|