数据集市,数据湖泊、和运营数据存储
在Microsoft SQL Server数据库或Oracle数据库周围,数据仓库目标是提取多个数据库并累积从数百个千兆字节的数据进行处理,以便根据所需格式,进程进入必要的转换,清洁,清洁,最后将数据加载到仓库中。 根据IBM研究人员(Barry devlin和Paul Murphy)“数据仓库是一个主题导向的,集成,相对稳定的数据收集,反映了历史变化,用于支持管理决策”
在数据仓库出现后,企业的信息需求已经远离关系数据库到决策支持系统。该决策支持系统实际上是我们称为商业智能(BI)。 数据库与数据仓库数据集合的比较可以被理解为“小数据仓库”,它不是根据异构数据库,而是仅在单个操作数据库实例上,数据范围不够宽。 数据集市专门针对数据集市的特定业务运营(销售,生产)用户快速找到所需的数据,在数据集市中,您只需要设计和构建数据库表,填充数据库表与相关数据,决定谁可以访问数据集。 数据集市可分为两种类型:
数据湖它与自然状态的流动水有多像流动的水,数据流从多个源系统到这个湖,用户可以获得他们想要的特定数据,验证,弥补和其他双务任务将在数据湖外执行。 数据湖可以以以下功能实现的方式开发:
操作数据存储操作数据存储(ODS)是用于交易处理数据的数据库,ODS中的数据主要是原始数据,来自ODS的数据总是向数据仓库或数 (编辑:东莞站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |