首页 > 其他 > 详细

数据仓库之数据仓库环境——读书笔记

时间:2018-05-23 10:44:02      阅读:156      评论:0      收藏:0      [点我收藏+]

数据仓库是一个面向主题的集成的非易失的随时间变化的用来支持管理人员决策的数据集合。

数据仓库环境中数据存在不同的细节层

  1. 早期细节层
  2. 当前细节层
  3. 轻度综合数据层
  4. 高度综合数据层

数据仓库只能一步一步的进行设计并载入数据,也就是说它是进化的,而非革命性的。

粒度是数据仓库中数据单元的细节程度或者综合程度的级别。

细节程度越高,粒度级就越低;细节程度越低,粒度级就越高。

技术分享图片

当一个企业或者组织的数据仓库拥有大量数据时,在细节部分采用双重或者多重粒度级别是很有意义的。

 

活样本数据库

是从数据仓库取得真实档案数据或轻度综合数据的一个子集,其中样本是指它是一个大的数据库的一个子集是指这个数据库需要进行周期刷新

活样本数据用来作统计分析和观察发展趋势,当数据必须以整体观察时,活样本数据库能提供非常理想的结果,但绝不适用于处理单个数据记录。

 

分区设计方法

数据分区是指将数据分散到可以独立处理的分离物理单元中去。

数据仓库环境中的问题是如何对当前细节数据进行分区

 

数据仓库的数据组织

1. 简单堆积数据

2. 轮转综合数据

3. 简单直接文件

4. 连续文件

数据仓库中数据的生命周期包含了数据的清理。

 

数据仓库之数据仓库环境——读书笔记

原文:https://www.cnblogs.com/reycg-blog/p/9075597.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!