数据仓库是一个面向主题的,集成的,非易失的,随时间变化的用来支持管理人员决策的数据集合。
数据仓库环境中数据存在不同的细节层
数据仓库只能一步一步的进行设计并载入数据,也就是说它是进化的,而非革命性的。
粒度是数据仓库中数据单元的细节程度或者综合程度的级别。
细节程度越高,粒度级就越低;细节程度越低,粒度级就越高。

当一个企业或者组织的数据仓库拥有大量数据时,在细节部分采用双重或者多重粒度级别是很有意义的。
活样本数据库
是从数据仓库取得真实档案数据或轻度综合数据的一个子集,其中样本是指它是一个大的数据库的一个子集,活是指这个数据库需要进行周期刷新。
活样本数据用来作统计分析和观察发展趋势,当数据必须以整体观察时,活样本数据库能提供非常理想的结果,但绝不适用于处理单个数据记录。
分区设计方法
数据分区是指将数据分散到可以独立处理的分离物理单元中去。
数据仓库环境中的问题是如何对当前细节数据进行分区
数据仓库的数据组织
1. 简单堆积数据
2. 轮转综合数据
3. 简单直接文件
4. 连续文件
数据仓库中数据的生命周期包含了数据的清理。
原文:https://www.cnblogs.com/reycg-blog/p/9075597.html