数据仓库之数据仓库环境——读书笔记

时间：2018-05-23 10:44:02 阅读：162 评论：0 收藏：0 [点我收藏+]

数据仓库是一个面向主题的，集成的，非易失的，随时间变化的用来支持管理人员决策的数据集合。

数据仓库环境中数据存在不同的细节层

数据仓库只能一步一步的进行设计并载入数据，也就是说它是进化的，而非革命性的。

粒度是数据仓库中数据单元的细节程度或者综合程度的级别。

细节程度越高，粒度级就越低；细节程度越低，粒度级就越高。

技术分享图片

当一个企业或者组织的数据仓库拥有大量数据时，在细节部分采用双重或者多重粒度级别是很有意义的。

活样本数据库

是从数据仓库取得真实档案数据或轻度综合数据的一个子集，其中样本是指它是一个大的数据库的一个子集，活是指这个数据库需要进行周期刷新。

活样本数据用来作统计分析和观察发展趋势，当数据必须以整体观察时，活样本数据库能提供非常理想的结果，但绝不适用于处理单个数据记录。

分区设计方法

数据分区是指将数据分散到可以独立处理的分离物理单元中去。

数据仓库环境中的问题是如何对当前细节数据进行分区

数据仓库的数据组织

1. 简单堆积数据

2. 轮转综合数据

3. 简单直接文件

4. 连续文件

数据仓库中数据的生命周期包含了数据的清理。

原文：https://www.cnblogs.com/reycg-blog/p/9075597.html

踩

(0)

评论一句话评论（0）

分享档案

更多>