首页 > 其他 > 详细

阿里巴巴大数据之路

时间:2020-05-20 20:29:36      阅读:57      评论:0      收藏:0      [点我收藏+]

 

1.市场常见的数据仓库建模方法:

1.1 市场做法:

数据模型就是数据组织和存储方法,它强调从业务、数据存取和使用角度合理存储数据。

1.ER模型建模方法:
数据仓库中的3NF与OLTP系统中的3NF的区别在于,它是站在企业角度面向主题的抽象,而不是针对某个具体业务流程的实体对象关系的抽象。采用ER模型建设数据仓库模型的出发点是整合数据,将各系统数据以整个企业角度按主题进行相似性组合和合并。建模步骤:
1.高层模型:一个高度抽象的模型,描述主要的主题以及主题间的关系,用于描述企业的业务总体概况。
2.中层模型:在高层模型的基础上,细化主题的数据项。
3.物理模型:考虑物理存储,同时基于性能和平台特点进行物理属性的设计,也可能做一些表的合并、分区的设计等。


2.维度建模方法:
选择需要进行分析决策的业务过程。选择粒度。识别维表。选择事实。

3.Data Vault模型:
Data Vault是Dan Linstedt发起创建的一种模型,它是ER模型的衍生,其设计的出发点也是为了实现数据的整合,但不能直接用于数据分析决策。Data Vault包含以下部分:
Hub :是企业的核心业务实体。
Link :代表Hub之间的关系。
Satellite :是Hub的详细描述内容,一个Hub可以有多个Satellite。
Data Vault模型比ER模型更容易设计和产出,它的ETL加工可实现配置化。

4.Anchor对Data Vault模型做了进一步规范化处理,其核心思想是所有的扩展只是添加而不是修改,基本变成了k-v结构化模型。

1.2 阿里巴巴做法:

 

阿里巴巴大数据之路

原文:https://www.cnblogs.com/natty-sky/p/12925671.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!