1.linux操作系统
2.大型网站高并发处理
3.zookeeper分布式协调服务框架
4.Hadoop分布式文件系统HDFS
5.Hadoop分布式计算框架MapReduce
6.数据仓库Hive
7.分布式数据库HBase
8.大型电商日志离线分析系统
9.elasticsearch分布式搜索
10.Redis缓存数据库
11.CDH集群管理
12.Kylin数据仓库分析引擎
13.Scala分布式语言
14.Spark分布式计算框架
15.大数据任务流调度系统azkaban
16.音乐数据中心数仓综合项目
17.python数据挖掘语言
18.机器学习与数据挖掘
19.推荐系统项目
20.Flink实时计算引擎
原文:https://www.cnblogs.com/mylifewell/p/13592113.html