求一份大数据学习路线
大数据要学习的内容是比较多的,整体分为三大阶段,一阶段是企业级离线智能,二阶段是企业级实时数据仓库,三阶段企业级项目实践,前两阶段偏重理论知识,后一阶段偏向实践操作。大数据学习路线整理如下,希望能帮到你。
第一阶段:企业级离线智能(7周)
掌握能力:掌握企业级基建环境部署、Hive和Spark数据开发、 数据仓库搭建、数据抽取、数据清洗、数据转换、数据加载、数据应用和京东云离线ETL
胜任职位:离线数据工程师、数据仓库工程师、ETL工程师、数据采集工程师、数据支持工程师、BI商业分析师、数据可视化工程师、Hadoop工程师、Spark 工程师
第二阶段:企业级实时数据仓库(5周)
掌握能力:掌握流数据接入、基于Flink实时数据开发、流批一体数据仓库开发、数据湖开发、实时ETL、 实时监控系统和京东云实时数据开发
胜任职位:实时工程师、Flink 工程师、实时数据仓库工程师、实时ETL工程师、Spark 工程师
第三阶段:企业级项目实践(4周)
掌握能力:掌握企业项目开发流程、用户画像开发、企业级推荐系统开发、数据治理、基于生产环境项目部署和京东云项目、性能调优
胜任职位:数据服务工程师、离线数据仓库开发工程师、BI商业分析师、实时数据仓库工程师、实时监控系统工程师、ETL工程师、数据可视化工程师、数据治理工程师、高级数据开发工程师、数据平台工程师、数据架构师。
以上就是大数据学习路线以及每阶段能够胜任的职位,建议大家可以在学习大数据之前先了解一下大数据的从业岗位都有哪些,根据自己的兴趣方向来安排学习重点,这样有的放矢,学习效果更好。
相关推荐HOT
redis数据类型有几种
消息队列(stream):一个特殊的数据结构,用于支持流式处理消息,并可以支持消费者分组、消费者位移等特性。每种数据类型都有对应的命令可以进行...详情>>
2023-03-16 10:19:36hadoop集群的最主要瓶颈
Hadoop集群的主要瓶颈取决于许多因素,例如集群的大小、硬件规格、网络架构、数据复杂性和处理任务等。以下是可能影响Hadoop集群性能的一些常见...详情>>
2023-03-14 10:22:17java底层hashmap扩容怎么实现?
Hashtable的synchronized是针对整张Hash表的,即每次锁住整张表让线程独占,ConcurrentHashMap允许多个修改操作并发进行,其关键在于使用了锁分...详情>>
2022-11-08 14:31:36用户画像系统中遇到的比较难的问题是什么?
如果我们直接将用户的标签转换为稀疏向量来存储,对于类别标签使用`one-hot`编码,但这样会出现维度爆炸的问题,向量过于稀疏,向量之间的余弦...详情>>
2022-11-07 15:25:17