
网盘:百度 | 学分:5,VIP免费 | 发布:2023-03-07 | 查看:0 | 更新:2023-12-15 | Java
【JAVA】玩转热门框架 用企业级思维 开发通用够硬的大数据平台
网盘:百度 | 学分:5,VIP免费 | 发布:2023-03-07 | 查看:0 | 更新:2023-12-15 | Java
【JAVA】玩转热门框架 用企业级思维 开发通用够硬的大数据平台
第1章 课程导学与学习指南 3 节 | 12分钟
第2章 认识企业中的大数据平台6 节 | 32分钟
为什么要有大数据平台?大数据平台究竟是为了解决什么问题产生的?如何判断一个大数据平台的好坏?在设计一个数据平台时,需要注意哪些,有什么步骤。各大企业现有的解决方案有哪些,常见的技术栈有哪些,我们自己设计的这个通用的大数据平台是什么结构。…
第3章 大数据平台 —— 数据仓库之离线&实时 16 节 | 116分钟
你真的理解数据仓库是什么吗?数据仓库如何进行分层,为什么要分层呢?分层一定好吗?带你理解数据仓库,逐步掌握离线数仓工具Hive。对比离线数仓和实时数仓,了解实时数仓常见架构。
视频:3-2 数据仓库分层建设 (08:52)
图文:3-9 【作业解答】Hive自定义函数注册
视频:3-10 Hive存储结构 ORCFile (10:38)
视频:3-12 Hive常见面试题 (13:45)
视频:3-13 离线数仓VS实时数仓 (05:23)
第4章 大数据平台——数据仓库之权限管理 18 节 | 155分钟
解决三大问题:数仓安全问题,对比常见权限认证框架,使用Ranger开发数仓权限模块;数据来源问题,对常用数据采集工具进行介绍,使用DataX进行数据采集;数仓管理问题,介绍数据治理的概念及ApacheAtlas
视频:4-4 Apache Ranger简介【图解Ranger架构、Ranger管理HDFS、Hive、Yarn举例】 (08:54)
视频:4-6 Apache Rangr安装 (06:13)
视频:4-7 Ranger HDFS Plugin安装 (09:46)
视频:4-8 Ranger Hive Plugin安装 (05:31)
视频:4-18 数据仓库常见面试题 (10:43)
第5章 大数据平台 —— 调度系统10 节 | 87分钟
解决离线批处理任务的定时执行问题,对主流调度框架Azkaban进行架构介绍、特性讲解和部署应用。通过Java程序调用Azkaban相关接口,实现创建任务、调度任务功能,实现API接口封装
第6章 大数据平台 —— 计算引擎15 节 | 117分钟
平台的计算引擎是基于Spark构建的,依托了Yarn进行资源调度。本章从Spark架构、核心介绍及部署开始,进行Spark部分开发。之后接入Spark SQL模块。最后介绍了Spark的一些高阶调优技巧。
视频:6-4 RDD依赖关系【图解Stage划分】 (06:25)
视频:6-10 Spark 自定义UDF开发 (05:08)
视频:6-12 Spark 数据倾斜调优 (07:32)
视频:6-14 Spark面试题答疑 (13:09)
第7章 大数据平台建设 —— SQL查询引擎11 节 | 90分钟
介绍SQL On HADoop 方案。对Presto架构和应用做了一些介绍,利用Presto作为底层的SQL查询引擎,实现快速查询和多数据源查询。涉及Presto的配置优化,自定义函数、EventListener、以及通用UDF的开发,最后完成Presto On Yarn部署
视频:7-11 Presto章节小结 (06:58)
第8章 大数据平台建设 —— 监控预警14 节 | 92分钟
集群监控能提高资源利用率,有效管理整个集群,本章对常见集群的预警方案做了介绍和应用,最后通过GANafa展示项目监控数据
视频:8-3 常用开源监控项目对比【Zabbix VS OpenFalcon VS PROmetheus】 (09:12)
视频:8-7 OpenFalcon基本使用 (15:33)
视频:8-8 OpenFalcon邮件网关安装 (05:34)
视频:8-10 自定义Plugin开发 (12:28)
视频:8-13 Grafana监控大盘配置 (07:30)
视频:8-14 监控系统 章节小结 (05:08)
第9章 大数据平台建设 —— 管理整合、任务定制21 节 | 173分钟
整合前面章节中开发的数仓管理功能,整合数仓权限、数据治理和数据采集,通过界面化配置实现数据采集任务定制。实现任务调度功能,实现shell命令、Java程序、python程序、Spark程序的运行和管理
第10章 系统集成及可视化23 节 | 108分钟
实现多引擎的数据查询及可视化模块,生成图表进行展示。将前面的数据仓库、调度系统、SQL引擎、计算引擎、预警监控系统、元数据管理系统等等,如何将他们集成到一起构建大数据平台
*声明:课程资源购自网络,版权归原作者所有,仅供参考学习使用,严禁外传及商用,若侵犯到您的权益请联系客服删除。