
网盘:百度 | 学分:5,VIP免费 | 发布:2023-02-28 | 查看:0 | 更新:2024-02-08 | Java
【JAVA】Spark实战大数据离线与实时项目 整合大数据生态圈多个框架
网盘:百度 | 学分:5,VIP免费 | 发布:2023-02-28 | 查看:0 | 更新:2024-02-08 | Java
【JAVA】Spark实战大数据离线与实时项目 整合大数据生态圈多个框架
〖课程介绍〗:
&nBSp; 本课程整合Redis和HBase打造以Spark技术栈为核心的离线处理项目以及实时处理项目,以功能实现为基础,通过调优及重构功能实现,达到企业级生产水平。课程最后讲解Alluxio整合HADoop和Spark的使用,拓展同学们的视野。
〖课程目录〗:
第1章 课程介绍&学习指南 试看2 节 | 12分钟
收起列表
第2章 Redis入门 试看12 节 | 126分钟
Redis是目前最火爆的内存数据库之一,通过在内存中读写数据,大大提高了读写速度。本章将从Redis特性、应用场景出发,到Redis的基础命令,再到Redis的常用数据类型实操,最后通过Java API来操作Redis,为后续实时处理项目打下坚实的基础…
收起列表
视频:2-1 课程目录 (02:44)
第3章 HBase入门20 节 | 142分钟
HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“BiGTable:一个结构化数据的分布式存储系统”。本章将从HBase是什么、有哪些特点出发,到HBase环境部署,到HBase的数据模型,到HBase的操作(命令行&AMp;API),为后续离线处理项目的数据存储以及查询打下坚实的基础。…
收起列表
视频:3-2 HBase是什么 (05:58)
视频:3-4 HBase的特点.mp4 (05:23)
视频:3-5 HBase vs RDBMS vs HDFS.mp4 (05:15)
视频:3-6 HBase的优势 (02:58)
视频:3-12 HBase shell DDL操作 (06:28)
视频:3-13 HBase shell DML操作 (09:48)
视频:3-18 HBase API编程之Scan (08:39)
视频:3-19 HBase API编程之Filter (06:09)
第4章 离线项目实战V1 试看22 节 | 182分钟
本章节讲解基于Spark和HBase的离线综合项目实战,从多个框架的整合出发,到使用Spark进行ETL处理然后数据落地到HBase中涉及到的传参、HBase Rowkey的设计,再到性能的初步调优,最后使用Spark整合HBase进行数据的统计分析。本章是基于Spark进行离线处理的重点,务必掌握。…
收起列表
第5章 离线项目实战优化11 节 | 109分钟
本章节将基于前面一个章节的功能实现进行进一步的优化,如何将在需求功能实现的基础之上,进行调优,使得在生产上的执行效率更高。本章将是提升自身综合实力的关键部分,务必掌握。
收起列表
视频:5-1 课程目录 (02:15)
视频:5-2 Spark on YARN (12:02)
视频:5-7 Spark ETL到HBase优化之禁用WAL (18:29)
视频:5-8 Spark ETL到HBase的HFile思路 (03:49)
作业:5-11 【讨论题】Spark OOM问题
第6章 实时项目实战15 节 | 103分钟
本章节讲解基于Spark和Redis的实时综合项目实战,从Spark StreAMing整合Kafka对接出发,如何实现需求的功能以及如何对代码进行重构使得执行效率更好,掌握Redis在项目实战中的数据类型选型,以及如何将SparkStreAMing处理完的数据写入到Redis中去。…
收起列表
第7章 初识Alluxio13 节 | 108分钟
Alluxio是一个以内存为中心的虚拟分布式存储系统,统一数据访问和桥梁的计算框架和底层存储系统。应用程序只需要Alluxio就可以把访问存储在任何底层存储系统的数据连接。本章节将从Alluxio为我们带来的好处出发,再到Alluxio如何整合HADoop以及Spark进行实操,并分享一些Alluxio在大公司中的使用案例。…
收起列表
视频:7-1 课程目录 (02:05)
视频:7-2 概述 (08:41)
视频:7-4 Alluxio能为我们带来什么 (08:05)
视频:7-5 Alluxio特点 (05:46)
视频:7-7 Alluxio部署 (11:29)
第8章 Spark优化11 节 | 76分钟
收起列表
第9章 (讨论群内直播内容分享)基于Spark定制ETL框架6 节 | 46分钟
收起列表
视频:9-1 Data PIPeline_x264 (06:19)
视频:9-3 (打标记处,3处听不清楚) Spark SQL DataSource API_x264 (06:40)
第10章 (讨论群内直播内容分享)Spark3新特性6 节 | 47分钟
Spark3是一个里程碑版的版本,其中包含很多新的特性,本次直播中主要带大家知晓新特性有哪些,以及讲解动态分区裁剪、外部数据源V2、自适应查询执行等相关知识。
收起列表
*声明:课程资源购自网络,版权归原作者所有,仅供参考学习使用,严禁外传及商用,若侵犯到您的权益请联系客服删除。