
网盘:百度 | 学分:5,VIP免费 | 发布:2023-03-02 | 查看:0 | 更新:2023-03-02 | Java
【JAVA】SparkSQL极速入门 整合Kudu实现广告业务数据分析
网盘:百度 | 学分:5,VIP免费 | 发布:2023-03-02 | 查看:0 | 更新:2023-03-02 | Java
【JAVA】SparkSQL极速入门 整合Kudu实现广告业务数据分析
〖课程介绍〗:
&nBSp; 以案例驱动,全面讲解Spark SQL大数据离线处理必备的知识点。使用Kudu整合Spark进行广告业务功能的实现,并针对已实现的需求代码进行调优;通过扩展Presto和大数据平台建设方面的相关内容,进一步提升技能。
〖课程目录〗:
第1章 课程介绍&学习指南 试看2 节 | 13分钟
收起列表
第2章 为什么要学Spark21 节 | 149分钟
Spark作为近几年最火爆的大数据处理技术,是成为大数据工程师必备的技能之一。本章节将从如下几个方面对Spark进行一个宏观上的介绍:Spark产生背景、特性、环境部署、Spark与HADoop的对比、Spark开发语言及运行模式等。
收起列表
视频:2-1 课程目录 (01:55)
视频:2-2 MaPreduce的槽点 (12:37)
视频:2-4 Spark Stack (04:11)
视频:2-6 JDK部署 (04:33)
视频:2-7 Maven部署 (06:37)
视频:2-8 IDEA部署 (01:40)
视频:2-9 HDFS部署 (13:42)
视频:2-10 YARN部署 (02:16)
视频:2-11 Hive部署 (11:50)
视频:2-20 HADoop与Spark对比 (02:30)
视频:2-21 Spark和HADoop的相互协作 (02:21)
第3章 Spark SQL快速入门 试看14 节 | 88分钟
Spark SQL面世已来,深受小伙伴们的喜爱,继续为Spark用户提供高性能SQL on HADoop解决方案,还为Spark带来了通用、高效、多元一体的结构化数据处理能力。本章将从为什么要学习SQL/Spark SQL、SQL on HADoop框架、Spark SQL概述、架构及快速入门,这几个角度进行展开讲解…
收起列表
视频:3-1 课程目录 (01:40)
视频:3-2 为什么需要SQL (06:51)
视频:3-3 SQL on HADoop (14:52)
视频:3-5 Spark SQL概述 (03:02)
视频:3-6 为什么要学习Spark SQL (03:40)
视频:3-7 Spark SQL架构 (07:00)
第4章 Spark SQL API编程12 节 | 96分钟
DataFrAMe&AMp;Dataset是Spark2.x中最核心的编程对象,Spark2.x中的子框架能够使用DataFrAMe或Dataset来进行数据的交互操作。本章将从DataFrAMe的概述、DataFrAMe对比RDD、DataFrAMe API操作等方面对DataFrAMe做详细的编程开发讲解。
收起列表
视频:4-1 课程目录 (02:05)
视频:4-2 认知SparkSession (09:35)
视频:4-3 了解SQLContext (05:59)
视频:4-4 认识DataFrAMe (07:59)
视频:4-9 DataFrAMe vs Dataset (06:46)
视频:4-10 Interoperating with RDD概述 (04:38)
第5章 Data Source API 试看11 节 | 70分钟
Spark SQL中的核心功能,可以使用Data Source API非常方便的对存储在不同系统上的不同格式的数据进行操作。本章将讲解如何使用Data Source API来操作text、json、Parquet、JDBC中的数据以及综合使用。
收起列表
视频:5-1 课程目录 (05:13)
视频:5-2 Data Source概述 (04:58)试看
视频:5-6 Data Source API标准写法 (06:15)
视频:5-8 Data Source格式转换 (03:15)
第6章 整合Hive操作及函数9 节 | 59分钟
如何使用Spark对接已有数据仓库Hive中的数据,这是在生产中常见的问题。本章将讲解如何使用Spark无缝对接Hive中已有数据进行处理,thriftserver的使用、以及如何使用Spark SQL中的内置函数以及自定义函数。
收起列表
视频:6-1 课程目录 (03:01)
第7章 Kudu入门7 节 | 73分钟
近两年,KUDU在大数据平台的应用越来越广泛,她是Cloudera开源的运行在HADoop平台上的列式存储系统,能够为我们提供“fast analytics on fast data”。本章将从Kudu的核心概念、架构、部署、API操作以及Spark整合Kudu的使用展开讲解。…
收起列表
第8章 基于Spark SQL和Kudu的广告业务项目实战(一)12 节 | 118分钟
本章使用Spark SQL整合Kudu对广告业务项目进行统计分析操作。涉及到的过程有:项目架构、数据清洗、数据统计、结果入库、项目重构。通过本实战项目将Spark SQL和Kudu中的知识点融会贯通,达到举一反三的效果 。
收起列表
视频:8-1 课程目录 (02:08)
视频:8-5 日志字段说明 (10:27)
第9章 基于Spark SQL和Kudu的广告业务项目实战(二)9 节 | 80分钟
收起列表
视频:9-1 课程目录 (02:02)
视频:9-9 本章节小结 (03:47)
第10章 Spark调优策略10 节 | 67分钟
Spark应用调优是一个在生产上或者面试中老生常谈的问题,本章节将从资源设置、广播变量、Shuffle、JVM引发的相关角度逐一展开讲解。
收起列表
第11章 Presto初识8 节 | 53分钟
Preso也是当下用的非常多的一种SQL on HADoop的解决方案。本章节将从Presto架构、API操作等角度出发,通过一个案例来进行综合演练。
收起列表
第12章 云平台建设的思考11 节 | 59分钟
本章将从如何建设大数据云平台的角度,涉及到数据平台的N个方面,是小伙伴以后进入大厂工作奠定基础,同时也会从Spark vs Flink的角度来为小伙伴们分析选型时的疑惑。
收起列表
*声明:课程资源购自网络,版权归原作者所有,仅供参考学习使用,严禁外传及商用,若侵犯到您的权益请联系客服删除。