在大数据处理领域,实时和离线各占非常大的比重,本套视频教程综合展示实时数据处理领域的一个重要应用:实时数仓项目。项目从数据采集开始,分别讲解了针对不同数据采取的不同采集策略,使用的不同数据采集工具。在数据处理部分,将实时采集的数据按照数据建模要求进行合理分层,使用当前最火热的实时计算引擎Flink,对实时计算结果进行可视化展示。 内容包括:搭建用户行为数据的实时数据采集框架Flume-Kafka-Flink;采用Canal、Maxwell、Flink CDC三种方案实现业务数据的实时采集;分层搭建实时数据仓库,包括ODS层、DWD层、DIM层、DWM层、DWS层、ADS层;数据可视化接口的实现;ClickHouse技术的深入讲解…… 每一部分讲解均参照实际开发环境,提供了多种问题的解决方案,引导学员对问题进行更深层的思考。通过本套教程的学习,你将掌握企业实际开发中实时数仓搭建的全流程,深入理解Flink的高阶应用实例,掌握开发环节多种框架技术。教程总计40小时+,附赠全部视频、代码、笔记及资料。 教程涵盖的关键技术点: 数仓架构深入讲解、离线架构与实时架构对比分析、SpringBoot项目搭建讲解、Nginx安装配置使用、Flink CDC深入案例分析、Maxwell与Canal对比分析、使用侧输出流分流操作、Flink与HBase交互、Flink状态编程应用、Flink CEP循环模式匹配、双流join、旁路缓存、异步IO编码、ClickHouse多引擎讲解、Flink SQL、数据可视化接口编写、Flink实战优化方案等。
视频目录 001.尚硅谷_Flink实时数仓-课程介绍002.尚硅谷_Flink实时数仓-项目介绍003.尚硅谷_Flink实时数仓-采集模块-课程介绍004.尚硅谷_Flink实时数仓-采集模块-数仓分层之为什么分层005.尚硅谷_Flink实时数仓-采集模块-数仓分层之分层明细006.尚硅谷_Flink实时数仓-采集模块-整体需求介绍007.尚硅谷_Flink实时数仓-采集模块-离线架构分析之Sqoop&Flume008.尚硅谷_Flink实时数仓-采集模块-离线架构分析之FlumeTairDirSource问题提出&解决009.尚硅谷_Flink实时数仓-采集模块-离线架构分析之Kafka010.尚硅谷_Flink实时数仓-采集模块-离线架构分析之其他011.尚硅谷_Flink实时数仓-采集模块-实时架构分析012.尚硅谷_Flink实时数仓-采集模块-架构对比013.尚硅谷_Flink实时数仓-采集模块-日志数据采集之需求分析014.尚硅谷_Flink实时数仓-采集模块-日志数据采集之MockJar包测试015.尚硅谷_Flink实时数仓-采集模块-日志数据采集之SpringBoot简单介绍016.尚硅谷_Flink实时数仓-采集模块-日志数据采集之SpringBoot创建项目&简单测试017.尚硅谷_Flink实时数仓-采集模块-日志数据采集之SpringBoot创建项目&加参数测试018.尚硅谷_Flink实时数仓-采集模块-日志数据采集之数据落盘&写入Kafka 编码019.尚硅谷_Flink实时数仓-采集模块-日志数据采集之数据落盘&写入Kafka 本地测试020.尚硅谷_Flink实时数仓-采集模块-日志数据采集之数据落盘&写入Kafka 单机测试021.尚硅谷_Flink实时数仓-采集模块-日志数据采集之Nginx 介绍022.尚硅谷_Flink实时数仓-采集模块-日志数据采集之Nginx 安装&启动023.尚硅谷_Flink实时数仓-采集模块-日志数据采集之Nginx 配置负载均衡&测试024.尚硅谷_Flink实时数仓-采集模块-日志数据采集之集群测试025.尚硅谷_Flink实时数仓-采集模块-业务数据采集之建库&建表026.尚硅谷_Flink实时数仓-采集模块-业务数据采集之FlinkCDC 什么是CDC&对比027.尚硅谷_Flink实时数仓-采集模块-业务数据采集之FlinkCDC 介绍028.尚硅谷_Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStream方式 编码029.尚硅谷_Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStream方式 测试030.尚硅谷_Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI 设置CK&打包&开启集群031.尚硅谷_Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI 打包进行断点续传测试032.尚硅谷_Flink实时数仓-采集模块-业务数据采集之FlinkCDC FlinkSQLAPI 编码&测试033.尚硅谷_Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器 格式说明034.尚硅谷_Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器 编码完成035.尚硅谷_Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器 代码测试036.尚硅谷_Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI&FlinkSQL对比037.尚硅谷_Flink实时数仓-采集模块-业务数据采集之Maxwell 安装说明&测试038.尚硅谷_Flink实时数仓-采集模块-业务数据采集之Canal 安装说明&测试039.尚硅谷_Flink实时数仓-采集模块-业务数据采集之CDC对比040.尚硅谷_Flink实时数仓-采集模块-业务数据采集之读取MySQL数据并写入Kafka 编码041.尚硅谷_Flink实时数仓-采集模块-业务数据采集之读取MySQL数据并写入Kafka 测试042.尚硅谷_Flink实时数仓-DWD&DIM-课程介绍043.尚硅谷_Flink实时数仓-DWD&DIM-行为数据 需求分析044.尚硅谷_Flink实时数仓-DWD&DIM-行为数据 思路整理&消费Kafka数据045.尚硅谷_Flink实时数仓-DWD&DIM-行为数据 将数据转换为JSON对象046.尚硅谷_Flink实时数仓-DWD&DIM-行为数据 新老用户校验047.尚硅谷_Flink实时数仓-DWD&DIM-行为数据 侧输出流&写入Kafka048.尚硅谷_Flink实时数仓-DWD&DIM-行为数据 测试049.尚硅谷_Flink实时数仓-DWD&DIM-业务数据之需求分析050.尚硅谷_Flink实时数仓-DWD&DIM-业务数据之代码逻辑梳理051.尚硅谷_Flink实时数仓-DWD&DIM-业务数据之代码编写 消费数据并过滤052.尚硅谷_Flink实时数仓-DWD&DIM-业务数据之代码编写 读取配置表创建广播流053.尚硅谷_Flink实时数仓-DWD&DIM-业务数据之代码编写 配置表字段分析&建表&JavaBean054.尚硅谷_Flink实时数仓-DWD&DIM-业务数据之代码编写 开启配置表Binlog并测试055.尚硅谷_Flink实时数仓-DWD&DIM-业务数据之代码编写 连接主流&广播流并分析业务逻辑056.尚硅谷_Flink实时数仓-DWD&DIM-业务数据之代码编写 创建TableProcessFunction并初始化相关参数057.尚硅谷_Flink实时数仓-DWD&DIM-业务数据之代码编写 处理广播流数据 解析数据&建表058.尚硅谷_Flink实时数仓-DWD&DIM-业务数据之代码编写 处理广播流数据 写入状态059.尚硅谷_Flink实时数仓-DWD&DIM-业务数据之代码编写 处理主流数据 读取状态&过滤字段060.尚硅谷_Flink实时数仓-DWD&DIM-业务数据之代码编写 处理主流数据 补充SinkTable&分流061.尚硅谷_Flink实时数仓-DWD&DIM-业务数据之代码编写 检查代码062.尚硅谷_Flink实时数仓-DWD&DIM-业务数据之代码编写 测试准备063.尚硅谷_Flink实时数仓-DWD&DIM-业务数据之代码编写 测试064.尚硅谷_Flink实时数仓-DWD&DIM-业务数据之代码编写 将数据写入HBase 编码065.尚硅谷_Flink实时数仓-DWD&DIM-业务数据之代码编写 将数据写入Kafka 编码066.尚硅谷_Flink实时数仓-DWD&DIM-业务数据之整体测试 环境准备067.尚硅谷_Flink实时数仓-DWD&DIM-业务数据之整体测试 测试完成068.尚硅谷_Flink实时数仓-ODS&DWD&DIM-小总结069.尚硅谷_Flink实时数仓-ODS&DWD&DIM-SQL分享 需求说明&建表&导数据070.尚硅谷_Flink实时数仓-ODS&DWD&DIM-SQL分享 方案一071.尚硅谷_Flink实时数仓-ODS&DWD&DIM-SQL分享 方案二072.尚硅谷_Flink实时数仓-ODS&DWD&DIM-SQL分享 HiveOnSpark Bug说明073.尚硅谷_Flink实时数仓-DWM层-需求分析074.尚硅谷_Flink实时数仓-DWM层-访客UV 需求分析075.尚硅谷_Flink实时数仓-DWM层-访客UV 代码编写 消费数据并转换为JSON对象076.尚硅谷_Flink实时数仓-DWM层-访客UV 代码编写 过滤数据077.尚硅谷_Flink实时数仓-DWM层-访客UV 代码编写 设置状态超时时间防止状态过大078.尚硅谷_Flink实时数仓-DWM层-访客UV 代码测试079.尚硅谷_Flink实时数仓-DWM层-跳出明细 需求分析080.尚硅谷_Flink实时数仓-DWM层-跳出明细 代码编写081.尚硅谷_Flink实时数仓-DWM层-跳出明细 代码测试082.尚硅谷_Flink实时数仓-DWM层-跳出明细 测试083.尚硅谷_Flink实时数仓-DWM层-跳出明细 CEP 循环模式084.尚硅谷_Flink实时数仓-DWM层-订单宽表 需求分析085.尚硅谷_Flink实时数仓-DWM层-订单宽表 双流JOIN 官方文档说明086.尚硅谷_Flink实时数仓-DWM层-订单宽表 双流JOIN 代码编写087.尚硅谷_Flink实时数仓-DWM层-订单宽表 双流JOIN 代码测试088.尚硅谷_Flink实时数仓-DWM层-订单宽表 代码编写 消费Kafka数据&转换JavaBean&提取事件时间089.尚硅谷_Flink实时数仓-DWM层-订单宽表 代码编写 订单与订单明细表双流JOIN090.尚硅谷_Flink实时数仓-DWM层-订单宽表 代码测试 准备工作091.尚硅谷_Flink实时数仓-DWM层-订单宽表 代码测试 测试完成092.尚硅谷_Flink实时数仓-DWM层-订单宽表 关联维度 思路梳理093.尚硅谷_Flink实时数仓-DWM层-订单宽表 关联维度 JDBCUtil 返回值&参数说明094.尚硅谷_Flink实时数仓-DWM层-订单宽表 关联维度 JDBCUtil 查询&封装泛型对象095.尚硅谷_Flink实时数仓-DWM层-订单宽表 关联维度 JDBCUtil 测试096.尚硅谷_Flink实时数仓-DWM层-订单宽表 关联维度 DimUtil封装&优化的必要性097.尚硅谷_Flink实时数仓-DWM层-订单宽表 关联维度 优化1旁路缓存 思路分析098.尚硅谷_Flink实时数仓-DWM层-订单宽表 关联维度 优化1旁路缓存 Redis工具类&Key的设计099.尚硅谷_Flink实时数仓-DWM层-订单宽表 关联维度 优化1旁路缓存 代码编写100.尚硅谷_Flink实时数仓-DWM层-订单宽表 关联维度 优化1旁路缓存 代码测试101.尚硅谷_Flink实时数仓-DWM层-订单宽表 回顾102.尚硅谷_Flink实时数仓-DWM层-订单宽表 关联维度 优化2 异步IO说明103.尚硅谷_Flink实时数仓-DWM层-订单宽表 关联维度 优化2 异步IO编码步骤104.尚硅谷_Flink实时数仓-DWM层-订单宽表 关联维度 优化2 异步IO编码 初始化函数105.尚硅谷_Flink实时数仓-DWM层-订单宽表 关联维度 优化2 异步IO编码 异步函数完成106.尚硅谷_Flink实时数仓-DWM层-订单宽表 关联维度 优化2 异步IO编码 测试准备107.尚硅谷_Flink实时数仓-DWM层-订单宽表 关联维度 优化2 异步IO编码 测试完成108.尚硅谷_Flink实时数仓-DWM层-订单宽表 关联维度 补充其他维度信息109.尚硅谷_Flink实时数仓-DWM层-订单宽表 最终测试110.尚硅谷_Flink实时数仓-DWM层-订单宽表 不丢维度数据说明111.尚硅谷_Flink实时数仓-DWM层-支付宽表 需求分析112.尚硅谷_Flink实时数仓-DWM层-支付宽表 代码编写113.尚硅谷_Flink实时数仓-DWM层-支付宽表 代码测试114.尚硅谷_Flink实时数仓-DWM层-支付宽表 时间工具类说明115.尚硅谷_Flink实时数仓-DWS层-课程介绍116.尚硅谷_Flink实时数仓-DWS层-访客主题宽表 需求分析117.尚硅谷_Flink实时数仓-DWS层-访客主题宽表 思路整理&读取Kafka数据118.尚硅谷_Flink实时数仓-DWS层-访客主题宽表 处理输出流&union&提取时间戳分组119.尚硅谷_Flink实时数仓-DWS层-访客主题宽表 开窗&聚合120.尚硅谷_Flink实时数仓-DWS层-访客主题宽表 打印测试121.尚硅谷_Flink实时数仓-DWS层-ClickHouse 课程介绍122.尚硅谷_Flink实时数仓-DWS层-ClickHouse 概述&特点123.尚硅谷_Flink实时数仓-DWS层-ClickHouse 安装准备工作124.尚硅谷_Flink实时数仓-DWS层-ClickHouse 安装&启动125.尚硅谷_Flink实时数仓-DWS层-ClickHouse 数据类型126.尚硅谷_Flink实时数仓-DWS层-ClickHouse 简单引擎介绍127.尚硅谷_Flink实时数仓-DWS层-ClickHouse MergeTree128.尚硅谷_Flink实时数仓-DWS层-ClickHouse MergeTree之Partition By129.尚硅谷_Flink实时数仓-DWS层-ClickHouse MergeTree之Primary Key130.尚硅谷_Flink实时数仓-DWS层-ClickHouse MergeTree之Order By131.尚硅谷_Flink实时数仓-DWS层-ClickHouse MergeTree之TTL132.尚硅谷_Flink实时数仓-DWS层-ClickHouse ReplacingMergeTree133.尚硅谷_Flink实时数仓-DWS层-ClickHouse SummingMergeTree134.尚硅谷_Flink实时数仓-DWS层-ClickHouse 引擎选择分析135.尚硅谷_Flink实时数仓-DWS层-ClickHouse SQL操作 一136.尚硅谷_Flink实时数仓-DWS层-ClickHouse SQL操作 二137.尚硅谷_Flink实时数仓-DWS层-ClickHouse 副本机制138.尚硅谷_Flink实时数仓-DWS层-ClickHouse 分片机制 说明139.尚硅谷_Flink实时数仓-DWS层-ClickHouse 分片机制 实操140.尚硅谷_Flink实时数仓-DWS层-访客主题 ClickHouseUtil 创建141.尚硅谷_Flink实时数仓-DWS层-访客主题 ClickHouseUtil 封装142.尚硅谷_Flink实时数仓-DWS层-访客主题 ClickHouseUtil 封装完成143.尚硅谷_Flink实时数仓-DWS层-访客主题 ClickHouseUtil 测试完成144.尚硅谷_Flink实时数仓-DWS层-商品主题 需求分析145.尚硅谷_Flink实时数仓-DWS层-商品主题 JavaBean说明146.尚硅谷_Flink实时数仓-DWS层-商品主题 代码编写 思路整理&消费数据创建流147.尚硅谷_Flink实时数仓-DWS层-商品主题 代码编写 处理页面日志&收藏数据&购物车数据148.尚硅谷_Flink实时数仓-DWS层-商品主题 代码编写 处理订单&支付数据149.尚硅谷_Flink实时数仓-DWS层-商品主题 代码编写 处理退单&评价数据150.尚硅谷_Flink实时数仓-DWS层-商品主题 代码编写 分组开窗&聚合151.尚硅谷_Flink实时数仓-DWS层-商品主题 代码编写 关联维度&将数据写入ClickHouse152.尚硅谷_Flink实时数仓-DWS层-商品主题-整体测试153.尚硅谷_Flink实时数仓-DWS层-商品主题-需求分析154.尚硅谷_Flink实时数仓-DWS层-商品主题 代码编写 创建环境&使用DDL方式读取Kafka数据155.尚硅谷_Flink实时数仓-DWS层-商品主题 代码编写 分组开窗聚合156.尚硅谷_Flink实时数仓-DWS层-商品主题 代码编写 将动态表转换为流并打印157.尚硅谷_Flink实时数仓-DWS层-商品主题 代码编写 将数据写入ClickHouse&测试158.尚硅谷_Flink实时数仓-DWS层-关键词主题 需求分析159.尚硅谷_Flink实时数仓-DWS层-关键词主题 代码编写 分词工具类封装160.尚硅谷_Flink实时数仓-DWS层-关键词主题 代码编写 分词UDTF161.尚硅谷_Flink实时数仓-DWS层-关键词主题 代码编写 思路分析&读取数据&建表162.尚硅谷_Flink实时数仓-DWS层-关键词主题 代码编写 分词&开窗聚合163.尚硅谷_Flink实时数仓-DWS层-关键词主题 代码编写 动态表转换为流&写入ClickHouse164.尚硅谷_Flink实时数仓-DWS层-关键词主题 代码测试165.尚硅谷_Flink实时数仓-数据可视化-课程介绍166.尚硅谷_Flink实时数仓-数据可视化-Sugar 创建大屏167.尚硅谷_Flink实时数仓-数据可视化-Sugar 使用步骤介绍168.尚硅谷_Flink实时数仓-数据可视化-数据接口 项目构建169.尚硅谷_Flink实时数仓-数据可视化-数据接口 依赖导入&分层说明170.尚硅谷_Flink实时数仓-数据可视化-数据接口 GMV接口 Mapper完成171.尚硅谷_Flink实时数仓-数据可视化-数据接口 GMV接口 Service&Controller完成172.尚硅谷_Flink实时数仓-数据可视化-数据接口 GMV接口 测试173.尚硅谷_Flink实时数仓-数据可视化-数据接口 GMV接口 对接Sugar174.尚硅谷_Flink实时数仓-数据可视化-数据接口 品牌GMV接口 Mapper完成175.尚硅谷_Flink实时数仓-数据可视化-数据接口 品牌GMV接口 Service完成176.尚硅谷_Flink实时数仓-数据可视化-数据接口 品牌GMV接口 Controller完成177.尚硅谷_Flink实时数仓-数据可视化-数据接口 品牌GMV接口 测试完成178.尚硅谷_Flink实时数仓-数据可视化-数据接口 品牌GMV接口 对接Sugar179.尚硅谷_Flink实时数仓-数据可视化-数据接口 导入代码&品类GMV&SPU GMV180.尚硅谷_Flink实时数仓-数据可视化-数据接口 其他需求图表181.尚硅谷_Flink实时数仓-数据可视化-最终测试182.尚硅谷_Flink优化-课程介绍183.尚硅谷_Flink优化-资源优化之内存设置184.尚硅谷_Flink优化-资源优化之并行度设置185.尚硅谷_Flink优化-资源优化之RockDB配置186.尚硅谷_Flink优化-资源优化之CheckPoint配置187.尚硅谷_Flink优化-资源优化之ParameterTool的介绍188.尚硅谷_Flink优化-反压处理之反压介绍&定位189.尚硅谷_Flink优化-反压处理之反压问题解决190.尚硅谷_Flink优化-数据倾斜之定位问题191.尚硅谷_Flink优化-数据倾斜之KeyBy之前的数据倾斜192.尚硅谷_Flink优化-数据倾斜之KeyBy之后直接聚合193.尚硅谷_Flink优化-数据倾斜之KeyBy之后开窗聚合194.尚硅谷_Flink优化-KafkaSource195.尚硅谷_Flink优化-FlinkSQL优化之MiniBatch196.尚硅谷_Flink优化-FlinkSQL优化之LocalGlobal197.尚硅谷_Flink优化-FlinkSQL优化之SplitDistinct198.尚硅谷_Flink优化-FlinkSQL优化之Agg With Filter199.尚硅谷_Flink优化-FlinkSQL优化之TopN优化200.尚硅谷_Flink优化-FlinkSQL优化之去重方案&其他