深入浅出:数据湖架构开发与Delta Lake技术教程

课程

资源简介

本教程专为初学者设计,从零开始,全面讲解数据湖架构开发,涵盖Delta Lake的最新技术,包括数据湖的核心概念、Delta Lake的使用形式、Lambda架构、数据版本控制等,适合希望快速掌握数据湖技术的读者。

已有 9 人浏览发布 2026-05-20更新 2026-06-14

网盘直链在单次购买成功后展示;若已开通会员且在有效期内,可在右侧用每日取链次数免费获取(不另扣单篇费)。

课程概述

本教程包含多个章节,从数据湖的基本概念讲起,逐步深入到Delta Lake的详细使用方法。课程内容丰富,包括:

  • 数据湖的核心概念及其与普通大数据分析平台的区别
  • Delta Lake的简介和重点特性解读
  • Delta Lake的使用形式,如写时模式和读时模式
  • Delta Lake的表分区、追加、Schema验证等高级功能
  • Delta Lake的事务日志和Schema演化相关概念
  • Delta Lake的最佳实践和总结
  • 云平台对企业的意义以及AWS相关工具的介绍

课程亮点

本教程具有以下亮点:

  • 适合初学者,从基础概念讲起,逐步深入
  • 涵盖Delta Lake的最新技术,紧跟行业发展趋势
  • 理论与实践相结合,注重实际应用
  • 课程内容全面,覆盖数据湖开发的各个方面

适用人群

本教程适合以下人群:

  • 对数据湖架构开发感兴趣的学习者
  • 希望快速掌握Delta Lake技术的开发者
  • 从事大数据相关工作的专业人士

📂 资源目录

📁 3-第三章
    3-第三章资料.zip  [1.8 MB]
    03-Lambda架构的简单介绍.mp4  [358.8 MB]
📁 10-第十章
    10-第十章必看.png  [493.5 KB]
    10-1-4-云平台对企业的意义.mp4  [58.3 MB]
    10-1-1云平台的基础概念.mp4  [153.6 MB]
    10-2-1-AWS-S3简介.mp4  [147.0 MB]
    10-1-2-两类云平台和主流公有云平台介绍.mp4  [59.1 MB]
    10-2-5-AWS-Glue-ETl-简单介绍.mp4  [287.7 MB]
    10-2-3-AWS-EMR-集群模式介绍.mp4  [411.1 MB]
    10-2-4-AWS-EMR-步骤运行模式介绍.mp4  [287.7 MB]
    10-2-6-AWS-其它辅助工具介绍和课程总结.mp4  [43.8 MB]
    10-1-3-IaaS-PaaS-SaaS的概念.mp4  [54.7 MB]
    10-2-2-AWS-Athena分析框架简介.mp4  [114.7 MB]
📁 2-第二章
    2-第二章文档.png  [493.5 KB]
    02-3-数据湖对企业的价值.mp4  [35.8 MB]
    02-4-数据湖概念的总结.mp4  [75.4 MB]
    02-5-数据湖的4个设计原则.mp4  [73.4 MB]
    02-2-3种常见的数据湖实现方案.mp4  [155.7 MB]
    02-1-写时模式和读时模式.mp4  [7.8 MB]
📁 7-第七章
    7-第七章文档.zip  [1.8 MB]
    07-3-DeltaLake-更新和删除对Parquet数据文件的影响.mp4  [173.8 MB]
    07-5-DeltaLake-表常用工具和阶段总结.mp4  [175.4 MB]
    07-2-DeltaLake-Schema验证.mp4  [242.0 MB]
    07-1-DeltaLake表分区和追加.mp4  [123.4 MB]
    07-4-DeltaLake-vacuum方法.mp4  [224.2 MB]
📁 4-第四章
    4-第四章资料.zip  [1.8 MB]
    04-数据湖的核心以及和普通大数据分析平台的不同.mp4  [229.8 MB]
📁 9-第九章
    9-第九章说明.png  [493.5 KB]
    09-3-第九章总结.mp4  [23.7 MB]
    09-2-5-导出数据为普通parquet文件.mp4  [63.3 MB]
    09-1-案例需求分析.mp4  [11.8 MB]
    09-2-2-基础数据增加新列.mp4  [112.2 MB]
    09-2-1-基础数据(中间数据)的准备.mp4  [383.6 MB]
    09-2-4-统计全天热门TOP100查询关键词.mp4  [251.0 MB]
    09-2-3-统计每小时TOP10热门查询关键词.mp4  [455.3 MB]
📁 6-第六章
    6-第六章说明.png  [493.5 KB]
    06-4-DeltaLake的事务日志.mp4  [126.5 MB]
    06-1-DeltaLake创建表-读取表-覆盖表操作.mp4  [21.8 MB]
    06-2-DeltaLake有条件更新和合并操作.mp4  [88.0 MB]
    06-3-DeltaLake的数据版本控制.mp4  [92.0 MB]
📁 1-第一章
    01-1-2-补充-结构化-半结构化-非结构化数据.mp4  [44.7 MB]
    00-课程目标.mp4  [3.8 MB]
    01-2-数据湖的概念.mp4  [50.1 MB]
    01-3-数据湖-数仓-数据集市的区别.mp4  [81.0 MB]
    01-1-1-企业的数据困扰.mp4  [83.6 MB]
📁 8-第八章
    08-3-DeltaLake-最佳实践和总结.mp4  [204.3 MB]
    08-2-DeltaLake-Schema演化相关概念回顾.mp4  [62.1 MB]
    08-1-DeltaLake-事务日志概念回顾.mp4  [140.0 MB]
📁 5-第五章
    05-1-DeltaLake的简介和重点特性解读.mp4  [182.5 MB]
    05-2-DeltaLake的使用形式.mp4  [78.9 MB]