扫码,加群听课

第一阶段:Hadoop生态体系

系统离线计算

Linux+Hadoop

知识点16课时

  • Linux简介、分类、安装、目录结构、常用操作、权限命令、ssh免密登录设置
  • Hadoop离线计算处理模块:Apache Hadoop的体系结构、Hadoop2.X、Hadoop3.0新特性
  • Hadoop应用案例分析、Hadoop应用案例分析、Hadoop数据压缩
  • 实验环境、YARN分布式管理平台、任务调度系统
  • 大数据文件系统HDFS、体系结构、存储原理、命令操作
  • MapReduce运行机制、执行过程、Shuffle过程、作业调优
  • 启用压缩、任务中间结果压缩、分片控制
  • 流量汇总程序开发、Combine案例、InputFormat案例、mapjoin、reducejoin
  • hdfs小文件优化、MapReduce优化、文件合并归并处理、任务参数设定

实战项目

  • 信息流日志大数据从零搭建包含Hadoop开发环境
  • 广告大流量的统计分析实战项目
  • 基于大数据的用户信息匹配碰撞实验

适合人群

  • 零基础、转行人员、想学习大数据、基础不牢固
...已有53542位同学学习
加群获取学习资料

第二阶段:Hive数据仓库实战技术

数据仓库

Hive数据仓库

知识点11课时

  • Hive系统概述、架构设计、组成部件的协同工作、SQL语句解析执行过程
  • Hive安装配置、metastore远程配置、schema初始化、启动执行
  • Hive与传统关系型数据对比、表类型、内部表、外部表、分区表、分桶表
  • Hive数据操作、加载数据、文件存储格式,ParquetFile、OrcFile格式、Snappy文件压缩
  • Hive数据查询、左连接、笛卡尔积、子查询、UNION联合查询、自定义函数
  • Hive数据倾斜问题原因及解决、性能优化、任务数量、内存设定

实战项目

  • 互联网广告数据统计的架构设计、多纬度多指标统计分析
  • 数据仓库ETL数据分层处理、数据仓库模型建设
  • 互联网公司数据治理、数据字典、数据百科全书

适合人群

  • 有大数据基础、转行人员、想学习大数据、基础不牢固
...已有53542位同学学习
加群获取学习资料

第三阶段:Hbase分布式数据库

分布式数据库

Hbase分布式数据库

知识点11课时

  • Hbase基本概念、数据模型
  • Hbase系统架构、查询流程
  • Hbase安装配置、region server相关
  • Hbase Shell操作、执行环境、文件操作、表和数据操作
  • Hbase Schema设计、性能调优

实战项目

  • 电商大数据Hbase分布式数据库架构设计
  • 低延时的性能展示、高度灵活的处理模式、实时响应

适合人群

  • 有大数据Hadoop基础、转行人员、想学习或基础不牢固
...已有53542位同学学习
加群获取学习资料

第四阶段:Spark实时计算处理模块

实时计算

Spark实时计算

知识点25课时

  • Spark运行机制、安装、SHELL操作
  • Spark技术简介,架构图设计,技术背景,Python语言教程、DAG有向无环图
  • Spark内存计算模型详解、Spark Streaming技术详解
  • Spark算子操作、作业提交、DataFrame、RDD转换和动作、编程模型
  • Spark深入探讨、性能调优

实战项目

  • 大数据统计分析平台、批量数据导入导出
  • 记录用户行为、统计页面转化率,热门商品及黑名单统计

适合人群

  • 零基础、转行人员、想学习大数据、基础不牢固
...已有53542位同学学习
加群获取学习资料

第五阶段:Kafka海量流式数据处理

流式数据

Kafka流式数据

知识点9课时

  • Kafka流式数据总线、概念功能、系统架构图
  • 常见消息系统对比、消费者、生产者
  • 安装配置Kafka、Kafka消息模型、发布订阅模式
  • Kafka架构详解、Topic主题、Partition分区详解
  • Kafka数据消费、任务提交、消费偏移记录
  • 管理Kafka集群、运维监控
  • Kafka性能调优、架构高可用、分布式

实战项目

  • 千万级APP海量日志处理、数据总线设计
  • 分布式数据管道的消费、数据实时更新

适合人群

  • 有大数据Hadoop、python基础想学习大数据的人员
...已有53542位同学学习
加群获取学习资料

第六阶段:ElasticSearch大数据查询引擎

大数据查询

ElasticSearch大数据查询引擎

知识点9课时

  • 大数据时代的查询引擎ElasticSearch
  • ElasticSearch安装部署、ES-SQL语句查询、倒排索引
  • ES存储原理、分片机制、数据副本、Lucene索引设计、段合并机制
  • ES数据加载、更新、删除、版本控制、字段更新、索引更新机制
  • 分布式数据查询、节点数据路由、数据汇总结果
  • ES复杂查询、组合过滤、精确匹配、范围控制、模糊界定、分词控制
  • ES的index、type、mapping与关系型数据对比
  • ES大规模数据查询调优、索引分片

实战项目

  • 大数据BI系统构建
  • 数据可视化大屏制作

适合人群

  • 大数据开发相关工作经验从业人员
...已有53542位同学学习
加群获取学习资料

大数据0基础速成知树

版权所有:雷顿学院大数据