正文
Java快速入门, 复习,巩固
Eclipse IDE环境配置
常见算法梳理总结,数据结构基础剖析
第⼀周: Big Data Introduction & HDFS
Big Data 在业界的发展现状,⼤数据⼯程师Skill Set
Hadoop Ecosystem,业界⼴泛使⽤的系统架构
Cluster环境、个⼈开发环境的搭建
HDFS介绍,常⽤command line练习
Course Exerise 1: Cluster Deployment & Practice with HDFS
第⼆周: MapReduce & Design Pattern
MapReduce 知识脉络梳理
MapReduce 项⽬开发流程, 例⼦讲解
MapReduce ⼯程 Design Pattern 介绍
Course Exerise 2: 10 ETL Examples of MapReduce Design Pattern
第三周: Hive Introduction & HiveQL language
Hive结构、⼯作原理介绍
HiveQL语法、操作介绍
Course Exerise 3: Data Processing using Hive
第四周: Pig Introduction & Pig Latin Language
Apache Pig 知识点讲解
Pig Latin 语法介绍
Pig 在 ETL 中的应⽤
Course Exercise 4: Data Ingestion using Pig
第五周: Storm & Kafka
Storm 知识框架介绍
Storm Code Demo详解
Kafka 介绍和开发部署
Course Exercise 5: Real-time system using Storm & Kafka
第六周: HBase Introduction
HBase Table 概念介绍
HBase Query 实践练习
Course Exercise 6: Storm works with HBase
第七周: Spark Introduction
Spark RDD 基础知识
RDD operations & transformation
Partition and shuffles
Spark Streaming
Course Exercise 7: Streaming Processing with Spark
第⼋周: Spark Machine Learning
Learn to use MLlib
图形计算
GraphX
Course Exercise 8: Machine Learning using Spark
我们和科技公司广泛合作,通过联合开发和技术咨询方式为学员提供实习机会。 每位学员可以选择我们提供的实习项目,也可以结合自己的背景在导师指导下完成个人定制化的实习项目。
1
.
Lambda Architecture
- 随着课程的进⾏, 逐步了解和实践⼤数据⾏业最常⽤的Lambda构架
- 根据事件, 依据数据的时效分层次处理