一、学习目标:
1.零基础脱产学习,1个月精学大数据技术
2.计算机、统计、数学等专业学习更佳
3.包学会,成为大数据稀缺人才,高薪就业
4.CDA大数据就业帮,助你前程似锦
5.大数据未来已来,只等你改变自己
二、课程内容:
14章分布式集群架构
14-01大数据行业前沿应用与知识介绍
14-02Linux入门基础
14-03Hadoop入门介绍
14-04Hadoop单机环境搭建
14-05Hadoop伪分布式集群搭建
14-06Hadoop完全分布式集群搭建
15章分布式文件存储系统HDFS
15-01HDFS简介
15-02HDFS编程入门
15-03HDFS读写文件
15-04HDFS架构原理及常用指令
16章ETL工具Sqoop基本原理和常用指令
16-01Sqoop介绍
16-02Sqoop原理
16-03Sqoop部署
16-04关系型数据库导入Hadoop
16-05Hadoop导入关系型数据库
16-06Sqoop job应用
17章大数据仓库知识应用
17-01Hive架构原理和技术方向
17-02HiveQL数据查询、函数(聚合函数、窗口函数、UDF)
17-03Hbase表设计及数据查询
17-04商业应用案例—宽表设计与用户画像
17-05商业应用案例—网站流量分析与页面运营
18章Spark架构原理和核心组件
18-01Spark介绍
18-02Spark数据结构及编程语言接口
18-03Spark与分布式数据库和分布式数据仓库的集成方法
19章PySpark编程指南与Spark RDD相关操作
19-01PySpark开发环境搭建
19-02PySpark编程入门:Spark基本数据结构
19-03 PySpark编程入门:PySpark常用语句
19-04采用PySpark读取分布式数据库中数据
19-05PySpark数据清洗案例
20章Spark MLLib与机器学习算法实践
温馨提示
温馨提示