HCIA-Big Data认证,培训和认证具备使用华为MRS大数据开发平台能力的工程师。
通过HCIA-Big Data认证,将证明您掌握常用且重要的大数据组件技术原理与架构,包括HDFS、Hive、HBase、Flume、Spark、Flink、ElasticSearch、Redis等组件,掌握华为大数据平台MRS的使用方法;具备基于华为MRS服务的操作和开发的能力;能够胜任大数据开发工程师等岗位。
l 希望成为大数据工程师的人员
l 希望获得HCIA-Big Data认证的人员
l 大数据初级工程师
l 掌握网络技术基础
l 具备Linux的基础知识
完成该项目培训后,您将能够:
掌握常用且重要的大数据组件技术原理与架构、分布式文件系统HDFS的基础操作、分布式数据库HBase客户端及表操作、分布式数据仓库Hive的常用HQL语句查询、分布式搜索引擎Elasticsearch进行数据的存储与检索、Flink进行实时数据的处理等,以及了解典型场景的综合应用等。使您具备大数据售前、大数据项目管理、大数据开发等岗位所必备的知识和技能。
内容提要 | 授课详细内容 | 培训形式 |
Module01 大数据行业与技术趋势 | 1、大数据时代的特征以及大数据的概念 | 理论+实验 |
Module03 FusionInsight HD 集成设计 | 1、集群组网设计 | |
Module05 HDFS分布式文件系统技术 | 1、HDFS概述以及应用场景 | 理论 |
Module06 MapReduce和Yarn分布式计算引擎技术 | 1、MR的基本定义和特点 | |
Module08 HBase分布式数据库 | 1、HBase的定义以及与传统数据库的对比 | 理论+实验 |
Module09 Hive数据仓库 | 1、Hive简介 | |
Module10 Streaming实时计算技术及应用 | 1、Streaming的定义与应用场景 | 理论 |
Module 11 Flume海量日志聚合判断题 | 1、Flume简介及架构 | |
Module12 Spark基于内存的分布式计算技术 | 1、Spark的简要介绍 | 理论 |
Module13 Flink流处理和批处理的数据处理引擎 | 1、Flink概述 |
考试代码 | 认证考试 |
H13-711 | HCIA-Big Data |
HCIP-Big Data Developer,培训和认证具备大数据方向应用开发技能以及行业分析技能的工程师。
通过HCIP-Big Data Developer认证,将证明您具备不同业务场景(包括离线批处理场景、实时检索场景、实时流场景场景)下使用华为大数据云服务或开源Hadoop平台组件应用开发的能力,以及大数据解决方案端到端开发实践能力,能够胜任大数据应用开发相关岗位。
l 大数据开发人员
l 大数据相关从业者
l 了解Java开发语言
l 了解大数据基本组件
l 了解Linux shell命令
完成该项目培训后,您将能够:
l 通过场景化项目实战,让学员掌握离线批处理场景化大数据开发实践;
l 通过场景化项目实战,让学员掌握实时检索场景化大数据开发实践;
l 通过场景化项目实战,让学员掌握实时流处理场景化大数据开发实践;
l 通过场景化项目实战,让学员掌握融合数仓场景化大数据开发实践。
内容提要 | 授课详细内容 | 培训形式 |
Java基础 | 涵盖Java基础内容 | 理论+实验 |
HDFS操作 | 1、HDFS理论 | 理论+实验 |
HIVE | 1、Hive数据仓库简介 | 理论+实验 |
Hbase | 1、Hbase非关系型数据库介绍 | 理论+实验 |
zookeeper、sqoop、flume | 1、ETL工具介绍及使用 | 理论+实验 |
kafka | 1、kafka概述及架构介绍 | 理论+实验 |
Spark操作 | 1、Spark基本概念介绍 | 理论+实验 |
Streaming操作 | 1.、SparkStreaming | 理论+实验 |
大数据离线批处理场景化解决方案 | 1、大数据离线场景应用概述 | 理论+实验 |
大数据实时流处理场景化解决方案 | 1、大数据实时流处理场景概述 | 理论+实验 |
大数据实时检索场景化解决方案 | 1、实时检索场景应用概述 | 理论+实验 |
大数据融合数仓场景化解决方案 | 1、大数据数据仓库与融合数仓模型介绍 | 理论+实验 |
考试代码 | 考试名称 |
H13-723 | HCIP-Big Data Developer |
HCIE-Big Data-Data Mining,培训与认证具备通过华为FusionInsight HD或开源技术平台进行大数据端到端建模,解决业务实际问题能力的。
通过HCIE-Big Data-Data Mining华为大数据挖掘认证,将证明您掌握大数据挖掘主流技术和复杂数据挖掘方法,具备通过华为FusionInsight HD或开源技术平台进行大数据端到端建模,解决业务实际问题的能力,实现数据蕴含的商业价值变现。
l 大数据开发工程师
l 大数据分析工程师
l 大数据挖掘工程师
l 了解大数据组件
l 了解python语言
完成该项目培训后,您将能够:
内容提要 | 授课详细内容 | 培训形式 |
大数据行业与技术趋势 | 1、大数据时代的特征以及大数据的概念 | 理论 |
FusionInsight HD 集成设计 | 1、集群组网设计 | |
HDFS分布式文件系统技术 | 1、HDFS概述以及应用场景 | 理论 |
MapReduce和Yarn分布式计算引擎技术 | 1、MR的基本定义和特点 | |
HBase分布式数据库 | 1、HBase的定义以及与传统数据库的对比 | 理论 |
Hive数据仓库 | 1、Hive简介 | |
Streaming实时计算技术及应用 | 1、Streaming的定义与应用场景 | 理论 |
Flume海量日志聚合判断题 | 1、Flume简介及架构 | |
Spark基于内存的分布式计算技术 | 1、Spark的简要介绍 | 理论 |
Flink流处理和批处理的数据处理引擎 | 1、Flink概述 | |
数据挖掘介绍 | 1、数据挖掘概述 | 理论 |
数学基础 | 1、线性代数(行列式、矩阵及其变换、矩阵分解、线性变换、向量空间) | |
Python基础 | 1、什么是Python | 理论+实验 |
1、函数和面向对象 | ||
数据采集 | 1、什么是爬虫 | 理论+实验 |
1、数据提取与存储 | ||
数据可视化 | 1、什么是数据可视化 | 理论+实验 |
数据预处理 | 1、ETL、ELT | |
特征选择和降维 | 1、特征选择概述 | 理论+实验 |
有监督学习 | 1、有监督学习的预备知识 | |
有监督学习 | 1、决策树 | 理论+实验 |
无监督学习 | 1、无监督学习 | |
无监督学习 | 关联算法(Apriori、FP-growth) | 理论+实验 |
模型评估与优化 | 1、模型优化与评估预备知识 | |
数据挖掘综合应用 | 数据挖掘流程 美国公民个人收入预测的综合应用案例分析 | 理论+实验 |
Spark Mllib | 1、Spark MLlib基础入门 | 理论+实验 |
1、Spark MLlib聚类与降维 | ||
华为机器学习服务MLS | 1、华为MLS服务介绍 | 理论 |
大数据架构和数据治理 | 1、大数据架构概述 |
考试代码 | 考试名称 |
H13-731 | HCIE-Big Data-Data Mining(笔试) |
H13-732 | HCIE-Big Data-Data Mining(实验) |
H13-733 | HCIE-Big Data-Data Mining(面试) |
温馨提示
温馨提示