分类菜单
大数据
培训首页> 西安培训> 大数据培训课程> 大数据HCIA认证培训
大数据HCIA认证培训

大数据HCIA认证培训

参考价格: 电话咨询
该校与厚学网暂未合作,平台不确保课程的真实有效性
如有侵权等争议,请及时与厚学网联系处理
立即预约 确认报名
姓名3:
电话:
城市:
想学
什么:
大数据HCIA认证培训
课程说明
课程级别
入门级
培训周期
1-2个月
上课地址
西安市高新区易和蓝钻第13幢1单元10层11011、11012号
【课程详情】

HCIA-Big Data认证,培训和认证具备使用华为MRS大数据开发平台能力的工程师。
通过HCIA-Big Data认证,将证明您掌握常用且重要的大数据组件技术原理与架构,包括HDFS、Hive、HBase、Flume、Spark、Flink、ElasticSearch、Redis等组件,掌握华为大数据平台MRS的使用方法;具备基于华为MRS服务的操作和开发的能力;能够胜任大数据开发工程师等岗位

培训对象

希望成为大数据工程师的人员

希望获得HCIA-Big Data认证的人员

大数据初级工程师

入学要求

掌握网络技术基础

具备Linux的基础知识

培训目标

完成该项目培训后,您将能够:

掌握常用且重要的大数据组件技术原理与架构、分布式文件系统HDFS的基础操作、分布式数据库HBase客户端及表操作、分布式数据仓库Hive的常用HQL语句查询、分布式搜索引擎Elasticsearch进行数据的存储与检索、Flink进行实时数据的处理等,以及了解典型场景的综合应用等。使您具备大数据售前、大数据项目管理、大数据开发等岗位所必备的知识和技能。

课程大纲

内容提要

授课详细内容

培训形式

Module01 大数据行业与技术趋势
Module02 FusionInsight解决方案介绍

1、大数据时代的特征以及大数据的概念
2、大数据的应用领域
3、大数据时代的机遇和挑战
4、华为大数据解决方案

理论+实验

Module03 FusionInsight HD 集成设计
Module04  FusionInsight HD 集群安装部署

1、集群组网设计
2、集群节点部署规划
3、磁盘规划
4、配置规划工具使用设计案例
5、实验环境FusionInsight HD 集群安装部署
6、集群维护

Module05 HDFS分布式文件系统技术

1、HDFS概述以及应用场景
2、HDFS在FusionInsight产品当中的位置
3、HDFS系统架构
4、HDFS的关键特性介绍
5、HDFS Shell应用开发

理论

Module06 MapReduce和Yarn分布式计算引擎技术
Module07 Zookeeper协调服务

1、MR的基本定义和特点
2、MR工作模式介绍
3、Yarn的基本定义
4、Yarn工作模式介绍
5、Yarn的资源管理和任务调度
6、Yarn的增强特性
7、ZooKeeper简介
8、ZooKeeper的系统架构
9、ZooKeeper的关键特性介绍
10、ZooKeeper与其它组件的关系

Module08 HBase分布式数据库

1、HBase的定义以及与传统数据库的对比
2、HBase的功能与架构
3、HBase的工作流程
4、HBase的华为增强特性

理论+实验

Module09 Hive数据仓库

1、Hive简介
2、Hive架构
3、Hive工作模式
4、Hive功能特性
5、HQL介绍+命令行演示演示

Module10 Streaming实时计算技术及应用

1、Streaming的定义与应用场景
2、Streaming在FusionInsight产品的位置
3、Streaming的关键特性介绍
4、StreamingCQL介绍

理论

Module 11 Flume海量日志聚合判断题
Module 11 Kafka分布式消息订阅系统
Module 11 Loader数据转换

1、Flume简介及架构
2、Flume关键特性介绍
3、Flume应用举例Kafka简介
4、Kafka架构与功能
5、Kafka关键流程Loader简介
6、Loader作业管理

Module12 Spark基于内存的分布式计算技术

1、Spark的简要介绍
2、Spark基本功能和技术架构
3、Spark Core的工作原理
4、Spark SQL和Dataset
5、Spark Structured Streaming
6、Spark Streaming工作原理
7、Spark在FusionInsight中的集成情况

理论

Module13 Flink流处理和批处理的数据处理引擎

1、Flink概述
2、Flink原理与技术架构
3、Flink在FusionInsight HD中的集成情况
4、总结前面所讲过的知识点

 

考试科目

考试代码

认证考试

H13-711

HCIA-Big Data

大数据HCIP认证培训

HCIP-Big Data Developer培训和认证具备大数据方向应用开发技能以及行业分析技能的工程师。
通过HCIP-Big Data Developer认证,将证明您具备不同业务场景(包括离线批处理场景、实时检索场景、实时流场景场景)下使用华为大数据云服务或开源Hadoop平台组件应用开发的能力,以及大数据解决方案端到端开发实践能力,能够胜任大数据应用开发相关岗位

培训对象

大数据开发人员

大数据相关从业者

入学要求

了解Java开发语言

了解大数据基本组件

了解Linux shell命令

培训目标

完成该项目培训后,您将能够

通过场景化项目实战,让学员掌握离线批处理场景化大数据开发实践;

通过场景化项目实战,让学员掌握实时检索场景化大数据开发实践;

通过场景化项目实战,让学员掌握实时流处理场景化大数据开发实践;

通过场景化项目实战,让学员掌握融合数仓场景化大数据开发实践。

课程大纲

内容提要

授课详细内容

培训形式

Java基础

涵盖Java基础内容

理论+实验

HDFS操作
MR编程操作

1、HDFS理论
2、HDFS shell命令操作
3、HDFS Java API接口调用
4、MR基本定义及工作模式
5、Yarn的基本定义及工作模式
6、MapReduce编程

理论+实验

HIVE

1、Hive数据仓库简介
2、Hive sql语句操作
3、Hive jdbc客户端开发

理论+实验

Hbase

1、Hbase非关系型数据库介绍
2、Hbase使用
3、Hbase java开发

理论+实验

zookeeper、sqoop、flume

1、ETL工具介绍及使用
2、zookeeper开发

理论+实验

kafka

1、kafka概述及架构介绍
2、kafka应用开发

理论+实验

Spark操作

1、Spark基本概念介绍
2、Spark RDD使用
3、Spark SQL使用

理论+实验

Streaming操作

1.、SparkStreaming
2、Streaming定义及概述
3、Streaming开发应用

理论+实验

大数据离线批处理场景化解决方案

1、大数据离线场景应用概述
2、离线批处理场景实战

理论+实验

大数据实时流处理场景化解决方案

1、大数据实时流处理场景概述
2、实时处理技术框架介绍
3、实时流处理项目实战

理论+实验

大数据实时检索场景化解决方案

1、实时检索场景应用概述
2、实时检索技术介绍
3、实时检索实际案例操作

理论+实验

大数据融合数仓场景化解决方案

1、大数据数据仓库与融合数仓模型介绍
2、GaussDB 200概述及使用
3、融合数仓实战

理论+实验

 

考试科目

考试代码

考试名称

H13-723

HCIP-Big Data Developer

大数据HCIE认证培训

HCIE-Big Data-Data Mining培训与认证具备通过华为FusionInsight HD或开源技术平台进行大数据端到端建模,解决业务实际问题能力的。
通过HCIE-Big Data-Data Mining华为大数据挖掘认证,将证明您掌握大数据挖掘主流技术和复杂数据挖掘方法,具备通过华为FusionInsight HD或开源技术平台进行大数据端到端建模,解决业务实际问题的能力,实现数据蕴含的商业价值变现

培训对象

大数据开发工程师

大数据分析工程师

大数据挖掘工程师

入学要求

了解大数据组件

了解python语言

培训目标

完成该项目培训后,您将能够

掌握数据挖掘方法

掌握FusionInsight MRS使用方法

掌握Spark MLlib使用方法

课程大纲

内容提要

授课详细内容

培训形式

大数据行业与技术趋势
FusionInsight解决方案介绍

1、大数据时代的特征以及大数据的概念 
2、大数据的应用领域 
3、大数据时代的机遇和挑战 
4、华为大数据解决方案

理论

FusionInsight HD 集成设计
FusionInsight HD 集群安装部署

1、集群组网设计
2、集群节点部署规划
3、磁盘规划
4、配置规划工具使用设计案例
5、实验环境FusionInsight HD 集群安装部署
6、集群维护

HDFS分布式文件系统技术

1HDFS概述以及应用场景 
2HDFSFusionInsight产品当中的位置 
3HDFS系统架构 4HDFS的关键特性介绍 
5HDFS Shell应用开发

理论

MapReduce和Yarn分布式计算引擎技术
Zookeeper协调服务

1MR的基本定义和特点 
2MR工作模式介绍 
3Yarn的基本定义 
4Yarn工作模式介绍 
5Yarn的资源管理和任务调度 
6Yarn的增强特性
7ZooKeeper简介
8ZooKeeper的系统架构
9ZooKeeper的关键特性介绍
10ZooKeeper与其它组件的关系

HBase分布式数据库

1HBase的定义以及与传统数据库的对比 
2HBase的功能与架构 
3HBase的工作流程 
4HBase的华为增强特性 

理论

Hive数据仓库

1Hive简介
2Hive架构 
3Hive工作模式 
4Hive功能特性 
5HQL介绍+命令行演示演示

Streaming实时计算技术及应用

1Streaming的定义与应用场景 
2StreamingFusionInsight产品的位置 
3Streaming的关键特性介绍 
4StreamingCQL介绍

理论

Flume海量日志聚合判断题
Kafka分布式消息订阅系统
Loader数据转换

1Flume简介及架构
2Flume关键特性介绍
3Flume应用举例
4Kafka简介
5Kafka架构与功能
6Kafka关键流程
7Loader简介
8Loader作业管理

Spark基于内存的分布式计算技术

1Spark的简要介绍 
2Spark基本功能和技术架构 
3Spark Core的工作原理 
4Spark SQLDataset
5Spark Structured Streaming
6Spark Streaming工作原理 
7SparkFusionInsight中的集成情况

理论

Flink流处理和批处理的数据处理引擎

1Flink概述
2Flink原理与技术架构
3FlinkFusionInsight HD中的集成情况
4、总结前面所讲过的知识点

数据挖掘介绍

1、数据挖掘概述
2、数据挖掘流程
3、数据、属性和度量
4、数据挖掘开发工具
5、数据挖掘学习路径

理论

数学基础

1、线性代数(行列式、矩阵及其变换、矩阵分解、线性变换、向量空间)
2、概率论与数理统计
3、信息熵与基尼指数
4、优化

Python基础

1、什么是Python
2、Python基础知识
3、Python中数据类型
4、判断与循环语句

理论+实验

1、函数和面向对象
2、Python常用模块
3、正则表达式
4、文件操作

数据采集

1、什么是爬虫
2、爬虫的工作及工作流程
3、爬虫常用的工具

理论+实验

1、数据提取与存储
2、常见的反爬虫机制和应对措施
3、爬虫程序的实现

数据可视化

1、什么是数据可视化
2、数据可视化的作用及使用场景
3、数据可视化的常用工具
4、数据可视化的实现流程

理论+实验

数据预处理

1ETLELT
2、常用工具(KattleDatastageInformatica
3、数据清洗
4、特征处理

特征选择和降维

1、特征选择概述
2Filter
3wrapper
4Embedded(嵌入法)
5、其他方法和特征扩增
6、降维导入
7SVD奇异值分解
8PCA主成分分析
9LDA线性判断分析
10LLE局部线性嵌入

理论+实验

有监督学习

1、有监督学习的预备知识
2、线性回归
3、逻辑回归
4、KNN
5、朴素贝叶斯
6、SVM

有监督学习

1、决策树
2、集成算法

理论+实验

无监督学习

1、无监督学习
2、聚类算法(K-MeansK-Means++Hierarchical-ClusteringBIRCHDBScan

无监督学习

关联算法(Apriori、FP-growth)

理论+实验

模型评估与优化

1、模型优化与评估预备知识
2、优化模型
3、模型评估与选择
4、正则化

数据挖掘综合应用

数据挖掘流程

美国公民个人收入预测的综合应用案例分析

理论+实验

Spark Mllib

1Spark MLlib基础入门
2Spark MLlib基础统计分析
3Spark MLlib分类与回归

理论+实验

1、Spark  MLlib聚类与降维
2、Spark  MLlib关联规则与算法
3、Spark  MLlib评估矩阵

华为机器学习服务MLS

1、华为MLS服务介绍
2、申请华为MLS服务
3、创建华为MLS工作流
4、典型算法的应用
5、机器学习平台 FusionInsight Miner

理论

大数据架构和数据治理

1、大数据架构概述
2、大数据架构在大数据中的重要性
3、大数据架构师具备的能力
4、如何构建大数据架构平台
5、大数据业务层通用架构
6、大数据治理

 

考试科目

考试代码

考试名称

H13-731

HCIE-Big Data-Data Mining(笔试)

H13-732

HCIE-Big Data-Data Mining(实验)

H13-733

HCIE-Big Data-Data Mining(面试)


课程内容以实际授课为准
  • 软件开发
  • 软件测试
  • 数据库
  • Web前端
  • 大数据
  • 人工智能
  • 零基础
  • 有HTML基础
  • 有PHP基础
  • 有C语言基础
  • 有JAVA基础
  • 其他计算机语言基础
  • 周末班
  • 全日制白班
  • 随到随学

温馨提示

个性定制课程


温馨提示