课程级别 | 入门级 |
培训周期 | 一周以内 |
上课时间 | 电话咨询 |
上课地址 | 北京市丰台夏家胡同育芳园东里3号楼B座 |
关于举办大数据平台搭建与高性能计算佳实战培训班的通知
培训地点 | 广州 | 北京 | 上海 | 杭州 | 青岛 | 南京 | 南宁 | 成都 | 郑州 | 北京 |
培训时间 | 3月24-27 | 4月23-26 | 5月22-25 | 6月27-30 | 7月28-31 | 8月25-28 | 9月21-24 | 10月26-29 | 11月24-27 | 12月15-18 |
各有关单位:
根据党中央和国务院“互联网+”行动计划战略布局,落实国务院促进大数据发展行动纲要,响应工业和信息化部培养大数据技术高端人才的号召,中国信息化培训中心特推出了大数据平台搭建与高性能计算实战课程培训班。通过专业的大数据技术架构体系与业界真实案例来提升大数据项目高管、大数据平台架构师,以及大数据开发工程师与大数据应用设计人员的专业水平,旨在培养专业的大数据技术架构,培养大数据技术和应用创新型人才,促进大数据技术在各行业内部及跨行业进行实施应用,以及企事业单位的大数据项目开发和落地,并利用大数据提升竞争力优势。现将相关事宜通知如下:
一、 培训特色
1. 课程培训业界流行、应用广泛的Hadoop与Spark大数据技术体系。
强化大数据平台的分布式集群架构和核心关键技术实现、大数据应用项目开发和大数据集群运维实践、以及Hadoop与Spark大数据项目应用开发与调优的全过程沙盘模拟实战。
2. 通过一个完整的大数据开发项目及一组实际项目训练案例,完全覆盖
Hadoop与Spark生态系统平台的应用开发与运维实践。课堂实践项目以项目小组的形式进行沙盘实操练习,重点强化理解Hadoop与Spark大数据项目各个阶段的工作重点,同时掌握作为大数据项目管理者的基本技术与业务素养。
3. 本课程的授课师资都是有着多年在从事Hadoop与Spark大数据项目
的讲师,采用原理技术剖析和实战案例相结合的方式开展互动教学、强化以建立大数据项目解决方案为主体的应用开发、技术讨论与交流咨询,在学习的同时促进讲师学员之间的交流,让每个学员都能在课程培训过程中学到实实在在的大数据技术知识体系,以及大数据技术应用实战技能,具备实际大数据应用项目的动手开发实践与运维管理部署能力。授课过程中,根据学员需求,增设交流环节,可将具体工作中遇到的实际问题展开讨论,讲师会根据学员的实际情况微调授课内容,由讲师带着全部学员积极讨论,并给出一定的时间让学员上台发言,现场剖析问题的症结,规划出可行的解决方案。
二、培训目标
1.深刻理解在“互联网+”时代下大数据的产生背景、发展历程和演化趋势;
2.了解业界市场需求和国内外新的大数据技术潮流,洞察大数据的潜在价值;
3.理解大数据项目解决方案及业界大数据应用案例,从而为企业在大数据项目中的技术选型及技术架构设计提供决策参考;
4.掌握业界流行的Hadoop与Spark大数据技术体系;
5.掌握大数据采集技术;
6.掌握大数据分布式存储技术;
7.掌握NoSQL与NewSQL分布式数据库技术;
8.掌握大数据仓库与统计机器学习技术;
9.掌握大数据分析挖掘与商业智能(BI)技术;
10.掌握大数据离线处理技术;
11.掌握Storm流式大数据处理技术;
12.掌握基于内存计算的大数据实时处理技术;
13.掌握大数据管理技术的原理知识和应用实战;
14.深入理解大数据平台技术架构和使用场景;
15.娴熟运用Hadoop与Spark大数据技术体系规划解决方案满足实际项目需求;
16.熟练地掌握基于Hadoop与Spark大数据平台进行应用程序开发、集群运维
管理和性能调优技巧。
三、课程大纲
时间 | 知识模块 | 授课内容 |
第一天 上午 | 大数据技术基础 | 1. 大数据的产生背景与发展历程 2. 大数据的4V特征,以及与云计算的关系 3. 大数据应用需求以及潜在价值分析 4. 业界新的大数据技术发展态势与应用趋势 5. 大数据项目的系统与技术选型,及落地实施的挑战 6. “互联网+”时代下的电子商务、制造业、零售批发、电信运营商、互联网金融业、电子政务、移动互联网、教育信息化等行业应用实践与应用案例介绍 |
业界主流的大数据技术方案 | 1. 大数据软硬件系统全栈与关键技术介绍 2. 主流的大数据解决方案介绍 3. Apache大数据平台方案剖析 4. CDH大数据平台方案剖析 5. HDP大数据平台方案剖析 6. 大数据解决方案与传统数据库方案比较 | |
大数据计算模型(一)——批处理MapReduce | 1. MapReduce产生背景与适用场景 2. MapReduce计算模型的基本原理 3. MapReduce作业执行流程 4. MapReduce基本组件,JobTracker和TaskTracker 5. MapReduce编程应用,Combiner和Partitioner 6. MapReduce性能优化技巧 7. MapReduce案例分析与开发实践操作 | |
第一天 下午 | 大数据存储系统与应用实践 | 1. 分布式文件系统HDFS产生背景与适用场景 2. HDFS master-slave系统架构与工作原理 3. HDFS核心组件技术讲解 4. HDFS高可用保证机制 5. HDFS集群的安装、部署与配置,熟练HDFS shell命令操作 6. 分布式小文件存储系统的平台架构、核心技术与应用场景 7. 分布式对象存储系统的平台架构、核心技术与应用场景 |
Hadoop框架与生态发展,以及应用实践操作 | 1. Hadoop的发展历程 2. Hadoop大数据生态圈系统与工具全貌介绍 3. Hadoop 1.0的核心组件与适用范围 4. Hadoop 2.0的核心组件YARN工作原理,以及与Hadoop 1.0的区别 5. Hadoop资源管理与作业调度机制 6. Hadoop 常用性能优化技术 7. Hadoop集群安装与部署实践,以及MapReduce程序在YARN上执行 | |
第二天 上午 | 大数据计算模型(二)——实时处理/内存计算 Spark | 1. MapReduce计算模型的瓶颈 2. Spark产生动机、基本概念与适用场景 3. Spark编程模型与RDD弹性分布式数据集的工作原理与机制 4. Spark实时处理平台运行架构与核心组件 5. Spark容错机制 6. Spark作业调度机制 7. Scala开发介绍与实践 8. Spark集群部署与配置实践,Spark开发环境构建,Spark案例程序分析,Spark程序开发与运行,Spark与Hadoop集群集成实践 |
第二天 下午 | 大数据仓库查询技术Hive、SparkSQL、Impala,以及应用实践 | 1. 基于MapReduce的大型分布式数据仓库Hive基础知识与应用场景 2. Hive数据仓库的平台架构与核心技术剖析 3. Hive metastore的工作机制与应用 4. Hive数据仓库实践:Hive集群安装部署,数据仓库表导入导出与分区操作,Hive SQL操作,Hive客户端操作 5. 基于Spark的大型分布式数据仓库SparkSQL基础知识与应用场景 6. Spark SQL实时数据仓库的实现原理与工作机制 7. SparkSQL应用分析与操作实践 8. 基于MPP的大型分布式数据仓库Impala基础知识与应用场景 9. Impala实时查询系统平台架构、关键技术剖析 |
Hadoop集群运维监控工具 | 1. Hadoop大数据运维监控管理系统HUE平台介绍 2. Hadoop运维管理监控系统Ambari工具介绍 3. 第三方运维系统与工具Ganglia, Nagios | |
第三天 上午 | 大数据计算模型(三)——流处理Storm, SparkStreaming | 1. 流数据处理应用场景与流数据处理的特点 2. 流数据处理工具Storm的平台架构与集群工作原理 3. Storm关键技术与并发机制 4. Storm编程模型与基本开发模式 5. Storm数据流分组 6. Storm可靠性保证与Acker机制 7. Storm应用案例分析与实践:Storm集群安装部署,Storm程序开发运行操作实践,Storm与Hadoop集群的集成 8. 流数据处理工具Spark Streaming基本概念与数据模型 9. Spark Streaming工作机制 |
大数据ETL操作工具,与大数据分布式采集系统 | 1. Hadoop与DBMS之间数据交互工具的应用 2. Sqoop导入导出数据的工作原理,以及Sqoop工具的安装部署与实践操作,利用Sqoop实现MySQL与Hadoop集群之间的数据导入导出交互 3. Flume-NG数据采集系统的数据流模型与系统架构 4. Kafka分布式消息订阅系统的应用介绍与平台架构,及其使用模式 | |
第三天 下午 | 面向OLTP型应用的NoSQL数据库及应用实践 | 1. 关系型数据库瓶颈,以及NoSQL数据库的发展,概念,分类,及其在半结构化和非结构化数据场景下的适用范围 2. 列存储NoSQL数据库HBase简介与数据模型剖析 3. HBase分布式集群系统架构与读写机制,ZooKeeper分布式协调服务系统的工作原理与应用 4. HBase表设计模式与primary key设计规范 5. HBase分布式集群安装、部署与操作实践 6. 文档NoSQL数据库MongoDB简介与数据模型剖析 7. MongoDB集群模式、读写机制与常用API操作 8. Cassandra分布式数据库的平台架构以及关键技术 9. Cassandra一致性哈希算法与数据分布策略,以及NWR策略 10.键值型NoSQL数据库Redis简介与数据模型剖析 11.Redis多实例集群架构与关键技术 12.NewSQL数据库技术简介及其适用场景 |
大数据项目选型、实施、优化等问题交流讨论 | 大数据项目的需求分析、应用实施、系统优化,以及解决方案等咨询与交流讨论 | |
第四天 | 学习考核与业内经验交流 |
四、授课师资
钟老师 现任职于中科院某研究所,工程师,副高职称,博士毕业于中国科学院计算技术研究所,获工学博士学位(计算机系统结构方向)。中培教育的大数据、云计算、移动互联网系列课程建设与教学。近六年来带领团队主要从事大数据与云计算技术项目的研发与IT项目管理工作。钟老师有着多年的企业内训和公开课培训讲师经历,主要讲授大数据平台技术、云计算、移动互联网、电子商务、IT信息软件项目管理、企业信息化规划与管理、IT战略规划与企业架构、数据中心主机规划与IDC系统运营等企业实战类培训课程。钟老师将原理技术剖析和应用实战相结合的授课风格受到广大公开课学员和企业内训学员的欢迎。
蒋老师 博士,云计算 熟悉主流的云计算平台,并有商业与开源云计算平台的实践经验,对云计算关键技术有深刻了解和实践经验,如分布式系统、虚拟化、分布式文件系统、云存储等,参与并领导多个大型云计算项目。对大数据关键技术有深刻了解和实践经验,如NoSQL数据库、大数据处理、Hadoop、Hive、HBase、Spark等。
五、培训费用
面授班培训费5800 元/人(含场地费、考试证书费、教材费、学习期间的午餐费) 食宿统一安排,费用自理。请学员带二寸彩照1张(背面注明姓名),身份证复印件一张。
本课程学习考核通过后由中国信息化培训中心颁发《大数据开发架构师》证书,证书查询:www.zpedu.org ; 证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。
以上就是软件开发培训课程的全部内容介绍,如需了解更多的软件开发培训班、课程、价格、试听等信息,也可以点击进入 软件开发 相关频道,定制专属课程,开始您的学习之旅。
温馨提示