培训首页  >  软件系统新闻  >  郑州数据分析师培训班哪家好?

郑州数据分析师培训班哪家好?

[2017-07-07 14:06:58] 浏览量:505 来源:

郑州新互联教育培训

  郑州数据分析师培训班哪家好?寻回答去厚学网。作为一所专业的IT培训学校——河南新互联教育 ,我们吸取以往的教学经验,采取多元化教学模式,将更快、更优作为教学理念,为莘莘学子提供便利。

  新互联科技有限公司是一家双软认证和高新科技企业认证的技术研发企业,专注于IT技术研发,以追求技术的先进性作为团队的精神导向,由IT教育家、IT评论家、投资人孟超先生所创立。在大数据培训圈里被称为大数据教父。创始团队来源于华为和中兴核心技术开发团队。

  公司执行合伙人北京晟壁科技有限公司CEO张鹏先生是北京航空航天大学工商管理硕士,2006年到2013年担任中兴通讯区域项目总监,PMI中国认证PMP项目管理讲师,中石油特邀项目管理讲师。

  公司专注于四大产品线:电子商务、日志管理、云计算SOA、财务共享。旗下公司包括实力雄厚的研发中心北京晟壁科技有限公司。创始团队来自于华为中兴的核心的技术团队,现有研发人员2000人,为通信、金融、石油、政府部门、零售业、服务业等各个领域提供一体化的企业信息化解决方案。研发各领域信息化管理系统50多个,并取得10度个软件著作权证书.经过多年对技术革新的不懈追求,公司积淀了深厚的技术经验和勇于自我革新的技术精神,得到了业内的一致好评。

  新互联科技发展历程

  2008年,由华为、中兴骨干员工创业成立北京晟壁科技有限公司。

  2009年,通过双软认证和高新技术企业认证。

  2010年,涉足通信行业,为中国移动,电网云提供云服务平台和SOA集成平台。

  2011年,成立公司内部人才培训中心,为中石油、中移动提供项目管理咨询。

  2012年,承接某省厅情报舆情系统和粤海铁路售票系统的项目开发工作。

  2013年,鉴于河南省出台的电子商务相关优惠政策,成立河南正在送科技有限公司,专注电商平台的开发和产业孵化。

  2014年,基于互联网人才需求旺盛和经验丰富的人才缺乏的现状,成立新互联教育咨询公司,专注于高校和往应届毕业生人才实训。

  2015年,成立新互联科技控股集团,成为中兴通讯内部员工的定点培训单位

  一张图告诉你什么是数据分析师

  运用不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。

  · 懂业务

  熟悉行业知识、公司业务及流程,好有自己独到的见解,若脱离行业认知和公司业务背景,分析的结果就没有太大的使用价值。

  · 懂管理

  一方面是搭建数据分析框架的要求,比如确定分析思路就需要用到营销、管理等理论知识来指导;另一方面是针对数据分析结论提出有指导意义的分析建议。

  · 懂分析

  能够掌握数据分析基本原理与一些有效的数据分析方法,并能灵活运用到实践工作中,对于开展数据分析起着至关重要的作用。

  · 懂工具

  数据分析方法是理论,而数据分析工具就是实现数据分析方法理论的工具,面对越来越庞大的数据,我们不能依靠计算器进行分析,必须依靠强大的数据分析工具帮我们完成数据分析工作。

  · 懂设计

  能够运用图表有效表达数据分析师的分析观点,使分析结果一目了然。图表的设计是门大学问,如图形的选择、版式的设计、颜色的搭配等等,都需要掌握一定的设计原则。

  不仅是职位颜值高 薪资更是刁到爆发

  · 业务数据分析师

  15万起

  · 建模数据挖掘师

  30万

  · 大数据分析师

   15万起

  · 席数据分析师

  50万

  · 大数据科学家

  50万

  · 系统架构师

  50万

  · 数据产品经理

  20万

  · 业务数据挖掘师

  30万

  · 数据产品经理

  40万

  · 运维架构师

  60万

  等级划分迅速找到自己的定位

  Level1 业务数据分析师

  学习条件

  适合从事市场、管理、财务、供应、咨询等职位业务人员;非统计、计算机专业背景零基础入行和转行就业人员。

  具备技能

  ● 概率统计基础知识

  ● EXCEL/SPSS/SAS软件应用

  ● 市场调研,数据报告

  ● 精准营销,客户画像

  Level2 建模分析师

  学习条件

  两年以上数据分析岗位工作经验,或学习过Level1全部内容且 通过 Level1考核

  具备技能

  ● 数据挖掘算法

  ● 软件建模运用

  ● 行业案例演练

  ● 宏观业务决策

  Level3 大数据分析师

  学习条件

  两年以上数据分析岗位工作经验,或学习过Level1全部内容且 通过 Level1考核

  具备技能

  ● 计算机、数理科学

  ● 业务模型优化

  ● 数据架构设计

  ● 运营数据资产

  Level4 数据分析

  学习条件

  五年以上数据分析岗位工作经验,或学习过Level2/ Level3全部内容且通过考核。

  具备技能

  ● 大数据编程技术

  ● 大数据架构设计

  ● 大数据管理分析

  ● 大数据项目实操

  一个合格的大数据分析师应该掌握的技能

  课程6大特色玩爆行业

  01专业 / 热门 / 前沿课程体系

  数据挖掘/数据分析/数据仓库/商业智能/大数据技术/人工智能/机器学习/深度学习/项目管理/系统架构 一个都不能少!

  02岗位技能

  0基础入门,4 大阶段,26门课程,2000+ 学时,8 大软技能,16 大硬技能,17大行业经典案例,8大项目实战!

  03灵活的学习方式

  在线学习/现场直播/线下面授多种学习方式供您选择,适合不同需求的学员。

  04定制学习计划

  全智能自适应TPCS教学平台,收集并监控分析您的学习数据,为您量身订做学习计划!

  05全程干货 实战为王

  我们不仅仅在于数据挖掘/数据分析,算法理论上深入讲解,更是贯穿大量实战案例与企业常用工具配合使用,让你成为一个实战家,入职企业即能上手工作。

  06适合不同层次学员学习

  无论您是刚毕业或在校大学生,还是您已经从事相关专业工作,只要您愿意,都可以选择学习本套课程,为您未来的更好的就业或晋级加薪充电加油!

  课程体系

  阶段一、业务数据分析师

  课程一、数据挖掘/分析师之硬技能 - 必备常用工具使用与技巧

  本部分内容主要介绍了数据挖掘、分析师、数据产品经理必备的常用工具的,主要有 Excel,Visio,Xmind,PPT的涉及图表数据分析方面的技巧,包括但不限于:数据透视表演练、Vision跨职能流程图演练、Xmind项目计划导图演练、PPT动画技巧等!

一、Excel

1)数据分析工具EXECL入门介绍
2)数据透视表演练
3) 数据处理
4) EXECL报告自动化
5) PPT报告数据自动化

二、Visio

1)流程图visio入门介绍
2)案例1:基本流程图演练
3)案例2:跨职能流程图演练
4)案例3:UML模型图演练
5)案例4:数据库、数据流模型图演练

三、Xmind

1) 思维导图xmind入门介绍
2)案例1:项目计划导图演练
3)案例2:拼车APP功能导图分析演练

四、 PPT

1) 办公PPT入门介绍
2)案例演示

  课程二、数据挖掘/分析师之硬技能 - 零基础到数据挖掘精通(Excel、Oracle、SPSS初步)

  本课程介绍了数据挖掘技术基本的概念、功能、使用人员所需能力、使用方式以及数据挖掘部分主流算法实现方式。课程中嵌入了oracle数据库和办公软件excel,

  这两款软件主要用于存储及处理数据挖掘所需的数据,其中还使用excel作为简单入门工具对数据挖掘进行了算法实现,该部分主要用于帮助大家对数据挖掘相关知

  识有一个和大概的了解。在此基础上,后期使用数据挖掘专业工具SPSS MODELER结合一些案例对之前的excle实现的挖掘算法部分进行了深入学习以及增加了

  一些SPSS MODELER自带的算法模块讲解。课程除了主要讲解了数据挖掘知识和技术,同时其中还涉及了部分oracle数据库知识、sql语句和excel的函数运用。

一、数据挖掘基础内容讲解

1)数据挖掘初探之功能介绍
2)excel基础知识及应用示范
3)Oracle数据库安装及应用示范
4)数据预处理(excel+Oracle)
5)预测算法-线性回归
6)分类算法
7)关联算法
8)聚类算法
9)优化求解

二、SPSS MODELER数据挖掘

1)SPSS Modeler 下载安装及常规数据操作
2)SPSS Modeler数据探索及分析
3)SPSS Modeler图形探索及分析
4)SPSS Modeler回归分析建模
5)SPSS Modeler逻辑分析建模
6)RFM介绍、建模及模型应用
7)SPSS Modeler分类
8)SPSS Modeler关联分析
9)SPSS Modeler聚类分析

  课程三、数据挖掘/分析师之软技能 - 数据分析入门

  本课程让学员明确数据分析思路和主要步骤,了解互联网分行业关键数据指标,熟练掌握常用的数据分析方法和数据分析方法的应用,熟练掌握数据分析报告的结构和应用。

1)数据分析概念、作用和步骤
2)数据分析方法论
3)数据分析常用方法

4)数据图表讲解
5)数据关键指标讲解
6)数据分析报告讲解

  课程四、数据挖掘/分析师之软技能 - 实战需求分析

  本部分内容主要包括两份重要文档的编写商业需求与文档撰写格式技巧(BRD)和市场需求分析与文档撰写技巧(MRD)

一、商业需求与文档撰写格式技巧(BRD)

1)行业分析-PEST宏观环境的分析
2)项目背景——利用黄金圆圈学会问为什么,探寻为什么,大的挑战就是成功
3)你会学到:如何谈论项目进度,如何描述项目阶段的起始和终止日期
4)学习预测未来,确定要达到的目标,估计会碰到的问题,并提出实现目标、解决问题的有效方案、方针、措施和手段的过程的方法
5)关注企业在市场中与用户的关系
6)收益、成本、风险及对策

二、市场需求分析与文档撰写技巧(MRD)

1)如何构建用户画像、理解用户行为,真正理解用户需求
2)理解市场需求描述、市场规模定义
3)利用SWOT分析法来确定企业自身的竞争优势、竞争劣势、机会和威胁,从而将公司的战略与公司内部资源、外部环境有机地结合起来的一种科学的分析方法
4)市场需求的经典案例

  课程五、数据挖掘/分析师之软技能 - 实战竞品分析

  1、本课程让学员真正了解竞品分析的用途、流程、方法,能够在正确的时间点,找到正确的竞品,并用恰当的方法,做出准确的分析,最终得出的结果有利于在产

  品定位的时候,确定需要学习、避免和差异化的点。 2、另外本课程选取体现互联网/移动互联网行业热点的App,以及部分优质的App;讲述其战略定位、行业标

  杆产品、自身在行业中、主要功能、差异化特色、盈利模式及逻辑、用户体验设计。使得学员通过学习,达到以下目标:,了解互联网及移动互联网的各个

  领域;第二,了解互联网各行业的热点,提升择业能力;第三,了解App的定位、设计、盈利模式,这对将来数据分析师的工作和实践非常有用;第四,培养产品感和分析产品的思路和能力;第五,通过对比,掌握同类产品定位、设计差异的缘由,从而能够举一反三,设计出自己的、有差异化特色和竞争力的产品。

一、竞品分析

1)什么是竞品
2)为什么要分析竞品
3)在什么地方做出差异化
4)竞品分析的方法与流程
5)实例一:大米先生餐饮App项目的竞品分析(完整流程及方法展示)
6)实例二:支付产品:支付宝 vs 支付(侧重战略、战术、产品定位分析)

二、热门各互联网行业 APP分析

1)2016年互联网行业投资热点及融资分布
2)2016年互联网行业热点概述(VR、文体娱乐、大数据、移动营销、移动出行、移动社交、移动支付、在线教育、在线
医疗、手机游戏)
3)在线视频APP:爱奇艺
4)拍摄美化神器APP:美拍
5)手机轻电台应用APP:荔枝FM vs 懒人听书
6)在线音乐APP:网易云音乐
7)在线体育APP:虎扑体育
8)文化新闻APP:今日头条 vs 凤凰新闻
9)在线阅读APP:书旗小说
10)文艺应用APP:ONE
11)移动出行APP:UBER
12)移动社交APP:陌陌
13)在线翻译APP:网易有道词典
14)女生助手APP:美柚
15)移动社交APP:探探?

  课程六、数据挖掘/分析师之软技能 - 实战产品规划与设计

  本部分课程主要包括两块内容: 1. 需求分析与管理 2. 产品需求文档撰写格式与技巧(PRD)

一、需求分析与管理

1)需求的定义、本质和分类
2)学习需求分析包括需求的获取、分析、规格说明、变更、验证、管理的一系列需求工程的方法
3)学习需求分析指需求的分析、定义过程
4)KANO模型定义了三个层次的顾客需求:基本型需求、期望型需求和兴奋型需求
5)需求优先级的定义
6)需求工作量估算、需求变更、需求的管理工具

二、产品需求文档撰写格式与技巧(PRD)

1)产品需求文档PRD的整体结构介绍
2)产品原型的设计
3)需求文档质量评估标准
4)PRD相关案例剖析

  阶段二、建模分析师

  课程七、建模分析师之软技能 - 数据库技术

  本部分课程主要介绍MySQL数据库的安装使用及常用数据操作

1、关系型数据库介绍

2、MySQL的基本操作:
    1)数据库的操作
    2)数据表的操作
    3)备份与恢复

3、常用的SQL语句:
    1)查询语句(SELECT)
    2)插入语句(INSERT)
    3)更新语句(UPDATE)
    4)删除语句(DELETE)

4、查询语句:
    1)聚合函数
    2)分组查询
    3)联合查询
    4)连接查询
    5)子查询

5、应用:
1)视图
2)索引

6、数据可视化管理:SQLyog


  课程八、建模分析师之软技能 - 实用型大数据挖掘算法、(Apriori算法、Tanagra工具、决策树)

  本课程名为深入浅出数据挖掘技术。所谓“深入”,指得是从数据挖掘的原理与经典算法入手。其一是要了解算法,知道什么场景应当应用什么样的方法;其二是学

  习算法的经典思想,可以将它应用到其他的实际项目之中;其三是理解算法,让数据挖掘的算法能够应用到您的项目开发之中去。所谓“浅出”,指得是将数据挖掘

  算法的应用落实到实际的应用中。课程会通过三个不同的方面来讲解算法的应用:一是微软公司的SQL Server与Excel等工具实现的数据挖掘;二是开源算法的

  数据挖掘,如Weka、KNIMA、Tanagra等开源工具;三是利用Java、C#语言两种语言做演示来完成数据挖掘算法的实现。根据实际的引用场景,数据挖掘技术通

  常分为分类器、关联分析、聚类算法等三大类别。本课程主要介绍这三大算法的经典思想以及部分的实现形式,并结合一些商业分析工具、开源工具或编程等方式来讲解具体的应用方法。

1、数据挖掘概述与数据
2、可视化与多维数据分析(实践课)
3、分类器与决策树
4、其他分类器
5、决策树的应用(实践课)

6、关联分析
7、购物车数据分析(实践课)
8、聚类算法
9、聚类算法C#源代码实现(实践课)

  课程九、建模分析师之硬技能 - SPSS Modeler数据挖掘项目实战(高阶篇)(课程9、10、11三门课任选其一)

  本教程从数据挖掘生命周期、过程及管理思想开始,讲解了实际项目中各大阶段的重要任务及各自承上启下的关键作用。并用通俗易懂的语言将挖掘技术所涉及的思

  想、方法、参数与统计学基础联系起来,仔细讲解了包括维度、数据、分析、数据流等在内的功能、参数的实际意义和选择、组合等应用方法。对建模技术的原理思

  想及选择方法是本课程的重点与难点。此外,本课程在结合对Modeler软件应用的同时,更加强调建模思想,强调模型规划设计。针对有更高要求的朋友,还应常常训练自己对数据挖掘项目全过程的整体规划与设计,培养自己项目全局的眼光和思维方式。

一、数据挖掘项目管理基础与思想

1)课程规划
2)DM项目的生命周期与建设过程
3)CRISP-DM详解
4)DM项目实际建设与管理过程
5)DM团队组成与能力素养

二、感性认识SPSS Modeler

1)SPSS MODELER软件基础
2)MODELER节点概要
3)MODELER数据流实例解读

三、必备的统计学基础

1)简单的统计学概念
2)常用的分布函数
3)统计学基础的其它补充

四、数据准备与预处理

1)数据质量与样本管理
2)MODELER变量管理
3)MODELER分析管理

五、常用模型的数学思想与思考

1)数据挖掘知识类型
2)模型过程思想
3)回归分析思想与建模解释
4)回归分析建模解释(续)
5)决策树思想与建模解释
6)回归与决策树增补
7)神经网络思想与建模解释
8)SVM思想与建模解释
9)聚类思想与建模解释
10)关联思想与建模解释

六、项目案例解析

1)信用风险评估
2)经营辅助决策

  课程十、建模分析师之硬技能 - Python基础和网络爬虫数据分析(课程9、10、11三门课任选其一)

  本课程面向从未接触过Python的学员,从基础的语法开始讲起,逐步进入到目前各种流行的应用。整个课程分为基础和实战两个单元。基础部分包括Python语法

  和面向对象、函数式编程两种编程范式,基础部分会介绍Python语言中的各种特色数据结构,如何使用包和函数,帮助同学通过语法关。在实战部分选择了网

  络爬虫、数据库开发、Web网站3种基础的应用类型,详细介绍其思想原理,并通过案例讲解Python中的实现方案,让学员真正达到融会贯通、举一反三的效果。并应用到自己的工作环境中。

一、Python语言开发要点详解

1)模块的概念.主模块和非主模块的区别.pycharm中定义代码模版
2)安装pip 多个虚拟python环境
3)语法.变量.内置类型.运算符
4)if.for.while.else
5)数据结构.列表.元组.字典.集合
6)函数.类.异常

二、Python数据类型

7)列表和列表解析
8)filter和map
9)生成器表达是
10)元组
11)字符串
12)字符串之中文处理
13)字典
14)集合

三、函数和函数式编程

15)函数参数和变长参数列表
16)函数返回值.变量作用域.和函数__doc__属性
17)函数的嵌套定义和闭包和装饰器介绍
18)装饰器例子(日志装饰器和身份认证装饰器)
19)迭代器和生成器1
20)生成器例子

四、面向对象编程

21)认识经典类和新式类
22)公有属性和私有属性属性
23)访问属性.属性装饰器.描述符
24)描述符
25)方法.实例方法.静态方法.类方法
26)特殊方法.运算符重载
27)继承.多重继承.super

五、网页爬虫(单线程,保存到文本

28)爬虫介绍
29)工具包介绍
30)request使用演示
31)xpath介绍
32)xpath使用演示
33)新闻爬虫
34)分页栏爬虫
35)豆瓣爬虫

六、mongodb数据库

44)mongodb介绍
45)安装.命令行.mongovue演示
46)python中插入记录
47)python中查询记录
48)python中更新记录
49)python中删除记录
50)聚合操作

七、多线程和多进程

51)概述
52)多线程编程
53)多进程编程
54)综合案例-网络爬虫3

八、scrapy实战

55)scrapy介绍和安装
56)scrapy项目框架
57)scrapy框架和案例需求分析
58)实战

九、django实战

59)django架构介绍
60)阶段1.安装.创建项目.创建应用.初始配置
61)阶段1.配置URL映射.视图函数
62)阶段2.定义ORM并注册到后台管理模块
63)阶段3.模版的继承.表单的使用.数据的展示
64)阶段4.多应用URL配置.数据的DML操作


  课程十一、建模分析师之硬技能 - 零基础数据分析与挖掘R语言实战课程(课程9、10、11三门课任选其一)

  本课程面向从未接触过数据分析的学员,从基础的R语法开始讲起,逐步进入到目前各行业流行的各种分析模型。整个课程分为基础和实战两个单元。基础部分包

  括R语法和统计思维两个主题,R语法单元会介绍R语言中的各种特色数据结构,以及如何从外部抓去数据,如何使用包和函数,帮助同学通过语法关。统计思维

  单元会指导如何用统计学的思想的发现数据特点或者模式,并利用R强大的绘图能力做可视化展现。在实战部分选择了回归、聚类、数据降维、关联规则、决策

  树这5中基础的数据分析模型,详细介绍其思想原理,并通过案例讲解R中的实现方案,尤其是详细的介绍了对各种参数和输出结果的解读,让学员真正达到融会贯通、举一反三的效果。并应用到自己的工作环境中。

一、R语法详解:

1)R的核心数据结构之向量、因子的区别和使用技巧
2)R的核心数据结构之矩阵、数据框、数组、列表的区别和使用技巧
3)R的控制结构(包括分支结构和循环结构)、函数和包、以及向量化计算

二、数据组织和整理:

1)数据导入,从多种数据源导入数据
2)数据预处理之缺失值的处理
3)数据预处理之数据转换,数据筛选?

三、建立数据分析的统计思维和可视化探索:

1)单变量数据特点的描述方法
2)多变量数据特点的描述方法
3)借助分组发现数据中的模式
4)数据可视化建立对数据的感性认识

四、用回归预测未来:

1)线性回归的思想,代码、结果的详细解读;
2)多项式回归、多元线性回归

五、聚类方法:

1)层次聚类和k-means聚类方法

六、数据降维——主成分分析和因子分析:

1)维度过多会导致哪些问题
2)用逐步回归法筛除无用变量
3)用主成分分析法解决多重共线性问题
4)用因子分析法获得有业务意义的变量

七、关联规则:

1)用关联规则做购物车分析

八、决策树:

1)决策树算法ID.3、C4.5、CART算法区别和演示
2)分类效果的评价方式

  课程十二、建模分析师之扩展篇(机器学习) - 零基础实战机器学习入门篇(Python语言、算法、Numpy库、MatplotLib)

  机器学习作为人工智能的一部分,已经应用于很多领域,远超过人们的想象,垃圾邮件的过滤,在线广告的系统,还有目前发展飞快的物体识别、人脸识别和语

  音识别的发展,都是机器学习的应用的成果。机器学习在改善商业决策、提高生产率、检测疾病、预测天气等方面都有非常大的应用前景。 本课程系统的介绍了机

  器学习的目的和方法。并且针对每一种常用的方法进行了详细的解析,用实例来说明具体的实现,学生可以跟着一步步完成。在面对现实的问题的时候,可以找到非常可靠的参照。本课程在开始讲解了Python语言的基础知识,以保证后面的课程中可以顺利进行。更多的Python语言的知识,需要学员自己去找更多的资料进行

  学习。 本课程主要讲述了两大类机器学习的方法:有监督学习和无监督学习,其中有监督学习里面,又分为分类和预测数值型数据。这些算法都是基础的算法。这样可以降低学习的难度,容易理解机器学习思路和实现的过程。

1)机器学习的任务和方法
2)Python语言基础
3)Python语言基础2
4)分类算法介绍
5)k-临近算法
6)决策树
7)基于概率论的分类方法:朴素贝叶斯
8)Logistic回归
9)支持向量机
10)第利用AdaBoost元算法提类性能

11)利用回归预测数值型数据
12)树回归
13)无监督学习
14)利用K-均值聚类算法对未标注数据分组
15)使用Apriori算法进行关联分析
16)使用FP-growth算法来发现频分项集
17)利用PCA来简化数据
18)利用SVD简化数据
19)大数据与MapReduce
20)学习总结

  课程十三、建模分析师之扩展篇(机器学习) - 实战机器学习高阶篇(基于Python机器学习、项目案例实战)

  大数据时代,数据是企业值钱的财富,但海量的数据并非都是有价值的,如何挖掘出有用的数据变成商业价值,就需要机器学习算法。大数据和机器学习势必颠覆传

  统行业的运营方式,必将驱动公司业务的发展。目前,越来越多的机器学习/数据挖掘算法被应用在电商、搜索、金融、游戏,医疗等领域中的分析、挖掘、

  上。 但懂机器学习算法的人才却少之又少,物以稀为贵,致使这个行业的工资奇高。 本课程作为深度学习系列课程的第一阶段,介绍机器学习的基本概念,原理,

  以及常用算法(如决策树,支持向量机,Adaboost、EM算法等)。以Python语言为工具对每种算法进行结合实例讲解。学生学完本课程后将会理解机器学习的常

  用算法原理,并会使用Python来对实际问题进行数据预处理,分类和回归分析。为开发机器学习相关应用打下必要基础,同时也为学习深度学习进阶课程打下必要基础。

一、k近邻算法:

1)机器学习课程介绍
2)K近邻算法的思想
3)机器学习中常用的距离指标解析
4)实战k近邻算法

二、朴素贝叶斯分类算法

5)概率论的基本知识(基本概念、加法公式、乘法公式)
6)通过例子深入掌握概率的基本公式
7)全概率公式和贝叶斯定理
8)实战贝叶斯分类算法,智能手环

三、聚类算法:

9)聚类算法概述
10)Kmeans聚类
11)Kmeans实战,图片按照色彩聚类

四、决策树算法:

12)决策树介绍
13)决策树的构造过程和各种算法
14)决策树中关键指标详解
15)实战决策树

五、线性回归和梯度下降算法:

16)线性回归的相关概念(相关、独立和协方差)
17)线性回归和小二乘法
18)梯度下降算法
19)梯度的推导过程
20)岭回归、lasso回归和弹性网

六、逻辑回归和极大似然估计:

21)广义线性回归和逻辑回归
22)极大似然估计的思想
23)逻辑回归中的梯度推导
24)逻辑回归代码实战

七、支持向量机:

25)支持向量机原理介绍
26)线性可分的支持向量机
27)近似线性可分、非线性可分、核函数
28)坐标上升法、O算法、实战支持向量机

八、EM算法和GMM:

29)EM算法思想
30)EM算法的推导
31)实战EM算法,GMM

九、随机森林和Adaboost:

32)随机森林
33)Adaboost思想精髓
34)Adaboost算法流程介绍
35)实战Adaboost算法

十、机器学习思想精华和实战经验分享:

36)机器学习解决问题思想框架
37)理解方差和偏差、损失函数和过拟合
38)L1、L2正则化和常见的5种损失函数
39)如何选择模型和选择参数,交叉验证和ROC曲线
40)自适应学习率和二分法搜索
41)自适应学习率和基于阿米霍准则的模糊搜索
42)经验分享

  阶段三、大数据分析师(赠送)

  课程十四、大数据挖掘/分析师之硬技能 - Java语言基础

  本课程讲解了java语法基础、类和对象、java中的字符串、java实用类与集合、泛型、继承和多态、接口与抽象类异常处理等等。

1、Java语法基础

2、类和对象

3、字符串

4、Java实用类

5、集合与泛型

6、面向对象三大特性

7、接口与抽象类

8、Java异常

  课程十五、大数据挖掘/分析师之硬技能 - 大数据必备的数据结构与算法

  这门课程是针对大数据工程师和云计算工程师的基础课程,同时也是所有计算机专业人士必须掌握的一门课程。如果不掌握数据结构和算法,你将难以掌握、专业的数据处理手段,更难以从容应对复杂的大数据处理场景。

1.数据结构和算法概述

2.数组、链表、队列、栈等线性表

3.二叉树、BST、AVL树及二叉树的递归与非递归遍历

4.B+树

5.跳表

6.图、图的存储、图的遍历

7.有向图、无向图、懒惰与积极的普利姆算法、克鲁斯卡尔算法及MST、单源短路径问题及Dijkstra算法

8.并查集与索引式优先队列、二叉堆

9.遗传算法初步与TSP问题

10.内部排序(直接插入、选择、希尔、堆排序、快排、归并等)算法与实践中的优化

11.外部排序与优化(文件编码、数据编码、I/O方式与JVM特点、多线程、多路归并等)

  课程十六、大数据挖掘/分析师之硬技能 - Linux必知必会

  本部分是基础课程,帮大家进入大数据领域打好Linux基础,以便更好地学习Hadoop,hbase,NoSQL,Spark,Storm,docker,openstack等众多课程。因为企业中的项目基本上都是使用Linux环境下搭建或部署的。

1.Linux系统概述

2.系统安装及相关配置

3.Linux网络基础

4.OpenSSH实现网络安全连接

5.vi文本编辑器

6.用户和用户组管理

7.磁盘管理

8.Linux文件和目录管理

9.Linux终端常用命令

10.linux系统监测与维护

  课程十七、大数据挖掘/分析师之硬技能 - Hadoop大数据开发技术光速入门

  本课程从基础的环境搭建到更深入的知识学习都会有一个比较好的讲解。帮助学员上手hadoop生态圈的大数据处理框架的使用,使用hadoop生态圈进行一些

  模块化、项目功能化的开发,主要包括安装部署hadoop、hive、hbase、hue、oozie、flume等生态圈相关软件环境的搭建,并且在已搭建好的环境上进行相关知

  识点的讲解和功能的开发。项目/模块主要涉及到使用MR开发相关实际业务功能,包括短路径的计算、社交好友算法实现、分布式锁的实现等,这些模块可

  以在实际的生成环境中使用到,可以很简单的将这些模块的代码直接集成到相关实际生产环境代码中。

一、hadoop:

1)Hadoop起源、体系结构以及生态圈介绍
2)Hadoop安装
3)Windows平台下Eclipse环境搭建
4)HDFS体系结构
5)HDFS SHELL API介绍
6)HDFS Java API介绍
7)Hadoop 2.x HDFS新特性
8)YARN体系结构
9)MR编程模型介绍
10)Map-Reduce编程实例:WordCount
11)MR数据类型讲解
12)MR输入格式讲解
13)MR输出格式讲解
14)案例:自定义输入、输出格式使用
15)MR Shuffle组件讲解
16)案例:二次排序
17)组合MR任务介绍
18)MR任务多数据源连接介绍
19)案例:倒排索引

二、zookeeper:

20)Zookeeper起源、体系结构介绍
21)Zookeeper安装
22)Zookeeper Shell命令
23)Zookeeper Java API
24)Zookeeper案例:分布式环境中实现共享锁

三、hbase:

25)HBase起源、体系结构以及数据模型介绍
26)HBase安装
27)HBase Shell命令
28)HBase Java API
29)HBase协处理器介绍
30)HBase和MapReduce整合
31)HBase案例:二级索引的创建

四、hive:

32)Hive起源、体系结构介绍
33)Hive安装
34)Hive Shell命令上
35)Hive Shell命令下
36)Hive函数

五、hue:

37)Hue简介

六、Oozie:

38)Oozie简介
39)Oozie安装
40)Oozie案例
41)Oozie Java客户端
42)Oozie Hue整合

七、Flume:

43)Flume介绍以及安装
44)Flume案例介绍上
45)Flume案例介绍下
46)Flume自定义Source
47)Flume自定义Interceptor

厚学推荐学校

温馨提示