「CDA 数据分析师人才行业标准」是面向全行业数据分析及大数据相关岗位的一套科
学化、专业化、正规化、系统化的人才技能准则。CDA数据分析师认证考试是评判「标准化人才」的考核路径。CDA考试大纲规定并明确了数据分析师认证考试的具体范围、内容和知识点,考生可按照大纲要求进行相关知识的学习,获取技能,成为专业人 才。
CDAL1业务数据分析师认证课程
•●
培训通知
●•
培训背景
「CDA 数据分析师人才行业标准」是面向全行业数据分析及大数据相关岗位的一套科
学化、专业化、正规化、系统化的人才技能准则。CDA数据分析师认证考试是评判「标准化人才」的考核路径。CDA考试大纲规定并明确了数据分析师认证考试的具体范围、内容和知识点,考生可按照大纲要求进行相关知识的学习,获取技能,成为专业人 才。
知识要求
针对不同知识,掌握程度的要求分为【领会】、【熟知】、【应用】三个,考生应按照
不同知识要求进行学习。
1.领会:考生能够领会了解规定的知识点,并能够了解规定知识点的内涵与外延,了
解其内容要点和它们之间的区别与联系,并能做出正确的阐述、解释和说明。
2.熟知:考生须掌握知识的要点,并能够正确理解和记忆相关理论方法,能够根据不
同要求,做出逻辑严密的解释、说明和阐述。此部分为考试的重点部分。
3.应用:考生须学会将知识点落地实践,并能够结合相关工具进行商业应用,能够根
据具体要求,给出问题的具体实施流程和策略。
考试范围
PART 1 数据分析概念与统计学基础 (占比 30%)
a. 数据分析概念、方法论、流程(占比 5%)
b. 描述性统计分析(占比 12%)
c. 推断性统计分析(占比 8%)
d. 方差分析(占比 2%)
e. 一元线性回归分析(占比 3%)
Ø PART 2 SQL 数据库基础 (占比 15%)
a. SQL 及关系型数据库基本概念(占比 1%)
b. SQL 数据类型、运算符、函数(占比 3%)
c. SQL 查询语句(占比 5%)
d. SQL 连接语句(占比 5%)
e. SQL 其它语句(占比 1%)
Ø PART 3 数据采集与处理 (占比 15%)
a. 数据采集方法(占比 5%)
b. 市场调研(占比 2%)
c. 数据预处理方法(占比 8%)
Ø PART 4 数据建模分析 (占比 40%)
a. 主成分分析法(占比 4%)、因子分析法(占比 2%)
b. 系统聚类法(占比 2%)、K-Means 聚类法(占比 3%)
c. 对应分析(占比 2%)、多维尺度分析(占比 2%)
d. 多元回归分析法
多元线性回归(占比 10%)
逻辑回归(占比 10%)
e. 时间序列(占比 5%).
考试形式与试卷结构
考试方式:VUE线上考试,随约随考
考试题型:客观题(单选+多选)
考试时间:120 分钟
考试成绩:分为 A、B、C、D 四个层次,A、B、C 为通过考试,D 为不通过.
注:考试未通过者可进行一次补考,补考费用为六折优惠。每个等级科目补考各限一次。
章节 | 模块 | 培训内容 |
PART 1 数据分析概念与统计 学基础 | 1、数据分析概述 | 【领会】 数据分析和数据挖掘的概念 强调商业数据分析中对业务的理解 商业数据分析和预测的本质 数据分析的8个层次 大数据对传统小数据分析的拓展 【熟知】 明确数据分析目标及意义 数据分析的过程 数据分析与数据挖掘的常用方法 CRISP-DM、SEMMA 方法论 数据分析中不同人员的角色与职责 |
2、描述性统计分析 | 【领会】 数据的计量尺度 数据的集中趋势、离中趋势和数据分布的概念 统计图的概念 各种统计图的含义和画法 【熟知】 衡量数据集中趋势、离中趋势和数据分布的常用指标及计算方法统计图形的 绘制、图形元素的调整、可视化效果,主要涉及条形图、线图、直方图、盒 须图、散点图、气泡图、马赛克图、玫瑰图及其多种图形整合。明确统计图 形对统计指标表达上的对应关系 【应用】 根据不同数据类型选用不同的统计指标来进行数据的集中趋势、离中趋势和 数据分布的衡量,不同统计图的使用场景。会写数据分析报告和结合业务需 求对报告进行合理解释,对业务ᨀ出建设性意见建议。 | |
3、抽样估计 | 【领会】 随机试验、随机事件、随机变量的概念 总体与样本的概念 抽样估计的理论基础 正态分布及三大分布的函数形式和图像形式 抽样的多种组织形式 确定必要样本容量的原因 【熟知】 随机事件的概率 抽样平均误差的概念与数学性质 点估计与区间估计方法的特点与优缺点 全体总体与样本总体 参数和统计量 重复抽样与不重复抽样 抽样误差的概念对总体平均数和总体成数的区间估计方法 必要样本容量的影响因素 中心极限定理的意义与应用 【应用】 随机变量及其概率分布 全部可能的样本单位数目的概念及其在不同抽样方法下的确定 抽样平均误差在实际数据分析中的计算方法 | |
4、假设检验 | 【领会】 假设检验的基本概念 其基本思想在数据分析中的作用 假设检验的基本步骤 假设检验与区间估计的联系 假设检验中的两类错误 【熟知】 P值的含义及计算 如何利用P值进行检验 z检验统计量 t检验统计量 F检验统计量 c2检验统计量的函数形式和检验步骤 【应用】 实现单样本t检验 两独立样本t检验的步骤和检验中使用的统计量与原假设 两种检验应用的数据分析场景。 | |
5、方差分析 | 【领会】 方差分析的相关概念 单因素方差分析的原理 统计量构造过程 【熟知】 单因素方差分析的基本步骤 总离差平方和(SST)的含义及计算 组间离差平方和(SSA)的含义及计算 组内离差平方和(SSE)的含义及计算 单因素方差分析的原假设 【应用】 实现单因素方差分析的步骤 对方差分析表的分析以及多重比较表的分析 | |
6、简 单线性回归分析 | 【领会】 相关图的绘制与作用 相关表的编制与作用 相关系数定义公式的字母含义 估计标准误差与相关系数的关系 【熟知】 相关关系的概念与特点 相关关系与函数关系的区别与联系 相关关系的种类 相关系数的意义以及利用相关系数的具体数值对现象相关等级的划分 回归分析的概念 回归分析的主要内容和特点 建立一元线性回归方程的条件 应用回归分析应注意的问题 估计标准误差的意义及计算 【应用】 运用简捷法公式计算相关系数 相关分析分析中应注意的问题 回归分析与相关分析的区别与联系 | |
PART 2 SQL数据库基础 | 1、SQL 基础概念 | 【领会】 关系型数据库基本概念、属性 主键 外键 E-R 图 ANSI-SQL 以及不同的数据库实现的关系 【熟知】 逻辑运算符 比较运算符 算术运算符 通配符 |
2、SQL 查询语句 | 【应用】 select 语句 包括查询单列 多列,去重,前 N 列 from 语句、where 语句、group by 语句、having 语句、order by 语 句、子查询 SQL 聚合函数,包括 count、sum、avg、max、min 等 | |
3、SQL 连接语句 | 【领会】 表的连接类型,包括内连接(等值、不等值)、外连接(左、右、全)、交 叉连接(笛卡 尔连接) 查询的集合操作,只包括并集操作 【应用】 inner join 的用法 left/right/full join 的用法 cross join 的用法 union 的用法 | |
4、其它 SQL 语句 | 【领会】 表的创建 视图及索引的概念及创建 数据插入、更新、删除 【领会】 函数,如 Oracle 或 Hive 中的 row number over partition by、正则 匹配等 | |
PART 3 数据采集与处理 | 1、数据采集方法 | 【领会】 一手数据与二手数据来源渠道 优劣势分析 使用注意事项 【熟知】 一手数据采集中的概率抽样与非概率抽样的区别与优缺点 【运用】 概率抽样方法,包括简单随机抽样、分层抽样、系统抽样、分段抽样 明确每种抽样的优缺点 根据给定条件选择可行的抽样方式 计算简单随机抽样所需的样本量 Ø 市场调研 【熟知】 市场调研的基本步骤(ᨀ出问题、调查收集材料、分析预测问题) 单选题及多项选择题的设置 数据编码及录入 Ø 数据预处理方法 【熟知】 数据预处理的基本步骤,包括数据集成(不同数据源的整合)、数据探索、数 据变换(标 准化)、数据归约(维度归约技术、数值归约技术),这部分内容不需要涉 及计算,只需要根 据需求明确可选的处理技术即可。 【应用】 数据清洗,包括填补遗漏的数据值(根据业务场景使用常数、中位数、众数 等 方法,不 涉及多重查补的方法)、平滑有噪声数据(移动平均)、识别或除去异常值( 单变量根据中心 标准化值,多变量使用聚类),以及解决不一致问题(熟知概念即可 ),查重(只考核 SQL 的语句,不涉及 R、SAS 等其它语言)。 |
PART 4 数据建模分析 总体要求 领会模型基本原理, 数值 模型操作流程, 懂得 模型应用场景, 能够 完成数据建模分 析报告。 | 1、描述 性数据分析 /挖掘 方法—— 主成 分分析 | 【领会】 主成分分析的计算步骤 主成分分析中对变量自身分布和多变量之间关系的假设以及模型设置 【熟知】 适用于主成分分析的变量度量类型。通过分析结果,选取合适的保留主成分 的个数,注意区分两种不同的分析目的(尽量压缩变量、避免共线性情况下 留更多信息)保留主成分 个数的评判标准的差异。 【应用】 在深入理解主成分的意义的基础之上,在遇到业务问题时,有能力决定是否 使用主成分分析方法;有能力决定何时采用相关系数计算方法和协方差矩阵 计算方法;有能力解释主成分得分的结果;根据变量分布情况进行函数转 换。 |
2、描 述性数据分析/挖 掘方法 ——因子分 析 | 【领会】 了解因子分析模型设置,只需要关注主成分法的计算步骤 【熟知】 适用于因子分析的变量度量类型。通过分析结果,选取合适的因子个数; 知道常用的因子旋转的方法。 【应用】 在遇到业务问题时,有能力决定是否使用因子分析,还是使用主成分分析方 法就可以了;有能力根据原始变量在各因子上的权重明确每个因子的意义; 有能力对大量变量进行维度分析,分维度打分,并比较与打分(德尔菲
分享到:
CDAL1业务数据分析师认证课程培训
原创内容,请点击北京大数据分析师培训
|