本标准按照GB/T 1.1-2009给出的规则起草。
本标准由中经数(北京)数据应用技术研究院提出并归口。
本标准起草人:教育部统计职业教育教学指导委员会何强委员、国家统计局统计科学研究所何强博士,中国信息协会市场研究业分会翁瑞光秘书长,台湾人工智慧发展学会、亚太市场调查委员会(APRC)扈琼玲副会长,山东省大数据研究会石玉峰会长,中经数(北京)数据应用技术研究院张良院长,中国联通智慧足迹数据科技有限公司文武高级副总裁,河北经贸大学李春林院长,天津商业大学安建业院长,天津财经大学王键院长。
本标准为二次发布。
声明:本标准的知识产权归属于中经数(北京)数据应用技术研究院,未经研究院同意,不得印刷、销售。任何组织、个人使用本标准开展认证、评测等活动应经本院批准授权.
2019年11月公布
【数据管理员】技能要求与相关知识
职业 功能 |
工作内容 | 技能要求 | 相关知识 |
基本 素养 |
职业道德与 安全意识 |
1.能遵守职业道德 2.能遵守涉及的数据安全和保密要求及规定 |
1.了解职业道德的知识和应用 2.了解数据安全和保密要求的知识及规定 |
办公 自动化 |
数据与结论 的可视化展示 |
1.能运用Excel软件管理数据 2.能运用PPT美化和展示分析结论 3.能熟练运用办公软件进行文档编辑排版等工作 |
1.掌握办公软件(word、excel、ppt等)的相关知识及应用 |
数据 管理 |
数据收集 | 1.能收集互联网上的数据 2.能通过调查活动收集数据 |
1.掌握互联网上公开数据的来源和采集方法 2.了解调查数据采集的基本要求和流程 |
数据 处理 |
1.能预处理结构化数据 2.能完成数据抽取、清理转换、格式化数据 |
1.了解数据的基本结构 2.了解数据预处理的相关方法及应用 3.理解数据集成、数据审核、数据清理和数据转换方法 |
【初级数据分析师】技能要求与相关知识
职业 功能 |
工作内容 | 技能要求 | 相关知识 |
基本 素养 |
职业道德与安全意识 | 1.能遵守职业道德 2.能遵守涉及的数据安全和保密要求及规定 |
1.了解职业道德的知识和应用 2.了解数据安全和保密要求的知识及规定 |
数据 管理 |
数据收集 | 1.能收集互联网上的数据 2.能收集外部的公开或非公开数据 3.能收集内部的数据 4.能通过调查活动收集数据 |
1.掌握互联网上公开数据的来源和采集方式 2.理解抽样调查及社会调查方法的基本知识及应用 3.掌握非公开数据和内部数据的采集方法 |
数据处理 | 1.能处理结构化与非结构化数据 2.能完成数据抽取、清理转换、格式化数据 3.能运用常用的数据库存取数据 |
1.理解数据集成、数据审核、数据清理和数据转换的基本方法 2.理解均值插补、回归插补、相似值插补等常用缺失值插补方法 3.了解数据结构及数据库的基本原理 4.了解分布式文件系统数据存取机理 |
|
数据 分析 |
数据分析 | 1.能根据业务问题选择数据分析方法 2.能运用各类数据分析方法进行数据分析 |
1.掌握统计学基础、数据分析方法基础 2.运用描述性分析、推断性分析、方差分析、线性回归分析等方法分析数据 |
数据分析工具的应用 | 1.能运用R、Excel、SPSS、SAS等某一数据分析工具 | 1.掌握基于R、Excel、SPSS、SAS等某一数据分析软件掌握数据分析的相关方法及应用 | |
可视 化设 计与 报告 写作 | 数据可视化展示 | 1.能通过程序语言或工具展示数据情况 2.能选择合适图型展示复杂数据 3.能运用Excel软件展示数据结论 4.能运用PPT美化和展示分析结论 |
1.掌握数据分析软件的可视化功能及应用 2.掌握办公软件(word、excel、ppt等)的相关知识及应用 |
撰写报告 | 1.能根据分析结论提出合理建议和撰写报告 2.能熟练运用办公自动化软件编辑报告文档 |
1.掌握数据分析报告的撰写要求 2.掌握调查分析报告的撰写要求 |
【中级数据分析师】技能要求与相关知识
功能 | 工作内容 | 技能要求 | 相关知识 |
基本 素养 |
职业道德与安全意识 | 1.能遵守职业道德 2.能遵守涉及的数据安全和保密要求及规定 |
1.了解职业道德的知识和应用 2.了解数据安全和保密要求的知识及规定 |
业务 分析 |
定义业务问题 | 1.能将业务目标转化为数据分析目标 2.能分析业务对应产品的分类和服务模式 3.能分析业务运营模式及系列结构 4.能分析相当业务计算机管理系统 |
1.了解项目分析的知识和方法 2.了解相关业务领域基本知识 |
数据 管理 |
数据库管理 | 1.能分析和评估不同场景的数据库应用 2.能搭建企业常用数据库 3.能对多数据库操作管理 4.能优化数据库 |
1.了解多款数据库的特性及优缺点 2.了解Hadoop生态圈上的Hbase、Hive、Impala的基本功能 3.了解数据库的索引机制、查询优化机制、存储机制,表分区应用等 4.掌握数据库的创建与管理、视图、索引以及备份与恢复等方法 |
数据预处理 | 1.能制定不同来源数据收集方案 2.能拼接不同来源不同类型的数据 3.能处理丢失或损坏的数据 4.能从海量数据中搜集并提取信息 5.能完成数据抽取、清理转换、重构整合和格式化数据 |
1.了解大数据的基本理论与应用 2.掌握数据集成、数据审核、数据清理和数据转换的基本方法 3.掌握均值插补法、回归插补法、相似值插补方法等常用缺失值插补方法, 4.了解EM插补法、多重插补法和基于模型的插补方法 |
|
数据挖掘与统计机器学习 | 数据挖掘分析 | 1.能分析数据特征 2.能运用数据挖掘分析方法 3.能分析和处理海量数据 4.能熟练的进行多维度分析 5.能实现特定数据挖掘功能 |
1.掌握数据挖掘相关知识 2.理解统计建模相关知识 3.运用分布分析、对比分析、统计量分析、周期性分析、贡献度分析、相关性分析等方法 4.运用因子分析、聚类分析、判别分析、对应分析、多元回归分析、Logistic回归分析、时间序列分析、结构方程模型等分析方法 5.掌握决策树、关联分析、神经网络等分析方法 6.理解开源的算法代码 |
模型训练与应用 | 1.能创建训练集、验证集和测试集 2.能评估模型性能 3.能运用建立好的模型预测业务问题 4.能实现特定模型功能 |
||
可视化分析 | 撰写报告与可视化数据 | 1.能使用可视化分析的相关工具及相关软件 2.能理解和掌握可视化分析的算法模型 3.能应用开源软件进行可视化分析项目 4.能按要求撰写数据分析报告 |
1.掌握数据分析报告的撰写要求 2.掌握调查分析报告的撰写要求 3.掌握python等数据分析工具可视化功能及应用 |
【准高级数据分析师】技能要求与相关知识
功能 | 工作内容 | 技能要求 | 相关知识 |
基本 素养 |
职业道德与安全意识 | 1.能遵守职业道德 2.能遵守涉及的数据安全和保密要求及规定 |
1.了解职业道德的知识和应用 2.了解数据安全和保密要求的知识及规定 |
业务 分析 |
定义业务问题 | 1.能将业务目标转化为数据分析目标 2.能分析业务对应产品的分类和服务模式 3.能分析业务运营模式及系列结构 4.能分析相当业务计算机管理系统 |
1.了解项目分析的知识和方法 2.了解相关业务领域基本知识 |
数据库管理 | 数据库架构设计与特性评估 | 1.能分析评估不同数据库的特性和优缺点 2.能协助工程师完成数据库架构设计 3.能协助ETL工程师工作 |
1.理解在不同场景下数据库的构建、运维和评估技术 2.了解大规模并行处理、分布式文件系统、分布式数据库、分布式计算等大数据平台的构建和运维技术 3.理解流计算等分析技术 4.理解数据库运作原理和工具实现方式 |
大数据管理与设计 | 1.能进行数据分析和建模 2.能协助实践BI全过程 3.能协助开发大数据分析处理系统 |
||
统计机器学习与深度学习 | 模型与算法的计设、测试和验证 | 1.模型选择与评估 2.运用建立好的模型预测业务问题 3.能灵活对特定的业务场景进行统计学方法和机器学习方法 4.能理解图像或语音或文本分析和挖掘方法 |
1.掌握特征提取、异常诊断、模型评估技术和决策树、关联分析、支持向量机、神经网络、贝叶斯网络等分析方法 2.理解图像分析,或语音分析,或文本分析方法 3.理解无监督学习、有监督学习、模式识别、卷积神经网络等分析方法 4.理解图像或语音或文本分析的内部机理 |
可视化分析 | 通过源代码或工具软件实现可视化分析 | 1.能使用可视化分析相关开源软件栈和工具 2.能协助开发分布式可视化分析系统 |
1.掌握python等数据分析工具可视化功能及应用 2.了解开源的算法代码编 |
【高级数据分析师】技能要求与相关知识
功能 | 工作内容 | 技能要求 | 相关知识 |
基本 素养 |
职业道德与安全意识 | 1.能遵守职业道德 2.能遵守涉及的数据安全和保密要求及规定 |
1.了解职业道德的知识和应用 2.了解数据安全和保密要求的知识及规定 |
业务 分析 |
规划业务问题 | 1.能深入了解业务问题 2.能拆解问题进行结构化 3.能把问题模块进行细分 4.能够找出可行的数据分析和建模方式 5.能够带领团队整合管理企业的数据资产 |
1.了解项目分析的知识和方法 2.了解相关行业领域知识 3.了解业务规划相关知识 4.熟悉国家有关大数据产业发展方针、政策和法规 |
大数据管理 | 数据库架构设计与特性评估 | 1.能分析评估不同数据库的特性和优缺点 2.能指导对数据库架构设计 3.能指导ETL工程师业务工作 |
1.掌握在不同场景下数据库的构建、运维和评估技术 2.掌握大规模并行处理、空间数据库、分布式文件系统、分布式数据库、分布式计算等大数据平台的构建和运维技术 3.基本掌握流计算等分析技术 4.理解数据库运作原理和工具实现方式 |
大数据管理与设计 | 1.能进行数据分析和建模 2.能实践BI全过程 3.能指导开发大数据分析处理系统。 |
||
统计机器学习与深度学习 | 模型与算法的计设、测试和验证 | 1.能承接算法项目 2.能完成算法设计 3.能选择与评估模型 4.运用建立好的模型预测业务问题 5.能灵活对特定的业务场景进行统计学方法和机器学习方法及算法设计 6.实现图像或语音或文本分析设计 7.能指导团队成员深度学习相关技术以及系统的研发 |
1.运用特征提取、异常诊断、模型评估技术和决策树、关联分析、支持向量机、神经网络、贝叶斯网络等分析方法 2.掌握图像分析,或语音分析,或文本分析方法 3.掌握无监督学习、有监督学习、模式识别等分析方法 4.理解图像或语音或文本分析的内部机理 |
可视化分析 | 通过源代码或工具软件实现可视化分析 | 1.能精通可视化分析相关开源软件栈和工具 2.能指导开发分布式可视化分析系统 |
1.掌握python等数据分析工具可视化功能及应用 2.掌握开源的算法代码编写经验 |
团队沟通协同与汇报 | 团队技术沟通 与用户需求沟通 | 1.能够与大型数据库管理人员协同工作 2.能够与大数据框架工程师协同工作 3.根据用户数据创造不同特性的产品和系统 4.推动业务落地实现数据分析建议 5.计划、领导、组织、实施大数据项目工作 |
1.具备项目管理经验 |
根据《关于调整在线考试理论和上机科目考试时长的通知》的要求已更新考试时长,时间:2021-12-9
【数据管理员】题型题量分值
[难易程度:难:10%,较难:15%,较易:15%,易:60%]
[报考条件:中职毕业(含在校生),经考核成绩合格。]
题型 | 线上 题量 |
分值 | 线上考试时长 | 方式 | 类别 | |
业务 知识 |
单选 | 60*1 | 100 | 120 分钟 |
闭卷 | 理论 |
多选 | 40*1 | |||||
数据管理实务 (数据分析、Excel数据处理与分析) |
单选 | 60*1 | 100 | 120 分钟 |
||
多选 | 40*1 |
【初级数据分析师】题型题量分值
[难易程度:难:10%,较难:15%,较易:15%,易:60%]
[报考条件:专科及以上学历(含在校生),或从事相关工作,经考核成绩合格。]
根据《关于调整在线考试理论和上机科目考试时长的通知》的要求已更新考试时长,时间:2021-12-9
自2023年11月起,线下线上统一上机综合应用实践考核题量题型,更新时间:2023-10-7
题型 | 线下 题量 |
分值 | 线下考试时长 | 线上 题量 |
分值 | 线上考试时长 | 方式 | 类别 | |
业务 知识 |
单选 | 20*4 | 100 | 150 分钟 |
60*1 | 100 | 120 分钟 |
闭卷 | 理论 |
多选 | 5*4 | 40*1 | |||||||
数据分析 | 单选 | 20*2 | 100 | 60*1 | 100 | 120 分钟 |
|||
多选 | 5*6 | 40*1 | |||||||
简答 | 3*6 | < | |||||||
综合应用 | 1*12 | ||||||||
大数据技术概论 | 单选 | 20*2 | 100 | 60*1 | 100 | 120 分钟 |
|||
多选 | 5*6 | 40*1 | |||||||
简答 | 3*6 | ||||||||
论述 | 1*12 | ||||||||
Excel数据处理与分析 | 综合案例 | 1*100 | 100 | 150 分钟 |
1*100 | 100 | 120 分钟 |
闭卷 | 上机 |
R语言 | 综合案例 | 1*100 | 100 | 1*100 | 100 | 120 分钟 |
|||
实践报告 | 数据分析报告 | 100 | 7天 | 7天 | 开卷 | 实践 |
【中级数据分析师】题型题量分值
[难易程度:难:10%,较难:15%,较易:15%,易:60%]
[报考条件:本科及以上学历(含在校生),或取得初级证书且从事相关工作1年以上,经考核成绩合格。]
根据《关于调整在线考试理论和上机科目考试时长的通知》的要求已更新考试时长,时间:2021-12-9
自2023年11月起,线下线上统一上机综合应用实践考核题量题型,更新时间:2023-10-7
题型 | 线下 题量 |
分值 | 线下考试时长 | 线上 题量 |
分值 | 线上考试时长 | 方式 | 类别 | |
业务 知识 |
单选 | 20*4 | 100 | 150 分钟 |
60*1 | 100 | 120 分钟 |
闭卷 | 理论 |
多选 | 5*4 | 40*1 | |||||||
数据挖掘 | 单选 | 20*2 | 100 | 60*1 | 100 | 120 分钟 |
|||
多选 | 5*6 | 40*1 | |||||||
简答 | 3*6 | ||||||||
综合应用 | 1*12 | ||||||||
大数据技术原理与应用 | 单选 | 20*2 | 100 | 60*1 | 100 | 120 分钟 |
|||
多选 | 5*6 | 40*1 | |||||||
简答 | 3*6 | ||||||||
论述 | 1*12 | ||||||||
Python数据分析 | 综合案例 | 1*100 | 100 | 150 分钟 |
1*100 | 100 | 120 分钟 |
闭卷 | 上机 |
SQL数据库应用与实践 | 综合案例 | 1*100 | 100 | 1*100 | 100 | 120 分钟 |
|||
实践报告 | 数据挖掘报告 | 100 | 7天 | 7天 | 开卷 | 实践 |
【准高级数据分析师】题型题量分值
[难易程度:难:10%,较难:15%,较易:15%,易:60%]
[报考条件:取得中级证书,经考核成绩合格。]
题型 | 线下 题量 |
分值 | 线下考试时长 | 线上 题量 |
分值 | 线上考试时长 | 方式 | 类别 | |
高级数据分析技术 | 综合案例 | 3 | 100 | 150 分钟 |
3 | 100 | 120 分钟 |
闭卷 | 上机 |
深度学习 | 综合案例 | 3 | 100 | 3 | 100 | ||||
文本数据分析与挖掘 | 综合案例 | 3 | 100 | 3 | 100 | ||||
大数据分析建模 | 综合案例 | 3 | 100 | 3 | 100 |
【高级数据分析师】题型题量分值
[难易程度:难:10%,较难:15%,较易:15%,易:60%]
[报考条件:博士学历,或硕士学历且取得准高级证书后连续从事相关工作3年以上(含3年),或连续从事相关工作5年以上且具有项目管理经验,经答辩成绩合格。]
题型 | 线下 题量 |
分值 | 线下考试时长 | 线上 题量 |
分值 | 线上考试时长 | 方式 | 类别 | |
深度学习实践应用项目 | 论文撰写 | 1 | 100 | 15天 | 1 | 100 | 15天 | 开卷 | 实践 环节 |
论文答辩 | 1 | 30分种 | 1 | 30分种 | 闭卷 |
考试费用包含:理论综合考试、上机实操考试、实践应用能力考核、报告指导答辩4项内容。
1.全科考试费用标准如下:
数据管理员考试费用:380元人民币;
初级数据分析师考试费用:900元人民币;
中级数据分析师考试费用:1200元人民币;
准高级数据分析师考试费用:2400元人民币;
高级数据分析师考试费用:8600元人民币;
2.单科补考费用标准如下:
理论综合考试单科补考费用:150元人民币;
上机操作考试补考费用:150元人民币:
初、中级实践应用能力考核补考费用:300元人民币;
高级实践应用能务考核补考费用:1600元人民币;
3.教材费用
各级别考试所需教材考生自行购买。
购买教材,请同学复制以下对应书号(数字部分)在各购物网站上自行购买。
员级 数据管理员
指定教材:
《数据分析》书号:978-7-5095-9289-2
《Excel高级数据处理及分析》书号:9787121246692
初级 数据分析师
指定教材:
《数据分析》书号:9787509592892
《大数据技术概论》书号:9787302450511
《Excel高级数据处理及分析》书号:9787121246692
《R语言实用教程》书号:9787302371175
中级 数据分析师
指定教材:
《数据挖掘》书号: 9787522309248
《大数据技术原理与应用(第2版)》书号:9787115443304
《利用Python进行数据分析》书号: 9787111436737
《SQL初学者指南(第2版)》书号:9787115448651
高级 & 准高级 数据分析师
指定教材:
《数据挖掘》书号: 9787522309248
《深度学习》书号:9787115461476
《Python自然语言处理》书号:9787115333681
《大数据分析与预测建模》书号:9787115463661