根据《国务院关于印发促进大数据发展行动纲要的通知》国发[2015]50号文件精神,启动了BDA大数据人才培养项目。经过三年的实践应用,取得显著成效,构建了以统计理论、计算机技术和行业案例应用三维一体的数据分析人才培养理念和课程体系,获得了用人单位的广泛认同。
为适应大数据与人工智能行业发展的需求,我部邀请了统计部门、科研院所、金融、数据分析行业及市场研究行业的专家对BDA课程设置及考核目标进行了修订,并正式印发《BDA数据分析师课程标准(2018年版)》,并于2018年春季开始执行。现将相关事宜说明如下:
一、基本原则
坚持科学论证。广泛听取不同领域专家的意见,向权威机构、权威人士咨询,求真务实,严谨认真,确保课程内容科学,符合大数据分析工作的需要。
坚持继承发展。继承已有经验和成功做法,有针对性地进行修订完善,确保课程调整的连续性,使课程体系充满活力。
依据职业要求。课程标准符合数据分析的工作要求,突出了大数据分析的优势,强调了数据分析工作的必备技能,适用不同专业的人员学习。
二、课程变化
按照大数据分析工作的不同场景和技术要求,调整了初、中、高级考试课程,其中初级4门课程、中级5门课程、高级4门课程(详见附件)。
强调了统计理论、计算机技术和行业案例应用三维一体的大数据分析人才培养理念。
三、考试变化
按照考试要求,初级考试题型定为单项选择题、多项选择题;中级考试题定为简答论述题、案例应用题;高级考试题定为行业案例分析题。取消了初、中、高级在线作业考核内容。加强了数据分析实践应用能力考核标准。
四、考试课程过渡
参加2017年11月考试的考生,还延续使用2016年考试大纲,完成后续考试工作。2017年11月之后报名的考生,依据《BDA数据分析师课程标准(2018年版)》学习备考。
《BDA数据分析师课程标准(2018年版)》是数据分析师考试考核的基本依据,是考试招生重要导向,要把课程标准与大数据分析人才培训有机结合起来,统筹兼顾,形成合力,发挥好课程标准在企业人才培养和选拔中的引导作用,强化考试内容与数据分析岗位的关联性,保证教、考、就业一致性,提升数据分析师与人工智能领域从业人员综合能力。
2018年1月8日
附件:BDA数据分析师课程标准(2018年版)
一、初级考试科目说明
序号 | 课程名称 | 选用教材 |
---|---|---|
科目一 | 初级数据分析方法 | 《统计学(第六版)》ISBN:9787300203096 |
本课程培养学生应用数据分析方法分析和解决问题的实际能力。内容包括数据分析的基本问题、数据的整理、数据的描述分析、数据的推断分析、数据的相关分析、数据的回归分析等内容。通过系统地掌握各种数据分析方法,理解其中所包含的统计思想及不同特点、应用条件及适用场合。 | ||
科目二 | Excel数据处理与分析 | 《Excel高级数据处理及分析》ISBN:9787121246692 |
本课程主要是从Excel数据分析角度讲解数据的输入与验证、编辑与格式化、公式和函数,数学和统计函数处理、日期与时间函数、文本函数、财务函数、查找与引用函数、工作表函数、数组公式的高级应用等对处理数据。数据的组织和管理、公式和函数的综合应用实例,数据透视表分析数据、导入和分析外部数据、数据可视化图表分析、宏与VBA程序入门、数据的保护与共享,Excel综合应用案例。 | ||
科目三 | 大数据技术概论 | 《大数据技术概论》ISBN:9787302450511 |
本课程包括大数据概论、大数据采集及预处理、大数据分析、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据等。 | ||
科目四 | R语言 | 《R语言实用教程》ISBN:9787302371175 |
本课程是R语言初级课程,内容包括R程序基础操作、数据集、数据管理、图形图表、常用函数、描述分析、相关分析、数据可视化等内容。 | ||
考试说明 | · 理论综合试卷:由科目一初级数据分析方法、科目二大数据技术概论、科目三Excel数据处理与分析、科目四R语言共4部分构成。 · 题型题量:单项选择题(共60道),多项选择题(共20道),理论综合试卷各科合计题量共80道选择题。 · 考试方式:笔试,150分钟,各科目分别达到60分及格。 |
|
· 上机综合试卷:由科目一初级数据分析方法、科目二大数据技术概论、科目三Excel数据处理与分析、科目四R语言共4部分构成。 · 题型题量:综合案例应用题共5道题。 考试方式:· 上机操作,150分钟,总分达到60分及格。 |
||
· 实践应用考核:按要求提交一份数据分析报告。 · 考核方式:自主完成报告的撰写,在线提交,经专家指导和答辩60分及格。 |
||
· 考试费:900元(包含理论考试、上机考试、实践应用考核总费用) |
二、中级考试科目说明
序号 | 课程名称 | 选用教材 |
---|---|---|
科目一 | 中级数据分析方法 | 《调查数据分析》ISBN:9787500577690 |
本课程主要内容有实验设计、参数检验、多元回归分析、主成份分析/因子分析、感知图、聚类分析、判别分析与分类树、时间序列分析、及其他常用的数据挖掘方法和思想。 | ||
科目二 | 数据挖掘 | 《数据挖掘导论(完整版)》ISBN: 9787115241009 |
本课程主要内容包括数据、分类、关联分析、聚类和异常检测五个方面。通过基本概念、代表性算法引出高级概念和算法。由浅入深理解数据挖掘。 | ||
科目三 | 大数据技术原理与应用 | 《大数据技术原理与应用(第2版)》ISBN:9787115443304 |
本课程以分布式数据存储的概念、原理和技术为主,包括HDFS、HBase、NoSQL数据库、云数据库、MapReduce分布式编程框架、基于内存的分布式计算框架Spark、图计算、流计算、数据可视化等。 | ||
科目四 | Python数据分析 | 《利用Python进行数据分析》ISBN: 9787111436737 |
本课程强调Python的数据处理与分析的能力学习,主要内容包括:Python的基础知识和基本概念,以及一些高级的主题,包括抽象、异常、魔法方法、属性、迭代器等。 | ||
科目五 | SQL数据库应用与实践 | 《SQL初学者指南(第2版)》ISBN:9787115448651 |
本课程主要以数据库的查询、统计、归并等数据操作内容为主,重点放在Sql语法的各种操作,以常见的关系Sql数据库为主。 | ||
考试说明 | · 理论综合试卷:由科目一中级数据分析方法、科目二数据挖掘、科目三大数据技术原理与应用,科目四Python数据分析、科目五SQL数据库应用与实践共5门课程构成。 · 题型题量:简答题(5道),论述题(5道)案例题(5道),理论综合试卷各科合计题量为15道。 · 考试方式:笔试,150分钟,各科目分别达到60分及格。 |
|
· 上机综合试卷:由科目一中级数据分析方法、科目二数据挖掘、科目三大数据技术原理与应用,科目四Python数据分析、科目五SQL数据库应用与实践共5门课程构成。 · 题型题量:案例应用题共5道题。 · 考试方式:上机操作,150分钟,总分达到60分及格。 |
||
· 实践应用考核:按要求提交一份数据分析报告。 · 考核方式:自主完成报告的撰写,并在线提交,经专家指导和答辩60分及格。 |
||
· 考试费:1200元(包含理论考试、上机考试、实践应用考核费用) |
三、高级考试科目说明
序号 | 课程名称 | 选用教材 |
---|---|---|
科目一 | 高级数据分析技术 | 《大数据与机器学习实践方法与行业案例》 ISBN:9787111556800 |
本课程重在不同算法的应用,以及模型的优化等,以机器学习、深度学习、图形挖掘等高级技术为主,以及相关应用。如个性化分析、推荐、社交关系分析等。 | ||
科目二 | 地理数据分析 | 《空间数据分析理论与实践》ISBN:9787307073951 |
本课程介绍了地理空间数据分析在科学以及决策相关研究方面的重要性,最新的探索性空间数据分析和空间建模方法,以及如何表达在地理空间中的属性的问题等。 | ||
科目三 | 文本数据分析与挖掘 | 《Python自然语言处理》ISBN:9787115333681 |
本课程以自然语言为主,是计算机科学领域与人工智能领域中的一个重要方向。它研究能够实现人与计算机之间用自然语言进行有效通信的各种理论和方法,也是人工智能、文本挖掘、语料库语言学的基础。 | ||
科目四 | 大数据分析建模 | 《大数据分析与预测建模》ISBN:9787115463661 |
本课程使用R语言进行数据分析,用R语言进行高级分析;“机器学习、大数据分析和可视化”,涉及机器学习的概念,社交媒体、移动分析和可视化,大数据分析的行业应用等。 | ||
考试说明 | · 理论综合试卷(准高级):由科目一高级数据分析技术、科目二地理数据分析、科目三文本数据分析与挖掘,科目四大数据分析建模共4门课程构成。 · 题型题量:理论综合试卷题量为2道综合案例应题。 · 考试方式:笔试,150分钟,各科目分别达到60分及格。 |
|
· 实践应用考核(准高级):按要求提交一份行业数据分析论文。 · 考核方式:自主完成论文的撰写,并在线提交论文,经指导和答辩,分数60分及格。 |
||
· 答辩考核(高级):相关工作5年后申请答辩,达到60分即通过考核。 | ||
· 考试费:8600元(包含理论与实践考试费、答辩费)[2019年修订] |