姓名:王磊
学历及学位: 博士研究生学历,经济学博士学位
职 称: 高级统计师
社 会 兼 职: 北京大学客座教授
工作经历:
2018.6- 银河时空大数据科技(北京)有限公司,首席科学家
2014.1–2018.6 中国国际经济交流中心博士后站(金融大数据方向)
2007.7–2017.1 国家统计局国际统计中心高级统计师,先后从事统计模型研究、大数据预测美国经济等工作。
某大型金融集团大数据业务负责人,带领80多人团队。
特长:AI算法、大数据建模、统计建模
熟练使用Python、Matlab、R等编写程序;熟悉Hadoop和Spark框架
大数据建模领域社会认可:
获邀为上海统计系统首届大数据建模大赛评委;
曾任北京大学肿瘤医院PET-CT图像挖掘项目首席数据科学家
近5年大数据应用/人工智能项目经验(按领域及结束时间顺序)
金融领域
1、2018.4— 强化学习AI选股项目
l 借助强化学习技术对股票池个股开展自主交易操作;
l 借助成熟策略定期更新股票池。
2、2017.9— 对公客户贷后风险预警项目
l 借助网络爬虫技术对分行有贷对公客户外部信息实行近实时监控,借助NLP、文本挖掘、情感分析等技术实现客户风险点归类与等级划分;
l 以预警事件驱动方式触发风险预警及贷后管理(向客户经理推送风险信息)。
3、2017.6—9 小额信贷生成模型及自动化审批探索研究
l 借鉴GAN(生成式对抗网络)、VAE(变分自编码器)等深度学习模型思想结合KNN等传统机器学习模型,生成违约数据;
l 评估各类生成模型效果,并在生成数据基础上结合信用评分模型给出建立自动化审批系统的可行性评估与操作方案。
4、2017.2—8 零售业务反欺诈项目
l 申请反欺诈;
l 交易反欺诈-基于行内现有交易渠道数据结合外部数据,利用深度学习、机器学习、图论等算法构建反欺诈模型完善专家规则库。
4、2016.8—2017.12 国际石油期货价格预测项目
l 周、月、年度石油期货价格预测(布伦特、WTI);
l 建立30多种预测模型,涵盖时间序列、机器学习、信号分解、系统动力等模型;
l 使用BiLSTM模型挖掘社交媒体文本信息,提炼看跌指数。
5、2016.1-7 主持“基于大数据技术的P2P平台风险甄别项目”
l 负责网络爬虫工作(爬取8万条论坛网友评论帖子和30万条新闻)
l 负责NLP、文本挖掘工作(生成词、段向量,对网友评论和新闻做情感分析)
医疗领域
1、2016.1— 北京肿瘤医院PET-CT图像挖掘项目(辅助诊疗)
l PET-CT图像特征提取;
l 深度学习模型构建(构建2D、3DCNN识别肿瘤,降低假阳性率)
法律领域
1、2018.4— 智能合同审查&法律文本信息提取项目
l 非涉诉法律合同审查——针对不同合同类别依据法审点审查合同文本;
l 涉诉法律文本关键信息提取——金额、证据项、证据瑕疵、法院态度等;
l 技术——规则+深度学习支持的NLP语义相似模型(如CNN-BiLSTM-Attention)。
经济统计领域
1、2018.7— 某一线城市政府智慧决策项目
l AI+经济,AI+投资,AI+产业链;
l 借助机器学习、AI技术(NLP技术)全面提升政府决策智能化程度。
2、2014.10—2015.12 主持国家统计局大数据预测美国经济项目
l 编写网络爬虫程序
l 解决Facebook/Twitter社交网络文本主题分类/词向量/情感分析等NLP问题。
近5年金融数据挖掘方向主要研究成果(按是否为第1作者及时间顺序)
[1]王磊. 破解小微企业融资难问题(核心章节包括大数据技术在小微客户风控领域的应用)[C].博士后报告, 2018
[2]王磊.小微企业银行贷款可得性影响因素研究——5081家小微企业银行融资行为考察[J].经济统计学(季刊), 2015, V32(2): 51-58
[3]王磊、范超、解明明. 数据挖掘模型在小企业主信用评分领域的应用[J].统计研究, 2014, V31(10)(CSSCI;国家社科基金A类期刊)
[4]范超、王磊. 基于大数据和文本挖掘技术的P2P平台风险甄别研究[J].统计研究,2017, V34(2)(CSSCI;国家社科基金A类期刊)
近5年在统计/金融/经济领域研究成果(按发表形式/是否第1作者及时间顺序)
期刊(第1作者),含8篇CSSCI文章:
[1]王磊、原鹏飞、王康. 是什么影响了中国城镇家庭的住房财产持有?—兼论不同财富阶层的差异[J].统计研究,2016,V33(12):44-57(CSSCI;国家社科基金A类期刊)
[2]王磊、王康.地区特征与中国地区间相对价格水平收敛性[J].山西财经大学学报, 2016, V38(8): 12-24(CSSCI)
[3]王磊.小微企业银行贷款可得性影响因素研究——5081家小微企业银行融资行为考察[J].经济统计学(季刊), 2015, V32(2): 51-58
[4]王磊、范超、解明明. 数据挖掘模型在小企业主信用评分领域的应用[J].统计研究, 2014, V31(10): 106-112(CSSCI;国家社科基金A类期刊)
[5]王磊、范超.购买力平价(PPP)与汇率背离原因研究[J].数量经济技术经济研究, 2013, V30(11): 125-143(CSSCI;国家自然科学基金A类期刊,教育部A类期刊)
[6]王磊.购买力平价(PPP)测算方法研究评述与展望[J].统计研究, 2012, V29(6): 106-112(CSSCI;国家社科基金A类期刊)
[7]王磊.我国地区间相对价格水平收敛性再检验—基于面板门限套利模型的经验研究[J].当代经济科学, 2012,V34(4) :16-25 (CSSCI)
[8]王磊、周晶.对中国省级地区相对价格水平的估计—基于一般化空间CPD模型的研究[J].统计与信息论坛, 2012,V27(8): 43-49(CSSCI)
[9]王磊、吕璐、解明明.经济增长、结构变迁与中国能源消费—基于半参数广义可加模型的经验研究[J].华东经济管理, 2012,V26(8)(CSSCI)
期刊(第2作者),含4篇CSSCI文章:
[1]范超、王磊. 基于大数据和文本挖掘技术的P2P平台风险甄别研究[J].统计研究,2017, V34(2)(CSSCI;国家社科基金A类期刊)
[2]王康、王磊、罗玉波.我国区域食品价格差异收敛性检验--基于微观价格数据的空间计量与动态效应分析 [J].统计与信息论坛, 2016,V31(5): 49-56(CSSCI)
[3]周晶、王磊、金茜.中国工业行业能源CES生产函数的适用性研究及非线性计量估算[J].统计研究, 2015, V32(4): 51-58(CSSCI)
[4]原鹏飞、王磊. 我国城镇居民住房财富分配不平等及贡献率分解研究[J].统计研究, 2013, V30(12): 69-76(CSSCI)
专著中析出的文献:
[1]王磊、范超、解明明.地区投入产出数据协调性评估模型—基于非参数与时变系数模型的研究[A]. 2012全国统计建模大赛获奖论文选[C].北京:中国统计出版社, 2013:73-109.
[2]王磊、吕璐、范超.宏观收入分配、结构调整与中国经济增长--基于随机前沿分析模型的经验研究[A]. 2010全国统计建模大赛获奖论文选[C].北京:中国统计出版社, 2012:444-472.
国际会议论文:
[1] Wanglei. Regional Characteristics and China inter-regional relative price level convergence[C]. Paper presented in the 60th Conference held by International Statistical Institute (ISI), 2015, 7