伴随着国家大数据战略的逐步落实以及大数据行业的蓬勃发展,数据科学被越来越多的高校和企业所重视,大数据专业师资、技术人才的需求日趋加大。为进一步推动数据科学的发展,帮助更多高校和企业培养大数据专业人才,大数据教育联盟和博雅大数据学院将于10月21日-10月24日联合推出“大数据分析的模型与应用”专题培训班。
本期培训将采用案例式教学,将企业应用案例贯穿到培训的全过程。通过系统的培训学习,学员可以有效掌握大数据分析的基本原理与模型算法,了解大数据分析的学术前沿和产业应用,为日后教学、科研等工作的开展奠定基础。欢迎从事数据科学教学与科研工作的青年教师、从事数据分析工作的企业技术人员积极报名参加。
课程内容
? 数据科学介绍
本讲主要介绍数据科学的基本原理和内容,机器学习的基本概念、方法和应用概述,以及本课程涵盖的主要内容。
? 数据预处理
本讲首先介绍数据的类型及相似度度量方式,随后重点介绍几种典型的数据预处理方法,包括特征编码、缺失值处理、数据标准化、特征离散化和离群值检测等。
? 回归模型
本讲主要介绍回归的概念及解决的主要问题,介绍正则化、偏差方差分析,并重点介绍线性回归模型,包括一元线性回归、多元线性回归以及岭回归和LASSO。
? 分类模型
本讲介绍有监督学习中非常重要的一大类——分类模型,首先概述分类模型的原理与应用,随后重点介绍分类算法K近邻、决策树、支持向量机、朴素贝叶斯和多层感知机。
? 集成模型
本讲主要介绍分类算法到集成算法的过度,介绍Bagging和Boosting两类集成方法及其典型算法,包括随机森林、AdaBoost、GBDT等算法。
? 聚类模型与数据降维
1、聚类模型
本讲主要介绍无监督学习中的聚类模型,首先介绍聚类模型的基本概念及应用,随后重点介绍聚类算法中的K-means算法及其变种、层次聚类算法和DBSCAN算法。
2、数据降维
本讲主要介绍线性降维和非线性降维算法,首先介绍降维中的基本概念,随后重点介绍线性降维算法——主成分分析PCA、线性判别分析LDA和独立成分分析IDA,并重点介绍非线性降维算法——多维尺度变换MDS、核主成分分析KPCA、局部线性嵌入LLE等算法。
? 自然语言处理与文本分析
本讲主要介绍一些常用的文本分析技术,介绍文本分析的主要流程,重点介绍文本表示模型TF和TF-IDF、文本数据降维方法LSA和pLSA、主题分析中的LDA模型和情感分析。
? 图与社交网络分析
本讲主要介绍图分析以及网络分析的基本概念和主要算法,首先介绍图研究的起源、小世界理论、随机图等基本概念,随后介绍几种中心度度量方式,并介绍链接分析中PageRank算法和HITS算法等,最后介绍社区发现算法,包括GN算法、Newman快速算法和Fast Unfolding算法。
? 分布式计算
本讲主要介绍各类分布式系统的构架与组成部件,首先介绍当前流行的分布式系统Hadoop,包括分布式存储系统HDFS和分布式数据处理框架MapReduce,介绍一些算法如K-means、PageRank的MapReduce实现方式,最后介绍分布式建模分析的工具Spark。
? 行业应用
1、交通大数据
介绍大数据技术在交通领域的应用和实践案例。
2、金融/医疗大数据
介绍大数据在银行业、保险业和证券行业的应用,介绍个人征信案例和大数据风控。
介绍健康医疗大数据现状,何为精准医疗,医院有哪些数据,健康医疗大数据的应用场景、医疗解决方案的经典案例,介绍健康医疗大数据的方案设计沙盘。
培训特色
? 权威的数据科学理论体系
北京大学已率先建立本科、硕士和博士三个层次完整的数据科学体系,本期培训采用北京大学数据科学专业体系。
? 全流程的实战演练,紧密结合行业应用
培训期间,大数据实训平台免费供学员使用,学员可以真正做到学以致用。
? 师资力量雄厚
由大数据教育联盟和博雅大数据学院专家团队联合授课。
? 课程针对性强,并具有权威认证
课程考核合格,颁发北京大数据研究院大数据讲师证书、大数据分析师证书。

主讲专家
欧高炎:北京大学计算机博士、计算数学博士后,博雅大数据学院院长,北京大数据研究院大数据教育研究中心主任,大数据教育联盟秘书长。
陈艳艳:博雅大数据学院特聘讲师,北京工业大学城市交通学院院长,新世纪百千万人才工程入选者。在交通大数据、城市交通规划与管理、智能交通与系统仿真等领域取得了一系列创新性成果。
宋国杰:博雅大数据学院特聘讲师,北京大学副教授。主要从事数据挖掘、机器学习、社会网络分析和智能交通系统等方面的研究与开发工作。
朱占星:博雅大数据学院特聘讲师,英国爱丁堡大学信息学院博士。现任北京大学大数据研究中心、北京大数据研究院研究员。主要研究方向为机器学习。长期从事人工智能、机器学习、深度学习以及大数据分析等方面的研究与应用。
李斌阳:博雅大数据学院特聘讲师,毕业于香港中文大学,现就职于国际关系学院任副教授。长期以来从事自然语言处理与社会计算的研究工作,承担、参与科研项目10 余项,包括国家863计划、自然科学基金、香港创新科技基金等。累计在国际顶级期刊、会议发表论文30余篇。
报名须知:
报名截止日期:2017年10月18日
建议申报人员:高校教研室主任、数据科学学科负责人、大数据骨干教师、企业高管、企业技术人员
授课时间:2017年10月21日-10月24日
授课地点:北京
报到时间:2017年10月20日 09:00-17:00
报到地点:北京
联系方式:王敬伟 18601990086
jingweiw@boyabigdata.cn
缴费说明
收费标准:6800元/人(食宿自理)
优惠政策①:同一联盟理事单位满3人每人减500元
优惠政策②:同一联盟理事单位满5人每人减1000元
缴费方式:可提前转账或现场刷卡
汇款形式(人民币):请务必在备注栏里注明“10月培训+高校/单位名称+姓名”,汇款后请及时告知王老师 18601990086
汇款信息:
收款人名称:北京博雅大数据科技有限公司
开户银行:工商银行北京海淀西区支行
银行账号:0200004509201223262
发票提示:培训费发票由指定单位北京博雅大数据科技有限公司代为开具。
往期培训案例

2017暑期学校——大数据分析的理论与应用
培训时间:2017年7月13日-7月28日
参训学员:50人
(备注:点击标题链接可查询培训详细介绍)

“数据科学与大数据技术”内蒙古医科大学专题师资培训
培训时间:2017年7月16日-7月30日
参训学员:27人
(备注:点击标题链接可查询培训详细介绍)

第二期“数据科学与大数据技术”专题师资培训
培训时间:2017年4月10日-5月19日
参训学员:30
(备注:点击标题链接可查询培训详细介绍)
请输入标题 bcdef
欢迎关注大数据教育联盟公众号

邮箱:services@bdealliance.org
请输入标题 abcdefg






共有条评论 网友评论