大数据分析人才培养模式的探索上课讲义.ppt
大数据分析人才培养模式的探索2国内外人才需求与项目状况国内外人才需求与项目状况1我们的人才培养平台与进展我们的人才培养平台与进展2主要内容主要内容3456789数据分析师数据分析师数据到价值关键环节数据到价值关键环节数据到价值核心环节数据到价值数据到价值基础基础环节环节数据挖掘工程师数据挖掘工程师算法工程师算法工程师10掌握Oracle,HiveSQL等数据库管理和使用技术熟悉Linux/Unix开发环境,能应用Shell、Python,Perl等脚本语言熟练掌握Hadoop技术和MapReduce算法计算机计算机技能技能编程编程技能技能业务和业务和管理技能管理技能基于大数据挖掘和统计建模结果撰写数据分析报告,为其他业务部门提供数据分析支撑精通JAVA、C+、SAS、R、python、ruby、spark等数据挖掘和统计分析编程语言熟练掌握统计建模和数据挖掘算法原理和技术协助团队进行相应的算法改进大数据挖掘工程师大数据挖掘工程师大数据挖大数据挖掘和统计掘和统计建模技能建模技能11l基本的数据基本的数据库管理、网管理、网络信息信息获取技取技能能l熟熟悉悉Linux/Unix操作系操作系统了解分布式了解分布式计算原理算原理l熟熟悉悉Hadoop技技术和和MapReduce算法算法原原理理l掌握掌握SAS、R等等数据挖数据挖掘掘和和统计分分析析编程程语言言l精通精通关关联规则、聚、聚类分析、判分析、判别分析分析、数、数据清洗、据清洗、数据降数据降维、决策、决策树、数据、数据流挖流挖掘、文本挖掘、社掘、文本挖掘、社交网交网络、神、神经网网络、支、支撑向量机撑向量机等等大数据挖掘技大数据挖掘技术和和统计建模建模技能技能和相关算和相关算法法l从海量数据中从海量数据中发现对企企业的潜在价的潜在价值,提,提炼出具出具体体统计问题,并上升,并上升为具体具体业务l撰撰写数据分析写数据分析报告,告,为企企业运运营、产品品、研研发和和销售提供决策支售提供决策支持持计算机技能计算机技能编程技能编程技能大数据挖掘大数据挖掘和统计建模和统计建模技能技能业务和业务和管理技能管理技能数据分析师数据分析师CodingCoding1213MBAMBA计算机计算机统计与运筹学统计与运筹学商学(市场营销、电子商务等)商学(市场营销、电子商务等)在大数据环境下处理、在大数据环境下处理、在大数据环境下处理、在大数据环境下处理、分析数据的能力分析数据的能力分析数据的能力分析数据的能力遴选出的遴选出的2020个最顶尖个最顶尖大数据分析硕士项目大数据分析硕士项目14DataAnalyticsCapstoneProjectAdvancedBusinessAnalyticsOrganizationalDesignandImplementationEconomicAnalysisFinancialAccountingPrinciplesofFinanceDecisionMakingUnderUncertaintyStatisticsforITManagersProfessionalWritingMeasuringSocialAppliedEconometricsDataAnalysisinHealthFieldsBusinessProcessModelingLargeScaleDataAnalysisTextAnalytics2 Projects2 Projects4 Electives4 Electives4 courses in 4 courses in OrganizationaOrganizational Management l Management and Strategyand Strategy5 courses in Analytics and Technique ManagementDistributedSystemsDatabaseManagementObjectOrientedProgramminginJavaDataMiningAnalytics&BusinessIntelligenceDataWarehousingDigitalTransformationu计算计算机机方向方向CMU:M.S.of Information Systems Management Business Intelligence and Data Analytics15u统计统计学和运筹学方向学和运筹学方向York:Master of Science in Business AnalyticsThemeGalleryisaDesignDigitalContent&ContentsmalldevelopedbyGuildDesignInc.12-credit electives21-credit required9-credit 9-credit projectprojectCoursesinmarketing/supplychainmanagement/general(quantitative+qualitative)IntrotopredictivemodelingDatamanagementandprogrammingSkillsforleadershipModelsandapplicationsinORDatamanagementandprogrammingIIAnalyticsconsultingCaseanalysisandpresentationskillsMultivariatemethodsforbusinessanalytics16Samplecourses:dataminingforbusinessintelligencedecisionmodelseconometricsFinancialaccountingandreportingStatsanddataanalysisFirms&marketsFoundationsoffinanceTheglobaleconomyLeadershipinorgMarketingOperationsmanagementStrategy7 required 7 required coursescoursesE ElectiveslectivesuMBAMBA以以NYU为例例172-credit 2-credit projectproject6-credit 6-credit application application coursescourses22-credit 22-credit requiredrequiredu商学(市场营销、电子商务方向)商学(市场营销、电子商务方向)UMD:M.S.in Business-Marketing AnalyticsMarketForecastingPricingAnalyticsandStrategiesRetailAnalyticsWebAnalyticsCustomerEquityManagement/CRMMarketing-basedManagementCustomerAnalysisAdvancedMarketingAnalysisStatisticalProgrammingBusinessCommunicationsBusinessEthicsDataScienceMarketingResearchandAnalysis18大数据分析大数据分析应用型人才的培养面用型人才的培养面临两个方面的挑两个方面的挑战。首先,大数据分析人才是交叉学科人才,除了首先,大数据分析人才是交叉学科人才,除了统计学科学科的的统计建模、数据挖掘等内容外,建模、数据挖掘等内容外,还需具需具备计算机学科算机学科的相关知的相关知识,应用用领域的背景域的背景(学科交叉学科交叉);其次,大数据分析其次,大数据分析应用型人才,要用型人才,要培养培养大数据大数据采集、管采集、管理、分析、决策的理、分析、决策的综合能力合能力,需要政企,需要政企产学研等多部学研等多部门协同培养同培养(培养培养过程交叉)程交叉)。这两个交叉决定必两个交叉决定必须协同同创新。新。2,我我们的人才培养平台与的人才培养平台与进展展19大数据大数据分析的分析的本本质主要主要有二:有二:第一,如何架构大数据第一,如何架构大数据环境来管理、存境来管理、存储和提取和提取数据;数据;第二,如何根据第二,如何根据“在在线”和和“实时”等等模式从数模式从数据中据中发掘出价掘出价值。这两个方面是两个方面是统计学关注的重点内容。学关注的重点内容。大数据技大数据技术以开源以开源为主,迄今主,迄今为止,尚未形成止,尚未形成绝对技技术垄断。断。即便是即便是IBM、甲骨文等行、甲骨文等行业巨擘,巨擘,也同也同样是集成了开源技是集成了开源技术.我我们有很多大数据公有很多大数据公司和行司和行业,只要我,只要我们方向正确、方向正确、应该在人才培养在人才培养上,至少在中等上,至少在中等层次人才培养上有次人才培养上有竞争力。争力。20国内国内试点有点有:2013年,北京航空航天大学与慧科教育合年,北京航空航天大学与慧科教育合作开作开办了了“大数据技大数据技术与与应用用”软件工程件工程硕士士研究研究,主要主要是面向是面向计算机算机领域域的的项目。目。今年今年5月,清月,清华大学集中校内若干学院力量大学集中校内若干学院力量也开也开办了大数据了大数据硕士士项目,也主要面向目,也主要面向计算机算机领域域21平台平台中的中的五所高校在大数据分析五所高校在大数据分析领域各具特色,域各具特色,优势互互补。中国人民大学中国人民大学:在大数据分析的全面性和在大数据分析的全面性和综合性方合性方面在国内名列前茅面在国内名列前茅;北京大学和中国科学院大学北京大学和中国科学院大学:大数据分析前沿技大数据分析前沿技术研究的重要基地研究的重要基地;中央中央财经大学和首都大学和首都经济贸易大学易大学:在在财经和管理和管理领域的大数据分析域的大数据分析应用用领域具有域具有鲜明特色。明特色。22平台中的平台中的业界界单位都是大数据位都是大数据应用的用的翘楚,代表了大数据楚,代表了大数据分析的方向和社会需求。分析的方向和社会需求。权威大数据媒体:威大数据媒体:人民日人民日报、新、新华社、中央社、中央电视台台、全全国手机媒体国手机媒体专业委委员会会、华闻传媒媒产业创新研究院新研究院运运营商:商:中国移中国移动、中国、中国联通、中国通、中国电信信权威大数据分析与云威大数据分析与云计算系算系统开开发者:者:SAS(北京)有(北京)有限公司限公司、西部云基地、西部云基地商商业大数据:阿里巴巴、京大数据:阿里巴巴、京东、华通人通人等等政府大数据:政府大数据:龙信数据(北京)有限公司信数据(北京)有限公司,中科院,中科院计算算机网机网络信息中心等。信息中心等。医学大数据医学大数据:中国中医科学研究院中国中医科学研究院23这些政府部些政府部门或企或企业将将为大数据分析大数据分析硕士建立士建立实习基地,基地,提供数据和提供数据和筛选重要社会和重要社会和经济问题供平台供平台交流使用,交流使用,选派有丰富大数据分析派有丰富大数据分析经验的的专家担任家担任大数据分析大数据分析硕士研究生的校外士研究生的校外导师,已聘已聘20多位校多位校外外导师.本平台本平台是一个向是一个向业界界人才需求人才需求单位开放的平台位开放的平台,将将建成一个建成一个政、企、政、企、产、学、研、学、研有机融和的有机融和的协同同创新新平台平台242526专业必修课课程名称程名称主要内容主要内容学学分分大数据分析大数据分析计算机基算机基础操作系操作系统简介、分布式系介、分布式系统简介和介和结构化(构化(SQL)、分布式数据)、分布式数据库(NoSQL、HBase、Hive、Pig等)、数据的整合等)、数据的整合3大数据分布式大数据分布式计算算Hadoop分布式平台、分布式平台、MapReduce并行并行编程、程、Storm实时计算等算等3大数据分析大数据分析统计基基础描述、多元、描述、多元、时序、空序、空间、可、可视化等化等3大数据挖掘与机器学大数据挖掘与机器学习抽抽样、分、分类、预测、聚、聚类、关、关联、降、降维、集成算法等、集成算法等3非非结构化大数据分析构化大数据分析文本挖掘、社交网文本挖掘、社交网络、数据流等、数据流等3大数据分析案例大数据分析案例3必修合必修合计18 应用用统计专业硕士(大数据分析方向)士(大数据分析方向)专业课程程设置置27教学计划教学计划大数据分析大数据分析硕士士项目将目将尝试个个性化的教学方式性化的教学方式:统计学背景的研究生学背景的研究生侧重重计算机学科相关知算机学科相关知识的学的学习计算机背景的研究生算机背景的研究生侧重重统计学知学知识的学的学习大数据分析大数据分析硕士士选修修课由各校分由各校分别开开设,彰,彰显五校自身特五校自身特色。色。课性质应修学分课程名称学时学分合计开课学期学期学分一二三四必修课18大数据分析计算机基础5433大数据分布式计算5433大数据分析统计基础5433大数据挖掘与机器学习5433非结构化大数据分析5433大数据统计建模54332829师资与首批实验班学生师资与首批实验班学生大数据分析大数据分析硕士培养士培养协同同创新平台新平台为每每门必修必修课均配均配备了了4人以上的教学人以上的教学团队教学教学团队由国家千人由国家千人计划入划入选者、者、长江学者、江学者、国家杰出青年基金国家杰出青年基金获得者在内,在大数据研究得者在内,在大数据研究和和应用方面有用方面有较高造高造诣的中青年学者的中青年学者组成成首批首批55名学生名学生,7所高校所高校 28男生男生,27女生女生 本科本科专业:统计学学31人人,数学数学15人人,计算机算机金融金融物理等物理等9人人 基本基本毕业于于985和和211高校高校303132