运筹学 数据模型与决策bgsm.pptx
《运筹学 数据模型与决策bgsm.pptx》由会员分享,可在线阅读,更多相关《运筹学 数据模型与决策bgsm.pptx(66页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 数据 模型与决策 西安理工大学工商管理学院5/21/20231 数据 模型与决策 Data Models and Decisions (DMD)学习内容学习内容一一数据分析(数据分析(Data Analysis)简记:简记:DA 二二 线性规划线性规划(Linear Programming)简记:简记:LP三三 动态规划动态规划(Dynamic Programming)简记:简记:DP四四 决策分析决策分析(Decision Analysis)简记:简记:DEA 5/21/20232n预修课程:n 线性代数n 管理学n 经济学n教材:n管理运筹学韩伯棠5/21/20233学习方式n1 课堂讲
2、授课堂讲授n2 案例讨论、分析案例讨论、分析n3 上机上机n4 平时作业平时作业n5 案例报告案例报告n6 考核考核:平时平时成绩成绩(20%)案例案例成绩成绩(30%)笔试成绩笔试成绩(50%)上课、实验考勤成绩,作业成绩成绩分析5/21/20234一、数据分析5/21/20235背景n 数据分析是研究如何收集、分析数据并从中提取数据分析是研究如何收集、分析数据并从中提取有用信息、知识供决策之用的方法,属于有用信息、知识供决策之用的方法,属于“统计学统计学”科学。科学。n 由于统计问题涉及的数据量都有一定规模且计算由于统计问题涉及的数据量都有一定规模且计算复杂,必须借助统计软件作为分析工具。
3、复杂,必须借助统计软件作为分析工具。n 常用的统计软件(如常用的统计软件(如SASSAS、SPSSSPSS)都是针对统计)都是针对统计专业人员编写的,不易掌握,另一方面,非统计专专业人员编写的,不易掌握,另一方面,非统计专业的学生,在今后的工作环境中运用专业统计软件业的学生,在今后的工作环境中运用专业统计软件的机会较少。因此,可充分应用的机会较少。因此,可充分应用 Microsoft Excel Microsoft Excel软件。软件。5/21/20236EXCEL软件简介n Microsoft ExcelMicrosoft Excel是一个功能强大、使是一个功能强大、使用灵活方便的电子表格
4、软件,也是最为流行用灵活方便的电子表格软件,也是最为流行的办公自动化软件,本课程主要利用的办公自动化软件,本课程主要利用EXCELEXCEL的统计分析功能和丰富的统计图表。的统计分析功能和丰富的统计图表。n 5/21/20237主要内容 第一章第一章 数值型变量数据分析数值型变量数据分析 1.1.数值型单变量数据分析数值型单变量数据分析 2.2.数值型双变量数据分析数值型双变量数据分析 第二章第二章 属性变量数据分析属性变量数据分析 1.1.单变量属性数据分析单变量属性数据分析 2.2.双变量属性数据分析双变量属性数据分析 第三章第三章 回归模型及分析回归模型及分析 1.1.线性回归线性回归
5、2.2.简单非线性回归简单非线性回归 3.3.多元回归多元回归 5/21/20238第一章第一章 数值型变量数据分析数值型变量数据分析 n1.1 数值型单变量数据分析n例1.1 某班DMD考试成绩如下:n80 85 76 78 67 93 88 90 75 66 65 77 74 83 81 70 83 64 96 60 79 86 80 71n试用相关统计量对成绩进行分析。5/21/20239 ExcelExcel有有3 3种分析工具用来描述数值型种分析工具用来描述数值型单变量数据:单变量数据:n1.1.描述性统计描述性统计n2.2.直方图直方图n3.3.排位和百分比排位排位和百分比排位5/
6、21/2023101.1.1 描述性统计 该统计工具提供了反映集中趋势、离散程度以及偏该统计工具提供了反映集中趋势、离散程度以及偏移程度的统计指标共移程度的统计指标共16个。个。步骤:步骤:1)打开)打开“工具工具”菜单;菜单;2)选择)选择“数据分析数据分析”;3)选择)选择“描述统计描述统计”;4)根据对话框,选择或输入相关数据。根据对话框,选择或输入相关数据。C:My Documents模拟成绩.xls5/21/202311描述统计指标说明:n1.平均:一组数据的平均值。平均:一组数据的平均值。2.2.中值(中位数):数据序列中位于中间的值。中值(中位数):数据序列中位于中间的值。3.3
7、.模式(众数):发生次数最多的值。模式(众数):发生次数最多的值。C:My Documents模拟成绩.xls 5/21/202312n4.4.标准差:反映数据的离散程度标准差:反映数据的离散程度。C:My Documents模拟成绩.xls5/21/2023135.峰值(峰态):它是衡量对称分布陡缓程度的指峰值(峰态):它是衡量对称分布陡缓程度的指标。标。n 当分布较正态分布平坦时,该指标为正;当分布较正态分布平坦时,该指标为正;n 当分布较正态分布陡峭、尖时,该指标为负。当分布较正态分布陡峭、尖时,该指标为负。5/21/2023146.偏斜度:它是衡量数据分布不对称程度的指标。偏斜度:它是
8、衡量数据分布不对称程度的指标。当某些极端值出现在正方向时,称为当某些极端值出现在正方向时,称为“向右偏离向右偏离”;当某些极端值出现在负方向时,称为当某些极端值出现在负方向时,称为“向左偏离向左偏离”。5/21/202315 7.区域(全距):数据中最大值与最小值之差。区域(全距):数据中最大值与最小值之差。8.最小值:样本中的最小值。最小值:样本中的最小值。9.最大值:样本中的最大值。最大值:样本中的最大值。10.求和:样本数据的和。求和:样本数据的和。11.计数:样本中数据个数。计数:样本中数据个数。12.最大最大k值:给出数据中第值:给出数据中第k个最大值。个最大值。13.最小最小k值:
9、给出数据中第值:给出数据中第k个最小值。个最小值。C:My Documents模拟成绩.xls5/21/2023161.1.2 直方图该统计工具提供一张频数分布表和一张直方图。该统计工具提供一张频数分布表和一张直方图。步骤:步骤:1)确定直方图的区间个数,填入每个组界值;确定直方图的区间个数,填入每个组界值;2)打开)打开“工具工具”菜单;菜单;3)选择)选择“数据分析数据分析”;4)选择)选择“直方图直方图”;5)在)在“直方图直方图”对话框中填入数据。对话框中填入数据。C:My Documents模拟成绩.xls5/21/202317输出图表的修饰:n1)单击条块选中图形;)单击条块选中图
10、形;n2)选择)选择“数据系列格式数据系列格式”;n3)在对话框)在对话框“图案图案”中,改中,改“区域区域”为无;为无;n4)单击)单击“选项选项”,改,改“分类间距分类间距”为为0;n5)单击)单击“确定确定”。nC:My Documents模拟成绩.xls5/21/2023181.1.3 排位和百分比排位该统计工具提供一张含有升序排列的数据表格以及其该统计工具提供一张含有升序排列的数据表格以及其排列后的序号、百分位号。排列后的序号、百分位号。步骤:步骤:1)打开)打开“工具工具”菜单;菜单;2)选择)选择“数据分析数据分析”;3)选择)选择“排位与百分比排位排位与百分比排位”。4)根据对
11、话框,选择或输入相关数据。根据对话框,选择或输入相关数据。数据模型课件模拟成绩.xls5/21/202319n练习n下列数据为15项资产的出售价格(万元),试用描述性统计、直方图、排位和百分比分析工具进行数据分析:¥260 380 436 310 396 448 374 312 406 348 372 418 392 384 4525/21/2023201.2 数值型双变量数据分析n对两组数值型数据分析它们之间的相关关系。有两种分对两组数值型数据分析它们之间的相关关系。有两种分析工具。析工具。n1.1.散点图散点图n2.2.相关系数相关系数5/21/202321例1.2n某公司欲调查办公楼的租
12、金和空置率间的关系,工作某公司欲调查办公楼的租金和空置率间的关系,工作人员在人员在1010个不同的城市里,对办公楼中每平方米的月个不同的城市里,对办公楼中每平方米的月租金和空置率的数据记录如下:租金和空置率的数据记录如下:n试作散点图,并判断两变量间的相关性。试作散点图,并判断两变量间的相关性。城市12345678910空置率 311659257108月租金 52.54.754.534.5433.25 2.755/21/2023221.2.1 散点图n该统计工具用来描述两个变量之间的关系。通常用该统计工具用来描述两个变量之间的关系。通常用在直观判断基本关系或用在回归模型使用前。在直观判断基本关
13、系或用在回归模型使用前。n步骤:步骤:1)输入变量)输入变量X和和Y的数值;的数值;n 2)选中数据;)选中数据;n 3)打开)打开“图表向导图表向导”;n 4)对散点图进行编辑。)对散点图进行编辑。房租模拟.xls房租模拟.xls5/21/2023231.2.2 相关系数n相关系数用来说明两个变量之间的相关密切程度。相关系数用来说明两个变量之间的相关密切程度。步骤:步骤:1)打开)打开“工具工具”菜单;菜单;2)选择)选择“数据分析数据分析”;3)选择)选择“相关系数相关系数”。4)根据对话框,选择或输入相关数据。根据对话框,选择或输入相关数据。nC:My Documents房租模拟.xls
14、5/21/202324n相关系数的基本计算公式:相关系数的基本计算公式:n两个数列的协方差:两个数列的协方差:n自变量数列的标准差:自变量数列的标准差:n因变量数列的标准差:因变量数列的标准差:5/21/202325相关程度判断标准:相关程度判断标准:1.当当 r=1时,时,X与与Y为线性相关;为线性相关;2.当当r0.3时,时,X与与Y为微弱相关;为微弱相关;3.当当 0.3r0.5时,时,X与与Y为低度相关;为低度相关;4.当当 0.5r0.8时,时,X与与Y为显著相关;为显著相关;5.当当 0.8r1时,时,X与与Y为高度相关。为高度相关。5/21/202326n练习 下面是10家商店销
15、售额和利润率的资料:n(1)画出散点图;(2)计算每人月平均销售额与利润率的相关系数。商店每人月平均销售额(万元)利润率(%)1612.62510.43818.5413.0548.16716.37612.3836.2936.610716.85/21/2023275/21/202328 2 2 属性变量数据分析属性变量数据分析 2.1单变量属性数据分析单变量属性数据分析用途:对性别、职称、品牌等属性数据进行分布描述。用途:对性别、职称、品牌等属性数据进行分布描述。例例 2.1 对某城市饭店业进行前景调查,问卷数据如下表对某城市饭店业进行前景调查,问卷数据如下表 所示。要求统计出各项数据的分布。所
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹学 数据模型与决策bgsm 数据模型 决策 bgsm
限制150内