《数据作用6ppt课件.ppt》由会员分享,可在线阅读,更多相关《数据作用6ppt课件.ppt(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据作用6ppt课件 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望部分模型完全建立部分模型完全建立在数据的基础上在数据的基础上.如数据拟合如数据拟合以及经验模型以及经验模型 2.利用数据来估计模型中出现的参数值利用数据来估计模型中出现的参数值,称称为为模型参数估计模型参数估计.3.利用数据进行利用数据进行模型检验模型检验,通常用实际数据,通常用实际数据与模型运算出的相应理论值进行比较与模型运算出的相应理论值进行比较.数据是建立数学模型的重要依据!数据是建立数学模
2、型的重要依据!6.1 数据的收集与整理数据的收集与整理 各种类型的数据为我们认识事物的内在规律、各种类型的数据为我们认识事物的内在规律、研研 究事物之间的关系、预测事物今后的可能发究事物之间的关系、预测事物今后的可能发展等一展等一 系列问题系列问题,提供了丰富的材料和科学依提供了丰富的材料和科学依据据.如何收集、整理和分析数据,如何收集、整理和分析数据,挖掘有用结果?挖掘有用结果?着手建立模型时着手建立模型时,关于数据需考虑以下问题:关于数据需考虑以下问题:1.需要哪些以及何种形式的数据需要哪些以及何种形式的数据?2.如何去获得数据?如何去获得数据?怎样表达数据?怎样表达数据?3.如何对数据进
3、行整理、分析?如何对数据进行整理、分析?获获取取方方式式图书馆文件检索图书馆文件检索网上资料检索网上资料检索询问相关部门人员询问相关部门人员试验、观察并记录试验、观察并记录 例例6.1.1开水房拥挤成因分析数据采集开水房拥挤成因分析数据采集 有人想分析出一所大学开水房拥挤的原因有人想分析出一所大学开水房拥挤的原因,并提出解决方案并提出解决方案.在连续一周的中午在连续一周的中午11:4012:20进行实地观进行实地观测测,得到开水房人到达情况的数据得到开水房人到达情况的数据 表表6.1 每每10秒到达人数及相应频数秒到达人数及相应频数人数人数012345678频数频数66132131110502
4、21043 猜测可能是管道阻塞造成拥挤猜测可能是管道阻塞造成拥挤,记录下两组记录下两组数据数据,用于比较分析用于比较分析.表表6.2 管道通畅时顾客打水时间及相应频数管道通畅时顾客打水时间及相应频数 打水时间打水时间303540455055606570频数频数123221394打水时间打水时间7580859095105125频数频数5352422表表6.2 管道阻塞时顾客打水时间及相应频数管道阻塞时顾客打水时间及相应频数 打水时间打水时间455565707580859095频数频数332341114打水时间打水时间100125130135160175205240300频数频数113211211
5、 *需要什么形式的数据需要什么形式的数据,与建模目的和所与建模目的和所选择的模型的特点有关选择的模型的特点有关.分析数据就初步可找到开水房拥挤的原因分析数据就初步可找到开水房拥挤的原因.例例6.1.2 渡口模型数据性质渡口模型数据性质 船主收集到的有一组数据是船主收集到的有一组数据是:需要摆需要摆渡的车辆中渡的车辆中“平均平均40的车为轿车的车为轿车,55的车为卡车的车为卡车,5的车为摩托车的车为摩托车.”.”*收集数据并非多多益善收集数据并非多多益善,要善于剔除冗要善于剔除冗余数据余数据.平均值更具有代表性平均值更具有代表性,更如实地反映了渡口更如实地反映了渡口的实际情况的实际情况 其中其中
6、“平均平均”两字至关重要两字至关重要,因一次摆渡因一次摆渡各类车所占百分比是无意义的各类车所占百分比是无意义的.需做较多次数的观察得到一大批数据需做较多次数的观察得到一大批数据,并求并求相应的平均值得到上述数据相应的平均值得到上述数据.用用数学模型描述现实问题数学模型描述现实问题,模型中模型中参数参数的估计的估计、模型的、模型的求解求解以及模型的以及模型的合理性合理性很大程度取决于数据的准确可信很大程度取决于数据的准确可信.实验数据中总存在实验误差实验数据中总存在实验误差 在建模工作的各个环节在建模工作的各个环节,实验数据误实验数据误差都可能造成失之毫厘差都可能造成失之毫厘,谬之千里的失谬之千
7、里的失误误.实实 验验 误误 差差随机误差随机误差系统误差系统误差过失误差过失误差 由一系列偶然因素引起的由一系列偶然因素引起的一类不易控制的测量误差一类不易控制的测量误差.实验观察过程中服从确定性实验观察过程中服从确定性规律的误差规律的误差.明显歪曲实验结果的误差明显歪曲实验结果的误差.无法避免无法避免,可可增加试验次数增加试验次数,取算术平均取算术平均来减小来减小.不能通过增加实验次数求算术平均值来不能通过增加实验次数求算术平均值来消除消除.可用一定方法可用一定方法识别、消除识别、消除.可以可以识别识别、并加以、并加以处理处理.*在实验数据中在实验数据中,三类实验误差常常同时三类实验误差常
8、常同时错综复杂的存在着错综复杂的存在着.控制实验数据的质量控制实验数据的质量整理实验数据整理实验数据消除实验误差消除实验误差重重要要工工作作方法:方法:1.用统计检验方法检验出异常数据;用统计检验方法检验出异常数据;参见电子科大概率论与数理统计参见电子科大概率论与数理统计p192“统计数据中异常值的检验统计数据中异常值的检验”.3.根据经验和实际背景知识做出实验数根据经验和实际背景知识做出实验数据的检查修正据的检查修正,异常数据的舍弃处理异常数据的舍弃处理.2.尽可能寻找产生异常点的技术上或尽可能寻找产生异常点的技术上或物理上的原因物理上的原因,作为处理异常值的依据作为处理异常值的依据.例例6
9、.1.3 施肥效果分析施肥效果分析 某地区作物生长所需的营养素主要是氮某地区作物生长所需的营养素主要是氮(N)、钾、钾(K)、磷、磷(P).(P).某作物研究所在某地某作物研究所在某地区对土豆与生菜做了一定数量的实验区对土豆与生菜做了一定数量的实验,实验实验数据如下列数据如下列表所示表所示,其中其中ha表示公顷表示公顷,t表示吨,表示吨,kg表示公斤表示公斤.当一个营养素的施肥当一个营养素的施肥量变化时量变化时,总将另两个营养素的施肥量保持总将另两个营养素的施肥量保持在第七个水平上在第七个水平上,如对土豆产量关于如对土豆产量关于 N N的施的施肥量做实验时肥量做实验时,P与与 K的施肥量分别取
10、为的施肥量分别取为 196kgha与与372kgha.试分析施肥量与产量之间关系试分析施肥量与产量之间关系,并对所得并对所得结果从应用价值与如何改进等方面做出估结果从应用价值与如何改进等方面做出估价价.施肥量施肥量(kg/ha)产量产量(t/ha)015.183421.366725.7210132.2913534.0320239.4525943.1533643.4640440.8347130.75施肥量施肥量(kg/ha)产量产量(t/ha)034.462432.474936.067337.969841.0414740.0919641.2624542.1729440.3634242.73施肥量
11、施肥量(kg/ha)产量产量(t/ha)018.984727.359334.8614039.9218638.4427937.7337238.4346543.8755842.7765146.22N P K经查阅农业资料可知:经查阅农业资料可知:2)在一定范围的磷施肥量可以促使土在一定范围的磷施肥量可以促使土豆产量增长豆产量增长,过多的施磷肥对土豆产量不过多的施磷肥对土豆产量不起作用起作用.1)氮(氮(N)的施肥量在一定范围内)的施肥量在一定范围内,土土豆产量随施肥量的增加而增长豆产量随施肥量的增加而增长,施肥量超施肥量超过一定范围后,土豆产量反而会降低过一定范围后,土豆产量反而会降低.对对氮施肥量一土豆产量的实验数据进行分氮施肥量一土豆产量的实验数据进行分析析,可认为其中没有明显的异常点可认为其中没有明显的异常点.可以认为可以认为y(0)、y(24)是病态数据是病态数据,并可取并可取y(0)与与y(49)的一次线性插值的一次线性插值 来取代来取代.记记 x为磷施肥量为磷施肥量,y(x)为土豆产量为土豆产量,磷施磷施肥量肥量土豆产量实验数据中有土豆产量实验数据中有
限制150内