文科概率和统计基础知识.docx
《文科概率和统计基础知识.docx》由会员分享,可在线阅读,更多相关《文科概率和统计基础知识.docx(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、文科概率和统计基础知识概率与统计一、统计 1 1 三种抽样方法的比较类别 共同点 特点 相互联系 适用范围 简 单 随 机抽样 抽样过程中每个个体被抽到的可能性相等;每次抽出个体后不再放回,即不 放回抽样. 从总体中逐个抽 取.总 体 个 数较少.系统抽样 将总体平均分成几部分,按预先制定的规则在各 部分中抽取 1 个个体. 系统:在 起始部分取样时,采纳简洁随机抽样,其余部分等距抽。分层:各层抽样时,采纳简洁随机抽样或系统抽样(层的容量大时可用系统抽样). 总 体 个 数较多.分层抽样 将 总 体 分 成 几层,按各层个体 数之比抽取. 总体由差 异 明 显 的几 部 分 组成.2 2 常用
2、的统计图表:一表(频率分布表);两图(频率分布直方图和茎叶图)(1) 频率分布直方图小长方形的面积=组距×频率组距=频率; 各小长方形的面积之和等于 1; 小长方形的高=频率组距,全部小长方形的高的和为1组距 直方图的纵轴(小长方形的高)一般是)频率除以组距的商(而不是频率),横轴一般是 数据的大小,小长方形的面积表示频率 (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好 3 3 用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 数字特征 样本数据 频率分布直方图 众数 出现次数最多的数据 取最高的小长方形 底边中点 的横坐标 中位数 将数据 按大小依次排列
3、,处在最中间位置的一个数据(或最中间两个数据的平均数)把频率分布直方图划分成 左右两个面积相等的 分界线与 x 轴交点的横坐标 平均数 样本数据的 算术平均数 每个小长方形的面积乘以小长方形 底边中点的横坐标之 和 (2)平均数1 21( )nx x x xn= + + 方差2 2 2 21 21( ) ( ) ( ) ns x x x x x xn= - + - + - 标准差2 2 21 21( ) ( ) ( ) ns x x x x x xn= - + - + - 标准差、方差越大,数据的离散程度越大,越不稳定 4 变量间的相关关系 学问点分析 1、线性回来方程:a x b y &ci
4、rc;ˆˆ + = ( x 叫做说明变量, y 叫做预报变量)线性回来方程系数公式:( 公式说明:回来直线过样本的中心点 ) ( y x , ,也就是平均值点.)2、相关系数公式3、几个结论:(1)回来直线过样本的中心点 ) ( y x , . (2)b b 0 >0 时, y 与 x 正相关,散点图呈上升趋势; b b 0 <0 时, y 与 x 负相关,散点图呈下降趋势. (3)斜率 b 的含义(举例):假如回来方程为 y =2.5 x +2,说明 x 增加 1 个单位时, y 平均增加 2.5 个单位; 假如回来方程为 y =2.5 x +2,说明 x 增
5、加 1 个单位时, y 平均削减 2.5 个单位.(4)相关系数 r 表示变量的相关程度。 范围:1 r ,即 1 1 - rr 越 大,相关性越 强。0 r 时, y 与 x 正相关; 0 r 时, y 与 x 负相关. (5)相关指数2R 表示模型的拟合效果。范围: 1 0 2, R2R 越 大,拟合效果越 好, ,(这时:残差平方和越小,残差点在带状区域内的分布比较匀称,带状区域宽度越窄,拟合精度越高). 2R 表示说明变量 x 对于预报变量 y 改变的贡献率。例如:64 . 02 R ,表明 x 说明了 64%的 y 改变,或者说 y 的差异有 64%是由 x引起的。(6)线性回来模型
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文科 概率 统计 基础知识
限制150内