《统计学统计量数-分析资料.ppt》由会员分享,可在线阅读,更多相关《统计学统计量数-分析资料.ppt(13页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、統計學(一)第四四單元:統計量數-分析資料2林瑞泉主講第四四單元:統計量數-分析資料2統計量數統計量數用來分析資料的分布情形,能更精確指用來分析資料的分布情形,能更精確指出資料出資料1.1.集中趨勢集中趨勢(中中央央位置位置)2.2.等分位置等分位置 3.3.分散的程度分散的程度 10 2020 30 40 50 60 70 80 904712361118 營業收入次數例子例子:海之濱冰店的營業收入海之濱冰店的營業收入次數直方圖直方圖由原來資料可得由原來資料可得:集中趨勢集中趨勢=54=54 分散的程度分散的程度=22=22 四等分位置有四等分位置有 43,53,64 43,53,64 分散度
2、的衡量分散度的衡量有下列幾種代表資料的分散度:1.全距 R R=最大最小=max-min2.四分位距 IQR IQR=Q3Q13.平均絕對離差(mad)(即mean absolute deviationmean absolute deviation)一組數量資料以平均數 為中心,可設每個 資料 Xi 的離差為 ,因此 4.樣本變異數 其指平均平方離差,但是它的單位是原來的平方。如要用原單位表示分散度須開根號如下。5.樣本標準差 S,即 6.相對分散度 CV 指分散度不受衡量單位的影響,或稱為樣本變異係數 cv(coefficient of variation)coefficient of va
3、riation)例子:縱貫路快還是中山高快?收集開車時間(分鐘)個 5 個資料 求它們的全距,平均絕對離差(mad),標準差(S),變異數解:(1)縱貫路 有全距 R=4236=6 平均絕對離差計算如下:先算縱貫路縱貫路縱貫路縱貫路38383636404039394242中山高中山高中山高中山高32321919414147475656開車時間3811136339401113900042339(2)中山高 有全距 R=5619=37開車時間32774919202040041224478864561717289總和054806比較不同路線開車所花的時間:(1)有相同的平均數39分鐘(2)對變異數及
4、標準差,中山高的分散度大很多,也可由CV看出 縱貫路 CV=0.057 中山高 CV=0.364 大約6倍的縱貫路 CV因此選擇開縱貫路會比較準時到。柴比氏定理柴比氏定理(Chebyshevs Theorem)此定理是要提出平均數,標準差及資料分布的關係定理:不論資料分配如何,至少有 的資料落在距離平均數K個S(標準差)範圍內。其中 K 1的任意數。說明:若K=2,1 =75%則有的觀察值落在 K=3,11/9=89%則有的觀察值落在 K=4,1-1/16=94%則有的觀察值落在如何檢查極端值如何檢查極端值極端值:只比較與其他大部分的數值來為極小 或極大的數值,以下列步驟可檢查:Step1:排
5、序觀察值由小而大Step2:計算 Q1 1 及 Q3 3Step3:計算 IQR=Q3 3 Q1 1 Step4:計算 及Step5:若有觀察值在區間L,U之外則為極端值利用盒鬚圖如下,則看出在右邊有極端值X最小Q1 Q3極端值區最大如何用如何用EXCELEXCEL來來分析資料1.敘述統計:此程式可計算資料的a.中央趨勢中央趨勢-平均數,中位數,眾數平均數,中位數,眾數 b.分散度分散度-樣本變異數樣本變異數 ,樣本標準差樣本標準差 S S 在在 工具工具 中,請點中,請點 資料分析資料分析 項目,可看到項目,可看到 敘述統計敘述統計 程式選程式選項項2.2.統計在函數 fx 中:a.(AVEDEV)-計算資料的平均絕對離差(mad)b.(Quartile)-計算資料的 四分位數 Q1 1,Q2 2,Q3 3c.(AVERAGE,MEDIANAVERAGE,MEDIAN)-計算資料的計算資料的平均數,中位數分析資料以統計測量數呈現中心位置的衡量等分位置的衡量盒鬚圖分析法分散度的衡量Excel 的的使用使用柴比氏定理平均絕平均絕對離差對離差變異數變異數標準差標準差相對分散度相對分散度四分位數四分位數十分位數十分位數百分位數百分位數平均數平均數中位數中位數眾數眾數中心位置中心位置各統計測各統計測量數之比量數之比較與選擇較與選擇總結:第四四單元:統計量數-分析資料2END
限制150内