资料的整理与表现-统计测量数-第一科大优秀PPT.ppt





《资料的整理与表现-统计测量数-第一科大优秀PPT.ppt》由会员分享,可在线阅读,更多相关《资料的整理与表现-统计测量数-第一科大优秀PPT.ppt(84页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章第三章敘述統計敘述統計(II)統計量數統計量數平均數平均數算術平均數全部觀察值的總和除以觀察值的個數算術平均數在數線上代表資料的平衡點 母體平均數i=1NXi=N樣本平均數X=nnxii=1 資料的平衡點資料的平衡點18000200002500027000平均數平均數2800050000 中位數中位數:數值大小順序排列的觀數值大小順序排列的觀 察值中心的那一個數值察值中心的那一個數值眾眾數數(Mode):觀察值中其出現次數出現次數最多最多的的那一個數值四分位數四分位數:將順序資料分成四等分四等分數值的分位數求下列二組資料之中位數與眾數:(I):3,8,9,9,5(II):4,8,6,2S
2、ol:按大小順序排列,找中間位置(I)3,5,8,9,9(II)2,4,6,8 (4+6)/2=5百分位百分位數(Pk):將順序資料均分為一一百等分百等分數值,取第k個等分點將順序資料排列求位置指標 i i=n(k/100)n:觀測值個數觀測值個數 I:非整數非整數 Pk:下一個整數位置值下一個整數位置值 I:整數整數 Pk:(第第i+第第i+1 位置值位置值)/2 Ex:假定某一班級20位學生之統計學成績如下:42 55 66 76 96 80 69 59 46 28 22 44 56 68 78 88 74 63 53 39 計算平均數,中位數,P35,P68Sol:22 28 39 42
3、 44 46 53 55 56 59 63 66 68 69 74 76 78 80 88 96 中位數:(59+63)/2=61P35:i=20 (35/100)=7 為整數取第7與第8兩位置之平均數 (53+55)/2=54P68:i=20 (68/100)=13.6 不為整數取第14位置值69 四分位距四分位距IQR=第第3四分位數第四分位數第1四分位數四分位數 =Q3Q1全距全距R=最大值最小值Ex:病房中的兩個病人,他們一天要測量脈搏三次,結果如下:A:72 75 78 B:48 64 113A=75=B 請問:可否只從平均數據下結論?Ex:兩個學生的各項成績如下:甲:80 76 7
4、8 83 83 乙:85 60 95 65 95甲=80=乙請問:可否只從平均數下結論?平均分數相同 实力或表現相同比較兩組數值時,须要考慮每個數值的變異程度變異程度:全距 甲:83-76=7 分 乙:95-60=35 分請問:從全距可否得到?資訊 變異數變異數將全部數據都納入考慮,來測量一組數據的變異程度,分布程度,離散程度,或一样性變異程度:測量各個數值和平 均數的差距平均絕對離差:為了避开正負 值相抵消 母體變異數母體變異數 測量原始數值和平均數的相近程度式中:母體平均數,N:母體個數。甲的成績 x x-u (x-u)807678838380-80=076-80=-478-80=-283
5、-80=383-80=3 016 4 9 9變異數:38/5=7.6母體標準差母體標準差樣本標準差樣本標準差平均絕對離差平均絕對離差平均絕對離差平均絕對離差母體:母體:MAD=1NNi=1Xi樣本:樣本:mad=1NNi=1XiX平均絕對離差越大平均絕對離差越大 分散程度越大分散程度越大一組數據資料中的標準差越大,這些數的離散或變異程度越大標準差不只考慮到資料中的最 大數和最小數,資料中的每一個 數都有被列入計算平均數中心數.探討各個數值分佈在平均數的旁边用標準差來精確敘述這種離散程度變異數變異數樣本變異數樣本變異數式中:式中:X:樣本均數,樣本均數,n:樣本數樣本數此離差為此離差為 (Xi-
6、X);一般而言一般而言,為未知為未知,以樣以樣本平均數本平均數 X 來推估來推估,故失去一個自由度故失去一個自由度一家銀行有八台自動櫃員機,在1小時中,各機器的运用次數如下:24 31 20 16 35 28 25 29試問每台櫃員機运用次數的平均值和標準差 x x-u (x-u)16 16-26=-10 100 20 20-26=-6 36 24 24-26=-2 425 25-26=-1 128 28-26=2 429 29-26=3 931 31-26=5 25 35 35-26=9 81 Total:260S=260/8=32.5S=5.75每小時每台服務次數 32.5相對差異量數相對
7、差異量數:用來比較用來比較兩種兩種或或 性質不同性質不同,或或單位不同單位不同的資料的資料,或或單位相同單位相同但但平均數相差很大平均數相差很大Ex:兩組測量同一批鋼管長度的觀測值:I:8,9,10,11,12 (公尺公尺)II:800,900,1000,1100,1200(公分)變異數I:2 標準差I:2變異數II:20000 標準差II:100 2柴比氏柴比氏(Chebyshev)定理定理不論資料為何種安排,至少有(11/k)的資料落在距離平均數 k個標準差的範圍內K為大於1的随意數即k1 由平均數和標準差 柴比氏定理 資料的範圍比例 2根據柴比氏定理柴比氏定理,當k=2時,至少有1-1/
8、22=3/4=75%觀測值落在平均數左右的兩個標準差的區間內.即(x-2s,x+2s)k 區間 落於該區間的比例 1 (x-s,x+s)至少為0 2 (x-2s,x+2s)至少為3/4 or(75%)3 (x-3s,x+3s)至少為8/9 or(89%)標準差的顯著程度標準差的顯著程度若資料為鐘形安排,則有68%的觀察值落在 內,有95%的觀察值落在內,有99%的觀察值落在內 (S為標準差)Ex:隨機抽出200名員工,發現每日支出平均為615元,標準差為135元.利用柴比氏,求每日支出落於(345,885)的區間人數假設呈對稱安排,試利用經驗法則求出落於(i)區間的人工員數(i)Sol:x =
9、615,s=135(ii)345=615-k*135 885=615+k*135 k=2根據柴比氏,至少有1-1/22=3/4=75%的員工其每日支出落在(345,885)的區間內,即0.75*200=150個員工(ii)根據經驗法則,約95%的觀測值落在(x-2s,x+2s)的區間.故約200*95%=190個員工每日支出金額在(345,885)之內P:Me所在組的組下界 q-p:Me所在組的組距Fi:Me所在組的組次數 Fi-1:Me前一組的累加次數中位數中位數組別組別 組界組界 次數次數 fi 以下累積次數以下累積次數 Fi 1 2030 f1 F1 2 3040 f2 F2 .i-1
10、h k fi-1 Fi-1 i p q fi Fi 假設中位數於此組假設中位數於此組 i+1 r s fi+1 Fi+1 Fk=n 內插法內插法 p Fi-1 Me n/2 q Fi Me p n/2-Fi-1 q-p Fi-Fi-1=眾數眾數粗略法眾數粗略法眾數皮爾生眾數皮爾生眾數眾數金氏法眾數 式中:母體變異數與標準差樣本變異數與標準差樣本變異數與標準差四分位數四分位數全部全部資料資料的前的前25%全部全部資料資料的其的其次個次個25%全部全部資料資料的第的第三個三個25%全部全部資料資料 的末的末25%Q1P25 P50 P75Q2 Q3中位數中位數?分位數分位數分組資料的第分組資料的第
11、?分位數分位數 位置指標位置指標 i=n*(k/100)n:總次數總次數 k:第第k個百分位數個百分位數計算以下累積次數計算以下累積次數,確定確定Pk組所在位置組所在位置利用內插法求利用內插法求PkEx:某一班50位學生統計成績次數安排如下:求中位數,第三四分位數與P70 組別 組界 次數 以下累積次數 1 3040 1 1 2 4050 2 3 3 5060 7 10 4 6070 10 20 5 7080 18 38 6 8090 8 46 7 90100 4 50 插入法插入法?-該組下界該組下界?-在組中的在組中的 的臨界值的臨界值 順位順位 =該組的組距該組的組距 該組的總次數該組的
12、總次數母體共變數母體共變數樣本共變數樣本共變數母體相關係數母體相關係數相關係數相關係數顯示出兩個變數的關係或趨勢點分佈圖形.樣本相關係樣本相關係數數2.23 由導出的由導出的,將,將C=0合併合併S:HW1)某探讨針對某大學生每晚的睡眠時間進行統計,一個含20位學生的隨機樣本統計結果如下:6,7,5,6,8,4,5,6.5,7,3.5,6,5,6,6,4.5,7.5,3,6,5,7 請求出這組資料的平均數,中位數,眾數,變異數,標準差,及繪製箱圖 HW2)一所大學針對每天學生攝取卡 路里數進行調查.結果得知平均數為1450卡路里,標準差為300卡路里.試問:(a)有多少比例的學生,其每天攝取卡
13、路里數介於8502050間?(b)68%的學生卡路里攝取數落在甚麼區間中?HW3)一所大學對於其學生申請助學金的貸款進行統計,結果如下表:貸款金額 學生人數 畫圖組距:取全部資料的 Max&Min之 difference再除以組數,取 近似值一組資料的次數安排如下,由於受到污染,致使表中A.B二欄字跡不清,試求A、B值組別 組中點(mi)次數(fi)mi*fi020 10 3 302040 30 4 1204060 50 9 4506080 70 A?80100 90 B?Total 40 2480 求A、B值之Solution:3+4+9+A+B=40 A+B=24 =A+B=2430+12
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 资料 整理 表现 统计 测量 第一 优秀 PPT

限制150内