统计分析基础幻灯片.ppt
《统计分析基础幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计分析基础幻灯片.ppt(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计分析基础2023/1/13基本統計1第1页,共61页,编辑于2022年,星期二2023/1/13基本統計2基本統計課程大綱n敘述統計(Descriptive Statistcs)n機率分配及抽樣機率分配概念n參數的估計 (Point Estimation&Interval Estimation)第2页,共61页,编辑于2022年,星期二2023/1/13基本統計3什麼是統計學?nStatistics源自印歐語系字根status(狀態);understand(了解)n蒐集、整理、陳述、解釋統計資料特性敘述統計學n利用已知樣本(sample)所蒐集的資料,推論未知母(群)體(populatio
2、n)的特性推論統計學n使在不確定情況下作成決策的科學方法第3页,共61页,编辑于2022年,星期二2023/1/13基本統計4敘述統計與推論統計之比較母體(欲分析的對象)樣本(母體的代表)統計抽樣分析推估敍述敍述統計統計推論推論統計統計從數據分析中有效掌握數據間從數據分析中有效掌握數據間的規律性及差異性的規律性及差異性第4页,共61页,编辑于2022年,星期二2023/1/13基本統計5統計資料的種類n屬性資料依資料的性質而劃分類別,無法按大小排列 例:產品區分為合格、不合格兩類 or 作業員、班別。n屬量資料計數值資料(離散型資料,Discrete Data)零或正整數計量值資料(連續型資料
3、,Continuous Data)可帶有小數點的資料第5页,共61页,编辑于2022年,星期二2023/1/13基本統計6敘述統計如何觀察一組數據莖葉圖直方圖統計量數箱型圖第6页,共61页,编辑于2022年,星期二2023/1/13基本統計7你對資料瞭解多少?收集某廠某月每天的產量,連續27天。第7页,共61页,编辑于2022年,星期二2023/1/13基本統計8莖葉圖 The Stem-and-Leaf Plot 將 十十 位位 數數視 為 莖,個個 位位 數數視 為 葉第8页,共61页,编辑于2022年,星期二2023/1/13基本統計9莖葉圖n你看出了什麼?平均產量約為(大部分資料落在)
4、40-60左右。資料大概分散在20-50之間。資料的分佈不對稱,偏向數字大的那一邊。第9页,共61页,编辑于2022年,星期二2023/1/13基本統計10莖葉圖n 你還可以看出什麼?n若覺得stem太少,或每一stem的資料太多,可以再分細一點。第10页,共61页,编辑于2022年,星期二2023/1/13基本統計11莖葉圖n你還可以看出什麼?Q2=X(14)=40Q1=X(7)=22Q3=X(21)=54IQR=Q3-Q1=32P10=(X(2)+X(3)/2=7P90=(X(25)+X(26)/2=61第11页,共61页,编辑于2022年,星期二2023/1/13基本統計12直方圖第12
5、页,共61页,编辑于2022年,星期二2023/1/13基本統計13直方圖與莖葉圖的補同n直方圖的分組可較細緻,莖葉圖的分組較粗略。n直方圖無原始數據,莖葉圖有原始數據。第13页,共61页,编辑于2022年,星期二2023/1/13基本統計14n資料大概落在哪裡?平均產量,平均厚度。n資料的分散程度?品質(變異)是高或低?n資料是否對稱?如何觀察一組數據第14页,共61页,编辑于2022年,星期二2023/1/13基本統計15如何以一些量數描述一組數據n代表資料特性的一些統計量數集中趨勢量數:(central tendency)o代表大部份資料集中的位置所在,通常利用此數作為資料的代表值差異量
6、數:(variation,dispersion)o代表資料的分散程度偏態量數:(shape)o代表資料偏離對稱的程度第15页,共61页,编辑于2022年,星期二2023/1/13基本統計16各種統計量數連連續續資資料料特特性性的的 描描 述述 方方 式式平均數平均數 Mean中位數中位數 Median眾數眾數 Mode全距全距 Range四分位距四分位距 Interquartile Range 變異數變異數 Variance標準差標準差 Standard Deviation偏態偏態 Skew集中趨勢量數集中趨勢量數差異量數差異量數偏態量數偏態量數第16页,共61页,编辑于2022年,星期二20
7、23/1/13基本統計17集中趨勢量數n意義:代表大部份資料集中的位置所在,通常利用通常利用此數作為資料的代表值此數作為資料的代表值n功用:簡化作用,代表作用,比較作用n常用的量數算數平均數中位數眾數第17页,共61页,编辑于2022年,星期二2023/1/13基本統計18算數平均數(Mean)n樣本平均數(sample mean)第18页,共61页,编辑于2022年,星期二2023/1/13基本統計19例子:連續27天LOTS平均產量?第19页,共61页,编辑于2022年,星期二2023/1/13基本統計20中位數(Median)n意義:一群資料中間的那個數。中位數將一組資料分成兩半,比中位
8、數大和比中位數小的資料數各為一半。(Median,Me)n算法:排序(X(1)X(2)X(n)算出中位數大概的位置所在(或是比中位數小的數字有幾個):I=(n+1)/2看I是否為整數,來決定中位數的所在。o若I為整數(資料數為奇數):Me=X(I)o若I為不整數(資料數為偶數):Me=(X(I)+X(I+1)/2第20页,共61页,编辑于2022年,星期二2023/1/13基本統計21眾數(Mode)n意義:一組資料中,出現次數最多的數No ModeRaw Data:10.3,4.9,8.9,11.7,6.3,7.7One ModeRaw Data:6.3,4.9,8.9,6.3,4.9,4.
9、9More Than 1 ModeRaw Data:21,28,28,41,43,43n算法:做次數分配表第21页,共61页,编辑于2022年,星期二2023/1/13基本統計22三種集中量數的比較 若有極端值時,平均數較不具意義。第22页,共61页,编辑于2022年,星期二2023/1/13基本統計23三種集中量數的比較nMedian一定居中。右偏右偏右偏右偏Right-SkewedRight-Skewed左偏左偏左偏左偏Left-SkewedLeft-Skewed對稱對稱對稱對稱SymmetricSymmetricMeanMean=MedianMedian=ModeModeMeanMean
10、MedianMedianModeModeModeModeMedianMedianMeanMean第23页,共61页,编辑于2022年,星期二2023/1/13基本統計24哪一個集中量數較好n原則:無極端值:mean有極端值:median類別資料:moden例:現有100名學生成績想知道班上整體表現如何mean成績分等級,想知道哪一等級較多人mode第24页,共61页,编辑于2022年,星期二2023/1/13基本統計25非集中位置量數n集中位置量數(集中趨勢量數)大部分資料的所在n非集中位置量數描繪數值資料的分佈情況百分位數(percentile)四分位數(quartile)十分位數(deci
11、mal)第25页,共61页,编辑于2022年,星期二2023/1/13基本統計26百分位數(Pk)n算法:排序:算出百分位數大概位置的所在(比百分為數小的大概有幾個):I=(n+1)*k/100看I是否為整數:o若 I 為整數,則 Pk=X(I)o若 I 不為整數,則 Pk=(X(I)+X(I+1)/2第26页,共61页,编辑于2022年,星期二2023/1/13基本統計27特殊的百分位數(Pk)n特殊的百分位數四分位數(Q1,Q2,Q3)QuartileoQ1=P25,Q2=P50,Q3=P75十分位數(D1,D2,D10)DecimaloD1=P10,D2=P20,D10=P100 第27
12、页,共61页,编辑于2022年,星期二2023/1/13基本統計28四分位數/十分位數n廠內每日產量例子:排序:1,1,13,14,21,21,22,23,25,30,35,38,39,40,42,48,50,52,53,53,54,56,56,58,59,63,65第一,二,三 四分位數:ok=25,I=(n+1)k/100=7,Q1=X(7)=22ok=50,I=(n+1)k/100=14,Q2=X(14)=40ok=75,I=(n+1)k/100=21,Q3=X(21)=54第十,九十 百分位數:ok=10,I=(n+1)/10=2.8,D1=(X(2)+X(3)/2=7ok=90,I=
13、(n+1)x0.9=25.2,D9=(X(25)+X(26)/2=61第28页,共61页,编辑于2022年,星期二2023/1/13基本統計29全距(Range)n想法:若有兩個數,如何表示他們的差異程度?n公式:RX(n)-X(1)n優點:意義簡單明瞭n缺點:只考慮兩個觀察值,無法測出中間各觀察值之間的差異程度,敏感度小。受極端值影響較大n產量例子:R=65-1=64.第29页,共61页,编辑于2022年,星期二2023/1/13基本統計30四分位距n想法:如何彌補全距易受極端值影響的缺點?用中間資料來衡量差異程度用中間資料來衡量差異程度n公式:IQR=Q3-Q1n意義:一組資料中間一半觀察
14、值的全距僅與中間50%的資料有關當資料對稱時,Me-Q1=Q3-Me=IQR/2第30页,共61页,编辑于2022年,星期二2023/1/13基本統計31四分位距n優點:計算方便易於瞭解,不受極端值影響n缺點:僅考慮中間一半的數值,對兩端之數值皆未涉及,較不敏感。為此項缺點不如全距之甚。n產量例子:Q1=22Q3=54IQR=54-22=32第31页,共61页,编辑于2022年,星期二2023/1/13基本統計32離差(deviation)n全距及四分位差均只考慮一群資料中的少數幾個資料,並未將全部資料考慮進來。那如何將全部資料考慮進來計算其分散程度?n離差=觀察值與集中量數之差可見離差的絕對
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计分析 基础 幻灯片
限制150内