《边际误差与区间估计优秀PPT.ppt》由会员分享,可在线阅读,更多相关《边际误差与区间估计优秀PPT.ppt(67页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第 8 章章區間估計本章內容本章內容8.1 母體平均數:已知8.2 母體平均數:未知8.3 樣本大小的決定8.4 母體比例2邊際誤差與區間估計邊際誤差與區間估計第第8章章 區間估計區間估計 第第292頁頁 3點估計量的值不會恰好等於母體參數值,。區間估計區間估計值值(interval estimate)通常是由點估計值加或減某個值求得,我們稱此加減值是邊際誤差邊際誤差(margin of error)。區間估計值的一般形式是:點估計值 邊際誤差區間估計值可以讓人瞭解,由樣本得到的點估計值與母體參數值的接近程度。邊際誤差與區間估計邊際誤差與區間估計第第8章章 區間估計區間估計 第第293頁頁
2、4母體平均數的區間估計值的通式如下:邊際誤差母體比例的區間估計值的通式如下:邊際誤差8.1 母體平均數:母體平均數:已知已知第第8章章 區間估計區間估計 第第293-296頁頁 5邊際誤差與區間估計 實務建議母體平均數:母體平均數:已知已知第第8章章 區間估計區間估計 第第293頁頁 6為求算母體平均數的區間估計值,必須知道母體標準差 或樣本標準差 s 以計算邊際誤差。大部分應用的 很少是已知數值,而以 s 來計算邊際誤差。某些應用有大量現成歷史資料,可以在抽樣前先用來估計母體標準差。在此情況下,可視母體標準差已知,我們稱此為 已知已知(known)的情況。母體平均數的區間估計:母體平均數的區
3、間估計:已知已知樣本平均數的抽樣誤差等於或少於 的機率為 1-。/2/2全部值的 1 的抽樣安排 第第8章章 區間估計區間估計7母體平均數的區間估計:母體平均數的區間估計:已知已知第第8章章 區間估計區間估計 8/2/2-此區間不包含 此區間包含 此區間包含 所有值的 1 的抽樣分配 母體平均數的區間估計:母體平均數的區間估計:已知已知第第8章章 區間估計區間估計 第第293頁頁 9母體平均數的區間估計值:已知其中 =樣本平均數 1-=信賴係數 =右尾面積/2 的標準常態安排的 z 值 =母體標準差 n=樣本大小邊際誤差與區間估計:邊際誤差與區間估計:已知實例已知實例第第8章章 區間估計區間估
4、計 第第293-294頁頁 10第7章洛依德公司例子中,購物花費的母體是標準差 20 的常態安排。邊際誤差與區間估計:邊際誤差與區間估計:已知實例已知實例第第8章章 區間估計區間估計 第第293-294頁頁 11利用標準常態機率表,我們可以發現任何常態安排隨機變數值,有95%會落在離平均數 1.96 個標準差內。因為 的抽樣安排是常態安排,因此有 95%的 值必須落在 內。洛依德例子的 的抽樣安排是常態安排,標準誤 。因為 1.96(2)3.92。我們的結論是:樣本大小為 n 100 得到的樣本平均數會有 95%落在母體平均數 3.92 的範圍內。見圖 8.2。邊際誤差與區間估計:邊際誤差與區
5、間估計:已知實例已知實例第第8章章 區間估計區間估計 第第294頁頁 12邊際誤差與區間估計:邊際誤差與區間估計:已知實例已知實例第第8章章 區間估計區間估計 第第294頁頁 13以洛依德公司為例,假如以 3.92 為邊際誤差,可以用 來計算 的區間估計值。為瞭解釋區間估計值的意義,我們先假定選取三個不同的簡單隨機樣本,每個樣本都有 100 名洛依德的顧客,第一個樣本的樣本平均數是圖 8.3 的 。圖 8.3 顯示,自 x1 加減 3.92 得到的區間會涵蓋母體平均數 。假如隨機樣本得到的 如圖 8.3所示,可以看到 顯然不等於 ,但是自 加減 3.92 得到的區間仍會涵蓋母體平均數。然而,若
6、第三個樣本平均數是圖 8.3 的 ,情況又是如何?可看出 形成的區間並未涵蓋母體平均數 。因為 落在抽樣安排的右尾,而且距離 超過 3.92。邊際誤差與區間估計:邊際誤差與區間估計:已知實例已知實例第第8章章 區間估計區間估計 第第294-295頁頁 14圖 8.3 陰影區內的任何樣本平均數 所建立的區間,都會包含母體平均數 。由於全部可能的樣本平均數有 95%都落在陰影區,所以將樣本平均數 加或減 3.92 所形成的全部區間,有 95%會包含母體平均數 。邊際誤差與區間估計:邊際誤差與區間估計:已知實例已知實例第第8章章 區間估計區間估計 第第295頁頁 15邊際誤差與區間估計:邊際誤差與區
7、間估計:已知實例已知實例第第8章章 區間估計區間估計 第第295頁頁 16假定最近數週內,洛依德的品管團隊調查 100 位顧客,得到購物花費的樣本平均數是 82,以 3.92計算區間估計值,可以得到 82 3.92。因此,以最近 1 週的樣本資料得到的區間估計值是 82 3.9278.08 到 823.9285.92。由於以 3.92 建立的各種區間估計值中,有 95%的區間估計值會包含母體平均數,因此,我們可以說有 95%的信念,78.08 到 85.92 的區間會包含母體平均數 。我們也可以說,這個區間是在 95%的信賴水準(confidence level)下建立的。其中,0.95 稱為
8、信賴係數(confidence coefficient),區間 78.08 到 85.92 則稱為 95%信賴區間(confidence interval)。邊際誤差與區間估計:邊際誤差與區間估計:已知實例已知實例第第8章章 區間估計區間估計 第第295-296頁頁 17我們運用式(8.1)來建立洛依德的 95%信賴區間。對 95%信賴區間而言,其信賴係數是(1)0.95,因此 0.05。利用標準常態機率表,右尾面積是 /2 0.05/2 0.025,z0.025 1.96。洛依德的樣本平均數是 82、20 及樣本大小 n=100。我們可以得到因此,利用式(8.1),邊際誤差是 3.92,95
9、%的信賴區間是82 3.92=78.08 到 823.92=85.92。邊際誤差與區間估計:邊際誤差與區間估計:已知實例已知實例第第8章章 區間估計區間估計 第第296頁頁 18雖然 95%的信賴水準很常运用,但其他如 90%及 99%的信賴水準也很常見。最常見的信賴水準之 值整理在表 8.1。邊際誤差與區間估計:邊際誤差與區間估計:已知實例已知實例第第8章章 區間估計區間估計 第第296頁頁 19运用這些值及式(8.1),洛依德的 90%信賴區間是因此,在 90%信賴水準下,邊際誤差是 3.29,信賴區間是 82 3.2978.71 到 823.2985.29。同樣地,99%信賴區間是因此,
10、在 99%信賴水準下,邊際誤差是 5.15,信賴區間是 82 5.1576.85 到 825.1587.15。比較90%、95%及99%三種信賴水準,我們可以看到,信賴水準提高時,信賴區間的寬度也會增加。實務建議實務建議第第8章章 區間估計區間估計 第第296頁頁 20實際樣本數大部分的實際應用中,以式(8.1)建立母體平均數的信賴區間時,樣本大小 n 30 就已足夠。假如母體不是常態安排,但大致上對稱,樣本大小至少為 15,式(8.1)即可得到良好的近似信賴區間。樣本更小時,只有分析人員信任或可以假定母體安排至少是近似常態時,才能运用式(8.1)。評註評註第第8章章 區間估計區間估計 第第2
11、97頁頁 211.本節討論的是在假設母體標準差 已知下所進行的區間估計程序。已知是指在選取樣本以求算母體平均數的估計值之前,歷史資料或其他現有資訊讓我們可以取得母體標準差 的良好估計值。所以,技術上來說,並非我們已知道 的確實值,而是在抽樣前就取得 的良好估計值,所以不必由同一個樣本來估計母體平均數及母體標準差。評註評註第第8章章 區間估計區間估計 第第297頁頁 222.留意式(8.1)中有运用到樣本數 n,假如在特定樣本數下所計算出的信賴區間太寬,以致無法供应特定用途,我們可能會增加樣本數來縮短信賴區間。由於 n 在區間估計公式的分母,假如樣本數增加,則邊際誤差會變小,所以會縮短區間,增加
12、精確度。有關如何決定適當樣本數以獲致所需精確度的程序,將在 8.3 節進一步說明。8.2母體平均數:母體平均數:未知未知第第8章章 區間估計區間估計 第第298-304頁頁 23邊際誤差與區間估計 實務建議 运用小樣本 區間估計程序摘要母體平均數:母體平均數:未知未知第第8章章 區間估計區間估計 第第298頁頁 24建立母體平均數的區間估計值時,我們通常也沒有母體標準差的良好估計值。這種情況下,就要以同一個樣本來估計 及 。此種情況稱為 未知(unknown)的情況。若以 s 來估計 ,邊際誤差及母體平均數的區間估計值是根據稱為 t 安排(t distribution)的機率安排求算而得。t
13、安排安排第第8章章 區間估計區間估計 第第298-299頁頁 25t 安排是由一群類似的機率安排組成。任一 t 安排都出名為自由度(degrees of freedom)的特定參數。可能有自由度為 1、自由度為 2、自由度為 3 等不同的 t 安排。t 安排安排第第8章章 區間估計區間估計 第第299頁頁 26當自由度增加時,t 安排和標準常態安排的差距將愈來愈小。圖 8.4 顯示 t 安排在自由度 10 和 20 時與標準常態安排圖的比較。請留意,當自由度較高時,t 安排較不分散,且更接近標準常態機率安排。另外,也請留意 t 安排的平均數為 0。t 安排安排第第8章章 區間估計區間估計 第第
14、299頁頁 27t 安排安排第第8章章 區間估計區間估計 第第299頁頁 28我們以 t 的右下標表示 t 安排右尾的機率,正如 z0.025 表示標準常態安排右尾面積為 0.025 所對應的z 值一樣,t0.025 代表 t 安排右尾面積為 0.025 所對應的 t 值。通常,我們以 t/2 表示 t 安排右尾面積為 /2 時所對應的 t 值,見圖 8.5。t 安排安排第第8章章 區間估計區間估計 第第299頁頁 29t 安排安排第第8章章 區間估計區間估計 第第299頁頁 30附錄 B 的表 2 是 t 安排表。表 8.2 為 t 安排表的一部分,表中每一列對應到特定自由度的 t 安排。當
15、 t 安排的自由度為 9 時,則 t0.025 2.262;同理,t 安排的自由度是 60 時,t0.025 2.000。當自由度繼續地增加,則 t0.025 愈靠近 z0.025 1.96。事實上,t 安排表中自由度為無限大()的對應欄位中可發現標準常態安排的 z 值。假如自由度大於100,就可用自由度無限大的 t 值來近似。換言之,自由度超過100 的 t 安排,標準常態 z 值是很好的近似值。t 安排安排第第8章章 區間估計區間估計 第第300頁頁 31t 安排安排第第8章章 區間估計區間估計 第第300頁頁 32t 安排安排第第8章章 區間估計區間估計 第第300頁頁 33t 安排安排
16、第第8章章 區間估計區間估計 第第300頁頁 34母體平均數的區間估計:母體平均數的區間估計:未知未知第第8章章 區間估計區間估計 第第301頁頁 35區間估計其中 s 是樣本標準差,(1 )是 信賴係數,t/2 是自由度為 n 1 的 t 安排,右尾面積為/2 時所對應的 t 值。母體平均數的區間估計:母體平均數的區間估計:未知實例未知實例第第8章章 區間估計區間估計 第第301頁頁 36某個探讨調查了關於美國家庭的平均信用卡債的情形。探讨中共有 70 個家庭的信用卡帳戶資料的餘額,如表 8.3。因為沒有任何歷史資料,我們並不知道信用卡帳戶餘額的母體標準差,因此,必須利用樣本標準差 s 來估
17、計母體標準差。接下來,我們要建立母體平均數的 95%信賴區間。母體平均數的區間估計:母體平均數的區間估計:未知實例未知實例第第8章章 區間估計區間估計 第第301頁頁 37母體平均數的區間估計:母體平均數的區間估計:未知實例未知實例第第8章章 區間估計區間估計 第第301-302頁頁 38利用表 8.3 的資料算出樣本平均數$9312,樣本標準差 s$4007。信賴水準是 95%,自由度為 n 169,查表 8.2 可得適當的 t0.025 值。我們可在自由度為 69 的列找到右尾是 0.025 時的 t0.025=1.995。母體平均數的點估計值是$9312,邊際誤差是$955,95%信賴區
18、間是9312 955$8357 到 9312955$10,267。實務建議實務建議第第8章章 區間估計區間估計 第第302頁頁 39假如母體是常態安排,式(8.2)的區間估計公式可以適用於任何大小的樣本,並產生確切的區間估計值。假如母體不是常態安排,則式(8.2)只是區間估計的近似值。此種情況下,近似值的近似程度視母體的安排及樣本大小而定。實務建議實務建議第第8章章 區間估計區間估計 第第302頁頁 40大部分的應用中,以式(8.2)建立母體平均數的信賴區間時,樣本大小 n 30 就已足夠。但是,假如母體安排有嚴重的偏態或是離群值,許多統計學者建議最好將樣本大小增加到 50 或更多。假如母體不
19、是常態安排,但大致上對稱,樣本大小至少為 15,也可以得到良好的近似信賴區間。但在樣本更小時,只有分析人員信任或可以假定母體安排至少是近似常態時,才能运用式(8.2)。运用小樣本實例运用小樣本實例第第8章章 區間估計區間估計 第第302頁頁 41以 Scheer 工業訓練計畫之評估為例,說明小樣本的區間估計的推算過程。Scheer 工業的生產部經志向要利用新的電腦輔助訓練計畫來訓練員工進行機器維修。為了完整評估此計畫,該經理希望能夠估計在員工完成在電腦輔助訓練的平均時間。選擇 20 名員工為樣本,接受此項訓練,樣本中的每位員工所需的訓練天數如表 8.4,樣本資料的直方圖如圖 8.6。运用小樣本
20、實例运用小樣本實例第第8章章 區間估計區間估計 第第302頁頁 42运用小樣本實例运用小樣本實例第第8章章 區間估計區間估計 第第302頁頁 43运用小樣本實例运用小樣本實例第第8章章 區間估計區間估計 第第303頁頁 44計算樣本平均數和樣本標準差如下。查附錄 B 的表 2,得知自由度為 n119 時,t0.0252.093,運用式(8.2)可求得 母題平均數的 95%信賴區間的估計值。母體平均數的點估計值為 51.5 天,邊際誤差是 3.2 天,95%信賴區間為 51.53.248.3 天到 51.53.254.7 天。區間估計程序摘要區間估計程序摘要第第8章章 區間估計區間估計 第第30
21、4-305頁頁 45圖 8.7 列出兩種情況下的母體區間估計程序。大部分的應用中,樣本大小n 30 就已足夠。假如母體是常態或近似常態安排,即使樣本大小不到 30 也可运用。但是,在 未知的情況下,假如母體有嚴重的偏態或是有離群值,建議樣本大小應為 n 50。區間估計程序摘要區間估計程序摘要第第8章章 區間估計區間估計 第第304頁頁 46評註評註第第8章章 區間估計區間估計 第第304頁頁 471.假如 已知,無論樣本大小 n 是多少,邊際誤差都固定是 。假如 未知,邊際誤差 2.則會隨著樣本而改變。因為樣本標準差 s 會隨樣本不同而改變。較大的 s,會有較大的邊際誤差;較小的 s,則有較小
22、的邊際誤差。評註評註第第8章章 區間估計區間估計 第第304頁頁 482.母體的安排形狀若呈現偏態,對區間估計值有何影響?以右偏母體為例,延长的右尾中會有很大的資料值。此種偏態下,樣本平均數 與樣本標準差 s 會有正相關。愈大的 s 值,通常有愈大的 值。因此,當 大於母體平均數時,s 也會大於母體標準差 。此種偏態會使邊際誤差 比起 已知時的邊際誤差來得大。較大的邊際誤差得到的信賴區間,比起运用正確的 得到的信賴區間,更简洁包含母體平均數 。但是,當 小於母體平均數時,與 s 的相關會使得邊際誤差較小。此種情況下計算出的信賴區間,由於邊際誤差較小,信賴區間的長度也較小。比起 已知的狀況,此種
23、狀況比較简洁發生信賴區間未包含正確母體平均數的情況。所以,我們建議在母體高度偏態時,應採用比較大的樣本。8.3 樣本大小的決定樣本大小的決定第第8章章 區間估計區間估計 第第307頁頁 49令 E=所要的邊際誤差。E 值是运用者在特定信賴水準下願意接受的邊際誤差。母體平均數區間估計的樣本大小母體平均數區間估計的樣本大小第第8章章 區間估計區間估計 第第307頁頁 50邊際誤差母體平均數區間估計所需的樣本數母體平均數區間估計的樣本大小母體平均數區間估計的樣本大小第第8章章 區間估計區間估計 第第307-308頁頁 51即使 未知,假如从前已有 的初始值或計畫值(planning value),仍
24、可运用式(8.3)。實務上有下列方式可供選擇:由以前的探讨得到的母體標準差的估計值做為 的計畫值。以前測實驗取得初步樣本。以此樣本得到的樣本標準差做為 的計畫值。利用判斷或最佳猜測法來決定 值。例如,先估計母體的最大值與最小值,最大值與最小值的差距可做為全距的估計值,再將全距除以 4 做為標準差的約略估計值,做為母體 的計畫值。母體平均數區間估計的樣本大小實母體平均數區間估計的樣本大小實例例第第8章章 區間估計區間估計 第第308頁頁 52一項美國租車費用的調查發現,租用中型汽車的平均費用約為每天$55。假設原先執行這項調查的公司想要執行另一項新調查,以估計現階段在美國租用一輛中型汽車 1 天
25、所需費用的的母體平均數。設計此項新探讨時,計畫主持人指定在估計每天租車費的母體平均數時,必須採用的邊際誤差為$2,信賴水準為 95%。我們可以瞭解到計畫主持人指定的邊際誤差 E 2,95%的信賴水準表示 z0.025 1.96。母體平均數區間估計的樣本大小實母體平均數區間估計的樣本大小實例例第第8章章 區間估計區間估計 第第308頁頁 53如此一來只须要得到母體標準差 的計畫值,即可算出符合條件的樣本大小。此時,一位分析師看過从前探讨的樣本資料後,得到樣本標準差為$9.65,將此值當作 的計畫值,可得因此,此項新探讨的樣本至少是 89.43,才能滿足計畫主持人之邊際誤差為$2 的要求。此例算出
26、的 n 值有小數點,我們採無條件進位法,所以建議的樣本數是 90 個中型汽車租金的資料。8.4 母體比例母體比例第第8章章 區間估計區間估計 第第310頁頁 54母體比例 p 的區間估計值的通式是 的抽樣安排在計算邊際誤差時扮演關鍵角色。若 np 5 且 n(1p)5,則 的抽樣安排會近似常態安排。母體比例的區間估計母體比例的區間估計第第8章章 區間估計區間估計 第第310頁頁 55母體比例的區間估計母體比例的區間估計第第8章章 區間估計區間估計 第第310頁頁 56母體比例的區間估計值 其中,1 為 信賴係數,而 z/2 為 標準常態安排 右尾面積/2 所對應的 z 值 母體比例的區間估計實
27、例母體比例的區間估計實例第第8章章 區間估計區間估計 第第311頁頁 57為了瞭解女性高爾夫球員對高爾夫球課程的看法,針對全美 900 位女性高爾夫球員進行調查。調查結果發現,有 396 位女性高爾夫球員對練習開球的次數感到滿意,如此一來,對開球次數感到滿意的女性高爾夫球員之母體比例的點估計為 396/900 0.44。母體比例的區間估計實例母體比例的區間估計實例第第8章章 區間估計區間估計 第第311頁頁 58利用式(8.6)及 95%信賴水準,可得因此,在 95%信賴水準下,邊際誤差為 0.0324 且母體比例的區間估計為 0.4076 至 0.4724 之間。此調查結果得到的結論是:我們
28、有 95%的信念說,有 40.76%至 47.24%的女性高爾夫球員對練習開球的次數感到滿意。樣本大小的決定樣本大小的決定第第8章章 區間區間 第第311頁頁 59令 E 表示所要的邊際誤差所需的樣本數 n 的公式如下但請留意,我們並不能运用上述公式來求算特定邊際誤差下的樣本大小,因為 必須在抽樣後才能得知。因此,我們须要 的計畫值,以便計算所需樣本大小。以符號 p*表示 的計畫值。樣本大小的決定樣本大小的決定第第8章章 區間估計區間估計 第第311-312頁頁 60母體比例區間估計值所需的樣本數此計畫值 p*可依下列程序獲得:利用以前來自相同或類似的樣本之樣本比例做為計畫值 p*。利用前測實
29、驗選擇初步的樣本,此樣本比例值即可做為計畫值 p*。利用判斷或最佳猜測來決定 p*值。在沒有从前的實驗資料可用的情形下,可令設 p*的計畫值為 0.50。樣本大小的決定實例樣本大小的決定實例第第8章章 區間估計區間估計 第第312頁頁 61再回到女性高爾夫球員的相關調查,假設公司有意執行一項新調查,以估計對練習開球的次數感到滿意之女性高爾夫球員的母體比例。假如此調查之主持人希望在 95%信賴水準下,母體比例估計的邊際誤差為 0.025,則究竟须要多大的樣本?樣本大小的決定實例樣本大小的決定實例第第8章章 區間估計區間估計 第第312頁頁 62因為 E0.025 且z/21.96,所以我們须要一
30、個計畫值 p*才能回答此樣本數的問題。我們以之前的調查結果中的 當作計畫值 p*,則式(8.7)顯示出因此,樣本大小必須至少為 1514.5,估計結果才能滿足邊際誤差的要求。將此數值無條件進位,建議應抽取 1515 位女性高爾夫球員做為樣本。樣本大小的決定實例樣本大小的決定實例第第8章章 區間估計區間估計 第第312頁頁 63選擇計畫值的第四項建議是运用 p*0.50 為計畫值,通常是沒有其他資訊時才會运用。要瞭解為何如此,請留意式(8.7)的分子,可看出樣本數和 p*(1p*)值成比例,假如 p*(1p*)值大的話,則樣本數也會隨之增加。表 8.5 列出某些 p*(1p*)的可能值,而 p*
31、(1p*)的最大值即在 p*0.50。因此,不確定有任何適當的計畫值時,p*0.50 得到的建議樣本數為最大。實際上,建議採用最大的樣本數,是平安的作法。假如樣本比例不是 0.50,邊際誤差會比預期為小。因此,設 p*0.50 將保證有足夠樣本數來得到預期的邊際誤差的。樣本大小的決定實例樣本大小的決定實例第第8章章 區間估計區間估計 第第312頁頁 64樣本大小的決定實例樣本大小的決定實例第第8章章 區間估計區間估計 第第312頁頁 65在女性高爾夫球員的調查例子中,若計畫值 p*0.50,則樣本大小將為因此,建議樣本大小應取 1537 位女性高爾夫球員。評註評註第第8章章 區間估計區間估計 第第312-313頁頁 661.通常估計母體比例時的邊際誤差都設在 0.10 或更小,諸如蓋洛普的民意調查機構常將邊際誤差設在 0.03 或0.04,因此運用式(8.7),所求得的 樣本數應足以符合 np 5 且 n(1p)5 的要求,使 的抽樣安排可近似常態安排。2.二元安排也可用來計算比例的信賴區間的確定值。比常態近似法更精確、更有解釋力。但是,常態近似法較簡單,以常態近似法計算出的信賴間隨著樣本數增加,精確度及解釋力也會提高。End of Chapter 867
限制150内