简单相关分析与简单线性回归分析优秀课件.ppt
《简单相关分析与简单线性回归分析优秀课件.ppt》由会员分享,可在线阅读,更多相关《简单相关分析与简单线性回归分析优秀课件.ppt(85页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、简单相关分析与简单线性回归分析第1页,本讲稿共85页學習目標學習目標1.1.瞭解簡單相關分析的意義。瞭解簡單相關分析的意義。2.2.使用相關分析的時機。使用相關分析的時機。3.3.瞭解共變異數的計算與意義。瞭解共變異數的計算與意義。4.4.瞭解相關係數的計算與檢定程序。瞭解相關係數的計算與檢定程序。5.5.瞭解簡單迴歸分析的意義。瞭解簡單迴歸分析的意義。6.6.學習估計與檢定迴歸係數。學習估計與檢定迴歸係數。7.7.利用估計的迴歸方程式作預測。利用估計的迴歸方程式作預測。8.8.檢定迴歸方程式的適合性。檢定迴歸方程式的適合性。第2页,本讲稿共85页本章架構本章架構 14.1 14.1 簡單相關
2、分析簡單相關分析 14.2 14.2 簡單線性迴歸分析簡單線性迴歸分析 14.3 14.3 簡單線性迴歸方程式的估計簡單線性迴歸方程式的估計最小平方法最小平方法 14.4 14.4 迴歸方程式的適合度迴歸方程式的適合度 14.5 14.5 迴歸方程式的檢定迴歸方程式的檢定 14.6 14.6 利用估計線性迴歸方程式進行預測利用估計線性迴歸方程式進行預測 14.7 14.7 殘差分析殘差分析第3页,本讲稿共85页14.1 簡單相關分析簡單相關分析 14.1.1 14.1.1 共變異數的意義共變異數的意義 14.1.2 14.1.2 相關係數的意義相關係數的意義 14.1.3 14.1.3 相關係
3、數的估計相關係數的估計 14.1.4 14.1.4 相關係數的檢定相關係數的檢定第4页,本讲稿共85页14.1 簡單相關分析簡單相關分析(續續)相關分析相關分析(correlation analysis)(correlation analysis)探討數值變數間線性關係的程度與方向的方法,共變異數探討數值變數間線性關係的程度與方向的方法,共變異數(covariance)(covariance)與相關係數是用來瞭解兩變數間線性關係的與相關係數是用來瞭解兩變數間線性關係的工具。工具。如果變數間無法區分出所謂的依變數如果變數間無法區分出所謂的依變數(dependent variable)(depen
4、dent variable)與自變數與自變數(或獨立變數或獨立變數)(independent variable)(independent variable)時,則使用相時,則使用相關分析來探討變數間的線性關係;如果變數是可以區分的話,關分析來探討變數間的線性關係;如果變數是可以區分的話,則使用線性迴歸分析來探討變數間的線性關係。則使用線性迴歸分析來探討變數間的線性關係。第5页,本讲稿共85页14.1.1 共變異數的意義共變異數的意義 共變異數共變異數(covariance)(covariance)測量兩個數值變數間的線性關係。測量兩個數值變數間的線性關係。線性關係線性關係 當一個變數變動時,另
5、一變數則呈同方向或相反方向變當一個變數變動時,另一變數則呈同方向或相反方向變動。動。第6页,本讲稿共85页14.1.1共變異數的意義共變異數的意義(續續)母體共變異數母體共變異數 其中其中N N代表母體總數。代表母體總數。樣本共變異數樣本共變異數 其中其中n n代表樣本數。代表樣本數。第7页,本讲稿共85页14.1.1共變異數的意義共變異數的意義(續續1)共變異數的性質共變異數的性質 1.1.共變異數的值介於共變異數的值介於-到到 之間。之間。2.2.X X與與Y Y的共變的共變異數大於零異數大於零,表示,表示X X與與Y Y同方向變動同方向變動。3.3.X X與與Y Y的共變的共變異數小於零
6、異數小於零,表示,表示X X與與Y Y反方向變動。反方向變動。4.4.X X與與Y Y的共變的共變異數等於零異數等於零,表示兩變數間沒有線性,表示兩變數間沒有線性關係,但並不表示兩者之間沒有其他關係存在關係,但並不表示兩者之間沒有其他關係存在。第8页,本讲稿共85页14.1.1共變異數的意義共變異數的意義(續續3)當兩變數與的共變異數大於零時,可以看出與大部分落當兩變數與的共變異數大於零時,可以看出與大部分落於第一與第三象限,也就是兩者移動的方向是一致的,於第一與第三象限,也就是兩者移動的方向是一致的,亦即正的線性關係。亦即正的線性關係。(如如圖圖14.114.1之左上圖之左上圖)當兩變數與的
7、共變異數小於零時,可以看出與大部分落當兩變數與的共變異數小於零時,可以看出與大部分落於第二與第四象限,也就是兩者移動的方向是相反的,於第二與第四象限,也就是兩者移動的方向是相反的,亦即負的線性關係。亦即負的線性關係。(如如圖圖14.114.1之右上圖之右上圖)當兩變數與的共變異數等於零時,可以看出與均勻落於所有當兩變數與的共變異數等於零時,可以看出與均勻落於所有四個象限,而看不出兩者間線性移動的關係,但卻可能存在四個象限,而看不出兩者間線性移動的關係,但卻可能存在其他非線性關係。其他非線性關係。(如圖如圖14.114.1之下方二圖之下方二圖)第9页,本讲稿共85页14.1.1共變異數的意義共變
8、異數的意義(續續2)圖圖14.114.1:不同共變異數值情況下:不同共變異數值情況下X X與與Y Y的散佈圖的散佈圖第10页,本讲稿共85页例例14.1 停留時間與消費額的關係停留時間與消費額的關係 某遊樂區經理想了解遊客停留時間與消費額的關係,於是蒐集某遊樂區經理想了解遊客停留時間與消費額的關係,於是蒐集了了1010位遊客的資料如表位遊客的資料如表14.1 14.1 表表14.1 1014.1 10位遊客的停留時間與消費額位遊客的停留時間與消費額 第11页,本讲稿共85页續例續例14.1 由表由表14.114.1可知可知第12页,本讲稿共85页14.1.2 相關係數的意義相關係數的意義 相關
9、係數(相關係數(correlation coefficient)correlation coefficient)乃是指皮爾生相關係數乃是指皮爾生相關係數(Pearson correlation coefficient)Pearson correlation coefficient),其用途在於測量兩個,其用途在於測量兩個數值變數間的線性關係。數值變數間的線性關係。當兩變數有相關存在,並不代表兩者一定存在因果關係,當兩變數有相關存在,並不代表兩者一定存在因果關係,但是當相關程度高的時候,彼此的預測能力也高。但是當相關程度高的時候,彼此的預測能力也高。第13页,本讲稿共85页相關係數應用實例一相關
10、係數應用實例一歐亞股市與美股連動性歐亞股市與美股連動性計算至計算至計算至計算至2003/3/24 2003/3/24 資料來源:資料來源:資料來源:資料來源:Bloomberg Bloomberg 整理:怡富投顧整理:怡富投顧整理:怡富投顧整理:怡富投顧 第14页,本讲稿共85页相關係數應用實例二相關係數應用實例二 我國在漸邁入高齡化社會的同時我國在漸邁入高齡化社會的同時,整體社會每年平均花在醫療保健上的整體社會每年平均花在醫療保健上的費用費用,將益為提高。由此可看出將益為提高。由此可看出 :年齡是影響個人每年花在醫年齡是影響個人每年花在醫療保健費用多寡的原因之一。療保健費用多寡的原因之一。個
11、人每年花在醫療保健費用和個人總財富累積這兩個因素個人每年花在醫療保健費用和個人總財富累積這兩個因素,同時同時受年齡的影響受年齡的影響,才使得醫療保健費用和個人總財富累積兩個變數間才使得醫療保健費用和個人總財富累積兩個變數間間接地具高度線性相關,而其實醫療保健費用和個人總財富累積兩個間接地具高度線性相關,而其實醫療保健費用和個人總財富累積兩個變數間並不具有因果關係。但是變數間並不具有因果關係。但是,如果醫療保健費用和總財富累積兩如果醫療保健費用和總財富累積兩個變數個變數,都去除掉年齡的影響後都去除掉年齡的影響後,將發現這兩個因素呈低度線將發現這兩個因素呈低度線性相關。也就是說性相關。也就是說,去
12、除掉年齡的影響後去除掉年齡的影響後,醫療保健費用和總醫療保健費用和總財富累積的偏相關係數變得很接近財富累積的偏相關係數變得很接近 0 0。“只要常看病只要常看病,口袋裏口袋裏的孫中山就會愈多的孫中山就會愈多”的奇怪推論的奇怪推論,在去除幕後的藏鏡人在去除幕後的藏鏡人年齡年齡之後之後,自可迎刃而解。自可迎刃而解。(資料來源資料來源易得太資訊易得太資訊(統計桃統計桃花源花源)第15页,本讲稿共85页14.1.2 相關係數的意義相關係數的意義(續續)母體相關係數母體相關係數 其中其中 X X,X X為隨機變數為隨機變數X X的平均數與標準差;的平均數與標準差;Y Y,Y Y為隨機變數為隨機變數Y Y
13、的平均數與標準差;的平均數與標準差;XYXY為隨機變數為隨機變數X X與與Y Y之共變異數。之共變異數。第16页,本讲稿共85页14.1.2 相關係數的意義相關係數的意義(續續1)若若X X與與Y Y為成對資料則母體相關係數可表為為成對資料則母體相關係數可表為第17页,本讲稿共85页14.1.2 相關係數的意義相關係數的意義(續續2)相關係數的性質相關係數的性質:1.相關係數的值介於相關係數的值介於 1 1 與與 1 1 之間。之間。2.當當 XYXY=1=1,表示,表示X X與與Y Y為完全正相關,亦即當為完全正相關,亦即當X X變變動時,動時,Y Y亦以相同方向變動;反之,亦然。亦以相同方
14、向變動;反之,亦然。3.當當 XYXY=1=1,表示,表示X X與與Y Y為完全負相關,亦即當為完全負相關,亦即當X X變動時,變動時,Y Y亦以相反方向來變動;反之,亦然。亦以相反方向來變動;反之,亦然。4.當當 XYXY=0=0,代表,代表X X與與Y Y完全沒有線性關係,不過完全沒有線性關係,不過並不代表兩者之間沒有其他型態關係並不代表兩者之間沒有其他型態關係(如拋物線如拋物線關係關係)存在。存在。第18页,本讲稿共85页14.1.3 相關係數的估計相關係數的估計 我們必須假設之母體為一二維常態分配我們必須假設之母體為一二維常態分配(Bivariate normal(Bivariate
15、normal distribution)distribution),然後抽出樣本資料,然後抽出樣本資料 ,來計算樣本相,來計算樣本相關係數,而其定義如下:關係數,而其定義如下:其中其中第19页,本讲稿共85页例例14.2 續例續例14.1 若試問停留時間與消費額之相關係數為何,可利用若試問停留時間與消費額之相關係數為何,可利用ExcelExcel來計算相關係數,來計算相關係數,步驟如下:步驟如下:1.輸入表輸入表14.114.1的資料。的資料。2.點選工具、資料分析、相關係數點選工具、資料分析、相關係數 。3.輸入資料範圍輸入資料範圍$A$1:$B$10$A$1:$B$10,並按確定。,並按確
16、定。4.結果可得結果可得r rXYXY=0.425265=0.425265。第20页,本讲稿共85页14.1.3 相關係數的估計(續)相關係數的估計(續)圖圖14.2 14.2 不同的不同的 XYXY時,時,X X與與Y Y的散布圖的散布圖第21页,本讲稿共85页14.1.4 相關係數的檢定相關係數的檢定 XYXY=0=0的檢定的檢定 1.1.假設假設 H H0 0:XYXY=0=0 H H1 1:XYXY 0 02.2.檢定統計量檢定統計量 當當 XYXY=0=0且且(x,y)(x,y)來自二元常態分配時,來自二元常態分配時,檢定統計量檢定統計量 t*t*為一自由度為一自由度為為 n n2
17、2 的的 t t 分配。分配。第22页,本讲稿共85页例例14.3 續例續例14.2 在例在例14.114.1中,試在中,試在=0.05=0.05的水準下,檢定停留時間與消費額是否有關係的水準下,檢定停留時間與消費額是否有關係存在。可設定虛無與對立假設為存在。可設定虛無與對立假設為 H H0 0:XY XY=0=0 H H1 1:XYXY 0 01.1.檢定統計量檢定統計量:2.2.拒絕域拒絕域:第23页,本讲稿共85页例例14.3 續例續例14.2(續(續)3.3.相關係數相關係數:4.4.檢定統計量之值檢定統計量之值:5.5.所以不拒絕所以不拒絕H H0 0,亦即無充分證據顯示停留時間與消
18、費,亦即無充分證據顯示停留時間與消費額間有相關存在。額間有相關存在。第24页,本讲稿共85页14.1.4相關係數的檢定相關係數的檢定(續續)XY=0的檢定 1.假設假設 H H0 0:XYXY=0 0 H H1 1:XY XY 0 02.檢定統計量採用檢定統計量採用FisherFisher轉換轉換 Zr Zr第25页,本讲稿共85页14.1.4 相關係數的檢定相關係數的檢定(續續1)XYXY=0 0的檢定的檢定 當當n n 30 30時,時,Z Zr r近似於常態分配,即近似於常態分配,即 ,其中,其中 所以可以透過所以可以透過Z Z檢定來完成,亦即檢定來完成,亦即第26页,本讲稿共85页例例
19、14.4 廣告費用與銷售量廣告費用與銷售量 某公司想瞭解廣告費用與銷售量之間的相關,於是蒐集了過某公司想瞭解廣告費用與銷售量之間的相關,於是蒐集了過去去3636個月的資料,並計算得相關係數為個月的資料,並計算得相關係數為0.680.68,試在,試在0.050.05的的顯著水準下,檢定下列的假設顯著水準下,檢定下列的假設:H H0 0:XYXY=0.75 =0.75 H H1 1:XYXY 0.75 0.75先求先求第27页,本讲稿共85页例例14.4 廣告費用與銷售量(續)廣告費用與銷售量(續)再求檢定統計量值再求檢定統計量值 ,所以不拒絕,所以不拒絕H H0 0 ,亦即無充分證據,亦即無充分
20、證據顯示廣告費用與銷售量之間的相關係數不為顯示廣告費用與銷售量之間的相關係數不為0.75 0.75。第28页,本讲稿共85页14.2 簡單線性迴歸分析簡單線性迴歸分析 14.2.1 14.2.1 簡單線性迴歸模型與假設條件簡單線性迴歸模型與假設條件 14.2.2 14.2.2 線性迴歸方程式線性迴歸方程式第29页,本讲稿共85页14.2 簡單線性迴歸分析簡單線性迴歸分析(續續)簡單線性迴歸分析簡單線性迴歸分析(simple regression analysis):(simple regression analysis):利用一個變數來預測利用一個變數來預測(或解釋或解釋)另一個變數,找出兩個
21、變數另一個變數,找出兩個變數間的關係模式的方法。間的關係模式的方法。散布圖散布圖(scatter diagram)(scatter diagram)之功能之功能:為確定自變數為確定自變數 X X 與依變數與依變數 Y Y 之間之間,是否適合用簡單線性,是否適合用簡單線性迴歸分析(如果散布圖呈現出線性關係,則迴歸分析(如果散布圖呈現出線性關係,則 X X 與與 Y Y 應是適應是適合利用簡單線性迴合利用簡單線性迴歸分析來瞭解其間的關係)。歸分析來瞭解其間的關係)。第30页,本讲稿共85页自變數與依變數自變數與依變數 迴歸分析適用在研究者可以掌握因果關係,以後採用的相關性分析。迴歸分析適用在研究者
22、可以掌握因果關係,以後採用的相關性分析。自變數即是獨立變數,在因果關係中,它是獨立的,因其並不依賴其自變數即是獨立變數,在因果關係中,它是獨立的,因其並不依賴其他變數。依變數,即是在此因果關係中人們關切的變數。他變數。依變數,即是在此因果關係中人們關切的變數。被假設變數的因與果之間,必須有著某種理論的聯繫,須符被假設變數的因與果之間,必須有著某種理論的聯繫,須符合以下五條件:合以下五條件:1.1.一個變數之變化必須聯繫於另一個變數的變化。一個變數之變化必須聯繫於另一個變數的變化。2.2.原因之變數在時間上必須早於或居先於另一變數。原因之變數在時間上必須早於或居先於另一變數。3.3.因與果之關係
23、必須大致可信。因與果之關係必須大致可信。4.4.所主張之關係必須與其他證據一致。所主張之關係必須與其他證據一致。5.5.所指認的因素必須是最重要的因素。所指認的因素必須是最重要的因素。(資料來源資料來源石之瑜石之瑜迴歸方法作為社會科學方法的省思迴歸方法作為社會科學方法的省思)第31页,本讲稿共85页練習思考題練習思考題 若要分析豬肉的需求與其價格的關係時,若要分析豬肉的需求與其價格的關係時,1.請問如何利用迴歸分析來分析之?請問如何利用迴歸分析來分析之?2.承承1 1,若以相關分析來分析,則有何異同?,若以相關分析來分析,則有何異同?第32页,本讲稿共85页例例14.5 廣告支出與營業額廣告支
24、出與營業額 ABCABC公司的行銷經理想了解公司廣告支出公司的行銷經理想了解公司廣告支出(X X)與營業額與營業額(Y Y)之間的關係於是蒐集了過去之間的關係於是蒐集了過去1010年的廣告支出與營業年的廣告支出與營業額的資料如表額的資料如表14.314.3,試問他,試問他(她她)是否適合利用簡單線性迴是否適合利用簡單線性迴歸分析來了解廣告支出與營業額的關係歸分析來了解廣告支出與營業額的關係?第33页,本讲稿共85页例例14.5 廣告支出與營業額廣告支出與營業額(續續)表表14.3 1014.3 10年的廣告支出與營業額資料年的廣告支出與營業額資料(單位:萬元單位:萬元)第34页,本讲稿共85页
25、例例14.5 廣告支出與營業額廣告支出與營業額(續續1)將表將表14.314.3的數據繪製成圖的數據繪製成圖14.314.3,由圖,由圖14.314.3中可看出,廣告中可看出,廣告支出與營業額間似乎存在著線性關係,因此簡單線性支出與營業額間似乎存在著線性關係,因此簡單線性迴歸分析應是適合用來分析廣告支出與營業額間的關迴歸分析應是適合用來分析廣告支出與營業額間的關係。係。圖圖14.3 14.3 廣告支出與營業額的散布圖廣告支出與營業額的散布圖 第35页,本讲稿共85页14.2.1 簡單線性迴歸模型與假設條件簡單線性迴歸模型與假設條件 簡單線性迴歸模型簡單線性迴歸模型(simple regress
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 简单 相关 分析 线性 回归 优秀 课件
限制150内