回归分析RegressionAnalysis.ppt
《回归分析RegressionAnalysis.ppt》由会员分享,可在线阅读,更多相关《回归分析RegressionAnalysis.ppt(27页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、迴歸分析Regression Analysis1 1簡單迴歸與多元迴歸Simple and Multiple regressionl l基本定義基本定義l l簡單迴歸:以單一自變項去解釋(預測)依變項的迴歸分析簡單迴歸:以單一自變項去解釋(預測)依變項的迴歸分析l l多元迴歸:同時以多個自變項去解釋(預測)依變項的迴歸分析多元迴歸:同時以多個自變項去解釋(預測)依變項的迴歸分析l l各變項均為連續性變項,或是可為虛擬為連續性變項者各變項均為連續性變項,或是可為虛擬為連續性變項者l l方程式方程式l l簡單迴歸:簡單迴歸:Y=bY=b1 1x x1 1+a+al l多元迴歸:多元迴歸:Y=bY=
2、b1 1x x1 1+b+b2 2x x2 2+b+b3 3x x3 3+b+bn nx xn n+a+al l多元迴歸的特性:多元迴歸的特性:l l對於依變項的解釋與預測,可以據以建立一個完整的模型。對於依變項的解釋與預測,可以據以建立一個完整的模型。l l各自變項之間概念上具有獨立性,但是數學上可能是非直交(具各自變項之間概念上具有獨立性,但是數學上可能是非直交(具有相關)有相關)l l自變項間的相關對於迴歸結果具有關鍵性的影響。自變項間的相關對於迴歸結果具有關鍵性的影響。2 2迴歸分析的統計原理:變異數拆解與F testl l利用回歸方程式,依變項Y變異量當中可以被解釋的部分稱為回歸變異
3、量l l無法被解釋的部分稱為殘差變異量l lSSy=SSreg+SSresSSy=SSreg+SSres迴歸離均差誤差原始離均差Xi3 3迴歸可解釋變異量比(R2)l l迴歸可解釋變異量比,又稱為迴歸可解釋變異量比,又稱為R2R2(R squareR square),表示使用),表示使用X X去預測去預測Y Y時的預測釋力,即時的預測釋力,即Y Y變項被自變項所解釋的比率。變項被自變項所解釋的比率。反應了由自變項與依變項所形成的線性迴歸模式的契合度反應了由自變項與依變項所形成的線性迴歸模式的契合度(goodness of fitgoodness of fit)l l又稱為迴歸模型的決定係數(又
4、稱為迴歸模型的決定係數(coefficient of determinationcoefficient of determination),),R2R2開方後可得開方後可得multiple multiple R R,為自變項與依變項的多元相關。,為自變項與依變項的多元相關。l l此一數值是否具有統計上的意義,反映了此一迴歸分析或此一數值是否具有統計上的意義,反映了此一迴歸分析或預測力是否具有統計上的意義,必須透過預測力是否具有統計上的意義,必須透過F F考驗來判斷考驗來判斷 4 4Adjusted R2l l以樣本統計量推導出來的以樣本統計量推導出來的R R2 2來評估整體模式的解來評估整體模
5、式的解釋力,並進而推論到母群體時,會有高估的傾向釋力,並進而推論到母群體時,會有高估的傾向 l l樣本數越小,越容易高估,解釋力膨脹效果越明樣本數越小,越容易高估,解釋力膨脹效果越明顯,樣本數越大,膨脹情形越輕微顯,樣本數越大,膨脹情形越輕微 l l校正後校正後R R2 2(adjusted Radjusted R2 2),可以減輕因為樣本估),可以減輕因為樣本估計帶來的計帶來的R2R2膨脹效果。當樣本數越小,應採用校膨脹效果。當樣本數越小,應採用校正後正後R R2 2。5 5迴歸係數(regression coefficient)l l迴歸方程式迴歸方程式Y=bX+aY=bX+al lB B
6、係數:係數:l l為一未標準化的迴歸係數,其意義為每單位為一未標準化的迴歸係數,其意義為每單位X X值的變動時,值的變動時,Y Y所變動的原始量所變動的原始量l lB B係數適用於實務工作的預測數值的計算係數適用於實務工作的預測數值的計算l l 係數:係數:l l如果將如果將b b值乘以值乘以X X變項的標準差再除以變項的標準差再除以Y Y變項的標準差,即變項的標準差,即可去除單位的影響,並控制兩個變項的分散情形,得到新可去除單位的影響,並控制兩個變項的分散情形,得到新的數值的數值(BetaBeta),為不具備特定單位的標準化迴歸係數),為不具備特定單位的標準化迴歸係數l l 係數也是將係數也
7、是將X X與與Y Y變項所有數值轉換成變項所有數值轉換成Z Z分數後,所計算得到的迴歸方分數後,所計算得到的迴歸方程式的斜率,該方程式通過程式的斜率,該方程式通過ZXZX,ZYZY的零點,因此截距為的零點,因此截距為0 0。l l 係數具有與相關係數相似的性質,也就是介於係數具有與相關係數相似的性質,也就是介於-1-1至至+1+1之間,其絕對值之間,其絕對值越大者,表示預測能力越強,正負向則代表越大者,表示預測能力越強,正負向則代表X X與與Y Y變項的關係方向。變項的關係方向。l l 係數適用於變項解釋力的比較,偏向學術用途係數適用於變項解釋力的比較,偏向學術用途6 6多元共線性的檢驗l l
8、對於某一個自變項共線性的檢驗,可以使用容忍值(對於某一個自變項共線性的檢驗,可以使用容忍值(tolerancetolerance)或變異數膨脹因素(或變異數膨脹因素(variance inflation factor,VIFvariance inflation factor,VIF)來評估。)來評估。l lRi2Ri2為某一個自變項被其他自變項當作依變項來預測時,該自變為某一個自變項被其他自變項當作依變項來預測時,該自變項可以被解釋的比例,項可以被解釋的比例,1-1-Ri2Ri2(容忍值)為該自變項被其他自變(容忍值)為該自變項被其他自變項無法解釋的殘差比項無法解釋的殘差比 l lRi2Ri2
9、比例越高,容忍值越小,代表預測變項不可解釋殘差比低,比例越高,容忍值越小,代表預測變項不可解釋殘差比低,VIFVIF越大,即預測變項迴歸係數的變異數增加,共變性越明顯。越大,即預測變項迴歸係數的變異數增加,共變性越明顯。l l整體迴歸模式的共線性診斷可以透過特徵值(整體迴歸模式的共線性診斷可以透過特徵值(eigenvalueeigenvalue)與條)與條件指數(件指數(conditional index;CIconditional index;CI)來判斷。)來判斷。l l各變量相對的變異數比例(各變量相對的變異數比例(variance proportionsvariance proport
10、ions),可看出自變項),可看出自變項之間多元共線性的結構特性。當任兩變項在同一個特徵值上的變之間多元共線性的結構特性。當任兩變項在同一個特徵值上的變異數比例接近異數比例接近1 1時,表示存在共線性組合。時,表示存在共線性組合。7 7Basic assumptions to regressionl lAssumptionsAssumptionsl lAssumptions for residuals(error scores)Assumptions for residuals(error scores)l lZero MeanZero Meanl lHomoscedasticHomosced
11、asticl lIndependence with predictorsIndependence with predictorsl lNormalityNormalityl lAssumptions for specification errorsAssumptions for specification errorsl lLinear relationshipLinear relationshipl lAll relevant predictors must be includedAll relevant predictors must be includedl lNo irrelevant
12、 predictors can be includedNo irrelevant predictors can be includedl lAssumptions for measurement errorsAssumptions for measurement errorsl lRelevant measurement procedures and variable selectionsRelevant measurement procedures and variable selectionsl lProvidence of the goodness index of measuremen
13、tProvidence of the goodness index of measurement8 8Issues in Regressionl lMulticollinearityMulticollinearityl lTheoretical issuesTheoretical issuesl lAnalytic or Technical issuesAnalytic or Technical issuesl lMeasurement issuesMeasurement issuesl lCategorical variable as predictorsCategorical variab
14、le as predictorsl lEffect codingEffect codingl lDummy codingDummy codingl lType of regression analysisType of regression analysisl lDetermination of selection procedures of predictorsDetermination of selection procedures of predictorsl lSimultaneous regressionSimultaneous regressionl lStepwise regre
15、ssionStepwise regressionl lHierarchical regressionHierarchical regressionl lControlling for Type I and II errorControlling for Type I and II errorl lLess is moreLess is morel lTheoretical considerationTheoretical considerationl lMeasurement considerationMeasurement consideration9 9Homoscedasticity a
16、nd Standard error of estimate;SEest1010多元迴歸的應用策略1111迴歸的應用模式迴歸的應用模式l lTwo applications of correlation and regressionl lPredictionPrediction To predict events or behavior for practical To predict events or behavior for practical decision-making purposes in applied settingsdecision-making purposes in a
17、pplied settingsl lExplanationExplanation To understand or explain the nature of a To understand or explain the nature of a phenomenon for purpose of testing or developing phenomenon for purpose of testing or developing theoriestheories1212預測型迴歸預測型迴歸l lDetermining the Determining the predictor variab
18、lespredictor variables and and criterion variables criterion variables l lSearching for valid variables and removing the unnecessary variablesSearching for valid variables and removing the unnecessary variablesl lDeriving a linear formula:multiple regression equation(Usage of Deriving a linear formu
19、la:multiple regression equation(Usage of derivation study)derivation study)l lLinear equation is custom-made,therefore the accuracy and degree of Linear equation is custom-made,therefore the accuracy and degree of relationship may shrink among studiesrelationship may shrink among studiesl lStrategy
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 RegressionAnalysis
限制150内