《生物统计学的未来精品文稿.ppt》由会员分享,可在线阅读,更多相关《生物统计学的未来精品文稿.ppt(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、生物统计学的未来第1页,本讲稿共29页一、引言一、引言n n學術界往往很不瞭解統計學的作用學術界往往很不瞭解統計學的作用n n許多統計學成就來自複雜的數學和計算工許多統計學成就來自複雜的數學和計算工具,所以只進入少數學者的視野具,所以只進入少數學者的視野第2页,本讲稿共29页什麼是統計學?什麼是統計學?n n統計學是一個學科,研究變異性、不確定性和統計學是一個學科,研究變異性、不確定性和面對不確定性的決策面對不確定性的決策 -對所有科學技術都重要,註定是一門對所有科學技術都重要,註定是一門多學科的科學多學科的科學 -多數統計學應用和許多統計學研究是多數統計學應用和許多統計學研究是其它專業領域的
2、科學家完成的其它專業領域的科學家完成的(DR Cox)第3页,本讲稿共29页統計學科研的作用統計學科研的作用n n統計學越來越不同於其它數學領域,電腦統計學越來越不同於其它數學領域,電腦和資訊科學工具至少和概率論一樣重要。和資訊科學工具至少和概率論一樣重要。n n統計學科研的作用是發展新的工具,應用統計學科研的作用是發展新的工具,應用於科學前沿。於科學前沿。第4页,本讲稿共29页統計學界統計學界n n在美國,現有在美國,現有86個統計學、生物統計學和個統計學、生物統計學和生物計量學的博士點生物計量學的博士點n n很大一部分統計學家工作於統計系之外很大一部分統計學家工作於統計系之外 -生物統計系
3、、醫學院、商學院、社會生物統計系、醫學院、商學院、社會科學系科學系 -政府機構、工業界(尤其是製藥廠)政府機構、工業界(尤其是製藥廠)第5页,本讲稿共29页統計學的現狀統計學的現狀n n資料收集資料收集 -高速電腦和感測器以及某些實驗科學可高速電腦和感測器以及某些實驗科學可產生巨量資料(例如人類基因組)產生巨量資料(例如人類基因組)-需要新工具來組織和提取重要資訊。需要新工具來組織和提取重要資訊。(National Science Foundation(1998)report 98-95)資料和資訊的區別:將資料轉化為資訊需要資料和資訊的區別:將資料轉化為資訊需要統計理論和實踐方面的洞察力、技
4、術和訓練。統計理論和實踐方面的洞察力、技術和訓練。(Zelen)第6页,本讲稿共29页統計學的現狀統計學的現狀n n科研合作的機會增多科研合作的機會增多 -應用、多學科課題中統計學的錯用嚴重應用、多學科課題中統計學的錯用嚴重 -由於大量資料的產生,人們主張統計人由於大量資料的產生,人們主張統計人員進入研究團隊員進入研究團隊 (National Science Foundation(1998)report 98-95)第7页,本讲稿共29页統計學的現狀統計學的現狀n n科學引用指數(科學引用指數(Science Citation Index):):1991-2001年其間年其間25位引用最多的數
5、學科學位引用最多的數學科學家中家中18位是統計學或生物統計學家;位是統計學或生物統計學家;Journal of the American Statistical Association是被引用最多的數學科學雜誌;是被引用最多的數學科學雜誌;最重要的一篇文章是最重要的一篇文章是Efron(1979)引入引入boostrap方法;方法;500次最近的引用中只有次最近的引用中只有152次出現在統計學文章中次出現在統計學文章中第8页,本讲稿共29页統計學的核心統計學的核心n n統計學與數學的其它分支不同,總是和應用、統計學與數學的其它分支不同,總是和應用、結果的重要性聯繫在一起。結果的重要性聯繫在一起
6、。(National Science Foundation(1998)report 98-95)n n統計學的核心是學科內在的東西,而不是特定統計學的核心是學科內在的東西,而不是特定科學問題對統計學的要求。科學問題對統計學的要求。n n統計學核心方面的研究著重基於該學科普遍原統計學核心方面的研究著重基於該學科普遍原理發展統計模型、方法和相關理論。理發展統計模型、方法和相關理論。第9页,本讲稿共29页 統計理論和統計實踐統計理論和統計實踐n n有些同事稱自己是數理統計學家或應用統有些同事稱自己是數理統計學家或應用統計學家。這兩個術語過時了,必須丟棄。計學家。這兩個術語過時了,必須丟棄。前者不和資
7、料打交道,後者不涉及理論前者不和資料打交道,後者不涉及理論(Selen)第10页,本讲稿共29页二、統計研究面臨的挑戰二、統計研究面臨的挑戰資料增長的規模:資料增長的規模:數據數據-指數指數 資料分析資料分析-二次方二次方 統計學家統計學家-線性線性資料縮減和壓縮資料縮減和壓縮 “縮減縮減”:用新的思路指導模型選擇、預測用新的思路指導模型選擇、預測和分類和分類“壓縮壓縮”:深刻瞭解資料結構有助於壓深刻瞭解資料結構有助於壓縮儲存和較好地重現縮儲存和較好地重現。第11页,本讲稿共29页統計學界以外的資料分析統計學界以外的資料分析 -許多方法和計算策略是統計學界以外發許多方法和計算策略是統計學界以外
8、發展起來的展起來的(如如machine learning和和neural network)-未來研究應將這些未來研究應將這些machine learning和其它方面發展起來的大量、複雜資料集的分和其它方面發展起來的大量、複雜資料集的分析方法納入統計學核心知識。析方法納入統計學核心知識。-如果我們的目標是利用資料解決問題,如果我們的目標是利用資料解決問題,那末我們必須從單純依靠資料模型走向採納各那末我們必須從單純依靠資料模型走向採納各種各樣工具。種各樣工具。第12页,本讲稿共29页大大p小小n多變數分析多變數分析 例例:曲線資料、譜、圖像、曲線資料、譜、圖像、DNA微陣列微陣列 -幾乎沒有現成
9、的統計理論支持和理解主成幾乎沒有現成的統計理論支持和理解主成分分析、典則分析等用於降維的富有啟發性的分分析、典則分析等用於降維的富有啟發性的方法方法 -其它領域的創新可能有助於這個問題。其它領域的創新可能有助於這個問題。例:例:隨機矩陣理論,過去隨機矩陣理論,過去40年發展了有許多年發展了有許多模型和方法,近年引起了概率和組合數學方面模型和方法,近年引起了概率和組合數學方面極大的興趣。極大的興趣。第13页,本讲稿共29页Bayes和有偏估計和有偏估計 發展和開拓發展和開拓Bayesian方法和現代非參數、半方法和現代非參數、半參數統計之間的聯繫,包括研究參數統計之間的聯繫,包括研究Bayesi
10、an和和and frequencist結合的方法學。結合的方法學。-對於具有大量變數的巨型資料,需要更廣對於具有大量變數的巨型資料,需要更廣泛的有偏估計理論。泛的有偏估計理論。-也需要進一步的也需要進一步的Monte Carlo方法做推方法做推斷。斷。第14页,本讲稿共29页證明和計算實驗之間的中間地帶證明和計算實驗之間的中間地帶 證明證明 太難,或非頭等重要太難,或非頭等重要 計算實驗計算實驗 太任意和不足以令人信服太任意和不足以令人信服 例:例:混合模型混合模型 大多忽略識別問題,因為困大多忽略識別問題,因為困難,並加重模型結構的多樣性難,並加重模型結構的多樣性第15页,本讲稿共29页三、
11、生命科學中的統計學三、生命科學中的統計學上半個世紀的里程碑:上半個世紀的里程碑:-生物統計學生物統計學 -統計流行病學統計流行病學 -隨機化臨床試驗隨機化臨床試驗第16页,本讲稿共29页與未來統計學有關的與未來統計學有關的 生命科學的四個領域生命科學的四個領域-生物分子序列分析和功能基因組學生物分子序列分析和功能基因組學-遺傳流行病學遺傳流行病學-進化、群體遺傳學和生態學進化、群體遺傳學和生態學-計算神經科學計算神經科學 第17页,本讲稿共29页生物統計與生物資訊生物統計與生物資訊n n分子生物學已進化到資訊科學,出現了新學科分子生物學已進化到資訊科學,出現了新學科Computational
12、Biology,或或Bioinformatics.-發現和實施演算法,以瞭解生物學過程發現和實施演算法,以瞭解生物學過程 -主要工具主要工具:計算、統計和計算、統計和“machine learning”技術技術 -分析方法主要是特定的,尚處初級階段分析方法主要是特定的,尚處初級階段n n這是統計科學家用武之地,尤其,這是統計科學家用武之地,尤其,micro-array技術已經創造了新穎的統計學問題,激技術已經創造了新穎的統計學問題,激發了許多新的生物統計學研究。發了許多新的生物統計學研究。-若干生物統計系已經改名為若干生物統計系已經改名為Biostatistics and Bioinforma
13、tics.第18页,本讲稿共29页中醫臨床試驗中醫臨床試驗n n“東方傳統醫學的某些方面可能真的有效東方傳統醫學的某些方面可能真的有效,可可以充實西方醫學以充實西方醫學.去年我在中國大陸參加了去年我在中國大陸參加了一個會議一個會議,主題是主題是 中藥臨床試驗的設計。很中藥臨床試驗的設計。很明顯,東方在彙集傳統醫學有效性和安全明顯,東方在彙集傳統醫學有效性和安全性方面的臨床試驗將會有重要的發展。性方面的臨床試驗將會有重要的發展。(Zelen)第19页,本讲稿共29页加強協作活動加強協作活動n n價值:發展統計方法學、多學科研究。價值:發展統計方法學、多學科研究。n n雖然不同人有不同側重,同一個
14、人不同時期也雖然不同人有不同側重,同一個人不同時期也有不同側重,所有統計學家都要有兩方面的活有不同側重,所有統計學家都要有兩方面的活動:方法學研究和其它專業中的應用。動:方法學研究和其它專業中的應用。第20页,本讲稿共29页大學與工業界關係大學與工業界關係n n生物統計學的領導地位主要在大學。生物統計學的領導地位主要在大學。n n工業界正聘用許多年輕有為生物統計學家,有工業界正聘用許多年輕有為生物統計學家,有助於加強工業界與大學間關係。助於加強工業界與大學間關係。n n大學與工業界有許多共同目標,工業界開始介大學與工業界有許多共同目標,工業界開始介入教育過程。入教育過程。n n學術界要抓緊與工
15、業界相結合的過程。學術界要抓緊與工業界相結合的過程。(Zelen)第21页,本讲稿共29页統計科學與衛生決策統計科學與衛生決策n n我們不僅負責收集資料和解釋資料,也要引導決策。我們不僅負責收集資料和解釋資料,也要引導決策。我們不僅負責收集資料和解釋資料,也要引導決策。我們不僅負責收集資料和解釋資料,也要引導決策。n n許多公共衛生問題需要決策:許多公共衛生問題需要決策:許多公共衛生問題需要決策:許多公共衛生問題需要決策:-世界範圍的愛滋病流行世界範圍的愛滋病流行世界範圍的愛滋病流行世界範圍的愛滋病流行 兩年前在遠東爆發的流行兩年前在遠東爆發的流行兩年前在遠東爆發的流行兩年前在遠東爆發的流行
16、AvarianAvarian病毒的擴散病毒的擴散病毒的擴散病毒的擴散 目前在某些阿拉伯國家的目前在某些阿拉伯國家的目前在某些阿拉伯國家的目前在某些阿拉伯國家的PolioPolio爆發爆發爆發爆發n n決策者得到的輸入是資料,多半要精製和綜合成定量模型。這決策者得到的輸入是資料,多半要精製和綜合成定量模型。這決策者得到的輸入是資料,多半要精製和綜合成定量模型。這決策者得到的輸入是資料,多半要精製和綜合成定量模型。這些模型可預測疾病流行的速度、最敏感的亞人群、所需疫苗的些模型可預測疾病流行的速度、最敏感的亞人群、所需疫苗的些模型可預測疾病流行的速度、最敏感的亞人群、所需疫苗的些模型可預測疾病流行的
17、速度、最敏感的亞人群、所需疫苗的規模等等規模等等規模等等規模等等n n我期待我們的同行們在公共衛生決策中發揮更大的作用我期待我們的同行們在公共衛生決策中發揮更大的作用我期待我們的同行們在公共衛生決策中發揮更大的作用我期待我們的同行們在公共衛生決策中發揮更大的作用,尤尤尤尤其是在國際範圍內其是在國際範圍內其是在國際範圍內其是在國際範圍內.(Zelen).(Zelen)第22页,本讲稿共29页四、統計學教育四、統計學教育n n“統計學年輕人有足夠的職業機會,學術界、工業部門、統計學年輕人有足夠的職業機會,學術界、工業部門、統計學年輕人有足夠的職業機會,學術界、工業部門、統計學年輕人有足夠的職業機會
18、,學術界、工業部門、政府機構政府機構政府機構政府機構”。“在美國,很高比例的統計研究生出生于外國,畢業後在美國,很高比例的統計研究生出生于外國,畢業後在美國,很高比例的統計研究生出生于外國,畢業後在美國,很高比例的統計研究生出生于外國,畢業後留在美國留在美國留在美國留在美國”。(National Science Foundation(1998)report 98-(National Science Foundation(1998)report 98-95)95)n n “對生物統計學的需求從來沒有象今天這樣大,特別對生物統計學的需求從來沒有象今天這樣大,特別對生物統計學的需求從來沒有象今天這樣
19、大,特別對生物統計學的需求從來沒有象今天這樣大,特別是美國。美國是美國。美國是美國。美國是美國。美國National Research CouncilNational Research Council研究研究研究研究結論:結論:結論:結論:在所有的衛生科研行業,最最缺乏生物統計在所有的衛生科研行業,最最缺乏生物統計在所有的衛生科研行業,最最缺乏生物統計在所有的衛生科研行業,最最缺乏生物統計學和流行病學人才學和流行病學人才學和流行病學人才學和流行病學人才”。(。(。(。(Zelen)Zelen)第23页,本讲稿共29页 教育改革教育改革:需求變了,訓練必須變!需求變了,訓練必須變!n n科學技術
20、快速發展。大學教學計畫必須變化以科學技術快速發展。大學教學計畫必須變化以抓住新的科學機遇。否則,我們的專業與未來抓住新的科學機遇。否則,我們的專業與未來無關。無關。n n我預見,未來的生物統計學家需要生物資訊學我預見,未來的生物統計學家需要生物資訊學和遺傳學方面的訓練;較少側重傳統數理統計,和遺傳學方面的訓練;較少側重傳統數理統計,而要更多注意資料分析,尤其是大型資料庫的而要更多注意資料分析,尤其是大型資料庫的處理。處理。(Zelen)第24页,本讲稿共29页多層次教育多層次教育n n鼓勵統計專業學生在一個或幾個應用領域獲鼓勵統計專業學生在一個或幾個應用領域獲取更深更廣的專業知識。取更深更廣的
21、專業知識。n n統計學研究生教育要提供足夠深而廣的、現統計學研究生教育要提供足夠深而廣的、現代統計學家所使用的工具,包括數學、電腦代統計學家所使用的工具,包括數學、電腦科學和基礎科學。科學和基礎科學。n n博士後教育和繼續教育幫助新畢業研究生發博士後教育和繼續教育幫助新畢業研究生發展專業技術,幫助年長統計學家更新知識。展專業技術,幫助年長統計學家更新知識。第25页,本讲稿共29页未來有用的統計和計算方法未來有用的統計和計算方法n n隨機過程隨機過程隨機過程隨機過程 有限有限有限有限MarkovMarkov鏈鏈鏈鏈,點過程點過程點過程點過程,Gaussian,Gaussian隨機場隨機場隨機場隨
22、機場n n隱隱隱隱MarkovMarkov模型和模型和模型和模型和MarkovMarkov鏈鏈鏈鏈Monte CarloMonte Carlo 重要演算重要演算重要演算重要演算法法法法n n傳統方法的改進傳統方法的改進傳統方法的改進傳統方法的改進 -多重比較多重比較多重比較多重比較(微陣列微陣列微陣列微陣列)-主成分主成分主成分主成分(主成分曲線主成分曲線主成分曲線主成分曲線)-似然分析似然分析似然分析似然分析(隨機過程的似然分析隨機過程的似然分析隨機過程的似然分析隨機過程的似然分析)-實驗設計實驗設計實驗設計實驗設計n n“User-friendlyUser-friendly”演算法演算法演
23、算法演算法n n與生命科學家的交流與生命科學家的交流與生命科學家的交流與生命科學家的交流第26页,本讲稿共29页將通訊資源用於教育將通訊資源用於教育n n將專業課程收集到網上將專業課程收集到網上,無償使用無償使用 -幻燈放到網上幻燈放到網上,在老師指導下在老師指導下,生物統計學生物統計學生可學到主要生物統計學中心的課程生可學到主要生物統計學中心的課程 -學術講座也可以上網學術講座也可以上網 -這種做法在流行病學已有先例這種做法在流行病學已有先例:(http:/www.pitt.edu/super1)Pittsburgh大學的大學的Prof.Ron LaPorte及其同事及其同事,已經收集了已經
24、收集了2000個課程和學術講個課程和學術講座座,放在網上供無償使用。放在網上供無償使用。第27页,本讲稿共29页生物統計學的領導地位生物統計學的領導地位n n我期待許多外國學生將回到他們的祖國,在生物統計學教我期待許多外國學生將回到他們的祖國,在生物統計學教我期待許多外國學生將回到他們的祖國,在生物統計學教我期待許多外國學生將回到他們的祖國,在生物統計學教育和實踐方面的影響。育和實踐方面的影響。育和實踐方面的影響。育和實踐方面的影響。n n我可以預見,雖然生物統計學某些方面的領導地位我可以預見,雖然生物統計學某些方面的領導地位我可以預見,雖然生物統計學某些方面的領導地位我可以預見,雖然生物統計
25、學某些方面的領導地位目前在美國或英國,但目前在美國或英國,但目前在美國或英國,但目前在美國或英國,但see that some of the see that some of the leadership in biostatistical science,which leadership in biostatistical science,which is inis in將會逐漸被其它國家分享。新的生物統計學項目將會逐漸被其它國家分享。新的生物統計學項目將會逐漸被其它國家分享。新的生物統計學項目將會逐漸被其它國家分享。新的生物統計學項目將在許多國家興起,尤其是東方國家。(將在許多國家興起,尤
26、其是東方國家。(將在許多國家興起,尤其是東方國家。(將在許多國家興起,尤其是東方國家。(Pacific Rim Pacific Rim countriescountries:日本、中國大陸)。:日本、中國大陸)。:日本、中國大陸)。:日本、中國大陸)。(Zelen)(Zelen)第28页,本讲稿共29页References1.Lindsay BG,Kettenring J,Siegmund DO(2004).A 1.Lindsay BG,Kettenring J,Siegmund DO(2004).A report on the future of statistics.Statistical
27、 Science.report on the future of statistics.Statistical Science.19(3)387-413.19(3)387-413.2.National Science Foundation(1998).Report of the senior 2.National Science Foundation(1998).Report of the senior assessment panel of the international assessment of the US assessment panel of the international
28、 assessment of the US mathematical science.Report 98-95,National Science mathematical science.Report 98-95,National Science Foundation.Arlington,VA.Foundation.Arlington,VA.3.Lindsay BG,Kettenring J,Siegmund DO(2004).3.Lindsay BG,Kettenring J,Siegmund DO(2004).Statistics:Challenges and opportunities
29、for the Statistics:Challenges and opportunities for the twenty-first century.http:/www.stat.psu.edu/twenty-first century.http:/www.stat.psu.edu/bgl/nsf_report.pdfbgl/nsf_report.pdf4.Zelen M(2005).Biostatisticians,biostatistical science 4.Zelen M(2005).Biostatisticians,biostatistical science and the future.(Keynote talk given before the Eastern and the future.(Keynote talk given before the Eastern Mediterranean Region of the Biometric Society,May Mediterranean Region of the Biometric Society,May 2005)2005)第29页,本讲稿共29页
限制150内