生物统计学的未来课件.ppt
《生物统计学的未来课件.ppt》由会员分享,可在线阅读,更多相关《生物统计学的未来课件.ppt(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、生物统计学的未来生物统计学的未来方积乾方积乾中山大学公共卫生学院中山大学公共卫生学院一、引言一、引言n n学术界往往很不了解统计学的作用学术界往往很不了解统计学的作用n n许多统计学成就来自复杂的数学和计算工许多统计学成就来自复杂的数学和计算工具,所以只进入少数学者的视野具,所以只进入少数学者的视野什么是统计学?什么是统计学?n n统计学是一个学科,研究变异性、不确定性和统计学是一个学科,研究变异性、不确定性和面对不确定性的决策面对不确定性的决策 -对所有科学技术都重要,注定是一门对所有科学技术都重要,注定是一门多学科的科学多学科的科学 -多数统计学应用和许多统计学研究是多数统计学应用和许多统
2、计学研究是其它专业领域的科学家完成的其它专业领域的科学家完成的(DR Cox)统计学科研的作用统计学科研的作用n n统计学越来越不同于其它数学领域,计算统计学越来越不同于其它数学领域,计算机和信息科学工具至少和概率论一样重要。机和信息科学工具至少和概率论一样重要。n n统计学科研的作用是发展新的工具,应用统计学科研的作用是发展新的工具,应用于科学前沿。于科学前沿。统计学界统计学界n n在美国,现有在美国,现有86个统计学、生物统计学和个统计学、生物统计学和生物计量学的博士点生物计量学的博士点n n很大一部分统计学家工作于统计系之外很大一部分统计学家工作于统计系之外 -生物统计系、医学院、商学院
3、、社会生物统计系、医学院、商学院、社会科学系科学系 -政府机构、工业界(尤其是制药厂)政府机构、工业界(尤其是制药厂)统计学的现状统计学的现状n n数据收集数据收集 -高速计算机和传感器以及某些实验科学高速计算机和传感器以及某些实验科学可产生巨量数据(例如人类基因组)可产生巨量数据(例如人类基因组)-需要新工具来组织和提取重要信息。需要新工具来组织和提取重要信息。(National Science Foundation(1998)report 98-95)数据和信息的区别:将数据转化为信息需要数据和信息的区别:将数据转化为信息需要统计理论和实践方面的洞察力、技术和训练。统计理论和实践方面的洞察
4、力、技术和训练。(Zelen)统计学的现状统计学的现状n n科研合作的机会增多科研合作的机会增多 -应用、多学科课题中统计学的错用严重应用、多学科课题中统计学的错用严重 -由于大量数据的产生,人们主张统计人由于大量数据的产生,人们主张统计人员进入研究团队员进入研究团队 (National Science Foundation(1998)report 98-95)统计学的现状统计学的现状n n科学引用指数(科学引用指数(Science Citation Index):):1991-2001年其间年其间25 位引用最多的数学科学位引用最多的数学科学家中家中18位是统计学或生物统计学家;位是统计学或
5、生物统计学家;Journal of the American Statistical Association 是被引用最多的数学科学杂志;是被引用最多的数学科学杂志;最重要的一篇文章是最重要的一篇文章是Efron(1979)引入引入 boostrap 方法;方法;500 次最近的引用中只有次最近的引用中只有152 次出现在统计学文章中次出现在统计学文章中统计学的核心统计学的核心n n统计学与数学的其它分支不同,总是和应用、统计学与数学的其它分支不同,总是和应用、结果的重要性联系在一起。结果的重要性联系在一起。(National Science Foundation(1998)report 98
6、-95)n n统计学的核心是学科内在的东西,而不是特定统计学的核心是学科内在的东西,而不是特定科学问题对统计学的要求。科学问题对统计学的要求。n n统计学核心方面的研究着重基于该学科普遍原统计学核心方面的研究着重基于该学科普遍原理发展统计模型、方法和相关理论。理发展统计模型、方法和相关理论。统计理论和统计实践统计理论和统计实践n n有些同事称自己是数理统计学家或应用统有些同事称自己是数理统计学家或应用统计学家。这两个术语过时了,必须丢弃。计学家。这两个术语过时了,必须丢弃。前者不和数据打交道,后者不涉及理论前者不和数据打交道,后者不涉及理论(Selen)二、统计研究面临的挑战二、统计研究面临的
7、挑战数据增长的规模:数据增长的规模:数据数据-指数指数 数据分析数据分析-二次方二次方 统计学家统计学家-线性线性数据缩减和压缩数据缩减和压缩 “缩减缩减”:用新的思路指导模型选择、预测用新的思路指导模型选择、预测和分类和分类 “压缩压缩”:深刻了解数据结构有助深刻了解数据结构有助于压缩储存和较好地重现于压缩储存和较好地重现。统计学界以外的数据分析统计学界以外的数据分析 -许多方法和计算策略是统计学界以外发许多方法和计算策略是统计学界以外发展起来的展起来的(如如machine learning 和和 neural network)-未来研究应将这些未来研究应将这些machine learnin
8、g 和其它方面发展起来的大量、复杂和其它方面发展起来的大量、复杂数据集的分析方法纳入统计学核心知识。数据集的分析方法纳入统计学核心知识。-如果我们的目标是利用数据解决问题,如果我们的目标是利用数据解决问题,那末我们必须从单纯依靠数据模型走向采纳各那末我们必须从单纯依靠数据模型走向采纳各种各样工具。种各样工具。大大p小小n多变量分析多变量分析 例例:曲线资料、谱、图像、曲线资料、谱、图像、DNA 微阵列微阵列 -几乎没有现成的统计理论支持和理解主几乎没有现成的统计理论支持和理解主成分分析、典则分析等用于降维的富有启发性成分分析、典则分析等用于降维的富有启发性的方法的方法 -其它领域的创新可能有助
9、于这个问题。其它领域的创新可能有助于这个问题。例:例:随机矩阵理论,过去随机矩阵理论,过去40年发展了有许多年发展了有许多模型和方法,近年引起了概率和组合数学方面模型和方法,近年引起了概率和组合数学方面极大的兴趣。极大的兴趣。Bayes 和有偏估计和有偏估计 发展和开拓发展和开拓Bayesian 方法和现代非参数、半方法和现代非参数、半参数统计之间的联系,包括研究参数统计之间的联系,包括研究 Bayesian 和和and frequencist 结合的方法学。结合的方法学。-对于具有大量变量的巨型数据,需要更广对于具有大量变量的巨型数据,需要更广泛的有偏估计理论。泛的有偏估计理论。-也需要进一
10、步的也需要进一步的Monte Carlo方法做推方法做推断。断。证明和计算实验之间的中间地带证明和计算实验之间的中间地带 证明证明 太难,或非头等重要太难,或非头等重要 计算实验计算实验 太任意和不足以令人信服太任意和不足以令人信服 例:例:混合模型混合模型 大多忽略识别问题,因为大多忽略识别问题,因为困难,并加重模型结构的多样性困难,并加重模型结构的多样性三、生命科学中的统计学三、生命科学中的统计学上半个世纪的里程碑:上半个世纪的里程碑:-生物统计学生物统计学 -统计流行病学统计流行病学 -随机化临床试验随机化临床试验与未来统计学有关的与未来统计学有关的 生命科学的四个领域生命科学的四个领域
11、-生物分子序列分析和功能基因组学生物分子序列分析和功能基因组学-遗传流行病学遗传流行病学-进化、群体遗传学和生态学进化、群体遗传学和生态学-计算神经科学计算神经科学 生物统计与生物信息生物统计与生物信息n n分子生物学已进化到信息科学,出现了新学科分子生物学已进化到信息科学,出现了新学科Computational Biology,或或 Bioinformatics.-发现和实施算法,以了解生物学过程发现和实施算法,以了解生物学过程 -主要工具主要工具:计算、统计和计算、统计和“machine learning”技术技术 -分析方法主要是特定的,尚处初级阶段分析方法主要是特定的,尚处初级阶段n
12、n这是统计科学家用武之地,尤其,这是统计科学家用武之地,尤其,micro-array技术已经创造了新颖的统计学问题,激技术已经创造了新颖的统计学问题,激发了许多新的生物统计学研究。发了许多新的生物统计学研究。-若干生物统计系已经改名为若干生物统计系已经改名为Biostatistics and Bioinformatics.中医临床试验中医临床试验n n“东方传统医学的某些方面可能真的有效东方传统医学的某些方面可能真的有效,可以充实西方医学可以充实西方医学.去年我在中国大陆参加去年我在中国大陆参加了一个会议了一个会议,主题是主题是 中药临床试验的设计。中药临床试验的设计。很明显,东方在汇集传统医
13、学有效性和安很明显,东方在汇集传统医学有效性和安全性方面的临床试验将会有重要的发展。全性方面的临床试验将会有重要的发展。(Zelen)加强协作活动加强协作活动n n价值:发展统计方法学、多学科研究。价值:发展统计方法学、多学科研究。n n虽然不同人有不同侧重,同一个人不同时期也虽然不同人有不同侧重,同一个人不同时期也有不同侧重,所有统计学家都要有两方面的活有不同侧重,所有统计学家都要有两方面的活动:方法学研究和其它专业中的应用。动:方法学研究和其它专业中的应用。大学与工业界关系大学与工业界关系n n生物统计学的领导地位主要在大学。生物统计学的领导地位主要在大学。n n工业界正聘用许多年轻有为生
14、物统计学家,有工业界正聘用许多年轻有为生物统计学家,有助于加强工业界与大学间关系。助于加强工业界与大学间关系。n n大学与工业界有许多共同目标,工业界开始介大学与工业界有许多共同目标,工业界开始介入教育过程。入教育过程。n n学术界要抓紧与工业界相结合的过程。学术界要抓紧与工业界相结合的过程。(Zelen)统计科学与卫生决策统计科学与卫生决策n n我们不仅负责收集数据和解释数据,也要引导决策。我们不仅负责收集数据和解释数据,也要引导决策。我们不仅负责收集数据和解释数据,也要引导决策。我们不仅负责收集数据和解释数据,也要引导决策。n n许多公共卫生问题需要决策:许多公共卫生问题需要决策:许多公共
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 未来 课件
限制150内