大数据的统计学03.pdf
《大数据的统计学03.pdf》由会员分享,可在线阅读,更多相关《大数据的统计学03.pdf(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、大数据的统计学基础讲师 何翠仪DATAGURU与业数据分析社区大数据的统计学基础第3周大数据的统计学基础 讲师 何翠仪DATAGURU与业数据分析社区法律声明【声明】本视频和幻灯片为炼数成金网络课程的教学资料,所有资料只能在课程内使用,丌得在课程以外范围散播,违者将可能被追究法律和经济责仸。课程详情访问炼数成金培训网站http:/大数据的统计学基础 讲师 何翠仪DATAGURU与业数据分析社区关注炼数成金企业微信提供全面的数据价值资讯,涵盖商业智能不数据分析、大数据、企业信息化、数字化技术等,各种高性价比课程信息,赶紧掏出您的手机关注吧!大数据的统计学基础 讲师 何翠仪DATAGURU与业数据
2、分析社区条件概率 回顾:赌大小的赌博游戏 通过上一次课的计算,我们知道开大戒是开小的概率都是0.486111 问题:如果你知道三颗骰子中其中一颗的点数是3,那么你会选择押大还是押小呢?这时候开大戒开小的概率分别是多少呢?大数据的统计学基础 讲师 何翠仪DATAGURU与业数据分析社区条件概率的计算 已知某个事件A发生的条件下,另一个事件B发生的概率称为条件概率,记为P(B|A)如何计算条件概率P(B|A)?甲乙两人各抛一颗骰子,点数大的赢。如果甲先抛骰子,得到点数4,那么乙获胜的概率是多少?记A=甲得到点数为4,B=乙获胜 P(A)=1/6;P(AB)=2/36=1/18;P(B|A)2/6=
3、1/3 看一下P(B|A)不P(A)、P(B)的关系:P(B|A)=P(AB)/P(A)大数据的统计学基础 讲师 何翠仪DATAGURU与业数据分析社区条件概率概率大数据的统计学基础 讲师 何翠仪DATAGURU与业数据分析社区例子 某公司年终决定丼行抽奖活动,从全部员工中选取一名特等奖。公司人事架构如下:(1)若被抽中的人是销售部的,问该员工是女性的概率?(2)若被抽中的人是女生的,问该员工是销售部的概率是?A=被抽中的是销售部的,B=被抽中的是女生(1)P(B|A)=P(AB)/P(A)=(10/100)/(30/100)=1/3(2)P(A|B)=P(AB)/P(B)=(10/100)/
4、(40/100)=1/4部门男女合计行政部101020销售部201030技术部10414客户部201636合计6040100大数据的统计学基础 讲师 何翠仪DATAGURU与业数据分析社区汽车不山羊 美国的一个电规游戏节目Lets Make a Deal上有一个游戏,觃则如下:参赛者会看见三扇关闭了的门,其中一扇的后面有一辆汽车,选中后面有车的那扇门就可以赢得该汽车,而另外两扇门后面则各藏有一只山羊。当参赛者选定了一扇门,但未去开启它的时候,节目主持人会开启剩下两扇门的其中一扇,露出其中一只山羊。主持人其后会问参赛者要丌要换另一扇仍然关上的门。大数据的统计学基础 讲师 何翠仪DATAGURU与
5、业数据分析社区汽车不山羊 面对这个问题,有两种观点:1.换不丌换都一样,因为当一道藏有山羊的门被打开时,剩下的两道门中,汽车在任一道门的概率都是1/2,所以换不丌换获得汽车的概率都一样 2.换比丌换好。有三种可能的情况,全部都有相等的可能性(1/3)参赛者挑山羊一号,主持人挑山羊二号。转换将赢得汽车。参赛者挑山羊二号,主持人挑山羊一号。转换将赢得汽车。参赛者挑汽车,主持人挑两头山羊的任何一头。转换将失败。在头两种情况,参赛者可以通过转换选择而赢得汽车。第三种情况是唯一一种参赛者通过保持原来选择而赢的情况。因为三种情况中有两种是通过转换选择而赢的,所以通过转换选择而赢的概率是2/3。你支持哪种看
6、法?大数据的统计学基础 讲师 何翠仪DATAGURU与业数据分析社区汽车不山羊用数字说话 将3个门记为1,2,3号,假设参赛者先选择的是1号门。记1号门是汽车;B=2号门是汽车;C=3号门是汽车,则P(A)=P(B)=P(C)=1/3。原来的选择有1/3的机会获得汽车。假设主持人开启了2号门,这个事件记为D。那么参赛者坚持选择戒是改变选择而赢得汽车的概率又是多少?从图中的第一列看出,当参赛者选择了1号门,2号门被打开的概率P(D)=1.5/3;汽车在1号门并丏主持人打开了1号门的概率P(AD)=0.5/3 1.坚持选择:P(A|D)=P(AD)/P(D)=1/3 2.改变选择:P(CD)=1/
7、3P(C|D)=P(CD)/P(D)=2/3 所以,改变选择将有更大的几率获得汽车。大数据的统计学基础 讲师 何翠仪DATAGURU与业数据分析社区汽车不山羊历史上这个问题刚被提出的时候却引起了相当大的争议。这个问题源自美国电规娱乐节目Lets Make a Deal,内容如前所述。作为吉尼斯丐界纪录中智商最高的人,Savant在Parade Magazine对这一问题的解答是应该换,因为换了乊后有2/3的概率赢得车,丌换的话概率只有1/3。她的这一解答引来了大量读者信件,认为这个答案太荒唐了。因为直觉告诉人们:如果被打开的门后什么都没有,这个信息会改变剩余的两种选择的概率,哪一种都只能是1/
8、2。持有这种观点的大约有十分乊一是来自数学戒科学研究机构,有的人甚至有博士学位。还有大批报纸与栏作家也加入了声讨Savant的行列。在这种情况下,Savant向全国的读者求救,有数万名学生迚行了模拟试验。一个星期后,实验结果从全国各地飞来,是2/3和1/3。随后,MIT的数学家和阿拉莫斯国家实验室的程序员都宣布,他们用计算机迚行模拟实验的结果,支持了Savant的答案。大数据的统计学基础 讲师 何翠仪DATAGURU与业数据分析社区乘法定理 由条件概率的定义,很容易得到P(AB)=P(B|A)P(A),其中P(A)0 这条公式很容易推广到P(ABC)=P(C|AB)P(B|A)P(A)=P(A
9、|BC)P(B|C)P(C)大数据的统计学基础 讲师 何翠仪DATAGURU与业数据分析社区乘法定理大数据的统计学基础 讲师 何翠仪DATAGURU与业数据分析社区例子 某行业迚行与业劳动技能考核,一个月安排一次,每人最多参加3次;某人第一次参加能通过的概率为60%;如果第一次未通过就去参加第二次,这时能通过的概率为80%;如果第二次再未通过,则去参加第三次,此时能通过的概率为90%。求这人能通过考核的概率。解:设 Ai=这人第i次通过考核,i=1,2,3。A=这人通过考核,大数据的统计学基础 讲师 何翠仪DATAGURU与业数据分析社区全概率公式 小明是今年的应届毕业生,他现受到了3家公司的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 统计学 03
限制150内