《信源及信源熵》PPT课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《《信源及信源熵》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《信源及信源熵》PPT课件.ppt(144页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章第二章 信源及信源熵信源及信源熵信源及信源熵信源及信源熵l 信源的数学模型和分类信源的数学模型和分类l2.2 离散信源熵和互信息离散信源熵和互信息l2.3 离散序列信源的熵离散序列信源的熵l2.4 冗余度冗余度l2.5 连续信源和波形信源连续信源和波形信源2.1 信源的数学模型和分类信源的数学模型和分类信息论对信源研究的内容:信息论对信源研究的内容:l信源的建模:用恰当的随机过程来描述信号信源的建模:用恰当的随机过程来描述信号l关心角度:信号中携带的信息关心角度:信号中携带的信息l信源输出信号中携带信息的效率的计算信源输出信号中携带信息的效率的计算l熵率、冗余度熵率、冗余度l信源输出信息
2、的有效表示信源输出信息的有效表示l信源编码信源编码l信息论不研究信源的内部结构,不研信息论不研究信源的内部结构,不研究信源为什么产生和怎样产生各种不究信源为什么产生和怎样产生各种不同的、可能的消息,而只研究信源的同的、可能的消息,而只研究信源的各种可能的输出,以及输出各种可能各种可能的输出,以及输出各种可能消息的不确定性。消息的不确定性。信源特性与分类信源特性与分类l信源的统计特性信源的统计特性l1)什么是信源?什么是信源?l信信源源是是信信息息的的来来源源,是是产产生生消消息息(符符号号)、消消息息序序列列(符符号号序列)以及连续消息的来源。序列)以及连续消息的来源。l实际通信中常见的信源有
3、:语音、文字、图像、数据实际通信中常见的信源有:语音、文字、图像、数据。l2)信源的主要特性)信源的主要特性l信信源源的的最最基基本本的的特特性性是是具具有有统统计计不不确确定定性性,即即信信源源发发出出的的消消息息是是不不确确定定的的、随随机机的的,因因此此可可以以用用随随机机变变量量、随随机机矢矢量量或或随机过程来描述信源输出的消息。随机过程来描述信源输出的消息。l一一般般使使用用一一个个样样本本空空间间及及其其概概率率测测度度概概率率空空间间(信信源源空空间)来描述信源,此概率空间也称为信源的数学模型。间)来描述信源,此概率空间也称为信源的数学模型。一、离散信源和连续信源一、离散信源和连
4、续信源l离散信源离散信源l信源发出的消息在时间上和幅度上是离散分布的。信源发出的消息在时间上和幅度上是离散分布的。l信源是由有限或无限个取值离散的符号。信源是由有限或无限个取值离散的符号。l例例如如:投投硬硬币币、书书信信文文字字、计计算算机机的的代代码码、电电报报符符号、阿拉伯数字码等等。号、阿拉伯数字码等等。l连续信源连续信源l信源发出的消息在时间上和幅度上是连续分布的。信源发出的消息在时间上和幅度上是连续分布的。l信信源源符符号号集集A的的取取值值是是连连续续的的,或或者者取取值值为为实实数数集集(,)。)。l例如:语音信号、热噪声信号、图像等等。例如:语音信号、热噪声信号、图像等等。二
5、、离散信源的数学模型二、离散信源的数学模型(一)单消息(符号)信源单消息(符号)信源l信信源源可可能能输输出出的的符符号号集集的的取取值值是是有有限限的的或或可可数数的的,而而且且每每次次只只输输出出其其中中一一个个符符号号代代表表一一个个消消息。息。l它它是是最最简简单单、最最基基本本的的信信源源,是是组组成成实实际际信信源源的基本单元。的基本单元。单符号离散信源的数学模型单符号离散信源的数学模型l我我们们可可用用一一维维离离散散型型随随机机变变量量X来来描描述述单单符符号号离离散散信信源源输输出出的的消消息息。这这个个随随机机变变量量X的的样样本本空空间间就就是是符符号号集集A=a1 a2
6、 aN;而而X的的概概率率分分布布就就是是各各消消息息出出现现的的先先验验概概率率,信信源源的的概概率空间必定是一个完备集(即率空间必定是一个完备集(即P1)。)。l该该信信源源的的数数学学模模型型就就是是离离散散型型的的概概率率空空间间,我我们们可可以以用用信信源源取取值值随随机机变变量量的的范范围围X和和对对应应概概率率分分布布P(x)共共同同组组成成的的二二元元序对序对X,P(x)来表示。来表示。l当当信信源源给给定定,其其相相应应的的概概率率空空间间就就已已给给定定;反反之之,如如果果概概率率空空间间给给定定,这这就就表表示示相相应应的的信信源源已已给给定定。所所以以,概概率率空空间间
7、能能表表征征这这离离散散信信源源的的统统计计特特性性,因因此此有有时时也也把把这这个个概概率率空空间间称称为为信源空间信源空间。信源空间信源空间:显然有:XP(x)a1 a2 aNP(a1)P(a2)P(aN)例例:对对于于二二进进制制数数据据、数数字字信信源源:X=0,1,若这两个符号是等概率出现的,则有:若这两个符号是等概率出现的,则有:XP(x)a1=0 a2=1P(a1)=0.5 P(a2(二)多符号离散信源(二)多符号离散信源l是发出符号序列的信源是发出符号序列的信源l信源每次发出一组含两个以上信源符号的符号序列信源每次发出一组含两个以上信源符号的符号序列代表一个消息。代表一个消息。
8、l又叫作离散信源的又叫作离散信源的N次扩展。次扩展。l信道的输入端与输出端对应,都是一个由同样个数信道的输入端与输出端对应,都是一个由同样个数的符号所组成的符号序列代表的消息。的符号所组成的符号序列代表的消息。平稳信源平稳信源l很很多多实实际际信信源源输输出出的的消消息息往往往往是是由由一一系系列列符符号号序序列列所所组组成成的的。可可以以把把这这种种信信源源输输出出的的消消息息看看做做时时间间上上或或空空间间上上离离散散的的一一系系列列随随机机变变量量,即即为为随随机机矢矢量量。这这时时,信信源源的的输输出出可可用用N维维随随机机矢矢量量X=(X,XXN)来来描描述述,其其中中N可可为为有有
9、限限正正整整数数或或可可数数的的无无限限值值。这这N维维随随机机矢矢量量X有时也称为有时也称为随机随机序列序列。l一一般般来来说说,信信源源输输出出的的随随机机序序列列的的统统计计特特性性比比较较复复杂杂,分分析析起起来来也也比比较较困困难难。为为了了便便于于分分析析,我我们们假假设设信信源源输输出出的的是是平平稳稳的的随随机机序序列列,也也就就是是序序列列的的统统计计性性质质与与时时间间的的推推移移无无关关。很很多多实实际际信信源源也也满满足足这这个个假假设。设。l若若在在信信源源输输出出的的随随机机序序列列X=(,)中中,每每个个随随机机变变量量Xi(i=1,2,,N)都都是是取取值值离离
10、散散的的离离散散型型随随机机变变量量,即即每每个个随随机机变变量量Xi的的可可能能取取值值是是有有限限的的或或可可数数的的;而而且且随随机机矢矢量量X的的各各维维概概率率分分布布都都与与时时间间起起点点无无关关,也也就就是是在在任任意意两两个个不不同同时时刻刻随随机机矢矢量量X的的各各维维概概率率分分布布都都相相同同。这这样样的的信信源源称称为为离离散散平平稳稳信信源源。如如中中文文自自然然语语言言文文字字,离散化平面灰度图像都是这种离散型平稳信源。离散化平面灰度图像都是这种离散型平稳信源。离散无记忆信源离散无记忆信源l在在某某些些简简单单的的离离散散平平稳稳信信源源情情况况下下,信信源源先先
11、后后发发出出的的一一个个个个符符号号彼彼此此是是统统计计独独立立的的。也也就就是是说说发发出出的的信信源源发发出出的的符符号号是是相相互互独独立立的的,发发出出符符号号序序列列中中各各个个符符号号之间也是相互独立的。之间也是相互独立的。l我我们们称称由由信信源源空空间间X,P(x)描描述述的的信信源源X为为离离散散无无记记忆忆信信源源。这这类类信信源源在在不不同同时时刻刻发发出出的的符符号号之之间间是是无无依依赖赖的的,彼彼此此统统计计独独立立的的,各各个个符符号号的的出出现现概概率率是是其其自身的先验概率。自身的先验概率。l信信源源输输出出的的随随机机矢矢量量X=(XXX)中中,各各随随机机
12、变变量量Xi(i=1,2,N)之之间间是是无无依依赖赖的的、统统计计独独立立的的,则则N维随机矢量的联合概率分布满足:维随机矢量的联合概率分布满足:离散无记忆信源离散无记忆信源X的的N次扩展信源次扩展信源l我我们们把把这这信信源源X所所输输出出的的随随机机矢矢量量X所所描描述述的的信信源源称称为为离离散散无无记记忆忆信信源源X的的N次次扩扩展展信信源源。可可见见,N次次扩扩展展信信源源是是由由离离散散无无记记忆忆信信源源输输出出N长长的的随随机序列构成的信源。机序列构成的信源。l离散无记忆信源的离散无记忆信源的N次扩展信源的数学模型是次扩展信源的数学模型是X信源空间的信源空间的N重空间。重空间
13、。有记忆信源有记忆信源l 一一般般情情况况下下,信信源源在在不不同同时时刻刻发发出出的的符符号号之之间间是是相相互互依依赖赖的的。也也就就是是信信源源输输出出的的平平稳稳随随机机序序列列X中中,各各随随机机变变量量xi之之间间是是有有依依赖赖的的。例例如如,在在汉汉字字组组成成的的中中文文序序列列中中,只只有有根根据据中中文文的的语语法法、习习惯惯用用语语、修修辞辞制制约约和和表表达达实实际际意意义义的的制制约约所所构构成成的的中中文文序序列列才才是是有有意意义义的的中中文文句句子子或或文文章章。所所以以,在在汉汉字字序序列列中中前前后后文文字字的的出出现现是是有有依依赖赖的的,不不能能认认为
14、为是是彼彼此此不不相相关关的的。其其他他如如英英文文,德德文文等等自自然然语语言言都都是是如如此此。这这种种信信源源称称为为有有记记忆信源忆信源。l我我们们需需在在N维维随随机机矢矢量量的的联联合合概概率率分分布布中中,引引入入条条件件概率分布来说明它们之间的关联。概率分布来说明它们之间的关联。马尔可夫信源马尔可夫信源l表表述述有有记记忆忆信信源源要要比比表表述述无无记记忆忆信信源源困困难难得得多多。实实际际上上信信源源发发出出的的符符号号往往往往只只与与前前若若干干个个符符号号的的依依赖赖关关系系强强,而而与与更更前前面面的的符符号号依依赖赖关关系系弱弱。为此,可以限制随机序列的记忆长度。为
15、此,可以限制随机序列的记忆长度。l当当记记忆忆长长度度为为m+1时时,称称这这种种有有记记忆忆信信源源为为m阶阶马马尔尔可可夫夫信信源源。也也就就是是信信源源每每次次发发出出的的符符号号只与前只与前m个符号有关,与更前面的符号无关。个符号有关,与更前面的符号无关。离散信源的分类:离散信源的分类:分类依据:前后符号之间的关系分类依据:前后符号之间的关系马尔可夫信源马尔可夫信源平稳序列信源平稳序列信源离散有记忆信源离散有记忆信源平稳无记忆信源平稳无记忆信源一般无记忆信源一般无记忆信源离散无记忆信源离散无记忆信源离散序列信源离散序列信源2.2 离散信源的信息熵离散信源的信息熵信源空间信源空间:XP(
16、x)a1 a2 aNp1 p2 pN一、离散消息的自信息量一、离散消息的自信息量(一)自信息量自信息量/非平均自信息量非平均自信息量离散信源符号集合离散信源符号集合A中的某一个符号中的某一个符号ai作为一作为一条消息发出时对外提供的信息量:条消息发出时对外提供的信息量:Il自信息量的单位自信息量的单位l单位之间的关系单位之间的关系:;。底数a的值单位名称a=2bit(binary unit)比特比特a=enit(nature unit)奈特奈特a=10Hart(Hartly)哈特哈特【例2.1】设信源只有两个符号设信源只有两个符号“0”和和“1”,且它们以,且它们以消息的形式向外发送时均以等概
17、率出现,求它消息的形式向外发送时均以等概率出现,求它们各自的自信息量。们各自的自信息量。(二)不确定度不确定度d(ai)与与自信息量自信息量I(ai)l两者的联系两者的联系l数值上相等,单位也相等,但含义不同。数值上相等,单位也相等,但含义不同。l两者的区别两者的区别l具有某种概率分布的随机事件,不管其发生与否,具有某种概率分布的随机事件,不管其发生与否,都存在不确定度,不确定度是任何随机事件都存在不确定度,不确定度是任何随机事件本身所本身所具有的属性具有的属性。l自信息量是用来消除不确定度的,消息只有被接收自信息量是用来消除不确定度的,消息只有被接收之后才有信息量,否则只有不确定度。之后才有
18、信息量,否则只有不确定度。二、离散信息熵二、离散信息熵离散消息集离散消息集合的平均不确定度合的平均不确定度(一)信息熵信息熵l自信息量的数学期望值是信源的平均自信息量。自信息量的数学期望值是信源的平均自信息量。(注:数学期望就是随机变量的(注:数学期望就是随机变量的统计统计平均值)平均值)l信息熵信息熵H(X)=E I(X)=P(xi)I(xi)=P(xi)log P(xi)=P(xi)log 1/P(xi)l单位为:比特单位为:比特/符号(单符号信源)、比特符号(单符号信源)、比特/符符号序列(多符号信源)号序列(多符号信源)。l信源熵信源熵H(X)是从平均意义上来表征信源的总是从平均意义上
19、来表征信源的总体特征,可以表示信源的平均不确定度。体特征,可以表示信源的平均不确定度。l对于特定的信源(即概率空间给定),其信源对于特定的信源(即概率空间给定),其信源熵是一个确定的数值,不同的信源因统计特性熵是一个确定的数值,不同的信源因统计特性不同,其熵也不同。不同,其熵也不同。例例通过例子了解信息熵的含义:通过例子了解信息熵的含义:一个布袋内放一个布袋内放100个球,其中个球,其中80个为红球,个为红球,20个为白球,个为白球,任摸取一个,猜测是什么颜色。任摸取一个,猜测是什么颜色。如果摸出红球,那么这一事件的自信息量为:如果摸出红球,那么这一事件的自信息量为:I(x1)=log P(x
20、1)=log 0.8 bit 如果摸出白球,那么这一事件的自信息量为:如果摸出白球,那么这一事件的自信息量为:I(x2)=log P(x2)=log 0.2 bitX P x1 x20.8 0.2l如果每次摸出一个球又放回去,再进行第二次摸如果每次摸出一个球又放回去,再进行第二次摸取,那么如此摸取取,那么如此摸取n次,红球出现的次数为次,红球出现的次数为nP(x1)次次,白球出现的次数为,白球出现的次数为nP(x2)次,则摸次,则摸n次后总共次后总共提供的信息量为:提供的信息量为:nP(x1)I(x1)+nP(x2)I(x2)l平均每摸取一次所获得的信息量为:平均每摸取一次所获得的信息量为:H
21、(X)=nP(x1)I(x1)+nP(x2)I(x2)n =P(x1)log P(x1)+P(x2)log P(x2)=P(xi)log P(xi)三种物理含义三种物理含义l信息熵具有三种物理含义:信息熵具有三种物理含义:l信源熵信源熵H(X)表示信源输出前,信源的平均不确定表示信源输出前,信源的平均不确定度。度。l信源熵信源熵H(X)表示信源输出后,平均每个消息或符表示信源输出后,平均每个消息或符号所能提供的信息量。号所能提供的信息量。l信源熵信源熵H(X)可用来表示变量可用来表示变量X的随机性。的随机性。注意:注意:l在在有噪声有噪声的情况下,信源熵并不等于平均获得的情况下,信源熵并不等于
22、平均获得的信息量;只有在无噪声的情况下,接收者才的信息量;只有在无噪声的情况下,接收者才能正确无误地接收到信源发出的全部消息。能正确无误地接收到信源发出的全部消息。l信源熵信源熵是表征信源平均不确定度的,是信源的是表征信源平均不确定度的,是信源的总体特性,是客观存在的,总体特性,是客观存在的,平均自信息量平均自信息量是消是消除信源不确定度时信宿所需的信息量,两者数除信源不确定度时信宿所需的信息量,两者数值相同,单位相同,但含义不同。值相同,单位相同,但含义不同。例题例题1设离散信源含有设离散信源含有26个英文字母,且每个字母以等个英文字母,且每个字母以等概率出现。求信源熵。概率出现。求信源熵。
23、例题例题2设信源设信源X只有两个符号只有两个符号x1和和x2,出现的概率分别,出现的概率分别为为P(x1)=q,P(x2)=(1q),求信源熵。,求信源熵。课本课本23页页【例2.1】检查检查8个串联灯泡中哪一只是坏灯泡个串联灯泡中哪一只是坏灯泡第一次测量获得的信息量是:第一次测量获得的信息量是:IP1(x)-IP2(x)第二次测量获得的信息量是:第二次测量获得的信息量是:IP2(x)-IP3(x)第三次测量获得的信息量是:第三次测量获得的信息量是:IP3(x)-0课本课本29页(续例题)页(续例题)【例例2.3】进一步分析例题,将进一步分析例题,将8个灯泡构成一信个灯泡构成一信源源X,每个灯
24、泡损坏的概率都相等,计算该信,每个灯泡损坏的概率都相等,计算该信源的信息熵。源的信息熵。课本课本29页(续例题)页(续例题)分析:分析:此时此时H(X)正好表示在获知哪个灯泡已损坏)正好表示在获知哪个灯泡已损坏的情况前,关于哪个灯泡已损坏的平均不确定的情况前,关于哪个灯泡已损坏的平均不确定性。性。只有获得只有获得3比特的信息量,才能完全消除平均比特的信息量,才能完全消除平均不确定性,才能确定是哪个灯泡坏了。不确定性,才能确定是哪个灯泡坏了。分析分析 这种测量方法每次只能获得这种测量方法每次只能获得1比特比特的信息量,所以说至少要测量的信息量,所以说至少要测量3次才能次才能完全消除不确定性完全消
25、除不确定性课本课本29页页【例例2.4】设某甲地的天气预报为:晴(设某甲地的天气预报为:晴(4/8)、)、阴(阴(2/8)、大雨()、大雨(1/8)和小雨()和小雨(1/8)。又设)。又设某乙地的天气预报为晴(某乙地的天气预报为晴(7/8)、小雨占)、小雨占(1/8)。试求两地天气预报各自提供的平均)。试求两地天气预报各自提供的平均信息量。若甲地天气预报为两极端情况,一种信息量。若甲地天气预报为两极端情况,一种是晴出现概率为是晴出现概率为1而其余为而其余为0。另一种是晴、阴、。另一种是晴、阴、小雨和大雨出现的概率都相等,为小雨和大雨出现的概率都相等,为1/4。试求。试求这两种极端情况所提供的平
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信源及信源熵 信源 PPT 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内