1
人际沟通学
1.4.5.2 二、度量信息的方法
二、度量信息的方法

从本质上来说,不定性是与“多种结果(或称状态)的可能性”相联系的,而在数学上,这些可能性是以概率来计量的,因而事物不定性的大小便可以用概率分布来描述。例如,考察掷硬币这一事件,它的不定性表现为具有两种同样可能的状态或结果,即状态x1(字朝上)出现的可能性(即概率)P(y1)为,状态x2(画朝上)P(y2)也是。再比如,投掷均匀正六面体骰子,具有六种同样可能的状态,即状态y1(1点)、y2(2点)、y3(3点)、y4(4点),y5(5点)和y6(6点)出现的概率为P(y1)=P(y2)= P(y3)=P(y4)=P(y5)=P(y6)=。在这种情况下,当然,掷六面体骰子的不定性大,为了消除它的不定性,掷骰子场合所需要的信息应该比掷硬币场合多。但是,如果骰子不是各面同重,而是其中的一面特别重,那么,投掷的结果往往是出现某一特定的点数,比如这时有:

P(y1)=0.95

P(y2)=P(y3)=P(y4)=P(y5)=P(y6)=0.01

那么,虽然它的可能状态数比掷硬币时多,但是不定性反而比掷硬币时小。可见,事物的不定性的大小,一方面与它的可能状态的数目有关,另一方面与各可能状态的概率分布情况有关。信息论证明:若某事物具有几种独立的可能结果(或者叫做状态):x1,x2,…,xn,每一状态出现的概率分别为P(x1),P(x2),…,P(xn),且有 =1,那么,该事物所具有的不定性数量H(x)为:

当对数底取2时,H(x)的单位为比特。值得注意的是,函数H(x)与统计热力学中L.克劳胥斯定义的熵公式是相同的。因此,在信息论中,H(x)也被称为熵。事实上,L.克劳胥斯的熵是表征统计热力系统的无组织性的,这与不定性的意义恰好相通。这样,熵函数H(x)表征了事物的不定性数量,因而我们就可以用它来表示信息的数量——信息量。

在通信的场合,如果在通信之前收信者对某事物存在的不定性数量——熵值为H(x),经过通信收到信息之后,这个不定性被完全消除了,那么,我们就说,收信者收到的信息量(记为I)等于H(x),即:

I=H(x)-0=H(x)

但是,如果收到信息之后,收信者的这个不定性并未完全消除,只是减少到H(x)。它表示收信者收到信息y之后对该事物x仍然存在的不定性数量(熵),那么我们就说,收信者收到的信息量为:

I=H(x)-H=H(x/y)

这就是前面所说的,信息量等于被消除的不定性数量,或者说,信息量等于熵的减少量。这是信息论的最重要结果之一。于是,任何一个事件,只要知道它的各个可能独立状态的概率分布,就可以求出它的熵值,从而也就可以求出它所能提供的信息量。正是由于统计热力学中的熵表征的是系统的无组织程度,亦即不定性,而且信息量又是以被消除的不定性来度量的,所以,信息的性质可以理解为负熵。

上述信息量公式H(x)= p(xi)log P(xi)中的量完全是统计量,它只能用来表示概率信息量,而在实际应用中,除了概率信息之外,还有另一类甚至更重要的信息——模糊信息。概率信息对应的不定性是由事件的概率性质(或叫统计性质,随机性质)引起的,而模糊信息对应的不定性则是由事件的非随机性质——模糊度性质引起的。概率是由普通集的测度来定义的,而模糊度则是由模糊集的测度来定义的。所谓普通集是指这样的集:某个元要么属于这个集,要么不属于这个集,是非分明,没有模棱两可的情形。因此,普通集的示性函数是矩形的,如图2-2所示,只要是区间[a,b]上的元x都属于这个集,它们的示性函数值f(x)为1,而在区间[a,b]之外的任何元都不属于这个集,它们的示性函数值f(x)为0。比如掷硬币这一事件,它的面只有两个:字和画。每次试验只能出现这两种结果之一,不可能有其他任何结果。这就是一个二元的普通集。而模糊集则不是这样,它的示性函数没有严格的界限,而是连续过程的,如图2-3所示,区间[a,b]内的元的示性函数等于1,但其外的示性函数并不都等于0,而是有界于0与1之间的模糊段。这种模糊集在现实生活中是大量存在的。正如美国学者L.A.扎德所言:“现实世界遇到的各类事物,更多的情况并不是界限分明的,比如,动物这个类,当然包括狗、马、鸟等,而不包括石头、流水、工厂等,可是细菌算不算动物类?海盘车属不属于动物类?这里就显示了模糊的性质。又如,远大于1的实数类,10是不是属于这个类?也没有明确的界限。当然,这些类都不能构成数学中的普通类或普通集。然而,这些不能精确定义的类却在人们的认识活动中,特别在图像识别、通信和抽象化研究方面起着重要的作用。许多生物系统、经济学系统、都市系统以及更一般的大范围系统都属于这样的类。”[7]事实上,恩格斯早就指出过:“‘绝对分明和固定不变的界限’是和进化论不相容的……‘非此即彼!’是愈来愈不够了。……一切差异都在中间阶段融合,一切对立都经过中间环节而相互过渡,对自然观的这种发展阶段来说,旧的形而上学的思维方法就不再够了。辩证法不知道什么绝对分明的和固定不变的界限,不知道什么无条件的普遍有效的‘非此即彼!’,它使固定的形而上学的差异互相过渡,除了‘非此即彼!’,又在适当的地方承认‘亦此亦彼!’,并且使对立互为中介。”[8]可见,模糊集是普遍存在的,因而模糊信息的研究有着重要的意义。

图2-2

图2-3

关于模糊信息的度量问题是模糊信息研究领域中的最重要且难度最大的问题之一。长期以来,人们从不同的侧面对此进行了有益的探索并且提出了一些颇具启发性的模糊信息度量方法,在此,我们不妨介绍其中的一种方法,以期对读者有所启发。

这种度量模糊信息的方法是这样的:

假设I是有限元(N)的模糊集,它的示性函数为f,则其模糊测度μ(f)为满足下列条件的非负函数:

(1)当且仅当f是普通集的示性函数时,有μ(f)=0;

(2)当且仅当对所有的x∈I均有f(x)=时,μ(f)=max;

(3)若f*是f的某种锐化形式,即对于f(x)≤,有f*(x)≤f(x),而对f(x)≥,有f*(x)≥f(x),则μ(f*)≤μ(f)。

用熵函数建立一种具体的模糊测度,记作d(f),有:

其中,熵函数为:

s(x)=-x ln x-(1-x)ln(1-x),

则称d(f)为模糊集I的模糊信息量。

最后应当说明的是,由于我们在此所说的“不定性”是广义的不定性,它既可以指随机型的不定性,也可以指模糊型的不定性,还可以指其他任何形式的不定性。所以,我们用所消除的不定性的数量来度量信息,当然是一个合情合理并且具有最广泛适用性的度量方法。