曹梦迪,学之。 这个问题看似混乱,其实却是以语法、文言文和编码理论为基础的。 先普及一个常识:古代文言以单字词为主的,直到现代汉语才演变成以双字词为主的语言。 例如:《项脊轩志》 百年老屋,尘泥渗漉,雨泽下注;每移案,顾视无可置者。又北向,不能得日,日过午已昏。余稍为修葺,使不上漏。前辟四窗,垣墙周庭,以前南日,日影反照,室始洞然。 现代汉语翻译: 由于是一间百年老屋,灰尘和泥土常从屋顶上漏下来,(尤其是)下雨时雨水往下直灌。每次移动桌子,环顾四周没有可安置的地方。又加上屋门朝北开,不能得到阳光照射,太阳一过中午,屋里就暗了下来。我稍微加以修补,使屋顶不再漏雨。室前就开四扇窗户,院子四周砌上围墙,用来挡住南边射来的阳光,经日光反射,屋子里才明亮起来。 文言文中的单字词:尘、泥、移、案、窗等字,在现代汉语中变成了灰尘、泥土、移动、桌子、窗户等字。仔细看一下就会发现:“灰”和“尘”,“泥”和“土”,“窗”和“户”都是近义词;“移”了必然会“动”,“桌”后面的“子”也没有实际意义,所以其实,这些字是冗余的,而去掉冗余之后的结果,就基本上回复了文言文的样子。 为什么要冗余?因为口语的需要。人们日常说话,由于环境的不同,听话者是会出现不同程度的误听。回想一下自己在大风天、大雨天、音质糟糕的电话里等各种情况下交流的情景你就能理解这种误听。而冗余的作用,就是减少误听。将双字词误听成音近词语的概率,要远小于将单字词误听为音近词语的概率。 如果一个双字词属于全冗余,即两个字意思基本相同(例如“灰尘”,只要听清了“灰 X”或者“X 尘”,再结合上下文就可以准确推断出“灰尘”这个词),那么我们做个简单的数学计算来解释一下这一点:令单一个字被听错的概率为 ,那么没有听错的概率则为 。那么两个字都被听错的概率为 ,而能正确听懂这个词语的概率为()。由于 ,有 ,于是 。其中等号只在 (完全不会听错)或者 (完全听不出说什么)的时候成立,在其它情况下取严格大于号。 如果一个双字词属于部分冗余,即由其中一个字可以推知另外一个字,但无法由另一个字推知这一个字的(例如“移动”,如果只听清了“移 X”则可以推断出“移动”。但是如果只听清了“X 动”则无法推断出“移动”——也有可能是“挪动”、“转动”、“开动”等。)那么在大脑中“习惯搭配库”的帮助下,冗余字也可以减少误听。比如这一个句子: “去试着把那袋面移一下。”就比较可能被误听为“去试着把那袋面提一下。” 但是如果改成“去试着把那袋面移动一下。”这个就不再可能误听为“去试着把那袋面提动一下。”因为“提动”用在这里就造成搭配不当了。 这一点用编码理论的说法就是:冗余增加了编码长度,但是增强了对误码的纠错能力。 再举个例子传统相声《聋子打岔》,后来被侯跃文改编为《打岔》: 侯耀文石富宽相声:打岔 太可气 > 听京戏 净瞎说 > 武家坡 忒费劲 > 追韩信 净装傻 > 盗御马 我说 > 老郭 听不见 > 上法院 …… 这个相声的精彩之处就是他符合语言规律,大部分被打岔的句子,都是单字词组成的。比如“太可气”如果说得含糊一点,或者距离隔得远,配合上春节晚会的环境,听成“听京戏”就不奇怪了。但是如果用双字词说成“让我非常生气”就很难听错了。 但是,冗余的最大问题就是——冗余。为了让听的人能够听清楚,加了将近 100% 的多余字词,而随着一些固定说法的出现,冗余的字就变得真得多余了。比如“红色警戒”,“红”本来就是一种“色”,而“警”和“戒”是近义词,重要的词只有“红”和“警”两个,而只要把“红警”作为固定搭配,就很难被误听(反之,如果一个不熟悉此游戏的人,对“红警”就容易听成“洪井”、“铜鼎”、“拱饼”之类的东西)。因此“红色警戒”这种固定搭配就叫做“红警”了,类似的缩写有很多: “公共汽车” > “公车” “人民代表大会” > “人代会” “高等数学” > “高数” “街头霸王” > “街霸” …… 再看看“星际争霸”这个词组,“星”、“际”、“争”、“霸”各有不同的含义,而且地位的重要性也相当,所以不存在冗余词,对于这样没有明确的“弱词”,汉语在不混淆的前提下,采用头字作为缩写——因为听一个字的话可能性太多,不能肯定;只要听清前两个字,后面的字基本上就可以肯定了,第三个以及以后的字就不必要了。这样的缩写法在生活中也很多: “出租汽车” > “出租” “头孢拉定”(或其它以“头孢”开头的抗生素)> “头孢” “无线局域网” > "无线” “帝国时代” > “帝国” …… 所以,其实广大人民群众是非常理解汉语语法和编码理论的哦! 查看知乎原文