正文
的规律,也就是要用适当长度的单词表达一定的意思,这是啥意思,有一个叫信息熵的概念,我们可以回忆一下,我们在看英语电影时,下面有英汉双语的字幕,同样的意思,用英语和汉语写出来的长度不一样,也就是说,每一种语言他的效率是不一样呢,想一想,我们学过的英文单词,一般由几个字母组成呢?有
dog,cat
这样三个字母组成的,也有
congratulations
这样十多个字母的单词,但是大多数的情况下,基本上,感觉也就是
5
,
6
个字母组成,那么为什么不能让组成单词的字母少一些呢,这样就容易记单词了,比如,都用两个字母,很显然,只有
26
个字母,那么也就是这样只能产生
26X26=676
个单词。如果要确保只由两个字母构成单词的前提下,想再生成新的单词,只能编出第
27
,第
28
个字母了。虽然单词短了,但是需要记的字母多,背着抱着一边沉。另一方面,单词为什么不能太长呢。显然,一个冗长的单词带来的好处就是可以表达更加形象,生动的意思,但是在记忆,书写中就会带来极大的麻烦。所以,每一种人类的语言都会选择一个折衷的方案。但是,电脑不一样,电脑的语言只有
1
和
0
,所以他们的一个单词会很长。比如大写字母
A
,电脑就会转换成
01000001
,
B
就是
01000010
,如果我们现实世界也么表达,那么效率将变的极低。我们可以设想一个极端的情况,比如,我们的汉语只有一个汉字,就是【一】,又好记,又好写,一就代表一,一一就代表我,一一一就代表你,一一一一就代表他,女神可能就是
185
个一,吃饭是
381
个一,约炮就是
382
个一。那你想请你的女神吃饭,可能就是一一一一一一,然后,你的女神也是一一一的回答。你一不留神,少数了一个一,那就只能吃饭了,可能人家还有别的想法呢。所以,在全世界范围内也不会有这种语言。
我们平时谈到学外语时,经常会想到的就是单词和语法,都说德语严谨,由此也产生了深刻,严谨的思维,才出现那么多哲学家,当然,这在一定程度上确实有关系,比如德语中完全相同发音的单词极其少见。而我们有很多多音字,而相同的读音,能写出几个,甚至是十几个字,所以才会有施氏食狮史的奇文。当然,语言,语系的话题要是展开那又得唠上好几期了。回归到
伏尼契
手稿,经过专家们的分析,手稿中的文字,单词的长度,大致上符合人类应用的语言。所以,如果你捡到了一本书,里面全是
1
和
0
,那我们直觉上就会觉得,这就有点不太像人话了。而
伏尼契
手稿虽然看不懂,但是很像人话。
我们还可以利用
齐夫定律
对手稿再加以分析,啥叫
齐夫定律
,比如我们看报纸,看杂志,或者是小说,那么,什么字出现的最多呢,当然是你我他,的地得,是不是,有没有了,同样英语中也是如此,一定是
come,go,yes,no,ONE,TWO,THREE
,
FOUR
,呦呦呦更常见了,如果再细分到字母的层面,自然是字母
A,E,O
等元音字母出现的最多,而字母中
Q
,
X
,
J
就不太常见了。这是有专门研究的,无论是【傲慢与偏见】,【理智与情感】,还是老人与海,还是
尤利西斯
,甚至你自己写一本英文小说,只要写的足够长,整个文章中的字母分布规律都是大体相同的,这也是密码学研究的重要方面。经过统计分析发现,
伏尼契
手稿的文字规律与
自然语言
很类似。就是词汇的出现频率符合
一定的规
律
。这在一定程度上也说明了,
伏尼契
手稿不太像是造假的,因为,上述我们说的什么信息熵,什么齐夫定律都是最近这
100
年人类才发现的,如果是造假,我们只能佩服古人造假的技术太高明了。我们看看
齐夫定律
有啥用,我在之前的节目有一期讲的是密码,有一种加密方式叫恺撒加密,估计,这是一种最简单且最广为人知的加密技术了。其实就是一种替换加密的技术,明文中的所有字母都在字母表上向后或向前按照一个固定数目进行移位后被替换成密文,
ABC,
变成了,
DEF
。如果,这种方法按照
齐夫定律
一分析,人家根本不看你每一个字母是啥,人家是分析频率,瞬间就破解了,出现最多的那个符号就是字母
E
,然后就是
t,a,o
等等。
伏尼契
手稿也有自己的规律,但是与现有已知的语言的齐夫定律分布又不一样。
如果在扩展一下,
每一个语言都有一个特点
,评价一种语言的发音是否优美,有一个公认的标准,那就是辅音数量和元音数量的比例是否合适,最好是一比一,听起来好听,比如日语中