正文
其实传统人文学术为我们提供了多种知识管理解决方案,最新的解决方案可能就蕴涵在古老的文献之中,我们今天应该善加继承、利用。需要特别强调的是,电子文献不会天然比传统媒介有优势,其至少存在两个方面的缺陷,一是文本准确率,一是检索的查全率、查准率。纸本文献必须达到万分之一以下的差错率才能出版,而目前既有电子文献远低于这个水平。又,利用检索工具书,纸本文献可以达到很高的查全率和查准率,目前还没有哪种数据库或知识库超过纸本文献既有的水平。人文学者有责任总结人类既有的知识管理策略和人文学术方法论,并积极普及推广,同时也要积极学习统计学、计算语言学、计算机科学和网络技术,提出更为明确的应用需求,寻求成熟而适用的方法以实现智能化的数字人文方法;而科学家们也要破除傲慢的现代中心观和科学主义偏见,积极学习并继承人类社会积累了数千年的有效知识。
关于数字人文研究的基础理论,笔者19年前发表了《论中国古籍的数字化与人文学术研究》
(《北京图书馆馆刊》1999年第2期,第28-35页)
,十二年前发表《索引与知识发现》
(《中国索引》2006年第1期,第2-9页)
和《古籍数字资源的知识库建设解析》
(《数字图书馆论坛》2006年第12期,第1-4页,与程佳羽合作)
,这些文章提出数字人文研究的基础是建立通用的词汇级的本体,转化、集成传统文献检索工具,建立基于本体的神经网络式的知识管理系统,提供语义网的智能知识服务。