专栏名称: 大家-腾讯新闻
精选大家文章,畅享阅读时光。
目录
相关文章推荐
51好读  ›  专栏  ›  大家-腾讯新闻

于溯:要怎样才能像杜甫一样写诗

大家-腾讯新闻  · 公众号  · 美文  · 2017-03-26 17:18

正文

请到「今天看啥」查看全文



另一方面,对数据样本本身的其特性也需要做前期分析——比如早期文献完整性往往很差,像唐诗的亡佚问题(以《早朝大明宫呈两省僚友》为例,也许当时和作不止三首)就会干扰最终结论;同时,对作者想实现的目的而言,唐诗文献这个样本自身也并不充足(两省僚友中很难说只有三位诗人,不管他们这次有没有和诗)。要之,诗作的往还,并不是诗人交往的唯一方式,又何况诗作亡佚甚多。应该说,作者的工作只是为研究唐代诗人交往情况做了一些前期准备,提供了一些可以进一步分析的数据,而全部工作还远没有完成。但我认为以上这些问题,应该责之文学研究者去解决,而不应该责之为我们提供这个方法的人。打个比方,当文学研究和数据挖掘相遇时,他们的关系就好比医生和设计医疗器械的工程师,各自都要对对方的工作懂一点,才好相互合作,但谁也不可能取代谁。


不错,大数据是把好用的柳叶刀。《诗人关系》的作者还用这把刀做过唐诗用字、用词(季节、颜色、植物、动物)等数据分析(《当我们在读唐诗时,我们在读什么?》,下面简称《读唐诗》)。如果说《诗人关系》是对文学的外部研究的话,《读唐诗》则是文学文本的内部分析。这种分析取径也是古已有之,我们说杜甫喜欢用万里、乾坤、日月之类的大词,李贺喜欢用各种颜色,这都是古今文学研究者总结出来的文学现象。所谓总结,其实就是一种算法,通过这种算法,我们能把握诗人创作的某些特点。我读大学的时候,我的老师考学生的一个办法,是找几首名家写的不那么常见的诗(相对于本科生的阅读量),让大家猜作者。猜,其实就是对诗人的用词、语法、章法习惯的一个综合计算。而古人习诗,特重拟作,模拟一篇作品,其实和读作品猜作者一样,也得先对诗人的用词、语法、章法习惯做综合计算。


所以说,文学美,但并不玄。人人知道太白斗酒诗百篇,太白可是把《昭明文选》反反复复拟作过三遍呢。这样看所谓斗酒诗百篇,不过是说做过无数套模拟题的学霸在醉醺醺的情况下仍能考好罢了。


据说阮籍的《咏怀》,“可以陶性灵,发幽思。言在耳目之内,情寄八荒之表”,很玄的样子,就像“夜中不能寐,起坐弹鸣琴。薄帷鉴明月,清风吹我衿。孤鸿号外野,朔鸟鸣北林。徘徊将何见,忧思独伤心”。可它和这样一首诗——“独夜不能寐,摄衣起抚琴。迅风拂裳袂,白露沾衣襟。孤雁飞南游,飞鸟翔故林。形影忽不见,翩翩伤我心”像不像呢?后一首可是我拿曹植、王粲的诗句乱拼的。所以说阮籍也是打开数据库写诗的,三曹七子汉乐府,这些都在他的数据库里。创作、研究的这种“数据库现象”,正是计算机可以介入文学研究的方法论基础。


无可否认,计算机比人体更适合处理海量数据,因此特别长于探索一些宏观的、结构性的东西——比如诗人团体构成、地域分布、阶层分布,它们在某个时间点呈现的静态图景,或者在某个时间段呈现的动态走势。而计算机的另一个长处是实现分析结果的可视化,我有时就在课上展示不同诗人的词云来让学生猜作者,学生会觉得很酷,而且很容易记住诗人的用词偏好,还能发现谁爱重复用词(就是词云图中出现的那些字号巨大的词)、谁更有避复的意识;我又想过把杜甫的诗按他的行迹标注在电子地图上,这样就是一个杜诗的生成地图,甚至可以进一步做成app,点击一个地点,作于此地的诗就弹出来,读者可以跟着杜甫,重走他诗人的一生。








请到「今天看啥」查看全文