专栏名称: 程序人生
十年漫漫程序人生,打过各种杂,也做过让我骄傲的软件;管理过数十人的团队,还带领一班兄弟姐妹创过业,目前在硅谷一家创业公司担任 VP。关注程序人生,了解程序猿,学做程序猿,做好程序猿,让我们的程序人生精彩满满。
目录
相关文章推荐
稀土掘金技术社区  ·  协程中使用 ... ·  2 天前  
程序员技术  ·  前美团员工求助:在美团背了个C绩效,慌得不行 ... ·  21 小时前  
蚂蚁技术AntTech  ·  清华蚂蚁开源首个全异步强化学习训练系统,SO ... ·  22 小时前  
51好读  ›  专栏  ›  程序人生

换个姿势读《资治通鉴》?

程序人生  · 公众号  · 程序员  · 2019-09-03 14:28

正文

请到「今天看啥」查看全文


程序员干这种事情一定是效率为先:能用代码搞定的,一定不用蛮力。于是这个目标被细化成:

  • 选取质量上乘的《资治通鉴》 txt 版本

  • 将文档切分成 294 卷,每卷一个胶片

  • 自动生成符合 marp 格式的胶片,做一些格式上的处理

  • 为引文生成不同的格式

  • 每页胶片都自动放置一个 audio tag,可以播放本页的语音素材,比如:臣光曰

  • 找相熟的小伙伴们创作每一张胶片的语音素材 为每一张胶片自动生成语音素材

  • 通读之,添加注释,相关图片和地图

切分文档这种活, csplit 可以很好胜任,连代码都不用写;为了进一步把文字做成语音素材和胶片,需要花些心思 —— 得写个简单的 script 把切出来的一卷卷内容转成一个 JSON 数组,供后续生成胶片或生成语音素材之用。

这个 JSON 数组长这个样子,除了内容本身,还有是否生成 audio 素材的字段:







请到「今天看啥」查看全文