专栏名称: CloudMan
云计算深度实践者;定期发布《每天5分钟玩转OpenStack》教程;让 OpenStack 不再难学!
目录
相关文章推荐
量子位  ·  ChatGPT普通会员能用编程神器Codex ... ·  昨天  
爱可可-爱生活  ·  //@爱可可-爱生活:明日开奖,欢迎参与~- ... ·  昨天  
中信建投证券研究  ·  中信建投 | ... ·  3 天前  
爱可可-爱生活  ·  【[87星]forge-gfx/forge: ... ·  2 天前  
中国证券报  ·  A股重要指数将调整 ·  2 天前  
51好读  ›  专栏  ›  CloudMan

网文校对系统 - 校对模块

CloudMan  · 公众号  ·  · 2025-03-28 05:37

主要观点总结

本文主要描述了与R1讨论后逐步清晰的校对模块方案,从基于规则的校对引擎到大模型自然语言理解和推理的应用。重点介绍了实体识别和关系数据提取的重要性,以及如何利用这些知识构建校对系统。文章还提到了AI在开发中的应用和潜力,强调了AI对人们学习和发展新技能的影响。

关键观点总结

关键观点1: 校对模块的方案讨论和完善过程

文章描述了与R1的讨论过程中,校对模块方案如何从初步的规则设定,逐步发展到大模型的应用,以及如何利用上下文信息提高校对效果。

关键观点2: 实体识别和关系数据提取的重要性

文章强调了在校对过程中,通过实体识别和关系数据提取获取上下文信息的必要性,这是构建有效校对系统的关键。

关键观点3: AI在开发中的应用和潜力

文章通过具体案例展示了AI在开发中的应用,如校对对新章节内容的一致性错误和创建问答系统等功能,突显了AI降低应用开发的门槛以及指导人的作用。


正文

请到「今天看啥」查看全文


看看R1的回复:

这个方案靠谱多了。利用大模型自然语言理解和推理能力,分析文本中的上下文关系,识别潜在的不一致。

要用大模型,除了要校对的新章节内容,还得给它上下文,即上图中R1提到的“知识快照”。虽然R1目前还没提及知识快照的实现细节,但不难判断,其内容应该是当前知识库中实体和关系的数据。

这里就有一个潜在问题了:对于上百万字的网络小说,这个知识快照的量得有多大?会不会超过大模型的上下文窗口?

对此,R1的改进方案如下:

这个改进方案就相当靠谱了。只需要从知识库中提取新章节涉及的实体和关系,按需加载就行了。由于新章节涉及的人物、物品、功法、事件有限,需提取的实体和关系只会占到整个知识库很小的一部分,而且数据量相对固定,不会随章节数的增加而膨胀。







请到「今天看啥」查看全文