做了个小说整理工具:抽人物档案和关系图,也能继续做插图 EPUB

查看 23|回复 2
作者:hresh   
最近做了一个小说 TXT 整理工具,还没正式上线,想先发出来听听大家意见。
最早的想法其实有点私人化。
我平时看小说的时候,对人物衣着描写是有兴趣的,但大多数时候都是一眼掠过。不是觉得它没用,而是我脑子里转不出画面。作者写“白衬衫”“黑色套裙”“披肩”“发簪”“耳坠”,我知道这些字是什么意思,但组合到一个具体人物身上是什么样,我经常想不出来。
说白了,见识和想象力都不太够。
后来又冒出另一个想法:想看看别人到底是怎么写小说的,尤其是人物衣着和外观这一块。那些描写到底抓的是什么细节,为什么有些人几句话就能把人物形象立住。我中间还短暂幻想过,能不能把这些片段整理出来,自己以后写东西时参考一下。
后来很快断了这个念头。没那个本事。
但“把小说里的人物、关系、衣着片段整理出来”这个想法留下来了。尤其是长篇小说里人物一多,各种别名、称呼、身份、关系就很容易混。隔几天再看,某个“夫人”“老师”“妈妈”到底是谁,和主角是什么关系,有时候真得往前翻。
所以我后来就做了这么个工具。它不是阅读器,也不是单纯 TXT 转 EPUB 。更准确地说,它先做小说人物档案和关系网络整理,然后再继续往衣着素材、角色图库、插图回传和 EPUB 成书走。
大概流程是:
上传 TXT -> 人物档案 -> 人物关系图 -> 识别衣着/外观片段 -> 人工审核 -> 智能抽取 -> 角色图库 -> 回传插图 -> 在线预览 -> 导出 EPUB

我拿一本 70 万字左右的小说完整跑了一遍:
  • 703,621 字
  • 8 个人物档案
  • 支持人物关系网络图
  • 44 条有效片段
  • 44 张插图
  • 导出 EPUB 约 7.9 MB


    我现在越来越觉得,人物档案和关系图本身就可以单独作为一个功能。
    有些人可能完全不关心衣着描写,也不想做插图,更不会导出 EPUB 。他只是想知道一本长篇小说里有哪些关键人物,谁是谁的别名,各自是什么身份,人物之间大概是什么关系,有哪些原文证据能支撑这些判断。
    这个需求和“做插图 EPUB”其实不是同一类人。
    继续往下才是衣着和插图相关的部分。系统会从原文里识别衣着、外观、配饰这类片段,人工确认哪些有用,再抽取成结构化素材。后续如果要生图,可以拿这些素材去用。
    这里也说明一下:生图功能我没有整合到网站里。
    现在生图工具太多了,每个工具风格不一样,限制不一样,能接受的尺度也不一样。硬塞到网站里,我感觉反而会把事情搞复杂。所以目前的想法是:网站负责整理人物档案、关系图、衣着素材、角色图库、插图绑定和 EPUB 成书;至于图怎么生,各凭本事。
    你在别的工具里生好图,再回传到网站里,绑定到对应片段就行。
    另外我做了一个图库功能。可以上传各种角色图源,然后给人物档案选择各自的形象图。这样后续做衣着描写生图时,至少能有一个相对固定的人物参考,不至于每张图都像换了个人。

    现在已经做出来的大概有这些:
  • 人物档案:提取人物名、别名、身份、关系和原文证据。
  • 人物关系图:把人物之间的关系梳理出来,方便回看谁和谁有关。
  • 衣着/外观片段识别:从原文里捞出适合整理或配图的内容。
  • 人工审核:无用片段可以剔掉,有用片段再继续抽取。
  • 智能抽取:整理服饰、颜色、材质、配饰、生图描述。
  • 角色图库:上传角色图源,给人物档案选择形象图。
  • 插图回传:把外部生成的图绑定回对应原文位置。
  • EPUB 预览和导出:导出前看图文位置,最后生成带插图的 EPUB 。


    最后导出的 EPUB 在阅读器里大概是这样:

    我现在没太想清楚这个东西到底该怎么定位,所以想问问大家:
    [ol]
  • 只做人物档案抽取和关系网络图,你会不会觉得有用?
  • 你更关心人物档案/关系图,还是后面的衣着素材、角色图库、插图 EPUB ?
  • 像这种半自动流程能不能接受?还是说只要不是一键生成,就不会想用?
  • 网站不内置生图,只做素材整理、角色图库、图片回传和 EPUB 成书,这个边界能不能接受?
  • 上传 TXT 到网站这件事,你主要会担心版权、隐私,还是文件安全?
    [/ol]
    如果大家只是觉得“看着还行”,但没人真的想试,那我可能就先不买服务器部署了。
    如果有人愿意拿自己的小说试一下,我再考虑做个小范围内测。

    人物, 关系, 衣着

  • jamesying   
    要测试?那必须是《少妇白洁》,能理清就说明 90%成功了。
    jamesying   
    UI 做的好漂亮
    您需要登录后才可以回帖 登录 | 立即注册

    返回顶部