『崩溃』 :肝了几天博文转视频的自动化流,卡在视觉表现和稳定性上,求老哥们指点架构思路!

查看 7|回复 0
作者:lanweizhujiao   
最近几天在捣鼓一个自动化项目,核心诉求就是把我手上攒的一批博文,全自动转成短视频发出去。
我初步手搓了一个 MVP ,工作流大概是这样的:
博文 -> 提炼口语脚本 -> 切分镜 -> 视觉设计 -> AI 生成 Remotion 代码 -> 前端预览 -> 渲染成片
目前主链路是跑通了,但是实际产出的效果简直没法看:
画面太糙:AI 生成的视觉基本就是最简单的 Icon 拼凑加上硬切动画,毫无美感可言。
排版灾难: 动不动就文字溢出。大模型脑子里根本没有屏幕尺寸和物理像素的概念,不知道换行。
布局极不合理: 元素经常乱飞,因为从头到尾所有的内容都是 AI 自由生成的,毫无约束,导致极度不稳定。
现在代码被 ai 搞的一塌糊涂, 我也懒得删除了,
有没有成熟的方案,保证一下视频的下限
另外附上我的技术栈:
前端: react + remotion
后端 fastapi + langchain/langgraph
您需要登录后才可以回帖 登录 | 立即注册

返回顶部