我初步手搓了一个 MVP ,工作流大概是这样的:
博文 -> 提炼口语脚本 -> 切分镜 -> 视觉设计 -> AI 生成 Remotion 代码 -> 前端预览 -> 渲染成片
目前主链路是跑通了,但是实际产出的效果简直没法看:
画面太糙:AI 生成的视觉基本就是最简单的 Icon 拼凑加上硬切动画,毫无美感可言。
排版灾难: 动不动就文字溢出。大模型脑子里根本没有屏幕尺寸和物理像素的概念,不知道换行。
布局极不合理: 元素经常乱飞,因为从头到尾所有的内容都是 AI 自由生成的,毫无约束,导致极度不稳定。
现在代码被 ai 搞的一塌糊涂, 我也懒得删除了,
有没有成熟的方案,保证一下视频的下限
另外附上我的技术栈:
前端: react + remotion
后端 fastapi + langchain/langgraph

