独立开发三个月,复盘做 AI 视频生成工具站的踩过的坑。

查看 7|回复 0
作者:Kelly00   
圈友们好,前 PM 现独立开发的小白一枚,第一次发帖,希望加入到 V2EX 社区和大家一起学,同时分享一些自己的上站踩的坑,也算作为复盘的一种方式。
几个月前我瞄准了视频赛道,尝试用各种 AI 视频工具,结果发现一个共同点:要么太贵,要么太慢,要么没声音。😅于是我决定自己试试看,在这期间踩了 n 多的坑,把几个花了最多时间修复的坑分享出来。
一、要选取正确的 技术栈 & 架构 !!非常关键,不然后面代码容易改成屎山:
整个项目我自己独立开发,技术栈大概是这样的:
Next.js + Tailwind:前端和 UI
Supabase:用户系统 + 数据库
Serverless Functions:用于签发任务请求、轮询状态和更新结果
在接入 api 接口的的过程中,我踩的坑包括:

  • 状态字段不统一( state / status / taskState 各种名字);

  • 有时候返回字段变动,比如视频结果可能在 resultUrl 、mediaUrl 或 resourceUrl ;

  • 授权签名有时间窗( SAS token ),过期就 401 ;

  • 任务长时间未完成时还会触发“假 completed”。

    我后来写了一个统一处理层,自动 fallback 字段、检测异常状态并生成结构化错误。
    状态轮询也加了指数退避,避免被限流。
    二、成本与优化
    GPU 渲染费用比我想象中高不少。
    为降低开销,我重新做了几个优化,站友可以建站的时候直接写进 cursor rules:

  • 任务队列分层:短视频优先渲染,避免长任务堵住短任务;

  • 状态缓存:api 接口状态变化频率不高,不用每秒轮询;

  • 失败重试策略:502 / 429 自动退避重试。

    目前平均生成时间大约 2 分钟。
    我给新用户赠送了 50 积分,想收集不同 prompt 的反馈并吸引一些用户。测试阶段没有收费。欢迎大家免费试用,不收费希望能获取一些反馈,也欢迎群友多多交流,一起进步。大家点这链接可以直接获取积分免费试用 https://sora2openai.com/generate
    三、开发过程的一些反思
    我发现很多 backend 的工具其实挺强大的,但文档写得很抽象,需要自己摸索。
    比如生成任务 ID 的字段,在不同模型下不一样,得手动 merge 才能稳定拿到视频链接。
    现在我做了一个“状态统一器”,能自动判断任务是否真的完成,
    并标注失败原因(算是 debug 最多的一段代码了 😅)。
    四、下一步计划
    加入 多语言配音(中/日/英)、支持自动加字幕、考虑开放一个简易 API 给其他开发者用
    💬 最后
    我知道 V2EX 上很多朋友也在玩 AI 项目,
    也想听听大家的意见:
    如果你是视频创作者,你希望 AI 视频工具还多什么功能? sora2openai.com 这个站主要特点追的新词,同时有声音、无水印、生成挺快、比市场价格都便宜。但是感觉在红海市场没有突出产品特色。欢迎拍砖、提建议、或者单纯聊聊。真的希望把这个工具打磨得好用一点。
  • 您需要登录后才可以回帖 登录 | 立即注册

    返回顶部