关于影视二创和搬运的

查看 32|回复 3
作者:spotsung   
1.从抖音上面将二创的内容全部下载回来
2.影视二创内容有解说的音轨还有时不时的视频的原生在里面,还包括一些环境音
3.考虑大模型的方案将解说的音轨提出来,然后文本化,并且生成字幕流
4.将提出来的字幕流的文本进行多语种翻译,对翻译质量还是有要求,不能是简单的冰冷的翻译,这里我想依然可以用大模型来做.
5.多语言的字幕流使用大模型再次生成高质量的语音,成为匹配字幕流的音轨
6.将音轨和原先的内容的环境音轨进行合并,生成多个多语言的二创短视频
以上目前来说是否可以利用各家的 AI 大模型的能力搭积木组合到一起?目的就是为了搬运视频到海外各平台
spotsung
OP
  
新人贴,多担待哈
vacuitym   
我目前在做一个从视频提取音频然后识别为文字然后翻译的,本来准备做来给小电影加字幕的。快做完了,但是发现用的音频识别要 2.5/h ,在纠结要不要继续做
younger027   
@vacuitym 音频转文字吗?开源的模型有试过吗?
您需要登录后才可以回帖 登录 | 立即注册

返回顶部