因为我从没接过这方面的需求,没这方面项目经验。也找了一点资料,只了解了一点皮毛,整体比较模糊,还没有一个较清晰的开发思路。
预算不高,不可能做像某飞某度那种大厂方案自己做训练学习。自己做训练学习太烧钱,这块不太现实,所以大体方向还是用开源框架,调用各 api 做整合(具体哪些平台和接口比较好用的可以推荐一下,gpt4 就不用提了),其余的用户基础部分自己写。
使用自己的视频,克隆自己的形象这块还不太清楚。最终实现能使用用户自己形象和动作以及语音,减少用户在系统上复杂性操作,轻松简便用到做直播上。
希望各位有经验的吴彦祖,各位大佬能指点一二,少走点弯路。感谢