求助,图像内容理解方案推荐

查看 68|回复 5
作者:Egfly   
现在手上有一个项目,需要用几个简单的词描述一下图片里的内容、拍摄距离(远、中、近)、光线的亮度(低、中、高)。由于图片数量比较大,人工去处理比较慢。
目前考虑的方案有以下三个:
1 、使用 chatgpt 4, 实验之后感觉效果不错。缺点是速度比较慢,而且 chatgpt4 有使用频率限制,一天处理不了多少图片。不知道有没有其他的平台有提供类似的服务,最好是可以用 api 的方式调用
2 、自己租一台服务器,去跑模型,目前看了一下 minigpt4, 效果未知。有没有其他的模型推荐
3 、人工一张一张处理
大佬们,有没有其他什么好的方案推荐?
描述示例

描述: restaurant menu card

描述:cheesecake store

描述:Advertisement of limited offer in McDonald's

图片, 人工, 模型, 方案

czfy   
描述示例

描述: restaurant menu card

描述:cheesecake store

描述:Advertisement of limited offer in McDonald's
h272377502   
“需要用几个简单的词描述一下图片里的内容”
举个例子,最后要描述成什么样
Egfly
OP
  
gpt4 不是提供了 api 了吗,minigpt4 和 gpt4 差距很大
Egfly
OP
  
@czfy 老哥,我 append 了
Egfly
OP
  
@h272377502 gpt4 api 有调用频率限制吗
您需要登录后才可以回帖 登录 | 立即注册

返回顶部