Yoo趣儿 › 后端服务 › 服务器 › 一夜普及，单显卡已能运行gpt3模型，速度100x ...

一夜普及，单显卡已能运行gpt3模型，速度100x

查看 140|回复 2

作者：spotlight 发布时间：2023-2-21 22:33:29

flexgen https://github.com/FMInference/FlexGen
Running large language models like OPT-175B/g p t-3 on a single GPU. Up to 100x faster than other offloading systems.
在单个gpu上运行大型语言模型，类似opt-175b/g p t-3，相比类似系统有高达100x速度提升
Hardware: an NVIDIA T4 (16GB) instance on GCP with 208GB of DRAM and 1.5TB of SSD.
硬件：gcp上一块16gb t4，208gb内存，1.5tb ssd。是不是要那么多内存存疑
12小时直接2.3k star，什么是国际热度，战术后仰

模型, 内存, 速度

公告

返回顶部

一夜普及，单显卡已能运行gpt3模型，速度100x

相关帖子

浏览过的版块

热门主题

下午和同事去了派出所回来了

Apple Creator Studio 的图标

Ai coding 分享

[分享] 写了一个基于 AI 的 Git 命令行工具

AICodeMirror 进群就领取 50 刀 Codex，我

在 AI 对话的产品中， LLM 如何输出业务定

在 AI 浪潮背景下，被收割的不只是程序员吧

现在海鲜市场都用什么暗语修车啊？

【收HH】 HostHatch日本性能机，不要大盘鸡

“开门红”揽储！多家中小银行上调定期存款

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

一夜普及，单显卡已能运行gpt3模型，速度100x

相关帖子

浏览过的版块

热门主题

下午和同事去了派出所回来了

Apple Creator Studio 的图标

Ai coding 分享

[分享] 写了一个基于 AI 的 Git 命令行工具

AICodeMirror 进群就领取 50 刀 Codex，我

在 AI 对话的产品中， LLM 如何输出业务定

在 AI 浪潮背景下，被收割的不只是程序员吧

现在海鲜市场都用什么暗语修车啊？

【收HH】 HostHatch日本性能机，不要大盘鸡

“开门红”揽储！多家中小银行上调定期存款

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

在 Yoo趣儿投放广告