transformers 混合精度一定需要 Ampere 架构的 gpu 吗？ ...

作者：buaacss 发布时间：2023-5-24 19:15:55

看 transformers 的源码，判断能否使用 bf16 混合精度的时候需要 Ampere 架构的 GPU ，不太明白是为什么。
改了下代码试试 2080ti 能不能跑出来，如果可以的话再给大家汇报。
如果有人知道是什么原因以及效果如何也请留言告知，不胜感激。

ampere, GPU, 精度, 混合

相关帖子

ShadowPower 2023-5-24 19:16:28

用 fp16 也是混合精度
Ampere 架构才支持 bf16 ，更早的显卡硬件不支持，跑的时候实际上转回 fp32 ，更慢了
Turing 架构有 Tensor Core ，可以跑 fp16 和 int8 ，相比 fp32 还快很多

buaacss

OP

2023-5-24 19:17:22

@ShadowPower 我使用的是 2080ti ，是 Turing 架构的。从我目前的测试上看，使用 fp16 会溢出，使用 bf16 按您的说法是会转回 fp32 ，会更慢。但是我确实看到加速了不少而且显存也下降了。
使用单精度，我 bs 最多只能设置到 8 ，需要大约 32 个小时训练
使用 bf16 ，我 bs 可以设置到 16 ，需要大约 16 个小时完成训练
使用 fp16 ，会直接溢出

transformers 混合精度一定需要 Ampere 架构的 gpu 吗？

相关帖子

浏览过的版块

热门主题

打印机错误任务清理程序

窗口一键全局轻松调节工具 AltSnap v1.66

提车了，开着还行

摸鱼任务管理器

程序顺序启动器

股市大暴跌，昨天股民开宝马跑步进场，今天

放谷歌广告是否影响百度必应收录

单页网站月流量30w

【Emmy精简系统】清爽加速 Windows 11 25H2

股评人：涨了是大好，跌了是为了迎接大好。

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

transformers 混合精度一定需要 Ampere 架构的 gpu 吗？

相关帖子

浏览过的版块

热门主题

打印机错误任务清理程序

窗口一键全局轻松调节工具 AltSnap v1.66

提车了，开着还行

摸鱼任务管理器

程序顺序启动器

股市大暴跌，昨天股民开宝马跑步进场，今天

放谷歌广告是否影响百度必应收录

单页网站 月流量30w

【Emmy精简系统】清爽加速 Windows 11 25H2

股评人：涨了是大好，跌了是为了迎接大好。

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

单页网站月流量30w

在 Yoo趣儿投放广告