transformers 混合精度一定需要 Ampere 架构的 gpu 吗？ ...

作者：buaacss 发布时间：2023-5-24 19:15:55

看 transformers 的源码，判断能否使用 bf16 混合精度的时候需要 Ampere 架构的 GPU ，不太明白是为什么。
改了下代码试试 2080ti 能不能跑出来，如果可以的话再给大家汇报。
如果有人知道是什么原因以及效果如何也请留言告知，不胜感激。

ampere, GPU, 精度, 混合

相关帖子

ShadowPower 2023-5-24 19:16:28

用 fp16 也是混合精度
Ampere 架构才支持 bf16 ，更早的显卡硬件不支持，跑的时候实际上转回 fp32 ，更慢了
Turing 架构有 Tensor Core ，可以跑 fp16 和 int8 ，相比 fp32 还快很多

buaacss

OP

2023-5-24 19:17:22

@ShadowPower 我使用的是 2080ti ，是 Turing 架构的。从我目前的测试上看，使用 fp16 会溢出，使用 bf16 按您的说法是会转回 fp32 ，会更慢。但是我确实看到加速了不少而且显存也下降了。
使用单精度，我 bs 最多只能设置到 8 ，需要大约 32 个小时训练
使用 bf16 ，我 bs 可以设置到 16 ，需要大约 16 个小时完成训练
使用 fp16 ，会直接溢出

transformers 混合精度一定需要 Ampere 架构的 gpu 吗？

相关帖子

浏览过的版块

热门主题

求推荐 300 价位电视盒子

[分享] 纯前端撸了一个「交互式哺乳动物演

她说离婚原因是男的挣不到钱

这是缅北开发的游戏…

短视频里，高速现在都开始堵车了啊，大家都

百度统计或者cnzz的数据，来源分析，直接访

必应移动端有流量的吗？

发现了很多这种后缀的的百度收录，是怎么做

我看那个huoban网站权重被百度干没了。。。

按 Ctrl 好累？我不是一个人吧

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

transformers 混合精度一定需要 Ampere 架构的 gpu 吗？

相关帖子

浏览过的版块

热门主题

求推荐 300 价位电视盒子

[分享] 纯前端撸了一个「交互式哺乳动物演

她说离婚原因是男的挣不到钱

这是缅北开发的游戏…

短视频里，高速现在都开始堵车了啊，大家都

百度统计或者cnzz的数据，来源分析，直接访

必应移动端有流量的吗？

发现了很多这种后缀的的百度收录，是怎么做

我看那个huoban网站权重被百度干没了。。。

按 Ctrl 好累？我不是一个人吧

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

在 Yoo趣儿投放广告