deepseek 崩了？今天网页端一直是“不好意思，和 DeepSeek 聊天的人有点太多了，请过一会儿再提问吧。”

查看 708|回复 18

LanhuaMa 2025-1-27 19:07:58

@LanhuaMa #10 用脚投票就完事了，大善人见不得穷人是吧

guguexxx 2025-1-27 19:08:57

@18k R1 可以理解为。在极其有限的成本下，跑出了较为优秀的效果。但是从性价比上来说，最优秀的模型的训练成本比他高了 N 倍，并没有多出 n 倍的领先优势。
我本地和官网都做了不少测试，和其他网上的测试者观点差不多一致。就是存在很大的波动性。因为目前他是靠高质量数据冷启动的，所以一旦触及到什么鬼知道的情况，就波动很大。。。
举个简单的例子，一个小学数学题。o1 mini 思考 1 秒，结束。deepseek 思考几分钟，反复质疑自己十五次。虽然答案是对的。但是可见其诡异的波动。。。。

Liftman 2025-1-27 19:09:43

社区劣化很明显啊，到现在都没人说 R1 最重要的贡献是用大规模 RL 训练推理能力。
社区大了以后，直接的结果就是蠢蛋先发声。

zaizaizai2333 2025-1-27 19:10:14

@Liftman 是的，看那个思考过程都想捶他两拳。如此深沉

RuriSmzk 2025-1-27 19:11:08

@LanhuaMa #10 润站特色。

frankilla 2025-1-27 19:11:55

最近真的热搜不断，炒太多了，此刻的热搜更是魔幻，创始人回家过年…
不过原来是幻方量化的创始人…天才少年，量化收割散户起家，战略布局购亿元芯片，再造 AI 比肩海外！然后年前一天不忘初心，再割散户开启科技内循环…

18k 2025-1-27 19:12:30

@LanhuaMa 如果你不懂就没必要胡说的..蒸馏和偷窃好像并没有什么关系。首先似乎并没有实锤证据表明 deepseek 蒸馏了 chatgpt ，虽然确实是有这种可能，但这种怀疑同样可以用于很多其他 LLM 。
况且蒸馏也不是什么大不了的事啊，你难道是觉得蒸馏是用什么神奇的方法把 gpt 的能力"偷"了过来吗？这只是一种形象化的说法而已，在我看来不过是学术界特有的造词行为...学界蒸馏的模型多的是，甚至模型蒸馏本来就算是一个研究方向。deepseek 在模型的工程训练上还是有独到之处的，更何况他还是开源权重，收到很多赞扬也不稀奇。至于有没有推动炒作那就不是我能知道的事了

YooboH 2025-1-27 19:13:23

今天 API 崩了

nullboy 2025-1-27 19:14:16

@LanhuaMa #10 那完了，论文是谷歌发的，第一个 LLM 也是谷歌做的，结果 closeai “偷窃”来做产品挣大钱那表现再好也是辣鸡。按 Perplexity CEO 在 CNBC 的原话：“Everybody copies everybody in this field.” 所以“偷窃是原罪”，这领域成垃圾桶了🤡

deepseek 崩了？今天网页端一直是“不好意思，和 DeepSeek 聊天的人有点太多了，请过一会儿再提问吧。”

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

deepseek 崩了？今天网页端一直是“不好意思，和 DeepSeek 聊天的人有点太多了，请过一会儿再提问吧。”

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告