李飞飞团队“50美元”复刻DeepSeek的R1真相：基于阿里云Qwen模型监督微调而成

2025-02-07 10:21

2月6日消息，今日有报道称李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。记者调查后发现，s1模型的训练并非从零开始，其基座模型为阿里通义千问(Qwen)模型。s1用50美元训练出新的具有推理能力的模型，实际上只是用从谷歌模型中提炼出来的1000个样本，然后对千问模型进行微调而成。（科创板日报）

喜欢您正在阅读的内容吗？欢迎免费订阅泰伯每周精选电邮。立即订阅

声明：泰伯网登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述，文章内容仅供参考。