李飞飞团队训练出媲美DeepSeek R1的推理模型,云计算费用不到50美元
研究人员表示,s1是使用通过蒸馏法由谷歌推理模型Gemini 2.0 Flash Thinking Experimental提炼出来的数据集,对Qwen模型进行监督微调,使用16个英伟达H100 GPU进行了26分钟的训练。
小K注:“不到50美元”仅为云计算服务费用,不包括服务器、显卡等硬件投入费用,因这部分已经由云厂商承担。(转载自:科创板日报 )

研究人员表示,s1是使用通过蒸馏法由谷歌推理模型Gemini 2.0 Flash Thinking Experimental提炼出来的数据集,对Qwen模型进行监督微调,使用16个英伟达H100 GPU进行了26分钟的训练。
小K注:“不到50美元”仅为云计算服务费用,不包括服务器、显卡等硬件投入费用,因这部分已经由云厂商承担。(转载自:科创板日报 )