广告入驻

李飞飞团队“50美元”复刻DeepSeek的R1真相：基座为阿里云Qwen模型

AI资讯9个月前发布人工智能

2,118 0 0

2月6日，有媒体报道称李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。s1模型的训练并非从零开始，其基座模型为阿里通义千问（Qwen）模型。s1用50美元训练出新的具有推理能力的模型，实际上只是用从谷歌模型中提炼出来的1000个样本，然后对千问模型进行微调而成。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

宁德时代第二代钠电池有望于2025年面世

人工智能

2,864

创晟半导体完成近亿元融资，华业天成等参投

人工智能

1,466

索尼与本田合作开发AI自动驾驶EV，计划2026年推出

人工智能

2,458

中国联通在杭州成立数据智能公司，注册资本15亿元

人工智能

2,022

小鹏自研芯片或5月上车，今后新车都将搭载自研芯片

人工智能

1,832

字节跳动正式进军AI视频生成赛道，一天发布两款视频生成大模型

人工智能

4,670

作为人工智能领域的专业导航网站，我们为您提供以下服务：AI网址、AI行业动态、AI技术教程、AI资源下载等。我们的目标是成为您在人工智能领域的得力助手，助您在这个充满无限可能的领域中探索和发现。立即加入我们，开启您的智能生活之旅吧！

友链申请免责声明广告合作关于我们

Copyright © 2025 AI导航 | 人工智能工具集