8月21日,DeepSeek正式发布DeepSeek-V3.1。官方App与网页端模型已同步升级为DeepSeek-V3.1。相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案。通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。此外,DeepSeek在其官宣的文章里面提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。另外,V3.1对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。DeepSeek官微在置顶留言里说,UE8M0 FP8是针对即将发布的下一代国产芯片设计。
© 版权声明
文章版权归作者所有,未经允许请勿转载。