DeepSeek-V3.2-Exp正式发布!API大降价 开发者成本降低超50%
快科技9月29日消息,今日,DeepSeek宣布正式发布DeepSeek-V3.2-Exp模型。该模型为实验性(Experimental)版本,是迈向新一代架构的中间步骤。V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价,新价格即刻生效。
DeepSeek-V3.2-Exp API
输入缓存命中0.2元;
输入未缓存命中2元;
输出3元。
DeepSeek表示,在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。
据介绍,DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。
为了严谨地评估引入稀疏注意力带来的影响,DeepSeek特意DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus进行严格对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。
DeepSeek-V3.2-Exp模型现已在Huggingface与魔搭开源:
HuggingFace:
https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp
ModelScope:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Exp
本文 三波网 原创,转载保留链接!网址:https://www.bbbr.net/articles/63909.html
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。
