天涯论坛_华人最大的社区论坛_新天涯社区

查看: 17|回复: 0

刚刚,DeepSeek新模子自砍一刀!大降价50%,华为寒武纪已适配

[复制链接]

2万

主题

0

回帖

6万

积分

论坛元老

Rank: 8Rank: 8

积分
63863
发表于 2025-10-2 19:20 | 显示全部楼层 |阅读模式

智工具
作者 | 李水青
编辑 | 漠影
智工具9月29日报道,刚刚,DeepSeek正式公布DeepSeek-V3.2-Exp模子,官方App、网页端、小法式均已同步更新为该版本,同时API大幅度降价提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

DeepSeek-V3.2-Exp的Hugging Face页面截图
DeepSeek-V3.2-Exp的一大亮点是价格暴降提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。在新的价格政策下,开辟者挪用DeepSeek API的本钱将下降50%以上提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
据悉,DeepSeek-V3.2-Exp API的输入价格由0.5元/百万tokens下降为0.2元/百万tokens(缓存射中),由4元/百万tokens下降为2元/百万tokens(缓存未射中),输出价格由12元/百万tokens下降为3元/百万tokens提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

DeepSeek-V3.2-Exp的全新价格政策
这得益于新模子办事本钱的大幅下降提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。V3.2-Exp是一个尝试性(Experimental)的版本,作为迈向新一代架构的中心步调,在V3.1-Terminus的根本上引入了一种稀疏留意力机制(DeepSeek Sparse Attention,DSA),针对长文本的练习和推理效力停止了摸干脆的优化和考证提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
据悉,DSA初次实现了细粒度稀疏留意力机制,在几近不影响模子输出结果的条件下,实现了长文本练习和推理效力的大幅提升提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

DeepSeek-V3.2-Exp相比V3.1-Terminus效力提升
为了松散地评价引入稀疏留意力带来的影响,DeepSeek特地把DeepSeek-V3.2-Exp的练习设备与V3.1-Terminus停止了严酷的对齐提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。在各范畴的公然评测集上,DeepSeek-V3.2-Exp的表示与V3.1-Terminus根基持平提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

DeepSeek-V3.2-Exp与V3.1-Terminus测评表示对照
DeepSeek-V3.2-Exp一经公布,就在外网交际平台X等炸开了锅提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。有网友对“本钱下降50%”暗示赞叹,也有网友对DeepSeek“周更”的节奏暗示满足,还有更多网友催更DeepSeek新一代模子R2及V4,并期待DeepSeek打败OpenAI提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

交际平台X网友热议DeepSeek-V3.2-Exp
国产AI芯片公司纷纷第一时候公布完成DeepSeek-V3.2-Exp的适配提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
华为发文公布,昇腾已快速基于vLLM/SGLang等推理框架完成适配摆设,实现DeepSeek-V3.2-Exp 0day支持,并面向开辟者开源一切推理代码和算子实现提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。其在128K长序列下可以连结TTFT低于2秒、TPOT低于30毫秒的推理天生速度提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

华为计较官方公众号发文
寒武纪也发文公布,其已同步实现对深度求索公司最新模子DeepSeek-V3.2-Exp的0day适配,并开源大模子推理引擎vLLM-MLU源代码提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。DeepSeek-V3.2-Exp叠加寒武纪的极致计较效力,可大幅下降长序列场景下的训推本钱提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

寒武纪开辟者公众号发文
作为一个尝试性的版本,DeepSeek-V3.2-Exp虽然已经在公然评测集上获得了有用性考证,但仍然需要在用户的实在利用处景中停止范围更广、范围更大的测试,以解除在某些场景下结果欠佳的能够提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
为方便用户停止对照测试,DeepSeek-V3.1-Terminus姑且保存了额外API拜候接口,保存到北京时候2025年10月15日23:59提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
用户只需点窜base_url=”
https://api.deepseek.com/v3.1_terminus_expires_on_20251015″ 即可拜候V3.1-Terminus,挪用价格与 V3.2-Exp不异提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
DeepSeek-V3.2-Exp模子现已在Hugging Face与魔搭开源提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
HuggingFace地址:
https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp
ModelScope地址:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Exp
论文地址:
https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf
结语:DeepSeek再降大模子落地门坎,国产芯片加速适配DeepSeek的模子迭代速度正在加速提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。就在9月22日晚间,其刚刚公布了DeepSeek-V3.1-Terminus,优化了编程、搜索智能体等表示提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。仅仅一周后,DeepSeek-V3.2-Exp随之公布,带来了大幅下降的本钱体验提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
这预示着DeepSeek的下一代模子很快就要到来了,此前已有外媒报道称,DeepSeek今年年末行将推出Agent模子提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。值得一提的是,我们看到DeepSeek不但上线阿里魔搭社区,并立马适配华为昇腾、寒武纪等国产AI芯片,也许意味着其快速迭代及落天时用与国产AI芯片联系加倍慎密提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|天涯论坛_华人最大的社区论坛_新天涯社区  

GMT+8, 2025-11-5 13:39 , Processed in 0.782164 second(s), 26 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表