DeepSeek拟发V4:1T MoE、1M上下文、适配昇腾
第三方模型目录与媒体称,DeepSeek计划在3月第一周发布旗舰V4:万亿参数MoE、约320亿激活参数,原生多模态覆盖文本/图像/视频/音频,并提供100万token上下文。信息显示其重点优化华为昇腾与寒武纪芯片,预发布阶段未面向Nvidia/AMD。泄露基准称HumanEval约90%、SWE-bench Verified>80,并可能采用MIT/Apache 2.0开放许可与更低推理定价;上述规格、性能与价格均未获官方确认。
阅读原文