国产万亿参数大模子再次暴发 但还不是DeepSeek V4
2026-03-12 12:00:19
3月12日消息,作为国产大模型中最受期待的明星,DeepSeek V4最近一直被传发布,但都落空了,现在又有新的大模型引发热议。
这次又是在OpenRuter平台出现的,而且是两个型号,一个代号Hunter Alpha,1万亿参数量,而且支持1M上下文,多模态输出。
另一个代号Healer Alpha,262K上下文,也是多模态,但没有公布参数量,输出速度更快。
很多人猜测Hunter Alpha就是即将发布的DeepSeek V4,但AI大模型评测大佬@karminski-牙医表示它不是V4,还是智谱的新模型,可能是智谱新一代旗舰大模型。
如果了解过DeepSeek的风格,大家也应该认为不是V4,DeepSeek发布新品之前没有在Openruter这样测试过,而是习惯低调上线,之后在群里发布一则简短的消息确认有新品。

DeepSeek V4这几天也有很多网传的新正经,比如1万亿参数量,MOE激活320亿参数,1M上下文,原生多模态,并且为昇腾910C平台优化,而不是只为NVIDIA或者AMD等国外芯片优化。
不过这些爆料可信度一般,目前比较可信一点的反而是下面这一条:知名量化专家@bdsqlsz被发现在HuggingFace上传了DeepSeek-V4-INT8权重,暗示了V4支持INT8算法,更关键的是这意味着V4这次真的差不多要发布了。
还有爆料说DeepSeek要求供应商在6-20号期间保持稳定,最近两天还在做最后的压力测试,很快就能发了。
反正耐心等等吧,好饭不怕晚。

相关阅读
-
Ripple高管分析:瑞波币(XRP)需要采取类似 索拉纳币(Sol)的战略才能跟上步伐区块链快讯 2026-03-12 11:57:08
-
《逐玉》热度狂飙破3万 成腾讯视频2026首部爆款剧深度解读 2026-03-12 11:56:12
-
瑞波币行情最新价格走势图分析:现状、趋势与未来展望区块链快讯 2026-03-12 11:54:21
-
京东自营外卖七鲜小厨公示食材产地:从市场到餐桌不超越48小时金融科技前沿 2026-03-12 11:53:30
-
开年爆款古装电视剧《逐玉》热度狂飙 一连2天播放量破亿深度解读 2026-03-12 11:50:20
-
乱码一二三与乱码一二三的区别金融科技前沿 2026-03-12 11:49:47
-
如何顺利进行9·1.免费版安装:全面解析与实用技巧区块链快讯 2026-03-12 11:49:29
-
大三排SUV销冠,蔚来全新ES8 M42星云红配色上市:选配价1万元金融科技前沿 2026-03-12 11:47:23
-
298元 日式恐惧《零红蝶,重制版》正式上线 双胞胎姐妹误入怨灵废村深度解读 2026-03-12 11:44:46
-
腾讯wegame下载速度慢怎么办?腾讯wegame下载速度慢解决方法资讯百科 2026-03-12 11:43:54