【野生】DeepSeek火了: 速度碾压官方版 权重开、源

2025-07-24 00:52:13      来源:求是网

机器之心报道

没等来DeepSeek官方的R2,却迎来了一个速度更快、性能不弱于R1的「野生」变体!

这两天,一个名为「DeepSeekR1T2」的模型火了!

这个模型的速度比R1-0528快200%,比R1快20%。除了速度上的显著优势,它在GPQADiamond(专家级推理能力问答基准)和AIME24(数学推理基准)上的表现均优于R1,但未达到R1-0528的水平。

在技术层面,采用了专家组合(AssemblyofExperts,AoE)技术开发,并融合了DeepSeek官方的V3、R1和R1-0528三大模型。

当然,这个模型也是开源的,遵循MIT协议,并在HuggingFace上开放了权重。

HuggingFace地址:https://huggingface.co/tngtech/DeepSeek-TNG-R1T2-Chimera

经过进一步了解,我们发现:DeepSeekR1T2是德国一家AI咨询公司「TNG」推出的,模型全称为「DeepSeek-TNGR1T2Chimera」(以下简称R1T2)。

该模型除了前文提到的在智力水平和输出效率之间实现完美平衡之外,相较于这家公司的初代模型「R1TChimera」,智力大幅跃升,并实现了突破性的think-token一致性。

不仅如此,即使在没有任何系统提示的情况下,该模型也能表现稳定,提供自然的对话交互体验。

在评论区,有人误以为这个模型出自DeepSeek官方,并且认为他们是不是也在走相同的路线:给模型起各种名称,就是不用主系列下一代版本号?

更多的人认可该模型「找到了智能与输出token长度之间的最佳平衡点,并且提升了速度」,并对该模型在现实世界的表现充满了期待。

模型细节概览

从HuggingFace主页来看,R1T2是一个基于DeepSeekR1-0528、R1以及V3-0324模型构建的AoEChimera模型。

该模型是一个采用DeepSeek-MoETransformer架构的大语言模型,参数规模为671B。

R1T2是该公司4月26日发布的初代模型「R1TChimera」的首个迭代版本。相较于利用双基模型(V3-0324+R1)的初代架构,本次升级到了三心智(Tri-Mind)融合架构,新增基模型R1-0528。

该模型采用AoE技术构建,过程中利用较高精度的直接脑区编辑(directbrainedits)实现。这种精密融合不仅带来全方位提升,更彻底解决了初代R1T的token一致性缺陷。

团队表示,R1T2对比其他模型具备如下优劣:

与DeepSeekR1对比:R1T2有望成为R1的理想替代品,两者几乎可以通用,并且R1T2性能更佳,可直接替换。

与R1-0528对比:如果不需要达到0528级别的最高智能,R1T2相比之下更加经济。

与R1T对比:通常更建议使用R1T2,除非R1T的特定人格是最佳选择、思考token问题不重要,或者极度需求速度。

与DeepSeekV3-0324对比:V3速度更快,如果不太关注智能可以选择V3;但是,如果需要推理能力,R1T2是首选。

此外,R1T2的几点局限性表现在:

R1-0528虽推理耗时更长,但在高难度基准测试中仍优于R1T2;

经SpeechMap.ai(由xlr8harder提供)测评,R1T2应答克制度(reserved)显著高于R1T,但低于R1-0528;

暂不支持函数调用:受R1基模型影响,现阶段不推荐函数调用密集型场景(后续版本可能修复);

基准测试变更说明:开发版由AIME24+MT-Bench变更为AIME24/25+GPQA-Diamond测评体系,新体系下R1与初代R1T的分差较早期公布数据更大。

最后,关于R1T2中重要的AoE技术,可以参考以下论文。

论文标题:AssemblyofExperts:Linear-timeconstructionoftheChimeraLLMvariantswithemergentandadaptablebehaviors

  游盈隆表示,赖清德上任第一个月,只获不到半数台湾民众的支持,赖清德社会支持基础的流失是全面性的,不同程度的。游盈隆指出,根据相关经验证据,近一个月赖清德社会支持基础的流失主要原因至少有三:

责编:丙贤淑编辑

官方调查那尔那茜

  纪宁说:“欧美国家的网球市场已逐渐进入饱和阶段,中国被认为可能带来新的爆发性增长点。”他认为,在中国这个网球新兴市场,应更充分地挖掘体育明星的商业价值。“这有利于全面释放中国体育经济的增长潜力。”

美代表口误谴责以色列

  美团数据也显示,7月以来,“网球”搜索量同比去年增长超60%。网球体验课、网球培训季度课包在平台热销,美团上网球运动相关团购订单量同比激增172%。

以军无人机袭击伊朗科学家

  “有些地区出现了多个国际航空枢纽的格局。比如华南的广州、深圳,西南的成都、重庆、昆明,西北的西安、乌鲁木齐。但与成渝不同的是,西北地域辽阔,西安与乌鲁木齐距离非常远,两个枢纽生态位截然不同。”

长期不吃主食年后身体的变化

  中央要求谋划新一轮财税改革,税制改革是重头戏,未来增值税、消费税、个税等主要税种还将有进一步改革举措。笔者呼吁,在税收征管不断强化的同时,为促进企业、个人实际税负维持在合理水平,未来税制改革应当统筹考虑降低名义税率。

再一次对印度人的聪明有了实感

  据介绍,根据气象监测情况,今年4月下旬以来,全省平均降水量26.6毫米,较常年同期偏少75%,截至6月13日,大部分地区连续无有效降水日数超60天,郑州等10个地市在70天以上;平均气温23.2度,较常年同期偏高1.8度。

印度扬言永不恢复印度河用水条约

  笔者跟多位省级、市级税务人士交流得知,目前并没有全国性查税部署。一些地方根据当地税收大数据风险提示等对个别企业查税,是日常工作,也是税务部门正常履职。毕竟税务部门主要负责税收、社会保险费和有关非税收入的征收管理,发现偷逃税、少缴税行为,理应依法制止,否则就是渎职。/p>

唐僧都开始卖房了

  绵阳拥有中国工程物理研究院、中国空气动力研究与发展中心等国家级科研院所18家,国家级创新平台25家,全社会研发经费(R&D)投入强度位居全国前列。/p>

我到月底的饭都被支付宝餐补包了

  坚持因地制宜、科学抗旱,河库灌区及时开闸放水,增加流量,采取疏通渠道、维修涵闸等措施,做到远送多浇、有水可浇;引黄灌区根据抗旱需水情况,及时开闸放水,争取多引黄河水;平原灌区发挥机电井作用,采取有效措施保障机井通电,并组织投入各类排灌机械179.4万台,努力增加抗旱播种面积。丘陵岗区利用坑、塘、堰、坝等小型水利工程组织抗旱播种。夏播以来,全省累计抗旱浇水7977.3万亩次,播种进度与常年相当。