英伟达双塔 AI 模型开源发布:文本生成速度提升 2.42 倍、画质保留 98.7%
英伟达 7 月 2 日推出 Nemotron-Labs-TwoTower 离散扩散语言模型,旨在解决大模型逐一生成 Token 速度慢的痛点,相关权重已在 Huggingface 开源。模型基于现有 Nemotron 骨干网络改造,复用预训练权重,无需从零完整训练,大幅降低开发成本。

60B 双塔架构,分工并行提升生成效率
模型总参数量 60B,拆分为两座 30B 独立神经网络协同工作,每塔激活 3B 参数,搭载 128 个可路由专家模块。上下文塔固定冻结,负责留存全文语义信息;去噪塔专门训练,依靠扩散机制并行生成文本,两塔通过交叉注意力互通数据。
传统模型逐 Token 串行输出,双塔架构可并行写入文本,大幅拉高推理吞吐量,兼顾速度与输出效果。多类基准测试数据显示,模型综合能力保留原版 98.7% 水准,文本生成吞吐速度直接提升 2.42 倍,仅代码、数学类任务小幅下滑。
开源落地,适配多场景推理部署
该模型采用英伟达专属开源协议开放权重,开发者可自由下载测试、商用部署。运行需搭配双张 H100 或 A100 80GB 显卡,单卡仅支持纯自回归模式,双塔完整推理需双卡协同。测试覆盖常识、数学、代码、阅读理解等多项任务,多数指标与原版基本持平,平衡了生成速度与内容质量。
-
07.05
冒险家艾略特的千年奇谭在喧嚣与酩酊之间任务做法分享
-
07.05
崩坏星穹铁道4.2版本如何获取星琼数据统计总览
-
07.05
王者万象棋庄小鱼强度测评-王者万象棋庄小鱼强度如何
-
07.05
冒险家艾略特的千年奇谭 最佳伙伴任务做法分享
-
07.05
冒险家艾略特的千年奇谭 家有家训任务做法分享
-
07.05
《怪物猎人物语 3:命运双龙》翻车:2小时流程DLC也敢卖50元
推荐专题
热门阅读
-
- 末日蚀影堡垒
- 07.05
-
- 动漫足球零食包装推广
- 07.05
-
-
-
-
-
-
下载
- 《神剑伏魔录》(神剑风云)游戏音乐合集
- 其他游戏|7.73 MB
- 一款非常好玩的武侠闯关游戏
-
-
下载
- 《行尸走肉第一章》免安装中文汉化硬盘版下载
- 单机|436 MB
- 一款以动作冒险为主题的游戏
-
-
下载
- 《街头霸王X铁拳》免安装中文汉化硬盘版下载
- 单机|111MB
- 一款非常好玩的格斗游戏
-
-
下载
- 《生化危机:浣熊市行动》免安装中文硬盘版下载
- 单机|6310 MB
- 一款以动作射击为主题的游戏
-
-
下载
- 《暗黑破坏神3》免安装繁体中文正式版下载
- 单机|7630 MB
- 一款以角色扮演为主题的游戏
-
-
下载
- 《马克思佩恩3》免安装硬盘版下载
- 单机|27033 MB
- 一款以第三人称射击为主题的游戏