登录或注册

XenForo 1.5.14 中文版——支持中文搜索！现已发布！查看详情
Xenforo 爱好者讨论群：215909318 XenForo专区

XenForo 1.5.14 中文版 Xenforo 爱好者

新闻 Omni-Infer v0.7.0 已经发布，超大规模 MoE 模型推理加速技术下载

本帖由漂亮的石头于 2025-12-16 发布。版面名称：软件资讯

漂亮的石头版主 管理成员

注册:

2012-02-10

帖子:

488,439

赞:

48

Omni-Infer v0.7.0 已经发布，超大规模 MoE 模型推理加速技术。 v0.7.0 核心特性 Omni Cache支持MLA/GQA chunk prefill混部入图支持SGLang 其它优化基于2P8-1D32@A3，平均3.5K+1K，Deepseek R1性能达到QPM186，TTFT<2s，TPOT<20ms 基于2P2-1D4@A3，2K+2K，openPangu-72B单卡Decode峰值性能达到1560 TPS，TPOT<30ms 支持...
Omni-Infer v0.7.0 已经发布，超大规模 MoE 模型推理加速技术下载地址

漂亮的石头, 2025-12-16

#1

(您必须注册并登陆后发表回复。)

正在加载...

论坛
论坛

快捷链接
- 最新主题
媒体相册
媒体相册

快捷链接
- 最新媒体
下载中心
下载中心

快捷链接
- 活跃作者
- 最新评论
会员
会员

快捷链接
菜单