Log in or Sign up

XenForo 1.5.14 中文版——支持中文搜索！现已发布！查看详情
Xenforo 爱好者讨论群：215909318 XenForo专区

XenForo 1.5.14 中文版 Xenforo 爱好者

新闻 vLLM 发布 v0.9.1，支持更多模型、引入 llm-d 框架下载

Discussion in '软件资讯' started by 漂亮的石头, 2025-06-17.

漂亮的石头版主 Staff Member

Joined:

2012-02-10

Messages:

487,766

Likes Received:

47

vLLM 发布了 v0.9.1 版本，新增 Magistral 模型支持、FlexAttention 支持等多项功能，并介绍了与 Inference Gateway (IGW) 共同设计的新型 Kubernetes 原生高性能分布式 LLM 推理框架 llm-d。 vLLM 最初由加州大学伯克利分校 Sky Computing 实验室开发，现已成为社区驱动的开源项目，为 LLM 推理和服务提供快速易用的库。...
vLLM 发布 v0.9.1，支持更多模型、引入 llm-d 框架下载地址

漂亮的石头, 2025-06-17

#1

(You must log in or sign up to reply here.)

Loading...

Forums
Forums

Quick Links
- Recent Posts
Media
Media

Quick Links
- New Media
Resources
Resources

Quick Links
- Most Active Authors
- Latest Reviews
Members
Members

Quick Links
Menu