1. XenForo 1.5.14 中文版——支持中文搜索!现已发布!查看详情
  2. Xenforo 爱好者讨论群:215909318 XenForo专区

新闻 vLLM 发布 v0.9.1,支持更多模型、引入 llm-d 框架 下载

本帖由 漂亮的石头2025-06-17 ,14:42 发布。版面名称:软件资讯

  1. 漂亮的石头

    漂亮的石头 版主 管理成员

    注册:
    2012-02-10
    帖子:
    487,683
    赞:
    47
    vLLM 发布了 v0.9.1 版本,新增 Magistral 模型支持、FlexAttention 支持等多项功能,并介绍了与 Inference Gateway (IGW) 共同设计的新型 Kubernetes 原生高性能分布式 LLM 推理框架 llm-d。 vLLM 最初由加州大学伯克利分校 Sky Computing 实验室开发,现已成为社区驱动的开源项目,为 LLM 推理和服务提供快速易用的库。...
    vLLM 发布 v0.9.1,支持更多模型、引入 llm-d 框架下载地址
     
正在加载...