登录或注册

XenForo 1.5.14 中文版——支持中文搜索！现已发布！查看详情
Xenforo 爱好者讨论群：215909318 XenForo专区

XenForo 1.5.14 中文版 Xenforo 爱好者

新闻 RWKV-8 预览之 DeepEmbed：对端侧友好的稀疏设计，解决 MoE 显存占用下载

本帖由漂亮的石头于 2025-05-28 发布。版面名称：软件资讯

漂亮的石头版主 管理成员

注册:

2012-02-10

帖子:

488,439

赞:

48

RWKV-8 "Heron" 是我们的下一代架构，具有多个全新技术。在此我们首先公布其中的 DeepEmbed 技术，它可以实现类似 MoE 的优秀推理性能，同时无需占用显存，甚至无需占用内存，可以让稀疏的大模型真正部署到所有端侧设备。推理代码：https://github.com/BlinkDL/RWKV-LM/blob/main/RWKV-v7/rwkv_v8_rc00_demo.py rwkv-8-...
RWKV-8 预览之 DeepEmbed：对端侧友好的稀疏设计，解决 MoE 显存占用下载地址

漂亮的石头, 2025-05-28

#1

(您必须注册并登陆后发表回复。)

正在加载...

论坛
论坛

快捷链接
- 最新主题
媒体相册
媒体相册

快捷链接
- 最新媒体
下载中心
下载中心

快捷链接
- 活跃作者
- 最新评论
会员
会员

快捷链接
菜单