❤容易使用Ai00 server 支持 Vulkan 作为推理后端,支持 INT8/NF4 量化,所以可以在绝大部分的个人电脑上快速的运行!支持大部分 NVIDIA、AMD、Inter 的显卡,包括集成显卡。7B 的 RWKV 模型 NF4 量化时仅占用 5.5G 显存。
👽能力出众兼容 ChatGPT 的 API 接口,使用强大的 RWKV 模型。RWKV 是将会吊打所有基于 Transformer 的模型的,在端侧 LLM 部署的王者模型。并且正在快速迭代中,功能和性能越来越强悍。