❤容易使用Ai00 server 支持 Vulkan/Dx12/openGL 作为推理后端,支持 INT8/NF4 量化,所以可以在绝大部分的个人电脑上快速的运行!支持大部分NVIDIA、AMD、Inter的显卡,包括集成显卡。7B的模型NF4量化时仅占用5.5G显存。