金十数据2月26日讯,从第四范式了解到,第四范式推出大模型推理端侧解决方案ModelHub AIoT,用户在端侧可轻松部署包括DeepSeek R1、Qwen 2.5、Llama 2/3系列等小尺寸蒸馏模型,并实现离线运行。用户可灵活在多个模型之间切换,兼顾了模型压缩、推理性能,解决了部署与优化的复杂性。公司表示,该方案不仅能够满足用户对隐私和实时性的需求,还极大降低了AI大模型推理成本。
第四范式推出大模型推理端侧解决方案ModelHub AIoT
金十数据2月26日讯,从第四范式了解到,第四范式推出大模型推理端侧解决方案ModelHub AIoT,用户在端侧可轻松部署包括DeepSeek R1、Qwen 2.5、Llama 2/3系列等小尺寸蒸馏模型,并实现离线运行。用户可灵活在多个模型之间切换,兼顾了模型压缩、推理性能,解决了部署与优化的复杂性。公司表示,该方案不仅能够满足用户对隐私和实时性的需求,还极大降低了AI大模型推理成本。