阿里MNN(Mobile Neural Network)是一个轻量级、高性能的深度学习推理引擎,由阿里巴巴开源,专为移动端和嵌入式设备优化设计。它旨在帮助开发者高效地将深度学习模型部署到资源受限的设备上,例如手机、IoT设备等。本次部署实践基于阿里官方MNN客户端测试,你可以通过本站获取该APP。
一、手机配置参数
处理器:骁龙888 Plus
内存:12G
存储:512G
操作系统:MagicOS
二、1.5B模型信息
名称:DeepSeek-R1-1.5B-Qwen-MNN
简介:该模型是使用 llmexport 从 DeepSeek-R1-Distill-Qwen-1.5B 导出的 MNN 模型的 4 位量化版本。
模型地址:https://hf-mirror.com/taobao-mnn/DeepSeek-R1-1.5B-Qwen-MNN
三、7B模型信息
名称:deepseek-llm-7b-chat-MNN
简介:该模型是使用 llmexport 从 deepseek-llm-7b-chat 导出的 MNN 模型的 4 位量化版本。
模型地址:https://hf-mirror.com/taobao-mnn/deepseek-llm-7b-chat-MNN
四、测试题目
数学题:有若干只鸡兔同在一个笼子里,从上面数,有35个头,从下面数,有94只脚。问笼中各有多少只鸡和兔?
答案:12只兔子,23只鸡。
五、题目1测试结果及速度
1.5B模型生成速度为9.78 tokens/s,回答结果正确。如下图:
7B模型生成速度为4.23 tokens/s,速度略慢,但是意外的是结果也不对,如下图: