阿里MNN(Mobile Neural Network)是一个轻量级、高性能的深度学习推理引擎,由阿里巴巴开源,专为移动端和嵌入式设备优化设计。它旨在帮助开发者高效地将深度学习模型部署到资源受限的设备上,例如手机、IoT设备等。本次部署实践基于阿里官方MNN客户端测试,你可以通过本站获取该APP。
一、红米手机配置参数
处理器:天玑810
内存:8G
存储:128G
操作系统:HyperOS1.0.1.0GBCNXM
二、1.5B模型信息
名称:DeepSeek-R1-1.5B-Qwen-MNN
简介:该模型是使用 llmexport 从 DeepSeek-R1-Distill-Qwen-1.5B 导出的 MNN 模型的 4 位量化版本。
模型地址:https://hf-mirror.com/taobao-mnn/DeepSeek-R1-1.5B-Qwen-MNN
三、7B模型信息
名称:deepseek-llm-7b-chat-MNN
简介:该模型是使用 llmexport 从 deepseek-llm-7b-chat 导出的 MNN 模型的 4 位量化版本。
模型地址:https://hf-mirror.com/taobao-mnn/deepseek-llm-7b-chat-MNN
四、测试题目
1、数学题:有若干只鸡兔同在一个笼子里,从上面数,有35个头,从下面数,有94只脚。问笼中各有多少只鸡和兔?
答案:12只兔子,23只鸡。
2、逻辑题:昨天的明天是今天的哪一天?
答案:今天。
五、题目1测试结果及速度
1.5B模型生成速度为2.2 tokens/s,回答结果正确。如下图:
7B模型生成速度为1.96 tokens/s,速度略慢,但是意外的是结果也不对,如下图:
六、题目2测试结果及速度
1.5B模型生成速度为6.25 tokens/s,结果错误,推理过程都错了。如下图:
7B模型生成速度为0.89 tokens/s,结果也正确。如下图: