Skip to main content

AI BenchMark For X2580

1 Overall Framework

Magik是一个立足于端侧AI应用场景打造的集模型训练、模型优化转换、模型部署推理于一体的全栈式深度神经网络开放平台。

image-20230620171248249

2 Fast Quantization Aware Training Precision

基于Magik平台进行训练量化,相关开源模型基于imagenet、coco等数据集,32bit、8bit及4bit的训练量化精度可查看Table1。

**Network****32bit****8bit****4bit**
inceptionv377.15%77.09%76.9%
mobilenetv271.87%70.69%68.08%
resnet1869.76%69.61%69.11%
resnet5076.14%76.02%75.53%
densenet12174.43%75.64%72.55%
ssd_mobilenet_v167.59%67.56%66.98%
retinaface94.51%94.26%93.42%
facerec99.23%99.15%98.26%
yolov5s_face94.64%94.58%93.34%
yolov5s_person70.1%70.0%69.6%
yolov5m_person79.2%79.1%79.0%

**Table 1**

3 Post Training Quantization Precision

基于Magik平台后量化至8bit,相关开源模型基于imagenet、coco数据集,32bit与8bit后量化精度可查看Table2。

**Network****Framework****Resulotion****DataSet****32bit****8bit**
yolov3onnx416*416coco55.30%55.20%
yolov5sonnx640*640coco56.80%56.54%
yolov5monnx640*640coco64.10%63.78%
yolov5lonnx640*640coco67.30%66.97%
yolov5xonnx640*640coco68.90%66.56%
ssd_mobilenet_v1tf300*300coco35.36%35.25%
ssd_mobilenet_v2tf300*300coco37.13%36.32%
mobilenetv1tf224*224ImageNet70.95%70.03%
mobilenetv2tf224*224ImageNet71.72%70.62%
shufflenetv2onnx224*224ImageNet69.36%68.67%
resnet50onnx224*224ImageNet76.15%75.95%
vgg16onnx224*224ImageNet71.59%71.45%
inceptionv3onnx224*224ImageNet69.49%69.36%
googlenetonnx224*224ImageNet69.78%69.77%
squeezenetonnx224*224ImageNet58.10%57.65%
densenet121caffe224*224ImageNet74.76%74.17%
densenet201caffe224*224ImageNet77.16%74.64%
inceptionv1tf224*224ImageNet70.40%70.43%
inceptionv4tf299*299ImageNet79.43%79.28%
inceptionv1caffe224*224ImageNet72.30%70.53%
resnet18caffe224*224ImageNet65.91%65.83%
resnet50caffe224*224ImageNet75.10%74.38%
squeezenetv1.1caffe227*227ImageNet56.42%56.24%
mobilenetv1caffe224*224ImageNet70.90%70.00%
mobilenetv2caffe224*224ImageNet71.83%71.27%
squeezenetv1.0caffe227*227ImageNet55.84%55.36%
vgg16caffe224*224ImageNet71.01%70.97%

**Table 2**

4 Model Efficiency

相关开源模型在板端进行前向推理的耗时可查看Table3。

**Network****Resulotion****GOPs****8bit(fps)****4bit(fps)**
yolov3416x416x365.988.5415.80
yolov5m640x640x354.597.5413.44
yolov5s640x640x316.9415.9224.81
yolov3_tiny416x416x36.2155.5286.58
resnet18224x224x33.71116.01151.52
resnet34224x224x37.4057.5493.81
resnet50224x224x38.2645.8356.18
mobilenetv1224x224x31.156147.06227.27

**Table 3**

5 X2580 Algorithm List

**序号****算法名称****算法描述****Flash Size****内存占用****完成状态**
1X2580移动侦测功能:移动侦测默认分辨率:640*3601.2M(算法库)2M完成
2X2580移动跟踪功能:移动跟踪(配合电机)反馈坐标默认分辨率:640*3601.5M(算法库)2M完成
3X2580周界检测功能:越界入侵、 区域入侵默认分辨率:640*3601.3M(算法库)2M完成
4X2580遮挡检测功能:检测镜头出现遮挡时进行告警。默认分辨率:640x3601.3M(算法库)2M完成
5X2580多物同检(人形、车辆)功能:人形、车辆检测、识别默认个数20(不做限制)默认分辨率:640*360(可用分辨率~1080p)召回率:> 91%准确率:> 93%2.5M(算法库+模型)4M完成
6X2580多物同检(人形、车辆)功能:人形、车辆检测、识别默认个数20(不做限制)、检测时间30ms左右默认分辨率:640*360(可用分辨率~1080p)召回率:> 93%准确率:> 95%5.5M(算法库+模型)6M完成
7X2580三物同检(人形、车辆、宠物)功能:人形、车辆、宠物检测、识别默认个数20(不做限制)、检测时间30ms左右默认分辨率:640*360(可用分辨率~1080p)召回率:> 93%准确率:> 95%5.5M(算法库+模型)6M完成
8X2580人脸检测功能:识别人脸默认个数20个(不做限制)、检测时间43ms默认分辨率:1280*720 (可用分辨率~1080p)召回率:> 99%准确率:> 98%5.8M(算法库+模型)17M完成
9X2580人脸抓拍功能:镜头下返回最优人脸、检测时间23ms默认分辨率:640*360 (可用分辨率~1080p)召回率:> 99%准确率:> 98%6.9M(算法库+模型)10M完成
10X2580车辆检测车牌识别功能:车牌检测,识别,车牌颜色识别;车辆检测,车型识别、车辆颜色识别,检测时间45ms默认分辨率:1920*1080 (可用分辨率~2560x1440)车辆车牌检测:召回率:93%准确率:95%车型识别准确率:> 91%车辆颜色准确率:> 95%车牌识别率:> 99%车牌颜色准确率:> 99%7.5M(算法库+模型)18M完成
11X2580烟火检测功能:检测画面中的烟火,检测时间30ms默认分辨率:1920*1080 (640x360~1920x1080)召回率:90%准确率:95%5.5M(算法库+模型)6M完成
12X2580哭声侦测功能:对传入的音频数据进行哭声侦测,返回识别为哭声的可信性得分,识别距离<3m,支持16K采样率,检测时间<74ms。默认帧长:640 (可用帧长480、640)召回率:> 98%准确率:> 98%2.5M(算法库+模型)6.5M完成
13X2580客流量统计功能:人员进出统计、支持同时进出人数默认20个(不做限制)、检测时间45ms默认分辨率:1280*720 (可用分辨率~1080p)召回率:> 95%准确率:> 98%8M(算法库+模型)17M完成
14X2580人脸识别-X2580(人脸检测/人脸识别/角度识别/模糊识别/关键点识别/近红外光活体识别)功能:人脸识别,识别时间约45ms默认分辨率:19201080 (可用分辨率100100~2560*1440)识别率(底库1W):> 98%误识率(底库1W):< 0.2%21M(算法库+模型)34M完成
15X2580人脸识别-X2580-专家版(人脸识别/角度识别/模糊识别/关键点识别/活体识别)功能:人脸识别、识别时间45ms建议分辨率:19201080(可用分辨率100100~2560*1440)识别率(底库1W):> 98%误识率(底库1W):< 0.2%21M(算法库+模型)34M完成