AI BenchMark For X2580
1 Overall Framework
Magik是一个立足于端侧AI应用场景打造的集模型训练、模型优化转换、模型部署推理于一体的全栈式深度神经网络开放平台。
2 Fast Quantization Aware Training Precision
基于Magik平台进行训练量化,相关开源模型基于imagenet、coco等数据集,32bit、8bit及4bit的训练量化精度可查看Table1。
**Network** | **32bit** | **8bit** | **4bit** |
---|---|---|---|
inceptionv3 | 77.15% | 77.09% | 76.9% |
mobilenetv2 | 71.87% | 70.69% | 68.08% |
resnet18 | 69.76% | 69.61% | 69.11% |
resnet50 | 76.14% | 76.02% | 75.53% |
densenet121 | 74.43% | 75.64% | 72.55% |
ssd_mobilenet_v1 | 67.59% | 67.56% | 66.98% |
retinaface | 94.51% | 94.26% | 93.42% |
facerec | 99.23% | 99.15% | 98.26% |
yolov5s_face | 94.64% | 94.58% | 93.34% |
yolov5s_person | 70.1% | 70.0% | 69.6% |
yolov5m_person | 79.2% | 79.1% | 79.0% |
**Table 1**
3 Post Training Quantization Precision
基于Magik平台后量化至8bit,相关开源模型基于imagenet、coco数据集,32bit与8bit后量化精度可查看Table2。
**Network** | **Framework** | **Resulotion** | **DataSet** | **32bit** | **8bit** |
---|---|---|---|---|---|
yolov3 | onnx | 416*416 | coco | 55.30% | 55.20% |
yolov5s | onnx | 640*640 | coco | 56.80% | 56.54% |
yolov5m | onnx | 640*640 | coco | 64.10% | 63.78% |
yolov5l | onnx | 640*640 | coco | 67.30% | 66.97% |
yolov5x | onnx | 640*640 | coco | 68.90% | 66.56% |
ssd_mobilenet_v1 | tf | 300*300 | coco | 35.36% | 35.25% |
ssd_mobilenet_v2 | tf | 300*300 | coco | 37.13% | 36.32% |
mobilenetv1 | tf | 224*224 | ImageNet | 70.95% | 70.03% |
mobilenetv2 | tf | 224*224 | ImageNet | 71.72% | 70.62% |
shufflenetv2 | onnx | 224*224 | ImageNet | 69.36% | 68.67% |
resnet50 | onnx | 224*224 | ImageNet | 76.15% | 75.95% |
vgg16 | onnx | 224*224 | ImageNet | 71.59% | 71.45% |
inceptionv3 | onnx | 224*224 | ImageNet | 69.49% | 69.36% |
googlenet | onnx | 224*224 | ImageNet | 69.78% | 69.77% |
squeezenet | onnx | 224*224 | ImageNet | 58.10% | 57.65% |
densenet121 | caffe | 224*224 | ImageNet | 74.76% | 74.17% |
densenet201 | caffe | 224*224 | ImageNet | 77.16% | 74.64% |
inceptionv1 | tf | 224*224 | ImageNet | 70.40% | 70.43% |
inceptionv4 | tf | 299*299 | ImageNet | 79.43% | 79.28% |
inceptionv1 | caffe | 224*224 | ImageNet | 72.30% | 70.53% |
resnet18 | caffe | 224*224 | ImageNet | 65.91% | 65.83% |
resnet50 | caffe | 224*224 | ImageNet | 75.10% | 74.38% |
squeezenetv1.1 | caffe | 227*227 | ImageNet | 56.42% | 56.24% |
mobilenetv1 | caffe | 224*224 | ImageNet | 70.90% | 70.00% |
mobilenetv2 | caffe | 224*224 | ImageNet | 71.83% | 71.27% |
squeezenetv1.0 | caffe | 227*227 | ImageNet | 55.84% | 55.36% |
vgg16 | caffe | 224*224 | ImageNet | 71.01% | 70.97% |
**Table 2**
4 Model Efficiency
相关开源模型在板端进行前向推理的耗时可查看Table3。
**Network** | **Resulotion** | **GOPs** | **8bit(fps)** | **4bit(fps)** |
---|---|---|---|---|
yolov3 | 416x416x3 | 65.98 | 8.54 | 15.80 |
yolov5m | 640x640x3 | 54.59 | 7.54 | 13.44 |
yolov5s | 640x640x3 | 16.94 | 15.92 | 24.81 |
yolov3_tiny | 416x416x3 | 6.21 | 55.52 | 86.58 |
resnet18 | 224x224x3 | 3.71 | 116.01 | 151.52 |
resnet34 | 224x224x3 | 7.40 | 57.54 | 93.81 |
resnet50 | 224x224x3 | 8.26 | 45.83 | 56.18 |
mobilenetv1 | 224x224x3 | 1.156 | 147.06 | 227.27 |
**Table 3**
5 X2580 Algorithm List
**序号** | **算法名称** | **算法描述** | **Flash Size** | **内存占用** | **完成状态** |
---|---|---|---|---|---|
1 | X2580移动侦测 | 功能:移动侦测默认分辨率:640*360 | 1.2M(算法库) | 2M | 完成 |
2 | X2580移动跟踪 | 功能:移动跟踪(配合电机)反馈坐标默认分辨率:640*360 | 1.5M(算法库) | 2M | 完成 |
3 | X2580周界检测 | 功能:越界入侵、 区域入侵默认分辨率:640*360 | 1.3M(算法库) | 2M | 完成 |
4 | X2580遮挡检测 | 功能:检测镜头出现遮挡时进行告警。默认分辨率:640x360 | 1.3M(算法库) | 2M | 完成 |
5 | X2580多物同检(人形、车辆) | 功能:人形、车辆检测、识别默认个数20(不做限制)默认分辨率:640*360(可用分辨率~1080p)召回率:> 91%准确率:> 93% | 2.5M(算法库+模型) | 4M | 完成 |
6 | X2580多物同检(人形、车辆) | 功能:人形、车辆检测、识别默认个数20(不做限制)、检测时间30ms左右默认分辨率:640*360(可用分辨率~1080p)召回率:> 93%准确率:> 95% | 5.5M(算法库+模型) | 6M | 完成 |
7 | X2580三物同检(人形、车辆、宠物) | 功能:人形、车辆、宠物检测、识别默认个数20(不做限制)、检测时间30ms左右默认分辨率:640*360(可用分辨率~1080p)召回率:> 93%准确率:> 95% | 5.5M(算法库+模型) | 6M | 完成 |
8 | X2580人脸检测 | 功能:识别人脸默认个数20个(不做限制)、检测时间43ms默认分辨率:1280*720 (可用分辨率~1080p)召回率:> 99%准确率:> 98% | 5.8M(算法库+模型) | 17M | 完成 |
9 | X2580人脸抓拍 | 功能:镜头下返回最优人脸、检测时间23ms默认分辨率:640*360 (可用分辨率~1080p)召回率:> 99%准确率:> 98% | 6.9M(算法库+模型) | 10M | 完成 |
10 | X2580车辆检测车牌识别 | 功能:车牌检测,识别,车牌颜色识别;车辆检测,车型识别、车辆颜色识别,检测时间45ms默认分辨率:1920*1080 (可用分辨率~2560x1440)车辆车牌检测:召回率:93%准确率:95%车型识别准确率:> 91%车辆颜色准确率:> 95%车牌识别率:> 99%车牌颜色准确率:> 99% | 7.5M(算法库+模型) | 18M | 完成 |
11 | X2580烟火检测 | 功能:检测画面中的烟火,检测时间30ms默认分辨率:1920*1080 (640x360~1920x1080)召回率:90%准确率:95% | 5.5M(算法库+模型) | 6M | 完成 |
12 | X2580哭声侦测 | 功能:对传入的音频数据进行哭声侦测,返回识别为哭声的可信性得分,识别距离<3m,支持16K采样率,检测时间<74ms。默认帧长:640 (可用帧长480、640)召回率:> 98%准确率:> 98% | 2.5M(算法库+模型) | 6.5M | 完成 |
13 | X2580客流量统计 | 功能:人员进出统计、支持同时进出人数默认20个(不做限制)、检测时间45ms默认分辨率:1280*720 (可用分辨率~1080p)召回率:> 95%准确率:> 98% | 8M(算法库+模型) | 17M | 完成 |
14 | X2580人脸识别-X2580(人脸检测/人脸识别/角度识别/模糊识别/关键点识别/近红外光活体识别) | 功能:人脸识别,识别时间约45ms默认分辨率:19201080 (可用分辨率100100~2560*1440)识别率(底库1W):> 98%误识率(底库1W):< 0.2% | 21M(算法库+模型) | 34M | 完成 |
15 | X2580人脸识别-X2580-专家版(人脸识别/角度识别/模糊识别/关键点识别/活体识别) | 功能:人脸识别、识别时间45ms建议分辨率:19201080(可用分辨率100100~2560*1440)识别率(底库1W):> 98%误识率(底库1W):< 0.2% | 21M(算法库+模型) | 34M | 完成 |