XPU Performance Test

科技 07-16 来源：笑看风云2019

名词解释：

NVIDIA DLA（Deep Learning Accelerator–深度学习加速器）

GPU graphics processing unit

CPU缓存（Cache Memoney）位于CPU与内存之间的临时存储器，它的容量比内存小但交换速度快

ARM：是Advanced RISC Machines Limited公司推出的一种RISC处理器体系结构即相关技术

Soc ：System on Chip

Top指令

XPU Performance Test

图一

sy: 内核CPU使用率

us: 用户CPU使用率

id: 空闲CPU使用率

total: 总内存

free: 空闲内存

used: 已使用内存

buff/cache: 缓存内存，富余内存

load average: 0.09, 0.05, 0.05 负载不要超过CPU 核数 * CPU个数, 三个数字平均值 1分钟，5分钟，15分钟，一般只看第1个值

注释：cpu中cpu能够并行处理的事务的数量应该是cpu个数*cpu核数

Orin Cpu information

XPU Performance Test

图二

DLA压测：

按顺序运行以下3个步骤，压测DLA1+2

1. /usr/src/tensorrt/bin/trtexec --onnx=/usr/src/tensorrt/data/resnet50/ResNet50.onnx --useDLACore=0 --allowGPUFallback --explicitBatch --int8 --saveEngine=resnet50.plan

2. /usr/src/tensorrt/bin/trtexec --useDLACore=0 --allowGPUFallback --explicitBatch --loadEngine=resnet50.plan --iterations=60000

参数：--iterations=【数字】，通过设置更大的数字可以延长测试时间。

3. /usr/src/tensorrt/bin/trtexec --useDLACore=1 --allowGPUFallback --explicitBatch --loadEngine=resnet50.plan --iterations=60000

参数：--iterations=【数字】，通过设置更大的数字可以延长测试时间。

XPU Performance Test

图三

GPU压测：

/usr/src/tensorrt/bin/trtexec --onnx=/usr/src/tensorrt/data/resnet50/ResNet50.onnx --explicitBatch --avgRuns=300

XPU Performance Test

图四

CPU 压测：

stress-ng -c 11 -l 80 --timeout 1h

XPU Performance Test

图五

DDR压测：

memtester 20G 1

XPU Performance Test

图六

XPU Performance Test

发表评论

留言与评论（共有 0 条评论） “”

相关文章

AirTest-selenium基于Web实现UI自动化测试

AirTest-selenium基于Web实现UI自

Pytest框架 - 运行参数实战案例剖析

Pytest框架 - 运行参数实战案例剖

网友投稿普通会员

我还没有学会写个人说明

211392 篇文章

7006992 次浏览

最近文章