编程语言|YOLOv8目标检测——详细记录使用ONNX Runtime进行推理部署C++/Python实现

id="article_content" class="article_content clearfix" style="height: 2000px; overflow: hidden;"> id="content_views" class="markdown_views prism-atom-one-dark">

概述

在之前博客中有介绍YOLOv8从环境安装到训练的完整过程，本节主要介绍ONNX Runtime的原理以及使用其进行推理加速，使用Python、C++两种编程语言来实现。
http://iyenn.com/rec/1641039.html?spm=1001.2014.3001.5501

1. ONNX Runtime

ONNX Runtime是一个由微软推出的跨平台机器学习模型加速器，它仅支持 ONNX 模型格式。它适用于桌面、服务器以及移动设备。

多框架支持：支持多种常见的深度学习框架，如 PyTorch、TensorFlow、Keras、scikit-learn 等，使开发者能轻松将不同框架训练的模型移植到 ONNX Runtime 中进行高效推理，促进了模型在不同框架间的共享与流转。
跨平台兼容性：可在 Linux、Windows、macOS 等多种操作系统上运行，还支持在云、边缘、网页和移动等不同环境中部署，能很好地满足各种应用场景的需求。
硬件优化：针对 GPU、CPU 以及各种 AI 加速器（如 Intel MKL、cuDNN、TensorRT 等）进行了优化，能够充分利用硬件资源提升性能。例如，在 GPU 上可实现并行计算，大大加快模型的推理速度。
高效的内存管理：采用零拷贝（Zero-Copy）技术和内存池管理，减少了数据传输的开销，提升了整体运行速度，在处理大规模数据时优势明显。
动态形状支持：允许输入尺寸在运行时发生变化，模型仍能正确处理，增加了模型应用的灵活性，可更好地适应不同的输入数据情况。

2. 模型转换

2.1 .pt与.onnx模型

2.1.1 pt 模型

.pt 模型是 PyTorch 模型的一种常见存储格式。PyTorch 是一个广泛使用的深度学习框架，在训练神经网络模型时，模型的参数（包括权重和偏置等）会被保存下来，这些参数可以以.pt 文件的形式存储在磁盘中。例如，当你使用 PyTorch 训练一个图像分类模型（如 ResNet）后，通过torch.save()函数就可以将训练好的模型保存为.pt 文件。

本质上它是一个二进制文件，它包含了模型的结构定义和参数。模型的结构定义包括网络的层数、每层的类型（如线性层、卷积层、池化层等）、激活函数的类型等信息。参数则是在训练过程中学习到的具体数值，这些数值决定了模型对输入数据的处理方式。

2.1.2 onnx 模型

ONNX（Open Neural Network Exchange）是一种开放的神经网络交换格式，.onnx 文件就是以这种格式存储的模型文件。它的出现是为了解决不同深度学习框架之间模型转换和互用的问题。许多深度学习框架（如 PyTorch、TensorFlow 等）都可以将自己的模型转换为 ONNX 格式。以 PyTorch 为例，通过torch.onnx.export()函数可以将.pt 模型转换为.onnx 模型。

.onnx 文件同样是一种结构化的文件，它以一种中间表示的形式存储了模型的计算图。这个计算图包含了模型中的各种操作（如加法、乘法、卷积等）以及操作之间的连接关系，同时也包含了模型的输入和输出信息。这种中间表示形式使得不同框架训练的模型能够在一个统一的格式下进行转换和推理。

.onnx 模型主要用于模型的跨框架部署和推理。由于它可以被多种推理引擎（如 ONNX Runtime、TensorRT 等）所支持，所以可以将在一个框架下训练好的模型转换为.onnx 格式，然后在其他环境中进行高效的推理。例如，在工业生产环境中，模型可能是在 PyTorch 中训练的，但在实际的产品线上，需要将其部署到一个对性能和效率要求更高的推理引擎上，此时将模型转换为.onnx 文件并使用 ONNX Runtime 等推理引擎进行部署就非常方便。同时，它也方便了不同团队之间的协作，即使不同团队使用不同的深度学习框架，也可以通过.onnx 文件进行模型的共享和集成。

2.2 .pt转换.onnx

将训练好的 YOLOv8 的.pt模型转换为.onnx模型。可以使用ultralytics库来进行转换。

yolo task=detect mode=export model=./runs/detect/train/weights/best.pt format=onnx
 class="hljs-button signin active" data-title="登录复制" data-report-click="{"spm":"1001.2101.3001.4334"}">

YOLOv8目标检测——详细记录使用ONNX Runtime进行推理部署C++/Python实现

概述

1. ONNX Runtime

2. 模型转换

2.1 .pt与.onnx模型

2.1.1 pt 模型

2.1.2 onnx 模型

2.2 .pt转换.onnx

3. 模型推理

3.1 Python实现

3.1.1 环境部署

3.1.2 推理步骤

（1）图像预处理

（2）模型推理

（3）后处理

3.1.3 代码部署

3.2 C++实现

3.2.1 为什么呢？？？

3.2.2 安装依赖库

（1）下载ONNX Runtime

（2）下载OpenCV

（3）配置ONNX Runtime和OpenCV

3.2.3 推理步骤

（1）图像预处理

（2）模型推理

a. 引入头文件

b. 初始化 ONNX Runtime 环境和会话

Step 1: 创建 ONNX Runtime 环境

Step 2: 创建 ONNX Runtime 会话选项

Step 3: 加载 ONNX 模型文件

c. 获取模型输入/输出信息

d. 创建输入张量

e. 进行推理

（3）后处理

3.2.4 代码部署

3.3 推理测试

评论记录：