TensorRT-Alpha

English | 简体中文

可视化

介绍

本仓库提供深度学习CV领域模型加速部署案例，仓库实现的cuda c支持多batch图像预处理、推理、decode、NMS。大部分模型转换流程为：torch->onnx->tensorrt。获取onnx文件以下有两种方式：

pth -> trt

coming soon.

pth -> onnx -> trt:

[i]. 本仓库提供的网盘直接下载onnx。weiyun or google driver
[ii]]. 按照本仓库提供的指令，手动从相关源代码框架导出onnx。

更新

2023.01.01 🔥 更新 yolov3, yolov4, yolov5, yolov6
2023.01.04 🍅 更新 yolov7, yolox, yolor
2023.01.05 🎉 更新 u2net, libfacedetection
2023.01.08 🚀 全网最快支持yolov8的tensorrt部署
2023.01.20 更新 efficientdet, pphunmanseg

安装

兼容平台: Windows and Linux. 以下环境已被测过：

Ubuntu18.04

cuda11.3
cudnn8.2.0
gcc7.5.0
tensorrt8.4.2.4
opencv3.x or 4.x
cmake3.10.2

Windows10

cuda11.3
cudnn8.2.0
visual studio 2017 or 2019 or 2022
tensorrt8.4.2.4
opencv3.x or 4.x

创建Python环境(可选）

# install miniconda first
conda create -n tensorrt-alpha python==3.8 -y
conda activate tensorrt-alpha
git clone https://github.com/FeiYull/tensorrt-alpha
cd tensorrt-alpha
pip install -r requirements.txt

安装教程：

Install For Ubuntu18.04
图文详细版：Ubuntu18.04环境配置
docker for linux (waiting for update)
图文详细版：Windows10环境配置

快速开始

Ubuntu18.04

设置TensorRT根目录（安装目录）路径:

git clone https://github.com/FeiYull/tensorrt-alpha
cd tensorrt-alpha/cmake
vim common.cmake
# 把common.cmake文件第20行中的TensorRT_ROOT修改成您的TensorRT安装目录, 例如改成如下:
# set(TensorRT_ROOT /root/TensorRT-8.4.2.4)

开始编译、运行工程，例如:yolov8

Windows10

图文详细版：Windows10环境配置

模型

目前已实现30多个主流模型，部分整理好的onnx文件如下列表：

model	weiyun	google driver
yolov3	weiyun	google driver
yolov4	weiyun	google driver
yolov5	weiyun	google driver
yolov6	weiyun	google driver
yolov7	weiyun	google driver
yolov8	weiyun	google driver
yolox	weiyun	google driver
yolor	weiyun	google driver
u2net	weiyun	google driver
libfacedetection	weiyun	google driver
facemesh	weiyun	google driver
pphumanseg	weiyun	google driver
efficientdet	weiyun	google driver
more...(🚀: I will be back soon!)

🍉稍后在tesla v100 和 A100上测量时间开销!现在看看yolov8n在移动端RTX2070m(8G)的性能表现：

模型	视频分辨率	模型输入尺寸	显存占用	GPU利用率
yolov8n	1920x1080	8x3x640x640	1093MiB/7982MiB	14%

一个batch内，平均每一帧的时间开销

严格的精度对齐，官方效果 vs TensorRT-Alpha:

yolov8n : Offical( left ) vs Ours( right )

yolov7-tiny : Offical( left ) vs Ours( right )

yolov6s : Offical( left ) vs Ours( right )

yolov5s : Offical( left ) vs Ours( right )

libfacedetection : Offical( left ) vs Ours( right topK:2000)

参考

[0].https://github.com/NVIDIA/TensorRT
[1].https://github.com/onnx/onnx-tensorrt
[2].https://github.com/NVIDIA-AI-IOT/torch2trt
[3].https://github.com/shouxieai/tensorRT_Pro
[4].https://github.com/opencv/opencv_zoo

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README_cn.md

README_cn.md

TensorRT-Alpha

可视化

介绍

更新

安装

快速开始

Ubuntu18.04

Windows10

模型

严格的精度对齐，官方效果 vs TensorRT-Alpha:

参考

Files

README_cn.md

Latest commit

History

README_cn.md

File metadata and controls

TensorRT-Alpha

可视化

介绍

更新

安装

快速开始

Ubuntu18.04

Windows10

模型

严格的精度对齐，官方效果 vs TensorRT-Alpha:

参考