百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分析 > 正文

目标检测神器mmdetection 目标检测软件

liebian365 2024-10-16 13:03 28 浏览 0 评论

mmdetection


GitHub地址:「链接」

mmdetection是商汤香港中文大学基于pytorch开源的一个深度学习目标检测工具,包括了RPNFast R-CNNFaster R-CNNMask R-CNNSSDRetinaNet以及Cascade R-CNN等,还包括了各种提取特征的主干网络ResNetResNextSENetVGGHRNet,还有包括了其它的特征如DCNGroup NormalizationSoft-NMSGeneralized Attention等,mmdetection已经成为目标检测竞赛的必备工具。


模型下载

模型下载地址:「链接」

mmdetection提供了很多的预训练模型,模型是基于COCO_2017_train训练的,在COCO_2017_val上测试的,通过8 NVIDIA Tesla V100 GPU训练的,训练时每个batch size为16(每块显卡2张图片)。默认下载地址使用的是AWS的镜像,速度可能比较慢,大家可以改为阿里云镜像,将下载链接中的https://s3.ap-northeast-2.amazonaws.com/open-mmlab改为https://open-mmlab.oss-cn-beijing.aliyuncs.com,经过测试部分模型下载不支持阿里云镜像。


环境要求

  • Linux
  • Python3.5+
  • Pytorch1.1+
  • CUDA9.0+
  • NCCL 2
  • GCC(G++)4.9+
  • mmcv

安装

mmdetection安装需要先安装anaconda,具体安装步骤我这里就不重复的

  • 创建conda虚拟环境
conda create -n open-mmlab python=3.7 -y
conda activate open-mmlab
  • 安装pytorch
conda install pytorch torchvision -c pytorch

上面安装命令默认安装的是最新的pytorch,安装的时候需要先看自己cuda的版本,通过nvcc -V可以查看也可以直接通过cat /usr/local/cuda/version.txt查看,如果是cuda9.0请用下面的命令安装

conda install pytorch==1.1.0 torchvision==0.3.0 cudatoolkit=9.0 -c pytorch
  • 下载mmdetection项目
git clone https://github.com/open-mmlab/mmdetection.git
cd mmdetection
  • 安装mmcv
pip install mmcv
python setup.py develop  # or "pip install -v -e ."

在安装mmcv时如果发现卡主半天都没有反应,可能是pip源导致的,这时候可以安装下面的方法来解决

#step1 找到你环境的安装目录 pip --version

使用预训练模型进行测试

这里需要先根据之前提供的模型下载地址先下载预训练模型

from mmdet.apis import init_detector, inference_detector, show_result
import mmcv

config_file = 'configs/faster_rcnn_r50_fpn_1x.py'
checkpoint_file = 'checkpoints/faster_rcnn_r50_fpn_1x_20181010-3d1b3351.pth'

# build the model from a config file and a checkpoint file
model = init_detector(config_file, checkpoint_file, device='cuda:0')

# test a single image and show the results
img = 'test.jpg'  # or img = mmcv.imread(img), which will only load it once
result = inference_detector(model, img)
# visualize the results in a new window
show_result(img, result, model.CLASSES)
# or save the visualization results to image files
show_result(img, result, model.CLASSES, out_file='result.jpg')

# test a video and show the results
video = mmcv.VideoReader('video.mp4')
for frame in video:
    result = inference_detector(model, frame)
    show_result(frame, result, model.CLASSES, wait_time=1)

训练自己的模型

  • 标记数据

如果我们想要在自己的数据集上训练一个目标检测模型,我们需要先标记数据可以使用labelmelabelImg工具进行标记

  • 数据格式

利用mmdetection/mmdet/datasets/custom.py类来加载数据,数据格式如下,我们需要将所有的图片和对应的标签文件最终合成一个下面这样数据格式的文件,可以自己写一个脚本来进行转换

Annotation format:
    [
        {
            'filename': 'a.jpg',
            'width': 1280,
            'height': 720,
            'ann': {
                'bboxes': <np.ndarray> (n, 4),
                'labels': <np.ndarray> (n, ),
                'bboxes_ignore': <np.ndarray> (k, 4), (optional field)
                'labels_ignore': <np.ndarray> (k, 4) (optional field)
            }
        },
        ...
    ]
  • 配置文件设置

根据自己选择的模型在mmdetection/configs/目录下找到对应的配置文件,可以根据自己的需要去修改一些参数网络的结构,这里有几个参数是必须要注意一下dataset_type,根据自己选择的数据格式进行修改,如果你使用的datasets文件是custom.py,就需要改为dataset_type = 'CustomDataset',就是对应文件里面dataset的类名

data_root:为数据存放的目录

ann_file:就是上面合成数据文件的路径

img_prefix:图片存放的路径

checkpoint_config = dict(interval=1):保存模型间隔的epoch,为1表示每次epoch之后都保存模型

total_epochs:迭代总的epoch次数

work_dir:模型的保存目录

load_from:预训练模型的目录,epoch从0开始训练

resume_from:重新训练模型的目录,根据保存模型时的epoch开始训练

  • 训练模型

单个GPU训练

python tools/train.py ${CONFIG_FILE}

多GPU训练

./tools/dist_train.sh ${CONFIG_FILE} ${GPU_NUM} [optional arguments]

可选参数:

  • --validate:每多少次epoch,在验证集上评估一下结果,默认是1
  • --work_dir:模型的保存目录
  • --resume_from ${CHECKPOINT_FILE}:预训练或重新开始训练模型的路径

相关推荐

“版本末期”了?下周平衡补丁!国服最强5套牌!上分首选

明天,酒馆战棋就将迎来大更新,也聊了很多天战棋相关的内容了,趁此机会,给兄弟们穿插一篇构筑模式的卡组推荐!老规矩,我们先来看10职业胜率。目前10职业胜率排名与一周前基本类似,没有太多的变化。平衡补丁...

VS2017 C++ 程序报错“error C2065:“M_PI”: 未声明的标识符&quot;

首先,程序中头文件的选择,要选择头文件,在文件中是没有对M_PI的定义的。选择:项目——>”XXX属性"——>配置属性——>C/C++——>预处理器——>预处理器定义,...

东营交警实名曝光一批酒驾人员名单 88人受处罚

齐鲁网·闪电新闻5月24日讯酒后驾驶是对自己和他人生命安全极不负责的行为,为守护大家的平安出行路,东营交警一直将酒驾作为重点打击对象。5月23日,东营交警公布最新一批饮酒、醉酒名单。对以下驾驶人醉酒...

Qt界面——搭配QCustomPlot(qt platform)

这是我第一个使用QCustomPlot控件的上位机,通过串口精确的5ms发送一次数据,再将读取的数据绘制到图表中。界面方面,尝试卡片式设计,外加QSS简单的配了个色。QCustomPlot官网:Qt...

大话西游2分享赢取种族坐骑手办!PK趣闻录由你书写

老友相聚,仗剑江湖!《大话西游2》2021全民PK季4月激燃打响,各PK玩法鏖战齐开,零门槛参与热情高涨。PK季期间,不仅各种玩法奖励丰厚,参与PK趣闻录活动,投稿自己在PK季遇到的趣事,还有机会带走...

测试谷歌VS Code AI 编程插件 Gemini Code Assist

用ClaudeSonnet3.7的天气测试编码,让谷歌VSCodeAI编程插件GeminiCodeAssist自动编程。生成的文件在浏览器中的效果如下:(附源代码)VSCode...

顾爷想知道第4.5期 国服便利性到底需优化啥?

前段时间DNF国服推出了名为“阿拉德B计划”的系列改版计划,截至目前我们已经看到了两项实装。不过关于便利性上,国服似乎还有很多路要走。自从顾爷回归DNF以来,几乎每天都在跟我抱怨关于DNF里面各种各样...

掌握Visual Studio项目配置【基础篇】

1.前言VisualStudio是Windows上最常用的C++集成开发环境之一,简称VS。VS功能十分强大,对应的,其配置系统较为复杂。不管是对于初学者还是有一定开发经验的开发者来说,捋清楚VS...

还嫌LED驱动设计套路深?那就来看看这篇文章吧

随着LED在各个领域的不同应用需求,LED驱动电路也在不断进步和发展。本文从LED的特性入手,推导出适合LED的电源驱动类型,再进一步介绍各类LED驱动设计。设计必读:LED四个关键特性特性一:非线...

Visual Studio Community 2022(VS2022)安装图文方法

直接上步骤:1,首先可以下载安装一个VisualStudio安装器,叫做VisualStudioinstaller。这个安装文件很小,很快就安装完成了。2,打开VisualStudioins...

Qt添加MSVC构建套件的方法(qt添加c++11)

前言有些时候,在Windows下因为某些需求需要使用MSVC编译器对程序进行编译,假设我们安装Qt的时候又只是安装了MingW构建套件,那么此时我们该如何给现有的Qt添加一个MSVC构建套件呢?本文以...

Qt为什么站稳c++GUI的top1(qt c)

为什么现在QT越来越成为c++界面编程的第一选择,从事QT编程多年,在这之前做C++界面都是基于MFC。当时为什么会从MFC转到QT?主要原因是MFC开发界面想做得好看一些十分困难,引用第三方基于MF...

qt开发IDE应该选择VS还是qt creator

如果一个公司选择了qt来开发自己的产品,在面临IDE的选择时会出现vs或者qtcreator,选择qt的IDE需要结合产品需求、部署平台、项目定位、程序猿本身和公司战略,因为大的软件产品需要明确IDE...

Qt 5.14.2超详细安装教程,不会来打我

Qt简介Qt(官方发音[kju:t],音同cute)是一个跨平台的C++开库,主要用来开发图形用户界面(GraphicalUserInterface,GUI)程序。Qt是纯C++开...

Cygwin配置与使用(四)——VI字体和颜色的配置

简介:VI的操作模式,基本上VI可以分为三种状态,分别是命令模式(commandmode)、插入模式(Insertmode)和底行模式(lastlinemode),各模式的功能区分如下:1)...

取消回复欢迎 发表评论: