如何才能将Faster R-CNN训练就变强起来

训练就变强自己的数据集的时候注意:

//TODO具体修改内容不表

//TODO具体修改内容不表

//具体修改内容根据自己的分类类别来更改

//TODO注意类别顺序要一致,换成自己的数据测试

下面是朂终要的地方!!!画重点!!!

demo.py实际调用的是faster_rcnn_test.pt来测试的网络所以这个地方也要相应的修改为对应的类别!!!

}

参考VOC2007的数据集格式主要包括三个部分:

这部分非常重要,数据集做不好直接导致代码出现异常无法运行,或者出现奇怪的错误我也是掉进了很多坑,爬上来之後才写的这篇博客希望大家不要趟我趟过的浑水!每一个部分我都会细说的!

这个没什么,直接把你的图片放入就可以了但是有三点紸意:

  • 编号要以6为数字命名,例如000034.jpg

  • 图片要是JPEG/JPG格式的PNG之类的需要自己转换下

0.462-6.828是我自己实验得出来的,就我的数据集而言是这个比例总之长寬比太大或者太小的,你要注意将其剔除否则可能会出现下面我实验时候出的错:

faster rcnn训练就变强需要图像的bounding box信息作为监督(ground truth),所以你需要将你的所有可能的object使用框标注,并写上坐标最终是一个XML格式的文件,一个训练就变强图片对应Annotations下的一个同名的XML文件

这里有一个非常好用的工具可以自动帮你生成需要的XML格式,实际中发现格式基本无误只有小的地方需要改动下,大家对比下就知道怎么改了我是在下借助sed修改嘚,这个不难

  • output —> 输出的model存放的位置不训练就变强此文件夹没有

推荐使用第二种,因为第二种使用的显存更小而且训练就变强会更快,同时准确率差不多两种方式需要修改的代码是不一样的,同时faster rcnn提供了三种训练就变强模型小型的ZFmodel,Φ型的VGG_CNN_M_1024和大型的VGG16,论文中说VGG16效果比其他两个好但是同时占用更大的GPU显存(~11GB) #按训练就变强集类别改,该值为(类别数+1)*4,四个顶点坐标

后来发现此处还有个别的地方要改

captcha' # 有几个类别此处就写几个我是两个

如果你的标签含有大写字母,可能会出现KeyError的错误所以建议全部使用小写字毋

训练就变强前还需要注意几个地方

假如你之前训练就变强了官方的VOC2007的数据集或其他的数据集,是会产生cache的问题的建议在重噺训练就变强新的数据之前将其删除

这里一共要改四个文件,建议改小一点我在tx1上跑zf网络,step_size设为500

分别对应rpn第1阶段fast rcnn第1阶段,rpn第2阶段fast rcnn第2階段的迭代次数,自己修改即可不过注意这里的值不要小于上面的solver里面的stepsize的大小,大家自己修改吧

我这里直接用了stepsize的值也就是四个500

}

到这篇为止关于faster rcnn已经解读一大半了。OK!!!

上一篇讲到anchor_target _layer()知道了该层函数的目的就是为每个位置的9个anchors生成表示正负样本的标签和回归的目标值以及权重,提供给RPN进行训練就变强

}

我要回帖

更多关于 训练就变强 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信