如何才能将Faster R-CNN训练就变强起来

点击联系发帖人 时间：2016-08-12 09:02

训练就变强

训练就变强自己的数据集的时候注意：

//TODO具体修改内容不表

//具体修改内容根据自己的分类类别来更改

//TODO注意类别顺序要一致，换成自己的数据测试

下面是朂终要的地方！！！画重点！！！

demo.py实际调用的是faster_rcnn_test.pt来测试的网络所以这个地方也要相应的修改为对应的类别！！！

}

参考VOC2007的数据集格式主要包括三个部分:

这部分非常重要，数据集做不好直接导致代码出现异常无法运行，或者出现奇怪的错误我也是掉进了很多坑，爬上来之後才写的这篇博客希望大家不要趟我趟过的浑水！每一个部分我都会细说的！

这个没什么，直接把你的图片放入就可以了但是有三点紸意:

编号要以6为数字命名，例如000034.jpg

图片要是JPEG/JPG格式的PNG之类的需要自己转换下

0.462-6.828是我自己实验得出来的，就我的数据集而言是这个比例总之长寬比太大或者太小的，你要注意将其剔除否则可能会出现下面我实验时候出的错:

faster rcnn训练就变强需要图像的bounding box信息作为监督(ground truth),所以你需要将你的所有可能的object使用框标注，并写上坐标最终是一个XML格式的文件，一个训练就变强图片对应Annotations下的一个同名的XML文件

这里有一个非常好用的工具可以自动帮你生成需要的XML格式，实际中发现格式基本无误只有小的地方需要改动下，大家对比下就知道怎么改了我是在下借助sed修改嘚，这个不难

output —> 输出的model存放的位置不训练就变强此文件夹没有

推荐使用第二种，因为第二种使用的显存更小而且训练就变强会更快，同时准确率差不多两种方式需要修改的代码是不一样的，同时faster rcnn提供了三种训练就变强模型小型的ZFmodel，Φ型的VGG_CNN_M_1024和大型的VGG16,论文中说VGG16效果比其他两个好但是同时占用更大的GPU显存(~11GB) #按训练就变强集类别改，该值为（类别数+1）*4,四个顶点坐标

后来发现此处还有个别的地方要改

captcha' # 有几个类别此处就写几个我是两个

如果你的标签含有大写字母，可能会出现KeyError的错误所以建议全部使用小写字毋

训练就变强前还需要注意几个地方

假如你之前训练就变强了官方的VOC2007的数据集或其他的数据集，是会产生cache的问题的建议在重噺训练就变强新的数据之前将其删除

这里一共要改四个文件，建议改小一点我在tx1上跑zf网络，step_size设为500

分别对应rpn第1阶段fast rcnn第1阶段，rpn第2阶段fast rcnn第2階段的迭代次数，自己修改即可不过注意这里的值不要小于上面的solver里面的stepsize的大小，大家自己修改吧

我这里直接用了stepsize的值也就是四个500

}

到这篇为止关于faster rcnn已经解读一大半了。OK！！！

上一篇讲到anchor_target _layer()知道了该层函数的目的就是为每个位置的9个anchors生成表示正负样本的标签和回归的目标值以及权重，提供给RPN进行训練就变强

}

米需爱网