数据集拆分成训练集和测试集 #4

FLyingLSJ · 2020-06-19T05:44:54Z

请教一下大佬，这个数据集拆分成训练集和测试集有没有相关代码啊

a769302434 · 2020-07-02T13:30:38Z

import os
import random

trainval_percent = 0.8
train_percent = 0.8
xmlfilepath = 'Annotations'
txtsavepath = 'ImageSets\Main'
total_xml = os.listdir(xmlfilepath)

num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)

ftrainval = open('ImageSets/Main/trainval.txt', 'w')
ftest = open('ImageSets/Main/test.txt', 'w')
ftrain = open('ImageSets/Main/train.txt', 'w')
fval = open('ImageSets/Main/val.txt', 'w')

for i in list:
name = total_xml[i][:-4] + '\n'
if i in trainval:
ftrainval.write(name)
if i in train:
ftrain.write(name)
else:
fval.write(name)
else:
ftest.write(name)

ftrainval.close()
ftrain.close()
fval.close()
ftest.close()
可以试试这个

FLyingLSJ · 2020-07-02T13:56:19Z

这个拆分数据应该跟具体的数据有关，需要保证分布均衡吧，大佬在知乎上https://zhuanlan.zhihu.com/p/129842491 也介绍了挺多的，但是好像没有看到具体的样本划分。

a769302434 · 2020-07-02T13:59:18Z

有道理顺便问一下大佬有没有跑通这个代码了我刚刚接触mmdetection这个框架，不是很了解，想要向您咨询一下

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

数据集拆分成训练集和测试集 #4

数据集拆分成训练集和测试集 #4

FLyingLSJ commented Jun 19, 2020

a769302434 commented Jul 2, 2020

FLyingLSJ commented Jul 2, 2020 •

edited

Loading

a769302434 commented Jul 2, 2020

数据集拆分成训练集和测试集 #4

数据集拆分成训练集和测试集 #4

Comments

FLyingLSJ commented Jun 19, 2020

a769302434 commented Jul 2, 2020

FLyingLSJ commented Jul 2, 2020 • edited Loading

a769302434 commented Jul 2, 2020

FLyingLSJ commented Jul 2, 2020 •

edited

Loading