我已经训练一个特模型使用pytorch约一百万的文本数据分类的任务。 测试后,该模型用新的数据我得到的假阳性和假阴性。 现在我想要重新训练现有的模型,只有FN和FP。 我不想追加FN和FP的现有数据集,然后是火车的整个模型。 我如何重新培训这伯特模型仅与这些FN和Fp过previosuly培训模型。
0
不知道码为你的是火车的循环,这个想法看起来应该像这样的东西后的培训:
results = model(data)
wrong_datapoints = []
for i, result in enumerate(results)
if result != labels[i]:
wrong_datapoints.append((data[i],labels[i]))
(data_new, labels_new) = list(zip(*wrong_datapoints))
model.train(data_new, labels_new)
如果你想更具体的东西,你会需要提供密码当前的火车循环。
谢谢你的反馈意见。 但是我想要保持一种模式的版本,因为我们训练每个星期,我们的模型版本。 并且还重复一百万个记录将需要大量的时间。 我想装的以前版本的bin文件(v1。0)和然后重新培训这只有新的数据点创造另一个版本v2。0
Patricia
你可能需要澄清你的问题给国家的。 但是,这样做的版本控制不排除需要追踪结果的数据点的训练后,需要一个单一的循环过训练数据的训练之后完成。 你需要确定什么是"新的数据点",之后。
Kroshtan