再训练一个特模型

0

的问题

我已经训练一个特模型使用pytorch约一百万的文本数据分类的任务。 测试后,该模型用新的数据我得到的假阳性和假阴性。 现在我想要重新训练现有的模型,只有FN和FP。 我不想追加FN和FP的现有数据集,然后是火车的整个模型。 我如何重新培训这伯特模型仅与这些FN和Fp过previosuly培训模型。

1

最好的答案

0

不知道码为你的是火车的循环,这个想法看起来应该像这样的东西后的培训:

results = model(data)
wrong_datapoints = []
for i, result in enumerate(results)

    if result != labels[i]:
        wrong_datapoints.append((data[i],labels[i]))


(data_new, labels_new) = list(zip(*wrong_datapoints))

model.train(data_new, labels_new)

如果你想更具体的东西,你会需要提供密码当前的火车循环。

2021-11-23 12:46:43

谢谢你的反馈意见。 但是我想要保持一种模式的版本,因为我们训练每个星期,我们的模型版本。 并且还重复一百万个记录将需要大量的时间。 我想装的以前版本的bin文件(v1。0)和然后重新培训这只有新的数据点创造另一个版本v2。0
Patricia

你可能需要澄清你的问题给国家的。 但是,这样做的版本控制不排除需要追踪结果的数据点的训练后,需要一个单一的循环过训练数据的训练之后完成。 你需要确定什么是"新的数据点",之后。
Kroshtan

其他语言

此页面有其他语言版本

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................