当前位置：网站首页>【问题解决】训练和验证准确率很高，但测试准确率很低

【问题解决】训练和验证准确率很高，但测试准确率很低

2022-08-09 22:59:00 【ifsun-】

采用ResNet50预训练模型训练自己的图像分类模型。训练和验证阶段准确率很高，但随机输入一张图片时，大多数情况下依旧预测得不准确。

(于是开始搜索各种“验证准确率高但测试准确率低”的原因……)

1.我原始的数据集仅有200张图片，因此做离线数据增强（对比度、饱和度、裁剪、翻转、变换颜色）来扩充数据集。网上说可能是数据增强做得太过了，导致训练集分布发生变化。

但我觉得应该不至于，所以这个因素暂时pass。

2.网上说可能过拟合。

但验证准确率却很高啊，所以这个因素也暂时pass。

3.突然刷到一篇文章！救我大命！万分感谢！

是因为读取图片的方式发生了变化。在训练模型时，我采用的是cv2.imread()，但调用训练好的模型做预测时采用的是PIL.Image.open()。而前者读取的色彩通道顺序为BGR，后者为RGB！！

于是修改预测时的图片读取方式，与训练阶段保持一致。但很奇怪，依旧不准确……

4.突然想到cv2无法读取中文路径。而我的数据集中的图片有一部分是中文命名的！虽然没有报错，但实际上是什么都没读到的，在print(img)时，结果为None。也就是说，我之前训练模型，完全是训练了个寂寞……

（成功近在眼前了！）

于是修改所有中文命名的文件名。（说个题外话，我在网上搜索了如何批量修改，但感觉依旧很麻烦，所以我完全是手动修改的呜呜呜，还好我的数据集中这样的图片不是特别多。）

修改完毕后，重新训练模型！成功了！

这是读取方式不同时的预测结果：

这是读取方式相同时的预测结果：

准确率和训练阶段的基本相同~

版权声明
本文为[ifsun-]所创，转载请带上原文链接，感谢
https://blog.csdn.net/ddddddggf/article/details/126239663