admin管理员组

文章数量:1529447

garbage in, garbage out
源自吴恩达老师举办的以数据为中心的竞赛,各胜利队伍的获胜方案。原网址如下
方法:
1.手动筛除噪声,标记错误数据
2.数据增强,扩展,收集
3.严格保证类别均衡(同一个罗马字母的大小写数量也一致)
4.“增加”一个特定训练点的少量权重,并在推断时观察这对模型预测的影响,删除有负面影响的数据
5.增强数据后使用聚类判断是否数据变换带来问题(附近点的标签都与该数据不同)
6.增加边缘点
7.对于每个错误分类的验证图像,使用提取的特征从一组增强图像中检索出最近邻(基于余弦相似度)。把这些最近的邻居增强图像添加到训练集

本文标签: 数据中心方案DataCentricAIPRLab