半监督学习中的伪标签(Pseudo-Labelling)

12 篇文章 3 订阅
订阅专栏

最近在做东西过程中接触到了半监督学习,所以以此篇博客记录个人觉得写的很好的一篇博客,以防遗忘。如若侵权请联系删除。

什么是伪标签技术

伪标签的定义来自于半监督学习,半监督学习的核心思想是通过借助无标签的数据来提升有监督过程中的模型性能。

举个简单的半监督学习例子,我想去训练一个通过胸片图像来诊断是否患有乳腺癌的模型,但是专家标注一张胸片图像要收费,于是我掏空自己的钱包让专家帮我标注了10张胸片,可是我这10张图片又要划分训练集测试集,咋训练看着都要过拟合哇,这可咋办?

聪明的我问了问专家,说不标注的胸片要钱吗?专家一愣,不要钱,随便拿(此处忽略病人隐私的问题,单纯举例子)。于是我掏出1张标注的胸片,换了10张没标注的胸片,在专家还没缓过劲之前先溜了。

回到家里,我就开始了如图所示的半监督学习过程~
 图1伪标签技术

图1伪标签技术

粗略来讲,伪标签技术就是利用在已标注数据所训练的模型在未标注的数据上进行预测,根据预测结果对样本进行筛选,再次输入模型中进行训练的一个过程。

但实际上,伪标签技术在具体应用的细节上,远没有说的如此简单,那让我们先看一下伪标签技术的具体做法吧。

伪标签的具体用法

伪标签技术的使用自由度非常高,在这里我们介绍最常用的也是最有效的三种,对于某些特殊场景,可能有更花哨的方法,这里希望能抛砖引玉,为大家拓宽一下视野。

入门版

  1. 使用标记数据训练有监督模型M

  2. 使用有监督模型M对无标签数据进行预测,得出预测概率P

  3. 通过预测概率P筛选高置信度样本

  4. 使用有标记数据以及伪标签数据训练新模型M’

图2 入门版伪标签技术

图2 入门版伪标签技术

进阶版

  1. 使用标记数据训练有监督模型M

  2. 使用有监督模型M对无标签数据进行预测,得出预测概率P

  3. 通过预测概率P筛选高置信度样本

  4. 使用有标记数据以及伪标签数据训练新模型M’

  5. 将M替换为M’,重复以上步骤直至模型效果不出现提升
    图3 进阶版伪标签技术

图3 进阶版伪标签技术

创新版

  1. 使用标记数据训练有监督模型M

  2. 使用有监督模型M对无标签数据进行预测,得出预测概率P

  3. 将模型损失函数改为Loss = loss(labeled_data) + alpha*loss(unlabeled_data)

  4. 使用有标记数据以及伪标签数据训练新模型M’
    图4 创新版伪标签技术

伪标签为何有效

在《Pseudo-Label : The Simple and Efficient Semi-Supervised Learning Method for Deep Neural Networks》论文中解释了伪标签学习为何有效,它的有效性可以在两个方面进行考虑,原文如下:

Low-Density Separation between Classes

"The goal of semi-supervised learning is to improve generalization performance using unlabeled data. The cluster assumption states that the decision boundary should lie in low-density regions to improve generalization performance (Chapelle et al., 2005). Recently proposed methods of training neural networks using manifold learning such as Semi-Supervised Embedding and Manifold Tangent Classifier utilize this assumption. Semi-Supervised Embedding (Weston et al., 2008) uses embedding-based regularizer to improve the generalization performance of deep neural networks. Because neighbors of a data sample have similar activations with the sample by embedding based penalty term, it’s more likely that data samples in a high-density region have the same label. Manifold Tangent Classifier (Rifai et al., 2011b) encourages the network output to be insensitive to variations in the directions of low-dimensional manifold. So the same purpose is achieved.”

Entropy Regularization

“Entropy Regularization (Grandvalet et al., 2006) is a means to benefit from unlabeled data in the framework of maximum a posteriori estimation. This scheme favors low density separation between classes without any modeling of the density by minimizing the conditional entropy of class probabilities for unlabeled data.”

作者考虑的两个点:

  • 根据聚类假设(cluster assumption),这些概率较高的点,通常在相同类别的可能性较大,所以其pseudo-label是可信度非常高的。(合理性)
  • 熵正则化是在最大后验估计框架内从未标记数据中获取信息的一种方法,通过最小化未标记数据的类概率的条件熵,促进了类之间的低密度分离,而无需对密度进行任何建模,通过熵正则化与伪标签具有相同的作用效果,都是希望利用未标签数据的分布的重叠程度的信息。(有效性)
    图5 熵正则化方法
图5 熵正则化方法

在理论外,伪标签技术给人的第一感觉就是利用置信度高的样本来提升模型的拟合能力。在聚类假设及熵正则化的角度上,这是符合我们的感受的,这也使得使用这项技术变得自然而然。

值得注意的是: 当场景不满足 聚类假设 、熵正则化失效(样本空间覆盖密集)情况下,伪标签技术很有可能失效。在用之前判断适用条件,对症下药,才能将伪标签这把匕首的作用发挥出来。

参考文献: TripleLift的知乎

JavaScript获取元素(Pseudo-Element)属性的方法技巧
10-24
主要介绍了JavaScript获取元素(Pseudo-Element)属性的方法技巧,本文直接给出实现代码,需要的朋友可以参考下
tailwindcss-pseudo-elements:TailwindCSS插件,添加元素的变体
03-07
tailwindcss-pseudo-elements TailwindCSS插件,添加元素的变体( ::before , ::after , ::first-letter等)。 用法 安装 NPM npm install tailwindcss-pseudo-elements --save-dev 纱 yarn add tailwindcss-...
Pseudo-Label : The Simple and Efficient Semi-Supervised Learning Method for Deep Neural Networks
DL路人甲的博客
11-27 1729
提出了一种简单有效的深神经网络半监督学习方法。基本上,所提出的网络是以有监督的方式训练,同时有标记和无标记的数据。对于未标记的数据,标签,只是选取具有最大预测概率的类,就好像它们是真的la-bels一样使用。这实际上相当于熵正则化。它支持类之间的低密度分离,这是半监督学习的一个常见假设。该方法在去除噪声的自动编码和丢失的情况下,优于传统的半监督学习方法,在MNIST-handrit-10位数据集上对非常小的标记数据进行半监督学习 文章目录核心思想训练过程核心公式结论 核心思想 Pseudo-Label.
标签pseudo label)(半监督学习
learn more,have more
07-15 996
标签pseudo label
一文速通半监督学习(Semi-supervised Learning):桥接有标签与无标签数据
最新发布
定期分享我的发现和想法,感谢你的陪伴和支持
03-18 4317
论文看到哪学到哪 ^ - ^在机器学习的世界里,我们通常遇到这样一个现实问题:标注数据(有标签的数据)往往昂贵且难以获得,而未标注数据(无标签的数据)却大量存在,易于收集。假设你正在尝试教会计算机区分猫和狗的照片,但只有少数照片是打上了“猫”或“狗”的标签,大部分照片都没有标签。这时候,半监督学习就闪亮登场了,它是一种使用大量未标注数据和少量标注数据进行学习的方法,旨在提高学习效率和准确性。
半监督学习 MixMatch:A Holistic Approach to Semi-Supervised Learning(核心代码)
poppy
06-07 1347
半监督学习 MixMatch:A Holistic Approach to Semi-Supervised Learning(核心代码)
标签Pseudo-Labelling)介绍:一种半监督机器学习技术
lizz2276的博客
06-25 3623
我们在解决监督机器学习的问题上取得了巨大的进步。这也意味着我们需要大量的数据来构建我们的图像分类器。但是,这并不是人类思维的学习方式。一个人的大脑不需要上百万个数据来进行训练,需要通过多次迭代来完成相同的图像来理解一个主题。它所需要的只是在基础模式上用几个指导点训练自己。显然,我们在当前的机器学习方法缺少一些东西。我们能否可以建立一个系统,能够要求最低限度的监督,并且能够自己掌握大部分的任务。 本文将介绍一种称为标签Pseudo-Labelling)的技术。我会给出一个直观的解释,说明标签是什么,然
标签还能这样用?半监督力作UPS(ICLR 2021)大揭秘!
阿木寺的博客
02-19 1941
点击上方“CVer”,选择加"星标"置顶重磅干货,第一时间送达本文作者:罗驳思 | 来源:知乎(已授权)https://zhuanlan.zhihu.com/p/3507...
标签Pseudo Label
年少的勇气已经用完,剩下的就是三思而后行
10-21 4870
标签()是半监督学习的一个概念,能够帮助模型更好的从无标注的信息进行学习。与完全的无监督学习相比,半监督学习拥有部分的标注数据和大量的未标注数据,这种形式也更加适合现实场景和竞赛场景。在现实,标注数据少,未标注数据多;在竞赛,训练集有标注,测试集未标注;那么如何完全将未标注的数据利用起来呢?在半监督学习标签是其的方法,具体思路如下:首先利用现有的标注数据,训练得到一个模型;利用训练得到的模型对无标注数据进行预测;然后将无标注数据的预测标签和数据加入训练集一起训练;
半监督学习标签(pseudo label,entropy minimization,self-training)
一只禾的博客
02-02 1万+
1.什么是标签 标签方法是一种同时从未标记数据和标记数据学习的监督范式。将具有最大预测概率的类作为标签。形式化后等价于熵正则化(Entropy Regularization)或熵最小化(Entropy Minimization). 根据半监督学习的假设,决策边界应该尽可能通过数据较为稀疏的区域,即低密度区域,从而避免把密集的样本数据点分到决策边界的两侧,也就是说模型需要对未标记数据做出低熵预测,即熵最小化。标签方法是有利于熵最小化的,即标签的目标其实就是熵最小化。 Loss function分为
半监督学习(主要标签方法)
Harry_Jack的博客
08-08 3739
目前许多研究的假设都是利用聚类假设而进行训练的,这些方法都基于一个概念,即如果给一个无标签样本增加扰动,那么扰动数据的预测和原数据的预测不会有明显的改变,在聚类假设下,具有不同真实标签的数据点应当在低密度区域分隔开,因此,某样本在扰动后的预测结果发生类别变化的可能性也该很小。因此,与其最小化在输入空间的零维数据点上的分类成本,正则化的模型使每个数据点周围的流形上的成本最小化,使决策边界远离未标记的数据点,并平滑数据所在的流形[193]。最后一步是,混合这两个batch的的样本,形成一个新的batch。
[机器学习] 半监督学习---标签Pseudo-Label
摩登都市天空---专栏
09-07 7613
大数据时代,在推荐、广告领域样本的获取从来都不是问题,似乎适用于小样本学习的标签技术渐渐淡出了人们的视野,但实际上在样本及其珍贵的金融、医疗图像、安全等领域,标签学习是一把锋利的匕首,简单而有效。 什么是标签技术 先说第一个问题,假设我们现在有一个文本分类模型(先不用管分类模型是怎么来的以及怎么训练的),以及大量的无标注数据。 我们现在使用文本分类模型对无标注数据进行预测,挑选softmax之后概率最大的那个类别为当前无标注数据对应的标签。 因为是无标注数据而且我们模型准确不可能是百分之
Pseudo-Label:深度学习一种简单有效的半监督方法
热门推荐
u012420553的博客
09-18 1万+
Pseudo-Label:深度学习一种简单有效的半监督方法1 摘要2 介绍 1 摘要 提出了一种简单有效的深度神经网络半监督学习方法。基本上,该网络采用带标签和无标签数据同时训练的监督方式。对于未标记的数据,标记,只是选取具有最大预测概率的类,就像它们是真实的标签一样使用。这实际上相当于熵正则化。它倾向于类与类之间的低密度间隔,这是半监督学习通常假定的前提。在MNIST手写体十位数数据集上,采...
pseudo-LiDAR_e2e:LiDAR_e2e
04-14
作者: , , , , , , , 和 引文@inproceedings{qian2020end, title={End-to-End Pseudo-LiDAR for Image-Based 3D Object Detection}, author={Qian, Rui and Garg, Divyansh and Wang, Yan and You, Yurong ...
PSeudo-世界上最简单的PLAYSTATION模拟器
02-04
PSeudo-世界上最简单的PLAYSTATION模拟器
CSS 类(Pseudo-classes)
12-14
CSS 类(Pseudo-classes) CSS类是用来添加一些选择器的特殊效果。 语法 类的语法: selector:pseudo-class {property:value;} CSS类也可以使用类: selector.class:pseudo-class {property:value;} ...
Pseudo-标签
weixin_43977748的博客
07-18 761
转载至作者随君 https://blog.csdn.net/u012420553/article/details/100975294 Pseudo-Label:深度学习一种简单有效的半监督方法 1 摘要2 介绍3 深度学习标签3.1 深度神经网络3.2 Denoising Auto-Encoder 去噪自编码器 1 摘要 提出了一种简单有效的深度神经网络半监督学习方法。基本上,该网络采用带标签和无标签数据同时训练的监督方式。对于未标
标签:用于深度神经网络的简单高效的半监督学习方法
deephub
01-27 4573
未标记的数据由监督学习网络标记,即所谓的标记。 然后使用标记数据和标记数据训练网络。 标签 (Pseudo-Labels) 标签是对未标记数据的进行分类后的目标类,在训练的时候可以像真正的标签一样使用它们,在选取标签的时使用的模型为每个未标记样本预测的最大预测概率的类: 标签可以用于带有 Dropout 的微调阶段。 预训练网络以监督方式同时使用标记和未标记数据进行训练: 其 n 是 SGD 标记数据的样本数,n’ 是未标记数据的样本数; C 是分类总数; fmi 是标注数据的输出,
pseudo-terminal will not
08-17
引用<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [Jenkins执行shell命令,提示Pseudo-terminal will not be allocated because stdin is not a terminal.](https://blog.csdn.net/weixin_43577647/article/details/125340693)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 50%"] - *2* [ssh登录问题出现Pseudo-terminal will not be allocated because stdin is not a terminal错误](https://blog.csdn.net/xqhrs232/article/details/73613414)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • Python split()方法 35863
  • 解决No module named pip问题 29902
  • 训练神经网络时,训练集loss下降,但是验证集loss一直不下降 16876
  • AttributeError: module ‘torch.distributed‘ has no attribute ‘deprecated‘问题解决方案 15023
  • 利用pytorch实现平均绝对值误差(MAE) 13397

分类专栏

  • 编译器使用 3篇
  • 深度学习 35篇
  • PC工具解决方案 3篇
  • python 23篇
  • 深度学习学习笔记 12篇
  • 图像处理基础知识 4篇
  • 机器学习基础理论 3篇
  • 11
  • Pytorch编译解决方案 3篇
  • 雷达 2篇
  • matlab 1篇

最新评论

  • RT-DETR个人整理向理解

    深度瞎学: 我个人觉得是没太大关系的,原来的DETR网络里面是没有IOU-aware这个的,我觉得RT-DETR加这个可能是为了更快收敛之类的。具体你可以看一下李沐老师的DETR的讲解,然后再回过头来看RT-DETR。

  • RT-DETR个人整理向理解

    噗叽开车车: 博主我想问一下IoU-aware和object query的初始化有什么关系吗,我不太理解论文中的这一点

  • RT-DETR个人整理向理解

    村口祖传点云小王子: 是的,yolov8官方代码里的是这样写的表情包

  • RT-DETR个人整理向理解

    深度瞎学: 你可以看一下我这里面HybridEncoder的图,或者你看一下原文fig.3的图。看看是不是你想要的答案。我个人理解是AIFI使用S5得到F5然后CCFM将S4、S3和F5做fusion,但是fig.5那个图这么去画不太好画就直接将3、4、5一起画里面了。但是也是加了一个总体框框的。我是这么理解的不知道对不对。

  • RT-DETR个人整理向理解

    村口祖传点云小王子: 对照组e在代码中只有s5一个输入,在图5中,所有对照组有3个输入。这三个输入没有看懂。。。

您愿意向朋友推荐“博客详情页”吗?

  • 强烈不推荐
  • 不推荐
  • 一般般
  • 推荐
  • 强烈推荐
提交

最新文章

  • AI模型边缘端部署全流程二(工具篇)
  • anaconda使用小tricks
  • RT-DETR个人整理向理解
2023年4篇
2022年2篇
2021年13篇
2020年58篇

目录

目录

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

4617作文网小小梦魇2游戏解说七画起名吉利字爸爸姓李妈妈姓陈起名祁的名字女孩起名周稔丰易筋洗髓经肖 诗经 起名周易64卦随卦排名起名周公解梦梦见好多虫子周易讲解听书客户生命周期价值计算五行金水起名大全蜜饯商标起名解梦 猫生小猫柒起名字周公解梦馆物流公司起名网免费生辰八字免费名起名软件太极鱼起名字网小孩子起名姓罗佳子起名字12月10日八字算命周公解梦桔子周易按生辰八字风水海南梦大奖网解美发店名字大全免费起名周易测算运势2019集团公司名咋起名范姓男孩起名 范姓男孩名字大全电子产品寿命计算淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻让美丽中国“从细节出发”清明节放假3天调休1天男子给前妻转账 现任妻子起诉要回网友建议重庆地铁不准乘客携带菜筐月嫂回应掌掴婴儿是在赶虫子重庆警方辟谣“男子杀人焚尸”国产伟哥去年销售近13亿新的一天从800个哈欠开始男孩疑遭霸凌 家长讨说法被踢出群高中生被打伤下体休学 邯郸通报男子持台球杆殴打2名女店员被抓19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警两大学生合买彩票中奖一人不认账德国打算提及普京时仅用姓名山西省委原副书记商黎光被逮捕武汉大学樱花即将进入盛花期今日春分张家界的山上“长”满了韩国人?特朗普谈“凯特王妃P图照”王树国3次鞠躬告别西交大师生白宫:哈马斯三号人物被杀代拍被何赛飞拿着魔杖追着打315晚会后胖东来又人满为患了房客欠租失踪 房东直发愁倪萍分享减重40斤方法“重生之我在北大当嫡校长”槽头肉企业被曝光前生意红火手机成瘾是影响睡眠质量重要因素考生莫言也上北大硕士复试名单了妈妈回应孩子在校撞护栏坠楼网友洛杉矶偶遇贾玲呼北高速交通事故已致14人死亡西双版纳热带植物园回应蜉蝣大爆发男孩8年未见母亲被告知被遗忘张立群任西安交通大学校长恒大被罚41.75亿到底怎么缴沈阳一轿车冲入人行道致3死2伤奥运男篮美国塞尔维亚同组周杰伦一审败诉网易国标起草人:淀粉肠是低配版火腿肠外国人感慨凌晨的中国很安全男子被流浪猫绊倒 投喂者赔24万杨倩无缘巴黎奥运男子被猫抓伤后确诊“猫抓病”春分“立蛋”成功率更高?记者:伊万改变了国足氛围奥巴马现身唐宁街 黑色着装引猜测

4617作文网 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化