【主动学习 01】经典综述-Active Learning Literature Survey-Burr Settles(2009)|电子爱好者

admin管理员组
文章数量:1630203

Active Learning Literature Survey - Burr Settles(2009)

Settles’ Survey，主动学习领域最经典的survey，主要介绍survey中采样策略部分。

通常在C-U和U-S上有比较多的工作

查询函数Q：不确定性准则（uncertainty）和差异性准则（diversity）

1）不确定性准则对于不确定性，我们可以借助信息熵的概念来进行理解。我们知道信息熵是衡量信息量的概念，也是衡量不确定性的概念。信息熵越大，就代表不确定性越大，包含的信息量也就越丰富。
不确定性策略就是要想方设法地找出不确定性高的样本，因为这些样本所包含的丰富信息量，对我们训练模型来说就是有用的。

2）差异性准则（diversity）
查询函数每次迭代中，查询一个或者一批样本。我们希望所查询的样本提供的信息是全面的，各个样本提供的信息不重复不冗余，即样本之间具有一定的差异性（概率分布尽量全面）。
在每轮迭代抽取单个信息量最大的样本加入训练集的情况下，每一轮迭代中模型都被重新训练，以新获得的知识去参与对样本不确定性的评估可以有效地避免数据冗余。但是如果每次迭代查询一批样本，那么就应该想办法来保证样本的差异性，避免数据冗余。

Uncertainty Sampling

对于二分类任务，以下三种方法是等价的。

Entropy

最简单最广泛使用的可能就是不确定性采样了，比如二分类问题，就取后验概率在0.5附近的样本点，非常的straightforward。

更普遍的不确定性采样策略是用***entropy***作为不确定性的度量：
x E N T ∗ = argmax ⁡ x − ∑ i P ( y i ∣ x ; θ ) log ⁡ P ( y i ∣ x ; θ ) x_{E N T}^{*}=\underset{x}{\operatorname{argmax}}-\sum_{i} P\left(y_{i} \mid x ; \theta\right) \log P\left(y_{i} \mid x ; \theta\right) xENT∗=xargmax−i∑P(yi∣x;θ)logP(yi∣x;θ)
其中 y i y_i yi覆盖了所有可能的标签。熵表示了encode一个分布所需要的信息量。在二分类问题中，熵最大等价于选择后验概率靠近0.5的。

Least confident

还可以用***least confident***，即“置信度最大的预测概率最低”。：
x L C ∗ = argmin ⁡ x P ( y ∗ ∣ x ; θ ) ， x_{L C}^{*}=\underset{x}{\operatorname{argmin}} P\left(y^{*} \mid x ; \theta\right)， xLC∗=xargminP(y∗∣x;θ)，

y ∗ = argmax ⁡ y P ( y ∣ x ; θ ) y^{*}=\operatorname{argmax}_{y} P(y \mid x ; \theta) y∗=argmaxyP(y∣x;θ)

举个例子就是 ( 0.9 , 0.1 ) (0.9, 0.1) (0.9,0.1)和 ( 0.51 , 0.49 ) (0.51, 0.49) (0.51,0.49)，后者应该采样。

Margin

边缘采样是指选择那些极易被判定为两类的样本数据，或者说这些数据被判定为两类的概率相差不大。边缘采样就是选择模型预测最大和第二大的概率差值最小的样本：
x M ∗ = argmin ⁡ x ( P θ ( y ^ 1 ∣ x ) − P θ ( y ^ 2 ∣ x ) ) x_{M}^{*}=\operatorname{argmin}_{x}\left(P_{\theta}\left(\hat{y}_{1} \mid x\right)-P_{\theta}\left(\hat{y}_{2} \mid x\right)\right) xM∗=argminx(Pθ(y^1∣x)−Pθ(y^2∣x))

不确定性采样采样策略也可以用在非概率模型。比如修改决策树和KNN模型，产生一个概率输出；SVM模型查询距离线性决策边界最近的点。

Query-By-Committee

委员会投票需要维护一个委员会 C = { θ ( 1 ) , … , θ ( C ) } \mathcal{C}=\left\{\theta^{(1)}, \ldots, \theta^{(C)}\right\} C={ θ(1),…,θ(C)}是 C C C个模型，这些模型都是通过数据集 L \mathcal{L} L训练得到的。所以最有信息的查询是他们预测最不一致的数据点。

QBC的根本假设在于借助多个委员会模型不断搜索（具体就是对输入空间的争议区域进行查询），可以更加精准的约束出version space：

因此实现一个QBC选择算法必须有两个条件：

能够构建出一系列委员会模型，来表示version space中的不同区域；
能够度量不同委员会模型之间的不一致性。

如果不需要考虑每个模型的检测效果，其实可以考虑类似不确定性采样中的 least confident 和 margin sampling 方法。可以选择某一个分类器难以区分的样本数据，也可以选择其中两三个分类器难以区分的数据。但是如果要考虑所有模型的分类效果的时候，则还是需要熵（Entropy）或者 KL 散度等指标。因此，QBC 通常也包括两种方法：

投票熵（Vote Entropy）：选择这些模型都无法区分的样本数据；
平均KL散度（Average Kullback-Leibler Divergence）：选择KL散度较大的样本数据。

Vote Entropy

对于这种多模型 { θ ( 1 ) , … , θ ( C ) } \left\{\theta^{(1)}, \ldots, \theta^{(C)}\right\} { θ(1),…,θ(C)}的场景而言，可以用熵来衡量样本数据被这些分类器区分的难易程度，如果这些分类器都把样本数据划分到某一类，则容易区分；如果分类器把样本数据划分到多类，则表示难以区分，需要重点关注：
x V E ∗ = argmax ⁡ x − ∑ i V ( y i ) C log ⁡ V ( y i ) C x_{V E}^{*}=\underset{x}{\operatorname{argmax}}-\sum_{i} \frac{V\left(y_{i}\right)}{C} \log \frac{V\left(y_{i}\rig

本文标签：主动经典 Active Learning Burr

版权声明：本文标题：【主动学习 01】经典综述-Active Learning Literature Survey-Burr Settles(2009) 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1729055797a1183944.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

【主动学习 01】经典综述-Active Learning Literature Survey-Burr Settles(2009)

Active Learning Literature Survey - Burr Settles(2009)

Uncertainty Sampling

Entropy

Least confident

Margin

Query-By-Committee

Vote Entropy

更多相关文章

联邦学习（Federated Learning）介绍

未知的系统错误(The transaction is no longer active - status: 'Committed'. No further JDBC access is allowed...

【转载】地球物理经典书目——成像方向

tensorboard可视化出现No dashboards are active for the current data set错误的解决和其它情况

[Machine Learning for Trading] {ud501} Lesson 19: 02-09 The Fundamental Law of active portfolio mana...

怎样花两年时间去面试一个人(对于我，重点是里面提及的经典书)

经典回忆Adobe Photoshop CS 2安装教程永久注册使用

【经典漏洞回顾】Microsoft Windows Win32k本地提权漏洞分析（CVE-2015-0057）

Statistical Machine Learning GR5241 Spring 2023 Homework 5Python

Interference:Does learning new things block your old memories?(1)干扰:学习新东西会阻断旧记忆吗?(一)

【论文阅读】Deep Learning Workload Scheduling in GPU Datacenters:Taxonomy, Challenges and Vision

CLIP论文翻译、Learning Transferable Visual Models From Natural Language Supervision翻译

Machine Learning Explainability for External Stakeholders

Machine Learning - Neural Networks Representation Part I

拆解USB无线网卡，电路方案非常经典（附高清美图）

Polaris Office for Mac(经典办公套件)

经典升级，长直播，马上开课 | 第 20 期高级转录组分析和R数据可视化火热报名中！！！...

Ａｃtive learning ｌiterature Survey

探索安全图学习的新边界：Graph Adversarial Learning Literature

Java Web开发实战经典 李兴华 PDF pdf

发表评论

推荐文章

双系统linux关机光标闪烁,Ubuntu 16.04安装完重启后黑屏，光标一直闪

Windows同时安装两个版本JDK，并实现动态切换JAVA8或者JAVA11

常用对照表

Java实现自动化pdf打水印小项目 使用技术pdfbox、Documents4j

centos7 安装拼音输入法

热门文章

使用密钥安装Visio 2019专业版完整指南

无线路由模式——Ad-hoc、Infrastructure、AP、Station

探索红队行动的未来：Red-Team-Infrastructure-Automation

鸿蒙系统和谷歌下一代系统比较,谷歌的Android系统对比华为的鸿蒙系统：差距无法接受...

鸿蒙-实践课程五 android、HarmonyOS Database

TCL怎样安装鸿蒙系统,鸿蒙系统六月份上线，可以吊打安卓！鸿蒙可完美兼容安卓的全部应用，运行速率比安卓高...

word批量转换成PDF的软件

iTextSharp 使用详解 读写PDF

探讨PDF转Word解决方案

U盘量产

最新文章

电脑——如何配置一台电脑

dos命令查看电脑配置

如何查计算机配件的配置,如何查看电脑配置信息？教你四种方法

影视处理计算机配置,影视后期制作电脑配置需要什么

在线查看计算机配置,怎样查看电脑配置信息？

Python--获取电脑配置信息--完整代码及过程

怎样配置炒股用的计算机,炒股专用电脑配置

如何查看ArcGIS Pro对电脑配置要求

查询计算机的配置命令是什么,查看电脑配置指令大全

如何用控制面板打开计算机配置,如何查看电脑的配置？学会下面几种方法，你就可以自己看电脑配置...

CMD查看电脑配置

电脑管家如何查看计算机配置,腾讯电脑管家怎么查看电脑硬件配置？

win7查看计算机的配置,win7系统查看电脑配置的方法

ubuntu查看电脑配置信息

查看计算机软件配置,最齐全的查看电脑配置指令集锦 查看电脑配置软件推荐【图文】...

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

Java Web开发实战经典李兴华 PDF pdf

Java实现自动化pdf打水印小项目使用技术pdfbox、Documents4j

iTextSharp 使用详解读写PDF

查看计算机软件配置,最齐全的查看电脑配置指令集锦查看电脑配置软件推荐【图文】...

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载