推荐系统中的bias&&debias(二)：position bias的消偏|电子爱好者

admin管理员组
文章数量:1610898

前面提到过position bias，即用户倾向于点击排在前面的结果，这使得“优势位置”的item会获得更高的后验点击率。

这本质上是和用户的注意力，用户对item的情绪有关，而和用户的真实兴趣无关，这显然是不利用推荐模型的学习的。
关于position bias的消偏，主要有以下几种：

方法一：将位置信息作为特征加入到模型的输入中

这是最简单的一种消偏方式，在训练时把位置信息作为特征，online infer时，由于无法获取位置特征，模型会自动取一个默认值，比如0，这个值可以借助AB实验来调整，作为一个base的方法。

方法二：位置信息单独建模成小网络

这块比较典型的工作是google发表在RecSys 2019上的paperRecommending What Video to Watch Next: A Multitask Ranking System。文章主要介绍了两个工作，一个是多目标建模，也就是大名鼎鼎的MMoE。（关于多目标学习可参照下面）：
推荐广告中多目标优化的主流范式
另一个就是关于position bias的消偏了。以往常用的做法是，训练时把位置作为输入特征，预测时或将位置特征设为常量/缺失。而论文的做法是在主模型(main model)之外，另外添加一个浅层网络(shallow tower)，这其实就是一种wide&deep框架，在shallow tower侧输入position feature, device info（原因是在不同的设备上会观察到不同的位置偏差), 以及其他能够带来位置偏差的特征。最后主模型的输出加上浅层网络的bias分量一起过sigmoid。

值得注意的是，论文中提到训练的时候，会随机丢掉10%的位置特征，防止模型过度依赖位置特征。预测的时候，要丢掉浅层网络shallow tower。
下图反映了不同位置分离出的偏差(position bias)。位置越靠前，位置带来的偏差越小；位置越靠后，偏差越大，因为越靠后，用户更有可能看不到。

方法三：将position bias转换成用户是否看到item的概率偏差

这是华为在RecSys 2019上的paperPAL: A Position-bias Aware Learning Framework for CTR
Prediction in Live Recommender Systems，也是一个位置消偏比较经典的工作。
作者分析到：用户点击广告的概率由两部分组成：

广告被用户看到的概率
用户看到广告后，点击广告的概率

那么可以进一步假设：
用户是否看到广告只跟广告的位置有关系
用户看到广告后，是否点击广告与广告的位置无关

基于该假设，就可以分开建模：

其中：ProbSeen部分是预估广告被用户看到的概率，pCTR部分是用户看到广告后，点击广告的概率，然后loss是两者的结合：

线上servering的时候，直接预估pCTR，不需要知道位置信息（这个点需要注意下，线上servering的时候，就预估假设这个广告被曝光后，用户点击的概率，只需要预估第二个模型）。

关于PAL的一些思考：

其实，PAL的设计和ESMM有异曲同工的地方，都是将事件拆解为两个概率事件的连乘，但是个人感觉PAL的假设过强，时间的关联性没有ESMM的点击——>购买这样的强关联，这是因为：
第一个假设，广告是否被用户看到只跟广告位置有关，这个假设在广告场景是不合适的。因为他跟广告、以及用户的属性都有关系（广告大图、小图等）。只能说，广告是否被用户看到，广告位置是其中一个因素，打个比方，一个显示页中有大量item，人的习惯可能更会关注头和尾，而快速划过中间的一些位置。因此可以对第一个模型更精细建模解决（看论文中这个模型只用了position信息）

第二个假设，用户看到广告后，点击广告的位置，其实跟广告是否被点击很可能还是有关的。比如都在一个页面，用户同时看到了位置1的广告和位置3的广告，但用户点击位置1的广告的概率更大。这其实还是position bias本身要解决的问题。

参考
1.https://zhuanlan.zhihu/p/405185215
2.https://dl.acm/doi/pdf/10.1145/3298689.3347033

本文标签：系统 bias amp debias Position

版权声明：本文标题：推荐系统中的bias&&debias(二)：position bias的消偏内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1728605539a1165403.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

推荐系统中的bias&amp;&amp;debias(二)：position bias的消偏

方法一：将位置信息作为特征加入到模型的输入中

方法二：位置信息单独建模成小网络

方法三：将position bias转换成用户是否看到item的概率偏差

关于PAL的一些思考：

更多相关文章

html中的绝对定位怎么写,CSS position绝对定位absolute relative

position:上下左右都为0是有什么作用

CSS padding（填充）position （定位）

SyntaxError: Unexpected token � in JSON at position 0 踩坑记

position fixed 固定定位失效问题及解决方案

UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘u30fb‘ in position

#全面解析# js中 Position 关键字的 static、fixed、absolute、relative 四个属性值

【Python】re.error: bad escape s at position 0

【CSS】position:absolute 元素完全居中的两种方法

【Uni-App】Unexpected token u in JSON at position 0

SyntaxError: Unexpected token T in JSON at position 0 的解决

使用 position:sticky 实现粘性布局

SyntaxError: Unexpected token ' in JSON at position 2

position:fixed的top:0与bottom:0配合的妙用

position:sticky处理导航吸顶

项目中遇到的position:fixed;无效问题

Vue: SyntaxError: Unexpected token o in JSON at position 1

惠普服务器装Linux7系统,惠普DL580 G7服务器系统安装与环境部署

惠普ENVY x360 14 2024 锐龙版笔记本重装win7系统教程

惠普打印机驱动下载（电脑系统和打印机型号自动匹配）

发表评论

推荐文章

Tomcat报错 Note: further occurrences of HTTP header parsing errors will be logged at DEBUG level.

CircuitBreakerOpenException断路器打开报错的解决方法，亲测有效，嘿嘿嘿

2023年最新最全uniCloud入门学习，零基础入门到实战项目 uni-admin打造uniapp网页后端 微信支付宝抖音小程序后端 unicloud数据后台快速打造uniapp小程序项目

Lecture 3 Control | CS 61A: Structure and Interpretation of Computer Programs Spring 2020

linux echo -e参数,Linux echo的用法

热门文章

HPE惠普设备固件升级步骤

计算机打印机无法打印,电脑打印机无法打印怎么办 打印机无法打印解决教程...

快速飞入城市空中交通的未来-权威公司发布参考

产品读书《Facebook效应：看Facebook如何打造无与伦比的社交帝国》

Excel 制作可视化看板的思路及操作 附开源数据

Multicarrier Interpretation of OTFS（OTFS的多载波解释）（7）⭐

position定位：相对定位、绝对定位、固定定位、粘滞定位

惠普136w耗材贵吗_性价比利器 惠普MFP 136w轻体验

【无标题】惠普ZHAN 66 PRO 14 G3 NOTEBOOK PC笔记本电脑装好系统没有触摸板驱动

惠普打印机驱动下载（电脑系统和打印机型号自动匹配）

最新文章

如何在32位win7上安装LCSolution 以及 解决DAO安装失败

漏洞补丁：windwos补丁下载（MS17-010）

win7win10win11,简体微軟拼音输入法如何输入繁体字

win7 下面 控件识别工具 Inspect spy

教你win7下如何删除微软拼音输入法~！

微软Win11七月更新补丁KB5040527发布！新功能抢先体验！

win7此更新不适用计算机,Windows系统安装补丁时提示“此更新不适用于你的计算机”的解决方案！...

win7 sp1 x64 离线安装.net framework 4.6.1

如何集成WIN7补丁

如何删除win7自带的微软拼音输入法

WIN7无法卸载掉中文繁体注音输入法

CCS7.3安装教程适用于win7系统，并且解决微软更新补丁安装不成功的问题

win11关闭微软拼音输入法中英文切换

告别最好用的微软UWP应用OneNote 微软已经开始将其替换为Win32版

Win7虚拟机安装vs2019，亲测有效

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

推荐系统中的bias&&debias(二)：position bias的消偏

2023年最新最全uniCloud入门学习，零基础入门到实战项目 uni-admin打造uniapp网页后端微信支付宝抖音小程序后端 unicloud数据后台快速打造uniapp小程序项目

计算机打印机无法打印,电脑打印机无法打印怎么办打印机无法打印解决教程...

Excel 制作可视化看板的思路及操作附开源数据

惠普136w耗材贵吗_性价比利器惠普MFP 136w轻体验

如何在32位win7上安装LCSolution 以及解决DAO安装失败

win7 下面控件识别工具 Inspect spy

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载