query词权重, 搜索词权重计算|电子爱好者

admin管理员组
文章数量:1530842

query词权重（term weighting）是为了计算query分词后，每个term的重要程度。常用的指标是tf*idf（query中term的tf大部分为1），即一个term的出现次数越多，表明信息量越少，相反一个term的次数越少，表明信息量越多。但是term的重要程度并不是和term的出现次数呈严格单调关系，并且idf缺乏上下文语境的考虑（比如“windows”在“windows应用软件”中比较重要，而在“windows xp系统iphone xs导照片”的重要性就比较低）。词权重计算作为一种基础资源在文本相关性，丢词等任务中有着重要作用，其优化方法主要分为下面三类：

1）基于语料统计

2）基于点击日志

3）基于有监督学习

本文首先介绍一些基于语料统计的计算方法。

一、imp（importance的缩写）

idf的一个缺点是仅仅依靠词频比较，imp从在query中的重要性占比基础上，采用迭代的计算方式优化词的静态赋权，其计算过程如下：

其中BT为term的imp值，初始值可设为1，Tmp_i是query中的第i个term的重要性占比，N指所有包含第i个term的query数目。

二、DIMP（Dynamic imp）

idf和imp的一个共同缺点是其都是静态的赋权。DIMP根据query的上下文计算每个term的动态赋权，其主要假设是任意query中的词权重可以由相关query 的词权重来计算，计算过程可分为两部分：

1）自顶向下的query树构建

根据实际场景中采用不同的构建方法，这里介绍一种在搜索中的做法。如下图，给定query作为根节点，首先获取query的相关query作为第二层节点，在第二层的基础上，枚举相关query的子query作为第三层节点，最后一层为分词后的term节点。因此query树种的节点都是不同粒度的文本串，边都是文本串间的相关关系。在拍卖词推荐任务中，用户query都是比较短的关键词，其可以通过拍卖词间的共同购买关系构建对应的query树。

本文标签：权重搜索词 Query

版权声明：本文标题：query词权重, 搜索词权重计算内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1725535983a1028343.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

query词权重, 搜索词权重计算

更多相关文章

上证50权重计算方法

Matlab的神经网络工具箱实用指南(3)

熵权法 变异系数法

抖音权重查询怎么做?抖音权重降低怎么办?

Tensorflow中dense(全连接层)各项参数

神经网络算法介绍

BP神经网络算法原理

【提前批】百度搜索策略部 - Query理解 &amp;amp； 召回算法团

探索WordPress查询的艺术：WordPress Query Comprehensive Reference

HTSQL is a comprehensive navigational query language for relational databases.

Lost connection to MySQL server during query的几种可能分析

mysql报错2013.Lost connection to MySQL server during query

Mysql出现2013 Lost connection to MySQL server during query

解决MySQL导入数据报错2013 - Lost connection to MySQL server during query

Lost connection to Mysql server during query问题解决

Unexpected exception encountered during query.

MySQL报错：Lost connection to MySQL server during query

grafana:Unknown error during query transaction. Please check JS console logs.

Notice to users of DB Query Analyzer in Windows 7, Windows 8 and Windows 10

科普帖：什么是Query？关于数据库查询的解释

发表评论

推荐文章

本科生毕业论文线上答辩流程（腾讯会议+WPS文字）

Ctrl快捷键使用大全

ChatGPT付费创作系统V3.0.6独立版 WEB+H5+小程序端 （新增AI全网搜索+文档解析+豆包AI通道）安装部署教程

amd显卡驱动linux 卸载,安装和卸载amd显卡驱动的正确方法

GPGPU台积电7nm制程

热门文章

在Linux服务器上下载百度云盘中的资料

Archery Competition

CentOS7安装chatGPT教程

Vector Commitments with Efficient Proofs学习笔记

学生信息管理系统（C语言）

优朋otv显示服务器接口异常,睿因路由器产品常见问题及解答汇总

无显示器、路由器、网线安装树莓派系统

区分计算机和服务器的内存条,AMD专用内存是什么意思 AMD专用内存和普通内存条的区别及真相...

AMD OpenCL Accelerated Parallel Processing (APP) Software Development Kit (SDK)

Debian下安装搜狗拼音输入法

最新文章

WiFi和WLAN有什么区别和联系？

公共wifi不安全家里的wifi就安全了吗？

路由器wifi热点丢包率高_使用笔记本电脑和虚拟路由器创建自己的Wifi热点

无线路由器服务器拒接,wifi被拒绝接入解决方法(图文)

WiFi篇（一）-WiFi“黑”暗的一面

如何给自己各种帐号编一个安全又不会忘记的密码？

ESP8266 Node mcu WIFI无线控制入门_01无线远程控制LED

看自己的Wifi是否被盗用的技巧

【Android wifi】wifi基本原理

【Android工程师与智能家居产品的第一次接触②】给设备配网 Esp8266 wifi模块的快速配网和AP配网简介（付Android demo）

【智能家居篇】wifi网络接入原理（中）——认证Authentication

Android Wifi连接控制、TCP、UDP通信，6.0以上适配

网络安全--解除认证攻击wifi(详细教程)

WIFI 一键配置原理-ESP8266

openwrt折腾记4-开通ipv6( wifi-client模式下)

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

熵权法变异系数法

【提前批】百度搜索策略部 - Query理解 &amp；召回算法团

ChatGPT付费创作系统V3.0.6独立版 WEB+H5+小程序端（新增AI全网搜索+文档解析+豆包AI通道）安装部署教程

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载