最小均方差的概率阐述(Probabilistic interpretation)|电子爱好者

admin管理员组
文章数量:1609899

当面对一个像线性回归的回归问题时，为什么最小方差代价函数（损失函数）是一个好的解决方案呢？在这一节的内容，我们通过概率论的视角会发现最小方差回归是一个很自然的算法。

我们不妨假设，目标变量与输入变量有如下关于：

y ( i ) = θ T x ( i ) + ϵ ( i ) , y^{(i)} = \theta^T x^{(i)} + \epsilon^{(i)}, y(i)=θTx(i)+ϵ(i),

上式中的 ϵ ( i ) \epsilon^{(i)} ϵ(i)是一个误差项，表示模型未捕捉的特征或随机噪声。我们假设这些 ϵ ( i ) \epsilon^{(i)} ϵ(i)是独立同分布于均值为0、方差为 σ 2 \sigma^2 σ2的高斯分布，记作 ϵ ( i ) ∼ N ( 0 , σ 2 ) \epsilon^{(i)} \sim \mathcal{N}(0, \sigma^2) ϵ(i)∼N(0,σ2)。 ϵ ( i ) \epsilon^{(i)} ϵ(i)的概率密度为：

p ( ϵ ( i ) ) = 1 2 π σ exp ( − ( ϵ ( i ) ) 2 2 σ 2 ) . p(\epsilon^{(i)}) = \frac{1}{\sqrt{2 \pi} \sigma} \text{exp} \left( - \frac{(\epsilon^{(i)})^2}{2 \sigma^2} \right). p(ϵ(i))=2π σ1exp(−2σ2(ϵ(i))2).

替换一下变量则有：

p ( y ( i ) ∣ x ( i ) ; θ ) = 1 2 π σ exp ( − ( y ( i ) − θ T x ( i ) ) 2 2 σ 2 ) . p(y^{(i)} | x^{(i)}; \theta) = \frac{1}{\sqrt{2 \pi} \sigma} \text{exp} \left( - \frac{(y^{(i)} - \theta^T x^{(i)})^2}{2 \sigma^2} \right). p(y(i)∣x(i);θ)=2π σ1exp(−2σ2(y(i)−θTx(i))2).

p ( y ( i ) ∣ x ( i ) ; θ ) p(y^{(i)} | x^{(i)}; \theta) p(y(i)∣x(i);θ)是对于给定输入特征 x ( i ) x^{(i)} x(i)和参数 θ \theta θ时， y ( i ) y^{(i)} y(i)的条件概率分布。需要注意的是它不能写成 p ( y ( i ) ∣ x ( i ) , θ ) p(y^{(i)} | x^{(i)}, \theta) p(y(i)∣x(i),θ)。因为 θ \theta θ不是随机变量， θ \theta θ是待沽参数，未知却是固定值。

给定 X X X（包含所有的数据集 x ( i ) x^{(i)} x(i)）和 θ \theta θ，如何确定 y ( i ) y^{(i)} y(i)的分布？这个概率由 p ( y ⃗ ∣ X ; θ ) p(\vec{y}|X; \theta) p(y ∣X;θ)表示，它是 y ⃗ \vec{y} y 关于 θ \theta θ的函数。而当我们把它看成是一个关于 θ \theta θ的函数时，这个函数就可以称为似然函数：

L ( θ ) = L ( θ ; X , y ⃗ ) = p ( y ⃗ ∣ X ; θ ) . L(\theta) = L(\theta; X, \vec{y}) = p(\vec{y} | X; \theta). L(θ)=L(θ;X,y )=p(y ∣X;θ).

又我们假设 ϵ ( i ) \epsilon^{(i)} ϵ(i)是独立的，上式可改写为：

L ( θ ) = ∏ i = 1 m p ( y ( i ) ∣ x ( i ) ; θ ) = ∏ i = 1 m 1 2 π σ exp ( − ( y ( i ) − θ T x ( i ) ) 2 2 σ 2 ) \begin{aligned} L(\theta) &= \prod_{i=1}^m \ p(y^{(i)} | x^{(i)}; \theta) \\ &= \prod_{i=1}^m \ \frac{1}{\sqrt{2 \pi} \sigma} \text{exp} \left( - \frac{(y^{(i)} - \theta^T x^{(i)})^2}{2 \sigma^2} \right) \\ \end{aligned} L(θ)=i=1∏m p(y(i)∣x(i);θ)=i=1∏m 2π σ1exp(−2σ2(y(i)−θTx(i))2)

为了求极大似然，使用对数似然函数可以简化我们的计算：

ℓ ( θ ) = log L ( θ ) = log ∏ i = 1 m 1 2 π σ exp ( − ( y ( i ) − θ T x ( i ) ) 2 2 σ 2 ) = ∑ i = 1 m log 1 2 π σ exp ( − ( y ( i ) − θ T x ( i ) ) 2 2 σ 2 ) = m log 1 2 π σ − 1 σ 2 ⋅ 1 2 ∑ i = 1 m ( y ( i ) − θ T x ( i ) ) 2 . \begin{aligned} \ell(\theta) &= \text{log} \ L(\theta) \\ &= \text{log} \prod_{i=1}^m \frac{1}{\sqrt{2 \pi} \sigma} \text{exp} \left( - \frac{(y^{(i)} - \theta^T x^{(i)})^2}{2 \sigma^2} \right) \\ &= \sum_{i=1}^m \text{log} \frac{1}{\sqrt{2 \pi} \sigma} \text{exp} \left( - \frac{(y^{(i)} - \theta^T x^{(i)})^2}{2 \sigma^2} \right) \\ &= m \text{log} \frac{1}{\sqrt{2 \pi} \sigma} - \frac{1}{\sigma^2} \cdot \frac{1}{2} \sum_{i=1}^m (y^{(i)} - \theta^T x^{(i)})^2.\\ \end{aligned} ℓ(θ)=log L(θ)=logi=1∏m2π σ1exp(−2σ2(y(i)−θTx(i))2)=i=1∑mlog2π σ1exp(−2σ2(y(i)−θTx(i))2)=mlog2π σ1−σ21⋅21i=1∑m(y(i)−θTx(i))2.

而这时我们就可以发现极大似然估计和最小均方差是同解的：

1 2 ∑ i = 1 m ( y ( i ) − θ T x ( i ) ) 2 \frac{1}{2} \sum_{i=1}^m (y^{(i)} - \theta^T x^{(i)})^2 21i=1∑m(y(i)−θTx(i))2

上式就是原始最小方差成本函数 J ( θ ) J(\theta) J(θ)。

总结： 在之前的概率假设下，最小方差回归和寻找 θ \theta θ的极大似然估计是对应的。在这一系列假设下，最小方差回归是处理极大似然估计的直接方法。
需要注意一点，最后参数 θ \theta θ的选择和方差 σ 2 \sigma^2 σ2是无关的，实际上即使 σ 2 \sigma^2 σ2不知道我们也可推出已上结论。这一点在后面的指数族和生成线性模型中也会有应用。

本文标签：方差概率最小 interpretation Probabilistic

版权声明：本文标题：最小均方差的概率阐述(Probabilistic interpretation) 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1728576255a1164505.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

最小均方差的概率阐述(Probabilistic interpretation)

更多相关文章

R语言使用interaction.plot函数创建交互关系图进行多因素方差分析（两个或者多个分类变量作为预测变量的方差分析、分析预测变量交互关系的可视化检验）

R语言使用aov函数进行双因素方差分析（Two-way factorial ANOVA）、使用interaction.plot函数在双因素方差分析中可视化交互作用（Interaction）

HDU 4043 Eliminate Witches! (求概率推公式 ＋ 大数)

哥本哈根诠释（Copenhagen Interpretation）

#64 Abstract Interpretation: Introduction &amp; #66 Galois Connections - 课程笔记

Probabilistic interpretation

A geometric interpretation of the covariance matrix

CS61A The Structure and Interpretation of Computer Programs

【Leetcode】1678. Goal Parser Interpretation

Android N Combines AOT, Interpretation and JIT

快速井筒测井解释工具：Basic-Well-Log-Interpretation

光模块行业术语之名词interpretation（三）

An Interpretation of Logistic Regression

signature=874d35de771f000cd34718a6fed95e40,The Interpretation Problems of Multilingual Treaties

signature=c6caa89b4de0f520e4ec0147d95111d3,Local luminance amplitude modulates the interpretation of...

Statistics for MIB RFC1066-MIB-INTERPRETATION

Polo Jackets books within the interpretation

Structure and Interpretation of Computer Programs

Basic-Well-Log-Interpretation 项目教程

解码深度学习的黑盒：一探可逆解释网络A Disentangling Invertible Interpretation Network...

发表评论

推荐文章

JDK、IDEA安装教程 IDEA安装２０２３年１０月 最新最详细！免费、亲测成功！！！

qt在线安装提示无法下载存档

2023转行要趁早！盘点网络安全的岗位汇总

linux下nacos启动报错，无法访问nacos页面

暗影精灵6 R74800U + GTX1650Ti Ubuntu系统20.04安装

热门文章

【信息收集】——3、信息收集指南

Wireshark的下载安装及简单使用教程

陷入瓶颈的中国航空WiFi，还有可能赶英超美吗？

【时间之外】一个命令解决win10登录黑屏

2024三掌柜赠书活动第三十期：秒懂AI小红书：7招玩转素人博主变现

SpringBoot集成XXL-Job启动报非法反射WARNING: An illegal reflective access operation has occurred

【事件】对战微信，阿里企业级社交产品“钉钉”的深度解读

【Excel 表打印基本操作】

如何用Excel软件制作最小二乘法①

天猫精灵 python_（一 ） 天猫精灵接入Home Assistant-服务器搭建

最新文章

在 装的Qt commercial 4.6.0 时报错

Toad DBA Suite for Oracle 12.6 64-bit Commercial 简单连接

Intel Non-Commercial Software Download

Toad for Oracle 10.5.1 Commercial

mysqlrouter、mycat+mysql8.0.30实现读写分离

电脑定时自动关机的多种实现方法

Toad for Oracle 10.5 Commercial

编译qt-win-commercial-src-4.3.0全过程。

java指令工具_jvm 指令工具 jcmd 命令（Java多功能命令行）

rpm 安装mysql的顺序_centos7 RPM方式安装MySQL5.7

Windows2000 server + Microsoft Visual Studio 6.0 + Qt-commercial4.22-src编译过程

每日论文推荐：我们距离GPT-4V有多远，最接近GPT-4V的开源多模态大模型

国际贸易术语(incoterms)

smartgit 授权文件 Free Trial License to Non-Commercial

Linux之Python代码打包工具Nuitka使用说明

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

HDU 4043 Eliminate Witches! (求概率推公式＋大数)

#64 Abstract Interpretation: Introduction & #66 Galois Connections - 课程笔记

JDK、IDEA安装教程 IDEA安装２０２３年１０月最新最详细！免费、亲测成功！！！

天猫精灵 python_（一）天猫精灵接入Home Assistant-服务器搭建

在装的Qt commercial 4.6.0 时报错

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载