sklearn学习笔记之feature_selection（特征选择）|电子爱好者

admin管理员组
文章数量:1650765

sklearn中文链接：http://www.scikitlearn/0.21.3/14/
sklearn官网链接:https://scikit-learn/stable/modules/classes.html?highlight=feature_selection#module-sklearn.feature_selection

本模块主要是对样本集进行feature_selection(特征选择)和dimensionality reduction(降温)，这将会提高估计器的准确度或者增强它们在高维数据集上的性能

API

SelectKBest

sklearn.feature_selection.SelectKBest(score_func=<function f_classif>, *, k=10)

根据k次中最高的分数选择特征集，即移除那些除了评分最高的 K 个特征之外的所有特征

score_fun
一个接受array类型X，y的函数，return (scores,pvalues)或者只返回scores.默认的函数只作用于分类任务中
scores:是评测分数
pvalues:暂时不知??
k:int or “all”,default=10
选择最好的k个特征集，"all"是

示例

使用chi2作为score_fun

>>> from sklearn.datasets import load_digits
>>> from sklearn.feature_selection import SelectKBest, chi2
>>> X, y = load_digits(return_X_y=True)
>>> X.shape
(1797, 64)
>>> X_new = SelectKBest(chi2, k=20).fit_transform(X, y)
>>> X_new.shape
(1797, 20)

SelectKBest官方链接

chi2

sklearn.feature_selection.chi2(X, y)

VarianceThreshold

移除所有那些方差不满足一些阈值的特征
默认情况下，它将会移除所有的零方差特征，即那些在所有的样本上的取值均不变的特征

 sklearn.feature_selection.VarianceThreshold(threshold=0.0)

这个算法只是对features(X)，并没有直接关系到outputs（Y），所以可以应用到无监督学习

Notes:允许input中有NaN

示例

假如我们有一个特征是布尔值的数据集，我们要移除那些在整个数据集中特征值为0或者为1的比例超过80%的特征。布尔特征是伯努利随机变量，变量的方差是 p ( 1 − p ) p(1-p) p(1−p)

>>> from sklearn.feature_selection import VarianceThreshold
>>> X = [[0, 0, 1], [0, 1, 0], [1, 0, 0], [0, 1, 1], [0, 1, 0], [0, 1, 1]]
>>> sel = VarianceThreshold(threshold=(.8 * (1 - .8)))
#先fit参数X，然后transform X
>>> sel.fit_transform(X)
array([[0, 1],
       [1, 0],
       [0, 0],
       [1, 1],
       [1, 0],
       [1, 1]])
# 默认情况是去除方差为0的特征列
>>> X = [[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1, 3]]
>>> selector = VarianceThreshold()
>>> selector.fit_transform(X)
array([[2, 0],
       [1, 4],
       [1, 1]])

正如预期那样，其移除了第一列

RFE

即Recursive Feature Elimination，递归式特征消除

给定一个外部的估计器，可以对特征赋予一定的权重(比如，线性模型的相关系数)，通过考虑越来越小的特征集合来递归的选择特征。

首先，评估其在初始的特征及和上面训练并且每一个特征的重要程度是通过一个coef_属性或者feature_importance_属性来获得。

然后，从当前的特征集中删除最不重要的特征。在经过修剪的集合上递归地重复这个过程，直到最终达到需要选择的特征数量

sklearn.feature_selection.RFE(estimator, *, n_features_to_select=None, step=1, verbose=0)

参数

estimator
n_features_to_select
step
verbose

SelectFromModel

是一个meta-transformer(元转换器)，它可以用来处理任何带有coef_或feature_importance_属性的训练之后的评估器

sklearn.feature_selection.SelectFromModel(estimator, *, threshold=None, prefit=False, norm_order=1, max_features=None)

本文标签：学习笔记特征 sklearn featureselection

版权声明：本文标题：sklearn学习笔记之feature_selection（特征选择）内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1729532123a1204941.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

理解卷积神经网络CNN中的特征图 feature map

6小时前

理解卷积神经网络CNN中的特征图 feature map feature map的含义在每个卷积层，数据都是以三维形式存在的。你可以把它看成许多个二维图片叠在一起，其中每一个称为一个featu

使用scikit-image feature计算图像特征与常见特征示例

6小时前

目录 canny corner_harris greycomatrix greycoprops hog local_binary_pattern scikit-image feature是一个强大的python可以调用的计算特征

【Deep Learning】VGG16之feature map学习笔记

6小时前

最近学习BeautyGAN需要用到VGG16提取的feature map进行训练，简单学习了一些关于VGG16和feature map相关的内容。 VGG16网络结构 VGG16总共有16层，

递归式特征消除：Recursive feature elimination

5小时前

简述特征的选取方式一共有三种，在sklearn实现了的包裹式(wrapper)特诊选取只有两个递归式特征消除的方法，如下： recursive feature elim

radiomics.featureextractor-----使用pyradiomics提取2维医学图像及其掩模的特征

5小时前

1 本篇解决的问题介绍一般而言都是使用SimpleITK.ReadImage()方法来读取3D的医学图像和掩模，然后再利用pyradiomics中featureextractor来直接提取一阶特征、3D形状特征、小

【Feature map visualization】卷积神经网络如何可视化特征图？—详细记录-函数可直接调用

5小时前

前言： 嘿~你需要知道，你的特征图在哪里！该教程是从知晓特征图的位置进行特征图查看!至于特征图在哪，建议Debug跟踪一下x的序列&#xff0

【特征选择】feature-selector工具助你一臂之力

5小时前

▍前言本篇主要介绍一个基础的特征选择工具feature-selector，feature-selector是由Feature Labs的一名数据科学家williamkoehrsen写的特征选择库。feature-se

特征提取（Feature Detect）、特征描述（Feature Descriptor）、特征匹配（Feature Match）

5小时前

1.1特征匹配（Feature Match) 特征匹配是计算机视觉中很多应用的基础，比如说图像配准，摄像机跟踪，三维重建，物体识别

[机器学习笔记] 特征（Feature）和特征选择(Feature Selection)

5小时前

特征（Feature）和特征选择(Feature Selection) 概念解释在机器学习中，将属性称为“特征（Feature）”，对当前学习任务有用的属性称为“相关特征（Relevant Feature）”，没有什么用的属性称为“无

理解CNN中的特征图 feature map

5小时前

feature map的含义在每个卷积层，数据都是以三维形式存在的。你可以把它看成许多个二维图片叠在一起，其中每一个称为一个feature map。在输入层，如果是灰度图片

Pytorch从入门到放弃（8）——可视化FeatureMap(特征图)

5小时前

在Pytorch的实际使用中，有时我们不仅要提取模型的中间层特征，甚至有时我们需要可视化模型的中间层特征，特别是在写论文的过程中，即可以补充一下文章的篇幅，也可以虎一虎外行人，让他觉得好牛逼好高大上啊。下面开始进入主题：其实很简单，想要

sklearn学习笔记之feature_selection（特征选择）

5小时前

sklearn中文链接：http:www.scikitlearn0.21.314 sklearn官网链接:https:scikit-learnstablemodulesclasses.html?hi

树模型中的特征重要性(feature_importances_)

5小时前

Decision Tree 该特征带来的标准(信息增益、基尼指数)减少的总和(需要经过标准化). 也被称为基尼重要性.sklearn官网说明原文如下：The importance of a feature is computed as th

Openlayers学习笔记—Geometry 和 Feature类

5小时前

Geometry Geometry类是feature对象的基本组成部分，Vector类采用Geometry类来存储一个要素的几何信息。 Feature Feature类是Vector类用来在地图上展示几何对象&

YOLOv7改进主干CFPNet系列：全网首发结合最新Centralized Feature Pyramid集中特征金字塔，测试私有数据集涨点，通过COCO数据集验证强势涨点

5小时前

Python以表格、可视化图像的形式输出模型特征重要度（feature importances）并进行重要度归一化及排序

5小时前

Python以表格、可视化图像的形式输出模型特征重要度（feature importances）并进行重要度归一化及排序目录 Python以表格、可视化图像的形式输出模型特征重要度（feature importances）并进行重要度归

Python数据处理025：自动特征工具包featuretools的使用方法

5小时前

# -*- coding: utf-8 -*-"""@ModuleName:feature_tools@Function: @Author: H2017824@Time: 2019118 下午 0

python中的sklearn.feature_extraction dictvectorizer

5小时前

class sklearn.feature_extraction. DictVectorizer ( dtype<type numpy.float64>, separator, sparseTrue, sortTrue )

Python librosa.feature.mfcc提取音频特征

4小时前

librosa.feature.mfcc参数介绍 librosa.feature.mfcc(yNone, sr22050, SNone, n_mfcc20, dct_type2, normortho, **kwargs) y:np.nd

spring cloud NetFlix 学习笔记

3小时前

spring cloud 1、前言1.1、概括1.2 、常见面试题 2. 微服务概述2.1 什么是微服务？2.2 微服务与微服务架构2.3 微服务优缺点2.4 微服务技术栈有那些？2.5 为什么

电子爱好者 - 最新技术资讯及电子产品介绍！

sklearn学习笔记之feature_selection（特征选择）

API

SelectKBest

chi2

VarianceThreshold

RFE

SelectFromModel

更多相关文章

理解卷积神经网络CNN中的特征图 feature map

使用scikit-image feature计算图像特征与常见特征示例

【Deep Learning】VGG16之feature map学习笔记

递归式特征消除：Recursive feature elimination

radiomics.featureextractor-----使用pyradiomics提取2维医学图像及其掩模的特征

【Feature map visualization】卷积神经网络如何可视化特征图？—详细记录-函数可直接调用

【特征选择】feature-selector工具助你一臂之力

特征提取（Feature Detect）、特征描述（Feature Descriptor）、特征匹配（Feature Match）

[机器学习笔记] 特征（Feature）和特征选择(Feature Selection)

理解CNN中的特征图 feature map

Pytorch从入门到放弃（8）——可视化FeatureMap(特征图)

sklearn学习笔记之feature_selection（特征选择）

树模型中的特征重要性(feature_importances_)

Openlayers学习笔记—Geometry 和 Feature类

YOLOv7改进主干CFPNet系列：全网首发结合最新Centralized Feature Pyramid集中特征金字塔，测试私有数据集涨点，通过COCO数据集验证强势涨点

Python以表格、可视化图像的形式输出模型特征重要度（feature importances）并进行重要度归一化及排序

Python数据处理025：自动特征工具包featuretools的使用方法

python中的sklearn.feature_extraction dictvectorizer

Python librosa.feature.mfcc提取音频特征

spring cloud NetFlix 学习笔记

发表评论

推荐文章

Appscan安全测试

软件删不掉要计算机管理,控制面板卸载不了程序,小编教你如何处理控制面板中卸载不掉的软件...

STM32F407ZGT6 fatfs出现挂载成功，但是文件读写失败的原因

springboot基于java的校园二手书籍交易平台-附源码131558

SpringCloud微服务

热门文章

如何制作PE？

这些神奇的 QQ 你还记得几个？

spark on k8s forbidden configured service account doesn't have access. service account may have been

NVIDIA 控制面板显示“拒绝访问，无法应用选定的设置”怎么办

matlab2020面板介绍

Linux之宝塔面板安装和使用

android程序中的AndroidManifest.xml中的uses-feature详解

python randomforestregressor_python–RandomForestRegressor和feature_importances_错误

线程 和进程

win7找不到win10计算机图标,win7电脑桌面图标不见了怎么办

最新文章

驰为vi10旗舰版linux,驰为Vi10平板电脑完全安装Win10步骤 BY Chinasred

windows7系统屏幕一直闪屏的解决教程

windows7电脑删除文件特别慢的解决方法

iwork8旗舰版 android,性能彪悍 双面神兽——酷比魔方iwork8旗舰版体验

win7如何设置通电自动开机_windows7自动开机怎么设置？

计算机文件预览取消,关闭视频文件预览，保留图片文件预览（windows7） -电脑资料...

Win7 64位旗舰版系统取消电脑开机自动检测硬盘的方法

如何避免计算机被别人共享,win7如何防止别人偷窥电脑 win7防止别人偷窥电脑操作方法...

如何把win7电脑设置成网站服务器吗,如何为win7电脑设置服务器

windows7电脑怎么永久关闭广告

Windows7共享文档—开启方法及用户权限设置

计算机管理记事本,win7旗舰版系统下自带记事本的强大功能汇总【图文详解】...

计算机全盘搜索功能不见了,新萝卜家园win7旗舰版电脑中的搜索功能不见了怎么办...

电脑Windows7系统上的appdata是什么文件夹

电脑windows7系统环境Framework 4.6.2无法安装的解决方法

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

线程和进程

iwork8旗舰版 android,性能彪悍双面神兽——酷比魔方iwork8旗舰版体验

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载