xgboost报错ValueError: feature_names mismatch|电子爱好者

admin管理员组
文章数量:1650772

@创建于：20210107
@修改于：20210107,20210108

文章目录

- - - 1、背景
    - 2、predict()介绍 ( xgboost==0.90)
    - 3、解决办法
    - - 3.1 把validate_features设置为False
      - 3.2 把输入的数据（dataframe类型）的列名进行对应修改
      - 3.3 变更predit输入数据的格式
      - 3.4 思考
    - 4、参考链接

1、背景

XGBClassifier自带fit()、predict()方法。

当通过网格搜索，交叉验证后，获得了最佳的参数，形成模型，并保存。

当再次加载模型，对测试集进行预测时候，使用XGBClassifier自带predict()方法时候，发现出现该问题。即：ValueError(“feature_names mismatch: [‘ntp’, ‘pg’, ‘dbp’, ‘tsft’, ‘si’, ‘bmi’, ‘dpf’, ‘age’] [‘f0’, ‘f1’, ‘f2’, ‘f3’, ‘f4’, ‘f5’, ‘f6’, ‘f7’]\nexpected bmi, age, si, dpf, ntp, dbp, tsft, pg in input data\ntraining data did not have the following fields: f5, f3, f1, f4, f6, f7, f0, f2”,)

2、predict()介绍 ( xgboost==0.90)

（1）用法
predict(self, data, output_margin=False, ntree_limit=None, validate_features=True)

（2）参数及其含义

参数	类型	介绍
data	DMatrix	The dmatrix storing the input.
output_margin	bool	Whether to output the raw untransformed margin value.
ntree_limit	int	Limit number of trees in the prediction; defaults to best_ntree_limit if defined(i.e. it has been trained with early stopping), otherwise 0 (use all trees).
validate_features	bool	When this is True, validate that the Booster’s and data’s feature_names are identical. Otherwise, it is assumed that the feature_names are the same.

3、解决办法

3.1 把validate_features设置为False

预测时候代码为：model_xgb.predict(X_test.values, validate_features=False)，X_test是dataframe格式，X_test.values是ndarray格式。

此时的假设是，模型训练时用的训练数据集的特征名称、特征数据和特征顺序，与验证集的数据特征名称、特征数据和特征顺序完全一致。

在训练集和验证集通过dataframe格式，用train_test_split来划分的时候，是一致的。

3.2 把输入的数据（dataframe类型）的列名进行对应修改

预测时候代码为：model_xgb.predict(X_test.values)，X_test是dataframe格式，X_test.values是ndarray格式。

在数据（以dataframe结构）进行划分之前，对列名进行重命名。重命名为[‘f0’, ‘f1’, ‘f2’, ‘f3’, ‘f4’, ‘f5’, ‘f6’, ‘f7’]形式。这是XGB特征的命名格式。可通过model.get_booster().feature_names进行查看。

# 重命名，与featuer name一致
print('df_tmp columns original names are {}'.format(df_tmp.columns))
rename_dict = dict()
for index, value in enumerate(df_tmp.columns.values):
    rename_dict[value] = "f" + str(index)
df_tmp.rename(columns=rename_dict, inplace=True)
print('df_tmp columns new names are {}'.format(df_tmp.columns))

3.3 变更predit输入数据的格式

X_test是dataframe格式，修改下面代码。

把
y_pred = model_xgb.predict(data=X_test.values)
改成
y_pred = model_xgb.predict(data=X_test)

3.4 思考

（1）predict中的data，要求是DMatrix格式，但可以兼容dataframe格式。
（2）当data是dataframe类型时，XGBoost的特征名称就是列名。
（3）当data是ndarray类型时，XGBoost的特征名称默认是[‘f0’, ‘f1’, ‘f2’]样式。

可修改dataframe的列名成[‘f0’, ‘f1’, ‘f2’]样式；
可把validate_features设置成False。

4、参考链接

（1）解决xgboost报错： ValueError: feature_names mismatch
（2）ValueError：feature_names不匹配
（3）成功解决 ValueError: feature_names mismatch training data did not have the following fields

本文标签：报错 Xgboost ValueError mismatch featurenames

版权声明：本文标题：xgboost报错ValueError: feature_names mismatch 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1729532076a1204936.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

xgboost报错ValueError: feature_names mismatch

文章目录

1、背景

2、predict()介绍 ( xgboost==0.90)

3、解决办法

3.1 把validate_features设置为False

3.2 把输入的数据（dataframe类型）的列名进行对应修改

3.3 变更predit输入数据的格式

3.4 思考

4、参考链接

更多相关文章

无法连接共享打印机，报错0x0000011b

WIN10共享打印机报错解决方法

windows 10 21H2 连接网络共享点击报错 0x0000007c

linux 切换用户报错：This account is currently not available

ValueError: Dependency on app with no migrations: account

Windows Server 2012 R2 安装sqlserver报错：无法通过Windows功能控制面板自动安装或卸载Windows Server 角色和功能。

成功解决raise TypeError(‘Unexpected feature_names type‘)TypeError: Unexpected feature_names type

skleaen报错UserWarning: X has feature names, but LassoCV was fitted without feature names

求助！使用monocle2 创建newCellDataSet时，报错feature numbers differ between assayData and featureData

vue23 - 报错Feature flag __VUE_PROD_HYDRATION_MISMATCH_DETAILS__ is not explicitly defined. You are r

安装HFSS2021R1版本报错Failover feature ‘ANSYS electronics_desktop‘ is not available. 解决方法

xgboost的特征重要性feature_importance计算

tfrecord数据报错 InvalidArgumentError: Feature: feature (data type: string) is required but could not

【影像组学】pyradiomics的安装及featureextractor报错

tensorboard使用报错:TensorFlow installation not found - running with reduced feature set.

openstack创建云主机日志报错qemu-kvm: CPU feature spec-ctrl not found

解决xgboost报错 ： ValueError: feature_names mismatch

ArcGIS Server发布服务时勾选Feature Access报错：要素服务需要一个已注册的数据库

typescript使用装饰器报错Experimental support for decorators is a feature that is subject to change in a...

python报错：Do not support special JSON characters in feature name

发表评论

推荐文章

小米10pro使用说明书_入手小米10pro，开箱设置评测，尽在本篇

如何更改恢复win10自带的游戏录制截图保存位置，捕获文件夹误删恢复，WIN10截图快捷方式

JAVA生成PDF标点符号不换行,生成的pdf文件中的文本换行问题

企业必会技能Docker容器、国内镜像源、web界面管理、配置镜像仓库、镜像加速器、超细详解

主机屋终生版本服务器，是否值得

热门文章

爬虫爬取QQ号

javamail使用qq邮箱发送邮件失败的解决方法

局域网下别人可以连接共享打印机，我不可以

【linuxdocker】解决ORA-28000: the account is locked

Linux下打开java控制面板、设置安全等级

Arcgis Online - FeatureLayer篇

ArcGIS JavaScript for API（007）featurelayer 要素查询，查询指定范围内包含要素featurelayer .queryFeatures。

opencv4(四)feature2d与xfeature2d模块中的Feature2D类

计算机没桌面,电脑桌面的计算机图标没了怎么办

vue 做的酷狗音乐网页版 ，酷狗音乐网页版，ui界面模仿原生酷狗音乐

最新文章

服务器如何开启电脑的虚拟化技术,win7怎么打开vt虚拟化技术|win7在bios开启vt虚化的方法...

windows7的用户账户控制每次重启计算机时都会被关闭,win7系统更改设置总是弹出用户账户控制的解决方法...

驰为vi10旗舰版linux,驰为Vi10平板电脑完全安装Win10步骤 BY Chinasred

windows7系统屏幕一直闪屏的解决教程

windows7电脑删除文件特别慢的解决方法

win7系统打印机开启服务器,开启打印机服务【设置模式】

服务器真在运行中,win7电脑服务器正在运行中的解决教程

windows 从命令行启动进入系统

计算机文件预览取消,关闭视频文件预览，保留图片文件预览（windows7） -电脑资料...

Win7 64位旗舰版系统取消电脑开机自动检测硬盘的方法

windows7 64位旗舰版 完美安装64位Oracle11g+32位plsql

windows7现实计算机内存不足,win7 64位有剩余空间却提示内存不足的解决方法

Windows7共享文档—开启方法及用户权限设置

计算机管理记事本,win7旗舰版系统下自带记事本的强大功能汇总【图文详解】...

计算机全盘搜索功能不见了,新萝卜家园win7旗舰版电脑中的搜索功能不见了怎么办...

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

解决xgboost报错： ValueError: feature_names mismatch

vue 做的酷狗音乐网页版，酷狗音乐网页版，ui界面模仿原生酷狗音乐

windows7 64位旗舰版完美安装64位Oracle11g+32位plsql

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载