M5 competition|电子爱好者

admin管理员组
文章数量:1530022

数据背景

数据前处理

1、数据类型归类->减少内存占用

if df[cols[i]].min() > np.iinfo(np.int8).min and df[cols[i]].max() < np.iinfo(np.int8).max:
                df[cols[i]] = df[cols[i]].astype(np.int8)

2、信息整合->合并三张表单

pd.merge(df, calendar, on='d', how='left')

3、数据探索->统计性指标：不同区域、不同产品价格均值、时间热力图

df.groupby(['store_id','cat_id','item_id'],as_index=False)['sell_price'].mean().dropna()

特征工程

1、category encoding

for i,type in enumerate(types):
    if type.name == 'category':
        df[cols[i]] = df[cols[i]].cat.codes

2、特征构建->频数特征、过去一段时间统计特征

df['iteam_sold_avg'] = df.groupby('item_id')['sold'].transform('mean').astype(np.float16)
df['rolling_sold_mean'] = df.groupby(['id', 'item_id', 'dept_id', 'cat_id', 'store_id', 'state_id'])['sold'].transform(lambda x: x.rolling(window=7).mean()).astype(np.float16)

建立模型

df.to_pickle('data.pkl')
del df
gc.collect();
data = pd.read_pickle('data.pkl')

model = LGBMRegressor(
        n_estimators=1000,
        learning_rate=0.3,
        subsample=0.8,
        colsample_bytree=0.8,
        max_depth=8,
        num_leaves=50,
        min_child_weight=300
    )

参考文献

https://www.kaggle/anshuls235/time-series-forecasting-eda-fe-modelling

本文标签： competition

版权声明：本文标题：M5 competition 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1726692933a1080899.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

NOMURA Programming Competition 2020 A Study Scheduling 60进制

1天前

NOMURA Programming Competition 2020 比赛人数6137 比赛开始后10分钟看到A题,在比赛开始后第13分钟看到所有题 NOMURA Programming Competition 2020 A

2009 Competition Highlights by ICPC Live

1天前

2009 Competition Highlights by ICPC Live Links：http:www.youtubewatch?vn0oZRcAz6w0 转载于:https:wwwblogsyew

开源项目 `competition-baseline` 使用教程

1天前

开源项目 competition-baseline 使用教程 competition-baseline数据挖掘、计算机视觉、自然语言处理、推荐系统竞赛知识、代码、思路项目地址:https:gitcodegh_mirrorscoco

开源项目教程：Kaggle-Competition-Favorita

1天前

开源项目教程：Kaggle-Competition-Favorita Kaggle-Competition-Favorita5th place solution for Kaggle competition Favor

zoj 3958 Cooking Competition

1天前

题目链接：Cooking Competition 题目大意，给你四种操作，每种操作的双方会获得不同分数，问你最后谁获胜； 题目思路

2050 Programming Competition(正式赛题解持续更新中及检讨)

1天前

补题ing Pro.IDTitleRatio(AcceptedSubmitted)1001开场白28.83%(350212147)1002时间间隔36.46%(27357501)1003 分宿舍（爆破&

推荐开源项目：Competition - 打造属于你的机器学习竞赛平台！

1天前

推荐开源项目：Competition - 打造属于你的机器学习竞赛平台！ competitions项目地址:https:gitcodegh_mirrorscocompetitions

tianchi电商搜索competition

1天前

文章目录 tianchi电商搜索competition一、环境配置&实践数据下载二、解决方法2.1 tf-idf2.2 dssm tianchi电商搜索competition 比赛：地址大体思路&

2019年1-4月份雅思口语题库素材（原创）describe a competition you want to take part in

1天前

Our school holds a badminton competition every year. All students in our school are able to take part in. when I was a f

PWN-COMPETITION-HGAME2022-Week3

1天前

PWN-COMPETITION-HGAME2022-Week3 changeable_noteelder_notesized_note changeable_note edit_note中的gets函数存在堆溢出漏洞本题没有leak函数

Shared bicycles competition problem

1天前

电子科技大学格拉斯哥学院 2017级邢珂诚 Shared bicycles competition Shared bicycles have been operating in China for a few years. The ma

matlab ground,Intelligent Ground Vehicle Competition

1天前

MathWorks is pleased to sponsor Intelligent Ground Vehicle Competition 2019. MathWorks will provide software, training,

re -09 buuctf [BJDCTF2020]BJD hamburger competition

1天前

BJD hamburger competition 题目是一个Unity游戏，可以用dnspy反编译，主逻辑模块代码静态编辑之后存储于Assembly-CSharp.dll文件中。具体参考文章&

用户查询意图检测（CIKM Competition数据挖掘竞赛夺冠算法陈运文）

1天前

原文出处背景 CIKM Cup(或者称为CIKM Competition)是ACM CIKM举办的国际数据挖掘竞赛的名称。CIKM全称是International Conference on Information and Knowled

The Competition

1天前

为什么80%的码农都做不了架构师？>>> 竞争。竞争在资本主义的基本结构中发生（定义）。 “资本主义的基本结构”意味着整个商业竞争的认识论基础不是建

THE CAST TESTING COMPETITION执行测试用例比赛

1天前

I sponsored the testing competition at CAST, last week, awarding $1,426.00 of my own money to the winners. My game, my

Archery Competition

1天前

The Archery Game in the Ranging Guild is the place to go if your accountre looking for Ranging Experience and prizes for

[codeforces 1399C] Boats Competition 桶排序+从总重量出发统计队数+注意边界处理

1天前

Codeforces Round #661 (Div. 3) 参与排名人数12987 [codeforces 1399C] Boats Competition 桶排序从总重量出发统计队数注意边界处理总目录详见https:

HDU 6095 Rikka with Competition

1天前

Rikka with Competition Time Limit: 20001000 MS (JavaOthers) Memory Limit: 6553665536 K (JavaOthers) Total Submis

HDU 6095 Rikka with Competition(思维)

1天前

Rikka with Competition Time Limit: 20001000 MS (JavaOthers) Memory Limit: 6553665536 K (JavaOthers) Total Submis

电子爱好者 - 最新技术资讯及电子产品介绍！

M5 competition

数据背景

数据前处理

1、数据类型归类->减少内存占用

2、信息整合->合并三张表单

3、数据探索->统计性指标：不同区域、不同产品价格均值、时间热力图

特征工程

1、category encoding

2、特征构建->频数特征、过去一段时间统计特征

建立模型

参考文献

更多相关文章

NOMURA Programming Competition 2020 A Study Scheduling 60进制

2009 Competition Highlights by ICPC Live

开源项目 `competition-baseline` 使用教程

开源项目教程：Kaggle-Competition-Favorita

zoj 3958 Cooking Competition

2050 Programming Competition(正式赛题解 持续更新中 及检讨)

推荐开源项目：Competition - 打造属于你的机器学习竞赛平台！

tianchi电商搜索competition

2019年1-4月份雅思口语题库素材（原创）describe a competition you want to take part in

PWN-COMPETITION-HGAME2022-Week3

Shared bicycles competition problem

matlab ground,Intelligent Ground Vehicle Competition

re -09 buuctf [BJDCTF2020]BJD hamburger competition

用户查询意图检测（CIKM Competition数据挖掘竞赛夺冠算法陈运文）

The Competition

THE CAST TESTING COMPETITION执行测试用例比赛

Archery Competition

[codeforces 1399C] Boats Competition 桶排序+从总重量出发统计队数+注意边界处理

HDU 6095 Rikka with Competition

HDU 6095 Rikka with Competition(思维)

发表评论

推荐文章

自己组装电脑配置清单2023 自己组装电脑都需要买什么

html 让360浏览器兼容模式,360浏览器兼容模式的设置方法

手机如何连接无线打印服务器,手机如何设置打印服务器的无线WiFi参数？（适用于 B1版）...

解决虚拟机VM-开启 虚拟化 Intel-VT-xEPT 或 AMD-VRVI（V） 后 电脑蓝屏重启 或显示此平台不支持虚拟化的问题 （Win10）

linux内核amdgpu源码解析

热门文章

Contact form 7插件使用介绍和常见问题解答

Mysql 加号 Contact

安卓模拟器 arm linux,让x86的android模拟器能模拟arm架构系统

ThinkPad联想E431笔记本电脑Win8改BIOS设置启动装Win7

计算机禁止安装游戏,win7系统禁用自动安装游戏应用的详细教程

camtasia2024绿色免费安装包win+mac下载含2024最新激活密钥

电脑黑屏只有鼠标能动

linux设置开机自启动网络,linux设置开机自启动

android三星定位闪退,三星手机闪退问题7种修复方法

C语言C++初学 问题

最新文章

云上武功秘籍（四）金蝶最新产品KIS全版本华为云部署

IDEA 下载、安装、配置和案例

2024年会声会影哪个版本最新版

【杂谈】当当最新购书优惠来了，满300-60，AI好书推荐

2024最新版IntelliJ IDEA安装教程（非常详细）从零基础入门到精通，看完这一篇就够了

Diffblue Cover AI Java：Difflane如何利用Diffblue Cover AI实现Java自动化的单元测试

IDEA新手使用教程（详解）

会声会影哪个版本最新

IDEA2021.2安装与配置（持续更新）

dbeaver-ultimate23.3安装注册免费试用

JAVA之开发神器——IntelliJ IDEA的下载与安装

eset nod32 v11无限试用补丁

会声会影哪个版本最好用?

Ubuntu安装 IDEA

【IntelliJ IDEA 2024 激活及安装教程，亲测可以使用】

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

2050 Programming Competition(正式赛题解持续更新中及检讨)

解决虚拟机VM-开启虚拟化 Intel-VT-xEPT 或 AMD-VRVI（V）后电脑蓝屏重启或显示此平台不支持虚拟化的问题（Win10）

C语言C++初学问题

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载