TVM之Schedule|电子爱好者

admin管理员组
文章数量:1531435

TVM之Schedule

- 1. schedule
- 2. stage
- 3. methods for stage
- - 3.1 split
  - 3.2 tile
  - 3.3 fuse
  - 3.4 reorder
  - 3.5 bind
  - 3.6 compute_at
  - 3.7 compute_inline
  - 3.8 compute_root

最近在阅读TVM官网的文档，在阅读的过程中将keywords以及相应理解记录了下来，有理解不对的地方，欢迎批评指正~~
update：2019/07/07 凌晨更新，欢迎提意见，欢迎来喷 ?

官网文档地址：Schedule Primitives in TVM

1. schedule

There often exist several methods to compute the same result, however, different methods will result in different locality and performance. So TVM asks user to provide how to execute the computation called Schedule. [摘自官方文档]

在描述了算子逻辑之后，用户需要告诉TVM如何具体地计算。通常情况下，有多种方式可以计算得到相同的结果，但是执行起来的效率可能相差很大，例如计算从1累加到100的结果，就有如下两种方式。因此，使用方式1还是方式2，这个过程就是schedule。

int sum = 0;

//第一种方式：循环累加
for(int i=1; i<101, i++)
{
   
    sum = sum + i;
}

//第二种方式：公式计算
sum = (1 + 100) * 50;

如下的例子中，计算shape均为(m,n)的两个tensor的乘积：

A = tvm.placeholder((m, n), name='A')
B = tvm.placeholder((m, n), name='B')
C = tvm.compute((m, n), lambda i, j: A[i, j] * B[i, j], name='C')

s = tvm.create_schedule([C.op])
# lower will transform the computation from definition to the real
# callable function. With argument `simple_mode=True`, it will
# return you a readable C like statement, we use it here to print the
# schedule result.
print(tvm.lower(s, [A, B, C], simple_mode=True))

使用tvm.create_schedule会产生一个默认的schedule。该默认的schedule如下所示，通过两层for循环计算C每个元素的积，该schedule未经过优化操作。

produce C {
   
  for (i, 0, m) {
   
    for (j, 0, n) {
   
      C[((i*n) + j)] = (A[((i*n) + j)]*B[((i*n) + j)])
    }
  }
}

2. stage

One schedule is composed by multiple stages, and one Stage represents schedule for one operation. We provide various methods to schedule every stage. [摘自官方文档]

此时引入了Stage的概念，一个完整的schedule包含多个stage，而每个stage是对一个操作的schedule。这里stage姑且理解为sub schedule。

TVM中有很多的方法可以用于每个stage。可以理解为，这些方法可用于优化默认的schedule。

3. methods for stage

3.1 split

split can split a specified axis into two axises by factor. [摘自官方文档]

该函数可以将tensor按某个指定的轴进行切分，如下的例子中计算tensor A 乘以标量2的结果，默认的schedule为一个for(int i=0; i<m-1; i++)的一个for循环，通过如下的例子中的split函数，可以将一个for循环切割成两个嵌套的循环。

A = tvm.placeholder((m,), name='A')
B = tvm.compute((m,), lambda i: A[i]*2, name='B')

s = tvm.create_schedule(B.op)
xo, xi = s[B].split(B.op.axis[0], factor=32)
print(tvm.lower(s, [A, B], simple_mode=True))

split之后的schedule如下所示，假设m=35，则A的shape为(35,)，且A的最后一个值为A[34]。split之后的计算过程变为两层for循环，其中i.outer的取值范围为[0,1]，当i.outer为0时，i.inner的取值范围为[0,31]。当i.outer为1时，i.inner的取值范围为[0,2]。因此最后一个值的计算过程为：B[32+2] = A[32+2] * 2。

produce B {
   
  for (i.outer, 0, ((m + 31)/32)) {
   
    for (i.inner, 0, 32) {
   
      if (likely(((i.outer*32) < (m - i.inner)))) {
   
        B[((i.outer*32) + i.inner)] = (A[((i.outer*32) + i.inner)]*2.000000f)
      }
    }
  }
}

3.2 tile

tile help you execute the computation tile by tile over two axises. [摘自官方文档]

该函数类似于split，区别是tile可以对2层for循环进行split操作。如下代码所示，其功能为输出一个与输入tensor A内容相同的tensor B。默认的schedule为for(int i=0; i<m-1; i++)与for(int j=0; j<n-1; j++)的两层for循环。通过tile可以指定0号轴按10进行切分，指定1号轴按5进行切分。

A = tvm.placeholder((m, n

本文标签： TVM schedule

版权声明：本文标题：TVM之Schedule 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1725779740a1042126.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

TVM之Schedule

TVM之Schedule

1. schedule

2. stage

3. methods for stage

3.1 split

3.2 tile

更多相关文章

java schedule 用法_java定时器的几种用法

不同环境下控制@Schedule 开启

关于cocos2dx中scheduleUpdate和schedule方法的一点测试

Python3学习（八）：使用schedule模块定时执行任务

SpringBoot Schedule 配置线程池

Linux schedule 1、调度的时刻

scheduleAtFixedRate与schedule区别

Python定时任务： schedule模块

ichat模块schedule模块运行遇到的错误

K8S学习之定时任务CronJob配置schedule参数详解

在java中使用@Schedule注解实现定时任务

哈工大操作系统学习笔记八——schedule函数

记录一次排查@Schedule不生效的问题

@Schedule定时任务

使用node-schedule时的注意点

python中的schedule模块定时执行任务

timer中schedule和scheduleAtFixedRate的区别

schedule定时任务修改表达式无效

import schedule ImportError: No module named schedule

时间自动过期解决方案之node-schedule

发表评论

推荐文章

windows10系统eclipse安装

U盘文件夹变成.exe文件的解决方法

2345浏览器怎么换主页 2345浏览器换主页教程

Windows操作系统：指定网卡ping连通性

【2024最新版】超详细Aircrack-ng安装保姆级教程，破译WiFi，收藏这一篇就够了

热门文章

亲测好用，ChatGPT 3.54.0新手使用手册，最全论文指令手册~ 【2024年9月 更新】

格式化 U盘TF卡SD卡 出错！！“windows无法完成格式化”解决办法。

广西专业技术职称服务平台个人版_2020年广西人才市场职称网，如何修改你的注册信息填错...

让Chrome浏览器下载而非打开文件

win10快捷键大全 win10常用快捷键

VMware虚拟机开机黑屏怎么办？虚拟机开机就黑屏的完美解决办法

IBM 3650 M4服务器问题总结

暴力递归&amp;动态规划

WiFi（Wireless Fidelity）基础（六）

Tuxera NTFS2022mac电脑无法读取写入移动硬盘如何解决?

最新文章

win7 插入鼠标自动禁用触摸板

appium环境搭建时，win7系统“adb devices”无法识别手机设备问题处理

win7计算机桌面文件位置更改,Win7小技巧：更改用户文件夹位置方法汇总

win7虚拟计算机名,Win7笔记本电脑启用虚拟wifi共享上网（图文介绍）

小米笔记安装双系统linux,小米笔记本电脑怎么安装双系统？-小米win7

win7 硬盘变成移动设备_MacBook Pro硬盘改造有技巧，维修师傅便宜盘改原装，省了近千元...

lenovo联想Legion Y9000P IRX8H 2023款(82WQ)原装出厂Windows11系统

小米笔记本Air 13.3（第7代CPU平台驱动 指纹版）安装WIN7

ASUS华硕ROG幻13笔记本电脑GV301QE原厂Windows10系统

Thinkpad E475换装Win7后，网络连接无故中断无法再次连接的问题

lenovo联想笔记本小新 潮7000-14IKBR 2018款(81GA)原装出厂Windows10系统镜像

炫龙毒刺x6 安装win7+ubuntu16.04双系统

ThinkPad T430 安装Win7 64Bit

ASUS华硕天选5笔记本电脑FX607JV原装出厂Win11系统下载

hp z230计算机系统,hp z230 工作站,怎么样安装windows 7 64位系统?

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

亲测好用，ChatGPT 3.54.0新手使用手册，最全论文指令手册~ 【2024年9月更新】

格式化 U盘TF卡SD卡出错！！“windows无法完成格式化”解决办法。

暴力递归&动态规划

小米笔记本Air 13.3（第7代CPU平台驱动指纹版）安装WIN7

lenovo联想笔记本小新潮7000-14IKBR 2018款(81GA)原装出厂Windows10系统镜像

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载