admin管理员组

文章数量:1591100

pycuda安装与使用

1.安装

(1)找到适合自己Python解释器和CUDA的pycuda版本
在这个网站上下载网站找到Pycuda

网站首页

找到pycuda


如:pycuda‑2020.1+cuda101‑cp37‑cp37m‑win_amd64.whl
pycuda‑2020.1表示pycuda版本为 2020.1
cuda101表示对应cuda版本为10.1
cp37表示Python解释器版本为3.7
找到对应的版本即可,这里可以不下载,用pip命令下载安装

(2)安装

pip install pycuda == 2020.1
这样就装好了!
**注意:**一定对应好自己的CUDA和Python版本
我的是python3.7.6和CUDA10.1

2. 简单使用

import pycuda.autoinit
import pycuda.driver as cuda
from pycuda.compiler import SourceModule
import numpy as np
import time

# 核函数编写
mod = SourceModule("""
自己的核函数
""")

函数名 = mod.get_function("自己写的核函数名")

if __name__ == '__main__':
    # 设置矩阵规格
    n = 10000
    block_size = 16 
    # 设置grid和block
    block = (block_size, block_size, 1)
    if n % block_size != 0:
        grid = (n // block_size + 1, n // block_size + 1, 1)
    else:
        grid = (n / /block_size, n // block_size, 1)
    # 执行GPU程序
    函数名(参数)

我的是pycuda的矩阵乘法
运行成功啦
10000 * 10000的矩阵乘法

本文标签: pycuda