入门
Python API
Gluon
Triton MLIR 方言
编程指南
使用 AMD WMMA 指令计算 a * b + acc 的矩阵乘法。
a (tensor) – 参与乘法的运算数 a。
b (tensor) – 参与乘法的运算数 b。
acc (tensor) – 累加器张量。