triton.experimental.gluon.language.amd.rdna4.wmma

triton.experimental.gluon.language.amd.rdna4.wmma(a, b, acc, _semantic=None)

使用 AMD WMMA 指令计算 a * b + acc 的矩阵乘法。

参数:
  • a (tensor) – 参与乘法的运算数 a。

  • b (tensor) – 参与乘法的运算数 b。

  • acc (tensor) – 累加器张量。