triton.language¶
编程模型¶
表示 N 维值或指针数组。 |
|
表示全局内存中的张量的描述符。 |
|
返回沿给定 |
|
返回沿给定 |
创建操作¶
返回半开区间 |
|
连接给定的块 |
|
返回一个张量,其中填充了给定 |
|
返回一个张量,其中填充了给定 |
|
返回一个与给定张量具有相同形状和类型的零张量。 |
|
将张量转换为给定的 |
形状操作¶
尝试将两个给定块广播到共同兼容的形状。 |
|
尝试将给定张量广播到新的 |
|
通过插入新的长度为 1 的维度来扩展张量的形状。 |
|
沿最后一个维度交错两个张量的值。 |
|
将给定的张量连接到一个新的次要维度中。 |
|
置换张量的维度。 |
|
返回 |
|
返回一个张量,其元素数量与输入相同,但具有提供的形状。 |
|
沿最后一个维度将张量拆分为两部分,其大小必须为 2。 |
|
置换张量的维度。 |
|
返回一个张量,其元素与 input 相同,但形状不同。 |
线性代数操作¶
返回两个块的矩阵乘积。 |
|
以微缩放格式返回两个块的矩阵乘积。 |
内存/指针操作¶
返回一个数据张量,其值从 pointer 定义的内存位置加载 |
|
将数据张量存储到 pointer 定义的内存位置。 |
|
创建一个张量描述符对象 |
|
从张量描述符加载数据块。 |
|
将数据块存储到张量描述符。 |
|
返回指向父张量中块的指针 |
|
移动块指针 |
索引操作¶
沿维度 dim 翻转张量 x。 |
|
根据 |
|
对于每组 size_g 行,将行主序 size_i * size_j 矩阵的索引转换为列主序矩阵的索引。 |
数学操作¶
计算 |
|
计算 |
|
计算 |
|
将输入张量 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
归约操作¶
返回 |
|
返回 |
|
返回 |
|
返回 |
|
沿提供的 |
|
返回 |
|
返回 |
扫描/排序操作¶
沿提供的 |
|
返回 |
|
返回 |
|
根据输入张量计算直方图,其中包含 num_bins 个 bin,bin 的宽度为 1,从 0 开始。 |
|
返回沿指定维度输入张量的 k 个最大元素。 |
|
沿给定维度从张量中收集。 |
原子操作¶
在 |
|
在 |
|
在 |
|
在 |
|
在 |
|
在 |
|
在 |
|
在 |
随机数生成¶
给定一个 |
|
给定一个 |
|
给定一个 |
|
给定一个 |
迭代器¶
永远向上计数的迭代器。 |
|
永远向上计数的迭代器。 |
内联汇编¶
对张量执行内联汇编。 |
编译器提示操作¶
允许编译器假设 |
|
插入一个屏障以同步块中的所有线程。 |
|
告知编译器 |
|
告知编译器 |
|
告知编译器 |
调试操作¶
在编译时打印值。 |
|
在编译时断言条件。 |
|
在运行时从设备打印值。 |
|
在运行时从设备断言条件。 |