triton.language¶
编程模型¶
表示 N 维值或指针数组。 |
|
表示全局内存中张量的描述符。 |
|
返回当前程序实例沿给定 |
|
返回沿给定 |
创建操作 (Creation Ops)¶
返回半开区间 |
|
连接给定的块 |
|
返回一个填充了给定 |
|
返回一个填充了给定 |
|
返回一个形状和类型与给定张量相同的零张量。 |
|
将张量转换为给定的 |
形状操作 (Shape Manipulation Ops)¶
尝试将两个给定块广播到共同的兼容形状。 |
|
尝试将给定张量广播到新的 |
|
通过插入新的长度为 1 的维度来扩展张量的形状。 |
|
沿最后维度交错两个张量的值。 |
|
在新的次要维度中连接给定张量。 |
|
置换张量的维度。 |
|
返回 |
|
返回一个元素数量与输入相同但形状不同的张量。 |
|
沿其最后维度将张量分成两半,该维度必须大小为 2。 |
|
置换张量的维度。 |
|
返回一个元素与 input 相同但形状不同的张量。 |
线性代数操作 (Linear Algebra Ops)¶
返回两个块的矩阵乘积。 |
|
返回两个块的微缩放格式的矩阵乘积。 |
内存/指针操作 (Memory/Pointer Ops)¶
返回一个数据张量,其值从 pointer 定义的内存位置加载 |
|
将数据张量存储到 pointer 定义的内存位置。 |
|
创建张量描述符对象 |
|
从张量描述符加载数据块。 |
|
将数据块存储到张量描述符。 |
|
返回父张量中块的指针 |
|
移动块指针 |
索引操作 (Indexing Ops)¶
沿维度 dim 翻转张量 x。 |
|
根据 |
|
将行主序 size_i * size_j 矩阵的索引转换为每个 size_g 行组的列主序矩阵的索引。 |
数学操作 (Math Ops)¶
计算 |
|
计算 |
|
计算 |
|
将输入张量 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
|
计算 |
归约操作 (Reduction Ops)¶
返回 |
|
返回 |
|
返回 |
|
返回 |
|
将 combine_fn 应用于 |
|
返回 |
|
返回 |
扫描/排序操作 (Scan/Sort Ops)¶
将 combine_fn 应用于 |
|
返回 |
|
返回 |
|
根据输入张量计算直方图,具有 num_bins 个箱子,箱子宽度为 1 并从 0 开始。 |
|
沿给定维度从张量中收集。 |
原子操作 (Atomic Ops)¶
在 |
|
在 |
|
在 |
|
在 |
|
在 |
|
在 |
|
在 |
|
在 |
随机数生成¶
给定一个 |
|
给定一个 |
|
给定一个 |
|
给定一个 |
迭代器¶
永远向上计数的迭代器。 |
|
永远向上计数的迭代器。 |
内联汇编¶
在张量上执行内联汇编。 |
编译器提示操作 (Compiler Hint Ops)¶
允许编译器假定 |
|
插入一个屏障以同步块中的所有线程。 |
|
告知编译器 |
|
告知编译器 |
|
告知编译器 |
调试操作 (Debug Ops)¶
在编译时打印值。 |
|
在编译时断言条件。 |
|
从设备在运行时打印值。 |
|
从设备在运行时断言条件。 |