Triton Logo

入门

  • 安装
  • 教程

Python API

  • triton
  • triton.language
  • triton.testing
  • Triton 语义

Gluon

  • 概述
  • 教程
    • Gluon 简介
    • 张量布局
    • Gluon 中的异步复制
    • Gluon 中的 TMA
    • Warp-Group MMA
    • 第五代 TensorCoreTM
    • 持久化内核 (Persistent Kernels)
    • Warp 专门化 (Warp Specialization)
    • 原生 TMA Gather 和 Scatter
    • TCGen05 复制指令
    • 分块缩放矩阵乘法
    • 集群启动控制 (CLC)
    • TMA im2col 模式及通过隐式 GEMM 进行卷积
    • 多 CTA (Multi-CTA)
    • matmul_multicta 基准测试
  • 示例
  • API 参考

Triton MLIR 方言

  • Triton MLIR 方言和操作

编程指南

  • 简介
  • 相关工作
  • 调试 Triton
  • 浮点数清理器 (FpSan)
Triton
  • Gluon 教程
  • 查看页面源

Gluon 教程

这些教程可以在 python/tutorials/gluon 中找到。

Gluon 简介
Gluon 简介
张量布局
张量布局
Gluon 中的异步复制
Gluon 中的异步复制
Gluon 中的 TMA
Gluon 中的 TMA
Warp-Group MMA
Warp-Group MMA
第五代 TensorCore™
第五代 TensorCore™
持久化内核 (Persistent Kernels)
持久化内核 (Persistent Kernels)
Warp 专门化 (Warp Specialization)
Warp 专门化 (Warp Specialization)
原生 TMA Gather 和 Scatter
原生 TMA Gather 和 Scatter
TCGen05 复制指令
TCGen05 复制指令
分块缩放矩阵乘法
分块缩放矩阵乘法
集群启动控制 (CLC)
集群启动控制 (CLC)
TMA im2col 模式及通过隐式 GEMM 进行卷积
TMA im2col 模式及通过隐式 GEMM 进行卷积
多 CTA (Multi-CTA)
多 CTA (Multi-CTA)
上一页 下一页

© 版权所有 2020, Philippe Tillet.

使用 Sphinx 构建,使用了由 Read the Docs 提供的主题。