议程:

项目:

  1. 英特尔更新

  2. AMD 更新

  3. 性能分析器更新

  4. 我们正在过渡到专业版 Slack 计划,以便所有人都能查看历史记录。预计这将需要几周时间。

  5. 我们仍在努力敲定一份关于我们技术治理结构的文件。预计这也需要几周时间。4. 公开讨论。

会议纪要:

录像链接在此

  1. 英特尔 GPU 与 Triton 和 PyTorch 的集成

    • PyTorch 没有强烈要求特定后端成为 Triton 官方发布的一部分。

    • 可以使用单独的分支/fork 进行 CI/CD 和测试。

    • 英特尔团队将与 PyTorch 线下合作以完成此项工作。

  2. AMD GPU 后端更新

    • AMD 团队分享了 AMD 后端重构后的设计。

    • 新设计模块化,减少了上游 Triton 中的冗余和重复。

    • 回归测试和安全运行器仍需进一步工作。

  3. Proton 性能分析器更新

    • 来自 OpenAI 团队的 Keren 介绍了一款新的 Triton 内核性能分析工具,该工具支持多种供应商、指标和格式。

    • 概述了该工具开源、集成和扩展的计划。