议程:¶
项目:¶
英特尔更新
AMD 更新
性能分析器更新
我们正在过渡到专业版 Slack 计划,以便所有人都能查看历史记录。预计这将需要几周时间。
我们仍在努力敲定一份关于我们技术治理结构的文件。预计这也需要几周时间。4. 公开讨论。
会议纪要:¶
录像链接在此
英特尔 GPU 与 Triton 和 PyTorch 的集成
PyTorch 没有强烈要求特定后端成为 Triton 官方发布的一部分。
可以使用单独的分支/fork 进行 CI/CD 和测试。
英特尔团队将与 PyTorch 线下合作以完成此项工作。
AMD GPU 后端更新
AMD 团队分享了 AMD 后端重构后的设计。
新设计模块化,减少了上游 Triton 中的冗余和重复。
回归测试和安全运行器仍需进一步工作。
Proton 性能分析器更新
来自 OpenAI 团队的 Keren 介绍了一款新的 Triton 内核性能分析工具,该工具支持多种供应商、指标和格式。
概述了该工具开源、集成和扩展的计划。