议程:¶
项目:¶
第三方后端重构更新。
AMD 关于重构后端和新流程体验的更新。
计划将 Intel XPU 后端恢复为第三方模块。
公开讨论。
会议纪要:¶
录音链接在此
第三方后端重构更新。
后端是 passes,IRs 由后端共享,以避免分歧和重复,这样开发人员就不必更改 Triton 源代码。
要在目录中发现后端分支,请在 setup.py 中放置环境变量。
后端可以链接任何它们想要的库,它们不需要复制粘贴 Nvidia 代码。
Nvidia 使用与其他后端相同的 API(C++ 代码的重构仍在进行中)。Nvidia 代码没有特殊处理。
如果 Triton 依赖项在主分支之上,那么它将适用于分支/forks。
仍待完成:LLVM IR 转换 – 可重用模式重写器更新;降低 Triton GPU 中状态性的复杂性 – 继承自基础模式。
AMD 关于重构后端和新流程体验的更新。
因时间不足而跳过。将在二月会议中涵盖。
计划将 Intel XPU 后端恢复为第三方模块。
上游前提条件 – 将考虑系统硬件和软件,性能达到 Nvidia 的约 80%,以允许上游。
考虑允许上游对于 AI 研究的有用性 – 因为它会影响后端的维护成本。
没有计划将移动后端上游。
英特尔将与 OpenAI 进行线下讨论,以实现in-tree集成。