议程:

项目:

  1. 第三方后端重构更新。

  2. AMD 关于重构后端和新流程体验的更新。

  3. 计划将 Intel XPU 后端恢复为第三方模块。

  4. 公开讨论。

会议纪要:

录音链接在此

  1. 第三方后端重构更新。

    • 后端是 passes,IRs 由后端共享,以避免分歧和重复,这样开发人员就不必更改 Triton 源代码。

    • 要在目录中发现后端分支,请在 setup.py 中放置环境变量。

    • 后端可以链接任何它们想要的库,它们不需要复制粘贴 Nvidia 代码。

    • Nvidia 使用与其他后端相同的 API(C++ 代码的重构仍在进行中)。Nvidia 代码没有特殊处理。

    • 如果 Triton 依赖项在主分支之上,那么它将适用于分支/forks。

    • 仍待完成:LLVM IR 转换 – 可重用模式重写器更新;降低 Triton GPU 中状态性的复杂性 – 继承自基础模式。

  2. AMD 关于重构后端和新流程体验的更新。

    • 因时间不足而跳过。将在二月会议中涵盖。

  3. 计划将 Intel XPU 后端恢复为第三方模块。

    • 上游前提条件 – 将考虑系统硬件和软件,性能达到 Nvidia 的约 80%,以允许上游。

    • 考虑允许上游对于 AI 研究的有用性 – 因为它会影响后端的维护成本。

    • 没有计划将移动后端上游。

    • 英特尔将与 OpenAI 进行线下讨论,以实现in-tree集成。