triton.language.extra.cuda

程序化依赖启动

gdc_wait

GDC wait 是一个阻塞指令,它会等待先前内核中的所有指令完成后再继续。

gdc_launch_dependents

当使用程序化依赖启动时,此操作发出信号,表明一旦当前内核中的所有程序调用此函数或完成,下一个程序就可以启动。