triton.language.extra.cuda

程序化依赖启动

gdc_wait

GDC wait 是一种阻塞指令,它会等待前一个内核中的所有指令完成后再继续执行。

gdc_launch_dependents

当通过程序化依赖启动方式调用时,该操作会发出信号,表示一旦当前内核中的所有程序都调用了此函数或执行完毕,下一个程序即可启动。