triton.language.extra.cuda

程序化依赖启动

gdc_wait

GDC wait 是一个阻塞指令,它会等待前一个内核中的所有指令完成,然后才继续执行。

gdc_launch_dependents

当通过程序化依赖启动调用此操作时,它会发出信号,表明一旦当前内核中的所有程序都调用此函数或完成,下一个程序就可以启动了。