triton.language.extra.cuda.gdc_wait

triton.language.extra.cuda.gdc_wait()

GDC wait 是一个阻塞指令,它等待前一个内核中的所有指令完成后再继续。这确保了在等待之前发生的所有内存操作对于等待之后的指令是可见的,例如,如果前一个内核写入地址“x”,则在等待之后,新值将在当前内核中可见。

当禁用程序化依赖启动时,此指令也可以安全执行。

有关更多详细信息,请参阅 https://docs.nvda.net.cn/cuda/parallel-thread-execution/index.html#parallel-synchronization-and-communication-instructions-griddepcontrol