计算时间¶
从 getting-started/tutorials 运行 10 个文件的总执行时间为 18:04.929
示例 |
时间 |
内存 (MB) |
|---|---|---|
融合注意力 ( |
13:08.989 |
0.0 |
矩阵乘法 ( |
02:06.838 |
0.0 |
持久化矩阵乘法 ( |
01:25.823 |
0.0 |
融合 Softmax ( |
00:37.173 |
0.0 |
层归一化 ( |
00:29.256 |
0.0 |
向量加法 ( |
00:09.602 |
0.0 |
分组 GEMM ( |
00:06.130 |
0.0 |
低内存 Dropout ( |
00:00.794 |
0.0 |
Libdevice (tl.extra.libdevice) 函数 ( |
00:00.292 |
0.0 |
分块缩放矩阵乘法 ( |
00:00.033 |
0.0 |