计算时间¶
17:46.738 10 个文件的总执行时间 来自 getting-started/tutorials
示例 |
时间 |
内存 (MB) |
---|---|---|
融合注意力 ( |
13:09.208 |
0.0 |
矩阵乘法 ( |
02:08.338 |
0.0 |
持久化矩阵乘法 ( |
01:07.788 |
0.0 |
融合 Softmax ( |
00:35.218 |
0.0 |
层归一化 ( |
00:29.112 |
0.0 |
向量加法 ( |
00:10.160 |
0.0 |
分组 GEMM ( |
00:05.930 |
0.0 |
低内存丢弃 ( |
00:00.736 |
0.0 |
Libdevice (tl.extra.libdevice) 函数 ( |
00:00.239 |
0.0 |
块缩放矩阵乘法 ( |
00:00.010 |
0.0 |