Skip to content

Commit b6c86eb

Browse files
committed
ehancement(cuda): 优化rearrange算子,并使其支持多维张量
需要注意目前 ARRAY_SIZE 的大小是5,该常亮与可接受的Tensor的维度有关,但太大会导致kernel计算量增大 Operator 需要用到max_warps_block,warp_size来辅助计算,目前并未用到 block_size 目前固定位256,可进一步优化
1 parent 30a518f commit b6c86eb

File tree

2 files changed

+468
-130
lines changed

2 files changed

+468
-130
lines changed

0 commit comments

Comments
 (0)