[08章中的规约算法]如果数组长度不是block_size的整倍数为什么不会越界呢 #38

Hukongtao · 2024-11-28T15:20:08Z

代码段：
https://github.com/brucefan1983/CUDA-Programming/blob/master/src/08-shared-memory/reduce2gpu.cu#L48

如果数组长度不能整除以block_size，那么对于最后一个线程块，tid + offset不是会大于block_size吗？为什么不会越界呢？而且计算结果也是正确的。

fever-Wong · 2024-11-28T15:20:42Z

谢谢，您发给我的邮件已经收到，我会尽快处理。Thank you,the email you sent me has been received and I will handle it as soon as possible.王景博fever wong

brucefan1983 · 2024-11-28T15:43:09Z

如果不能整除，是会有问题的。这也就是为啥后面会讨论使用共享内存的做法。

brucefan1983 · 2024-11-28T15:44:08Z

书也强调了这一点的。你可以看src/文件夹中的PDF书稿。

Hukongtao · 2024-11-29T03:37:53Z

书也强调了这一点的。你可以看src/文件夹中的PDF书稿。

对我看书上是说需要整除。但是我跑的时候给了个不能整除的例子，发现结果也是没有问题的。所以比较迷惑

brucefan1983 · 2024-11-29T06:52:01Z

那也许是运气了。

Provide feedback