NVIDIA · Flamefire · Aug 11, 2025 · hwu36 · Aug 13, 2025 · alihassanijr
diff --git a/examples/common/dist_gemm_helpers.h b/examples/common/dist_gemm_helpers.h
@@ -60,7 +60,9 @@ using AtomicBoolean = cuda::atomic<bool>;
 
 __global__ void delay_kernel(const AtomicBoolean* atomic_flag_ptr) {
   while (not atomic_flag_ptr->load()) {
+#if defined(__CUDA_ARCH__) && __CUDA_ARCH__ >= 700
     __nanosleep(40);
+#endif
   }
 }