Use specialized functor for multiplying or adding complex inputs

ndgrigorian · ndgrigorian · commit c0ca6cb17e7e · 2025-04-30T18:35:20.000-07:00
converts to experimental sycl complex values, then performs math operations
diff --git a/dpctl/tensor/libtensor/include/utils/math_utils.hpp b/dpctl/tensor/libtensor/include/utils/math_utils.hpp
@@ -154,6 +154,20 @@ template <typename T> T logaddexp(T x, T y)
     }
 }
 
+template <typename T> T plus_complex(const T &x1, const T &x2)
+{
+    using realT = typename T::value_type;
+    using sycl_complexT = exprm_ns::complex<realT>;
+    return T(sycl_complexT(x1) + sycl_complexT(x2));
+}
+
+template <typename T> T multiplies_complex(const T &x1, const T &x2)
+{
+    using realT = typename T::value_type;
+    using sycl_complexT = exprm_ns::complex<realT>;
+    return T(sycl_complexT(x1) * sycl_complexT(x2));
+}
+
 } // namespace math_utils
 } // namespace tensor
 } // namespace dpctl
diff --git a/dpctl/tensor/libtensor/include/utils/sycl_utils.hpp b/dpctl/tensor/libtensor/include/utils/sycl_utils.hpp
@@ -298,7 +298,11 @@ T custom_inclusive_scan_over_group(GroupT &&wg,
     return scan_val;
 }
 
-// Reduction functors
+// Define identities and operator checking structs
+
+template <typename Op, typename T, typename = void> struct GetIdentity
+{
+};
 
 // Maximum
 
@@ -324,38 +328,6 @@ template <typename T> struct Maximum
     }
 };
 
-// Minimum
-
-template <typename T> struct Minimum
-{
-    T operator()(const T &x, const T &y) const
-    {
-        if constexpr (detail::IsComplex<T>::value) {
-            using dpctl::tensor::math_utils::min_complex;
-            return min_complex<T>(x, y);
-        }
-        else if constexpr (std::is_floating_point_v<T> ||
-                           std::is_same_v<T, sycl::half>)
-        {
-            return (std::isnan(x) || x < y) ? x : y;
-        }
-        else if constexpr (std::is_same_v<T, bool>) {
-            return x && y;
-        }
-        else {
-            return (x < y) ? x : y;
-        }
-    }
-};
-
-// Define identities and operator checking structs
-
-template <typename Op, typename T, typename = void> struct GetIdentity
-{
-};
-
-// Maximum
-
 template <typename T, class Op>
 using IsMaximum = std::bool_constant<std::is_same_v<Op, sycl::maximum<T>> ||
                                      std::is_same_v<Op, Maximum<T>>>;
@@ -389,6 +361,28 @@ struct GetIdentity<Op,
 
 // Minimum
 
+template <typename T> struct Minimum
+{
+    T operator()(const T &x, const T &y) const
+    {
+        if constexpr (detail::IsComplex<T>::value) {
+            using dpctl::tensor::math_utils::min_complex;
+            return min_complex<T>(x, y);
+        }
+        else if constexpr (std::is_floating_point_v<T> ||
+                           std::is_same_v<T, sycl::half>)
+        {
+            return (std::isnan(x) || x < y) ? x : y;
+        }
+        else if constexpr (std::is_same_v<T, bool>) {
+            return x && y;
+        }
+        else {
+            return (x < y) ? x : y;
+        }
+    }
+};
+
 template <typename T, class Op>
 using IsMinimum = std::bool_constant<std::is_same_v<Op, sycl::minimum<T>> ||
                                      std::is_same_v<Op, Minimum<T>>>;
@@ -422,19 +416,55 @@ struct GetIdentity<Op,
 
 // Plus
 
+template <typename T> struct Plus
+{
+    T operator()(const T &x, const T &y) const
+    {
+        if constexpr (detail::IsComplex<T>::value) {
+            using dpctl::tensor::math_utils::plus_complex;
+            return plus_complex<T>(x, y);
+        }
+        else {
+            return sycl::plus<T>(x, y);
+        }
+    }
+};
+
 template <typename T, class Op>
 using IsPlus = std::bool_constant<std::is_same_v<Op, sycl::plus<T>> ||
-                                  std::is_same_v<Op, std::plus<T>>>;
+                                  std::is_same_v<Op, std::plus<T>> ||
+                                  std::is_same_v<Op, Plus<T>>>;
 
 template <typename T, class Op>
 using IsSyclPlus = std::bool_constant<std::is_same_v<Op, sycl::plus<T>>>;
 
+template <typename Op, typename T>
+struct GetIdentity<Op, T, std::enable_if_t<IsPlus<T, Op>::value>>
+{
+    static constexpr T value = static_cast<T>(0);
+};
+
 // Multiplies
 
+template <typename T> struct Multiplies
+{
+    T operator()(const T &x, const T &y) const
+    {
+        if constexpr (detail::IsComplex<T>::value) {
+            using dpctl::tensor::math_utils::multiplies_complex;
+            return multiplies_complex<T>(x, y);
+        }
+        else {
+            return sycl::multiplies<T>(x, y);
+        }
+    }
+};
+
 template <typename T, class Op>
 using IsMultiplies =
     std::bool_constant<std::is_same_v<Op, sycl::multiplies<T>> ||
-                       std::is_same_v<Op, std::multiplies<T>>>;
+                       std::is_same_v<Op, std::multiplies<T>> ||
+                       std::is_same_v<Op, Multiplies<T>>>;
 
 template <typename T, class Op>
 using IsSyclMultiplies =
diff --git a/dpctl/tensor/libtensor/source/accumulators/cumulative_prod.cpp b/dpctl/tensor/libtensor/source/accumulators/cumulative_prod.cpp
@@ -46,6 +46,7 @@ namespace py_internal
 
 namespace su_ns = dpctl::tensor::sycl_utils;
 namespace td_ns = dpctl::tensor::type_dispatch;
+namespace tu_ns = dpctl::tensor::type_utils;
 
 namespace impl
 {
@@ -133,9 +134,12 @@ struct TypePairSupportDataForProdAccumulation
 };
 
 template <typename T>
-using CumProdScanOpT = std::conditional_t<std::is_same_v<T, bool>,
-                                          sycl::logical_and<T>,
-                                          sycl::multiplies<T>>;
+using CumProdScanOpT =
+    std::conditional_t<std::is_same_v<T, bool>,
+                       sycl::logical_and<T>,
+                       std::conditional_t<tu_ns::is_complex_v<T>,
+                                          su_ns::Multiplies<T>,
+                                          sycl::multiplies<T>>>;
 
 template <typename fnT, typename srcTy, typename dstTy>
 struct CumProd1DContigFactory
diff --git a/dpctl/tensor/libtensor/source/accumulators/cumulative_sum.cpp b/dpctl/tensor/libtensor/source/accumulators/cumulative_sum.cpp
@@ -34,6 +34,7 @@
 #include "kernels/accumulators.hpp"
 #include "utils/sycl_utils.hpp"
 #include "utils/type_dispatch_building.hpp"
+#include "utils/type_utils.hpp"
 
 namespace py = pybind11;
 
@@ -46,6 +47,7 @@ namespace py_internal
 
 namespace su_ns = dpctl::tensor::sycl_utils;
 namespace td_ns = dpctl::tensor::type_dispatch;
+namespace tu_ns = dpctl::tensor::type_utils;
 
 namespace impl
 {
@@ -133,8 +135,10 @@ struct TypePairSupportDataForSumAccumulation
 };
 
 template <typename T>
-using CumSumScanOpT = std::
-    conditional_t<std::is_same_v<T, bool>, sycl::logical_or<T>, sycl::plus<T>>;
+using CumSumScanOpT = std::conditional_t<
+    std::is_same_v<T, bool>,
+    sycl::logical_or<T>,
+    std::conditional_t<tu_ns::is_complex_v<T>, su_ns::Plus<T>, sycl::plus<T>>>;
 
 template <typename fnT, typename srcTy, typename dstTy>
 struct CumSum1DContigFactory
diff --git a/dpctl/tensor/libtensor/source/reductions/prod.cpp b/dpctl/tensor/libtensor/source/reductions/prod.cpp
@@ -31,7 +31,9 @@
 #include <vector>
 
 #include "kernels/reductions.hpp"
+#include "utils/sycl_utils.hpp"
 #include "utils/type_dispatch_building.hpp"
+#include "utils/type_utils.hpp"
 
 #include "reduction_atomic_support.hpp"
 #include "reduction_over_axis.hpp"
@@ -45,7 +47,9 @@ namespace tensor
 namespace py_internal
 {
 
+namespace su_ns = dpctl::tensor::sycl_utils;
 namespace td_ns = dpctl::tensor::type_dispatch;
+namespace tu_ns = dpctl::tensor::type_utils;
 
 namespace impl
 {
@@ -256,9 +260,11 @@ struct ProductOverAxisTempsStridedFactory
         if constexpr (TypePairSupportDataForProductReductionTemps<
                           srcTy, dstTy>::is_defined)
         {
-            using ReductionOpT = std::conditional_t<std::is_same_v<dstTy, bool>,
-                                                    sycl::logical_and<dstTy>,
-                                                    sycl::multiplies<dstTy>>;
+            using ReductionOpT = std::conditional_t<
+                std::is_same_v<dstTy, bool>, sycl::logical_and<dstTy>,
+                std::conditional_t<tu_ns::is_complex_v<dstTy>,
+                                   su_ns::Multiplies<dstTy>,
+                                   sycl::multiplies<dstTy>>>;
             return dpctl::tensor::kernels::
                 reduction_over_group_temps_strided_impl<srcTy, dstTy,
                                                         ReductionOpT>;
@@ -315,9 +321,11 @@ struct ProductOverAxis1TempsContigFactory
         if constexpr (TypePairSupportDataForProductReductionTemps<
                           srcTy, dstTy>::is_defined)
         {
-            using ReductionOpT = std::conditional_t<std::is_same_v<dstTy, bool>,
-                                                    sycl::logical_and<dstTy>,
-                                                    sycl::multiplies<dstTy>>;
+            using ReductionOpT = std::conditional_t<
+                std::is_same_v<dstTy, bool>, sycl::logical_and<dstTy>,
+                std::conditional_t<tu_ns::is_complex_v<dstTy>,
+                                   su_ns::Multiplies<dstTy>,
+                                   sycl::multiplies<dstTy>>>;
             return dpctl::tensor::kernels::
                 reduction_axis1_over_group_temps_contig_impl<srcTy, dstTy,
                                                              ReductionOpT>;
@@ -336,9 +344,11 @@ struct ProductOverAxis0TempsContigFactory
         if constexpr (TypePairSupportDataForProductReductionTemps<
                           srcTy, dstTy>::is_defined)
         {
-            using ReductionOpT = std::conditional_t<std::is_same_v<dstTy, bool>,
-                                                    sycl::logical_and<dstTy>,
-                                                    sycl::multiplies<dstTy>>;
+            using ReductionOpT = std::conditional_t<
+                std::is_same_v<dstTy, bool>, sycl::logical_and<dstTy>,
+                std::conditional_t<tu_ns::is_complex_v<dstTy>,
+                                   su_ns::Multiplies<dstTy>,
+                                   sycl::multiplies<dstTy>>>;
             return dpctl::tensor::kernels::
                 reduction_axis0_over_group_temps_contig_impl<srcTy, dstTy,
                                                              ReductionOpT>;
diff --git a/dpctl/tensor/libtensor/source/reductions/sum.cpp b/dpctl/tensor/libtensor/source/reductions/sum.cpp
@@ -31,7 +31,9 @@
 #include <vector>
 
 #include "kernels/reductions.hpp"
+#include "utils/sycl_utils.hpp"
 #include "utils/type_dispatch_building.hpp"
+#include "utils/type_utils.hpp"
 
 #include "reduction_atomic_support.hpp"
 #include "reduction_over_axis.hpp"
@@ -45,7 +47,9 @@ namespace tensor
 namespace py_internal
 {
 
+namespace su_ns = dpctl::tensor::sycl_utils;
 namespace td_ns = dpctl::tensor::type_dispatch;
+namespace tu_ns = dpctl::tensor::type_utils;
 
 namespace impl
 {
@@ -256,9 +260,10 @@ struct SumOverAxisTempsStridedFactory
         if constexpr (TypePairSupportDataForSumReductionTemps<
                           srcTy, dstTy>::is_defined)
         {
-            using ReductionOpT =
-                std::conditional_t<std::is_same_v<dstTy, bool>,
-                                   sycl::logical_or<dstTy>, sycl::plus<dstTy>>;
+            using ReductionOpT = std::conditional_t<
+                std::is_same_v<dstTy, bool>, sycl::logical_or<dstTy>,
+                std::conditional_t<tu_ns::is_complex_v<dstTy>,
+                                   su_ns::Plus<dstTy>, sycl::plus<dstTy>>>;
             return dpctl::tensor::kernels::
                 reduction_over_group_temps_strided_impl<srcTy, dstTy,
                                                         ReductionOpT>;
@@ -315,9 +320,10 @@ struct SumOverAxis1TempsContigFactory
         if constexpr (TypePairSupportDataForSumReductionTemps<
                           srcTy, dstTy>::is_defined)
         {
-            using ReductionOpT =
-                std::conditional_t<std::is_same_v<dstTy, bool>,
-                                   sycl::logical_or<dstTy>, sycl::plus<dstTy>>;
+            using ReductionOpT = std::conditional_t<
+                std::is_same_v<dstTy, bool>, sycl::logical_or<dstTy>,
+                std::conditional_t<tu_ns::is_complex_v<dstTy>,
+                                   su_ns::Plus<dstTy>, sycl::plus<dstTy>>>;
             return dpctl::tensor::kernels::
                 reduction_axis1_over_group_temps_contig_impl<srcTy, dstTy,
                                                              ReductionOpT>;
@@ -336,9 +342,10 @@ struct SumOverAxis0TempsContigFactory
         if constexpr (TypePairSupportDataForSumReductionTemps<
                           srcTy, dstTy>::is_defined)
         {
-            using ReductionOpT =
-                std::conditional_t<std::is_same_v<dstTy, bool>,
-                                   sycl::logical_or<dstTy>, sycl::plus<dstTy>>;
+            using ReductionOpT = std::conditional_t<
+                std::is_same_v<dstTy, bool>, sycl::logical_or<dstTy>,
+                std::conditional_t<tu_ns::is_complex_v<dstTy>,
+                                   su_ns::Plus<dstTy>, sycl::plus<dstTy>>>;
             return dpctl::tensor::kernels::
                 reduction_axis0_over_group_temps_contig_impl<srcTy, dstTy,
                                                              ReductionOpT>;