Fboemer/ntt fix (#58)

fboemer · web-flow · commit 7301e504b8a2 · 2021-09-01T11:46:36.000-07:00
* Fix NTT AVX512 implementation
diff --git a/CHANGES.md b/CHANGES.md
@@ -2,10 +2,12 @@
 
 ## Version 1.2.1
 - Fixes a bug in AVX512 floating-point implementation of element-wise vector-vector modular multiplication (https://github.com/microsoft/SEAL/issues/385)
-- Fixes a bug in the NTT default allocator (https://gitlab.com/palisade/palisade-development/-/issues/323#note_662270512)
+- Fixes a bug in the NTT default constructor (https://gitlab.com/palisade/palisade-development/-/issues/329)
+- Fixes a bug in the AVX512 NTT (https://github.com/intel/hexl/pull/58)
 - Improves performance of EltwiseFMAModAVX512 on ICX (https://github.com/intel/hexl/pull/42)
 - Improves performance of the native NTT
 - Adds reference implementations for the radix-4 NTT
+- Enables support for pre-built easylogging (https://github.com/intel/hexl/pull/57)
 
 ## Version 1.2.0
 - Large performance improvement in large (N >= 16384) AVX512 NTTs via recursive implementations
diff --git a/benchmark/bench-eltwise-fma-mod.cpp b/benchmark/bench-eltwise-fma-mod.cpp
@@ -35,7 +35,7 @@ static void BM_EltwiseFMAModAddNative(benchmark::State& state) {  //  NOLINT
 
 BENCHMARK(BM_EltwiseFMAModAddNative)
     ->Unit(benchmark::kMicrosecond)
-    ->ArgsProduct({{1024, 8192, 16384}, {false, true}});
+    ->ArgsProduct({{1024, 4096, 16384}, {false, true}});
 
 //=================================================================
 
@@ -59,7 +59,7 @@ static void BM_EltwiseFMAModAVX512DQ(benchmark::State& state) {  //  NOLINT
 
 BENCHMARK(BM_EltwiseFMAModAVX512DQ)
     ->Unit(benchmark::kMicrosecond)
-    ->ArgsProduct({{1024, 8192, 16384}, {false, true}});
+    ->ArgsProduct({{1024, 4096, 16384}, {false, true}});
 #endif
 
 //=================================================================
@@ -84,7 +84,7 @@ static void BM_EltwiseFMAModAVX512IFMA(benchmark::State& state) {  //  NOLINT
 
 BENCHMARK(BM_EltwiseFMAModAVX512IFMA)
     ->Unit(benchmark::kMicrosecond)
-    ->ArgsProduct({{1024, 8192, 16384}, {false, true}});
+    ->ArgsProduct({{1024, 4096, 16384}, {false, true}});
 
 #endif
 
diff --git a/benchmark/bench-eltwise-mult-mod.cpp b/benchmark/bench-eltwise-mult-mod.cpp
@@ -36,7 +36,7 @@ static void BM_EltwiseMultMod(benchmark::State& state) {  //  NOLINT
 
 BENCHMARK(BM_EltwiseMultMod)
     ->Unit(benchmark::kMicrosecond)
-    ->ArgsProduct({{1024, 8192, 16384}, {48, 60}, {1, 2, 4}});
+    ->ArgsProduct({{1024, 4096, 16384}, {48, 60}, {1, 2, 4}});
 
 //=================================================================
 
diff --git a/benchmark/bench-ntt.cpp b/benchmark/bench-ntt.cpp
@@ -22,7 +22,7 @@ namespace hexl {
 
 static void BM_FwdNTTNativeRadix2(benchmark::State& state) {  //  NOLINT
   size_t ntt_size = state.range(0);
-  size_t modulus = GeneratePrimes(1, 45, ntt_size)[0];
+  size_t modulus = GeneratePrimes(1, 45, true, ntt_size)[0];
 
   AlignedVector64<uint64_t> input(ntt_size, 1);
   NTT ntt(ntt_size, modulus);
@@ -43,7 +43,7 @@ BENCHMARK(BM_FwdNTTNativeRadix2)
 
 static void BM_FwdNTTNativeRadix4(benchmark::State& state) {  //  NOLINT
   size_t ntt_size = state.range(0);
-  size_t modulus = GeneratePrimes(1, 45, ntt_size)[0];
+  size_t modulus = GeneratePrimes(1, 45, true, ntt_size)[0];
 
   AlignedVector64<uint64_t> input(ntt_size, 1);
   NTT ntt(ntt_size, modulus);
@@ -67,7 +67,7 @@ BENCHMARK(BM_FwdNTTNativeRadix4)
 static void BM_FwdNTT_AVX512IFMA(benchmark::State& state) {  //  NOLINT
   size_t ntt_size = state.range(0);
   size_t modulus_bits = 49;
-  size_t modulus = GeneratePrimes(1, modulus_bits, ntt_size)[0];
+  size_t modulus = GeneratePrimes(1, modulus_bits, true, ntt_size)[0];
 
   AlignedVector64<uint64_t> input(ntt_size, 1);
   NTT ntt(ntt_size, modulus);
@@ -96,7 +96,7 @@ BENCHMARK(BM_FwdNTT_AVX512IFMA)
 static void BM_FwdNTT_AVX512IFMALazy(benchmark::State& state) {  //  NOLINT
   size_t ntt_size = state.range(0);
   size_t modulus_bits = 49;
-  size_t modulus = GeneratePrimes(1, modulus_bits, ntt_size)[0];
+  size_t modulus = GeneratePrimes(1, modulus_bits, true, ntt_size)[0];
 
   AlignedVector64<uint64_t> input(ntt_size, 1);
   NTT ntt(ntt_size, modulus);
@@ -132,7 +132,7 @@ static void BM_FwdNTT_AVX512DQ_32(benchmark::State& state) {  //  NOLINT
   size_t ntt_size = state.range(0);
   uint64_t output_mod_factor = state.range(1);
   size_t modulus_bits = 29;
-  size_t modulus = GeneratePrimes(1, modulus_bits, ntt_size)[0];
+  size_t modulus = GeneratePrimes(1, modulus_bits, true, ntt_size)[0];
 
   AlignedVector64<uint64_t> input(ntt_size, 1);
   NTT ntt(ntt_size, modulus);
@@ -163,7 +163,7 @@ static void BM_FwdNTT_AVX512DQ_64(benchmark::State& state) {  //  NOLINT
   size_t ntt_size = state.range(0);
   uint64_t output_mod_factor = state.range(1);
   size_t modulus_bits = 55;
-  size_t modulus = GeneratePrimes(1, modulus_bits, ntt_size)[0];
+  size_t modulus = GeneratePrimes(1, modulus_bits, true, ntt_size)[0];
 
   AlignedVector64<uint64_t> input(ntt_size, 1);
   NTT ntt(ntt_size, modulus);
@@ -195,7 +195,7 @@ BENCHMARK(BM_FwdNTT_AVX512DQ_64)
 // state[0] is the degree
 static void BM_FwdNTTInPlace(benchmark::State& state) {  //  NOLINT
   size_t ntt_size = state.range(0);
-  size_t modulus = GeneratePrimes(1, 61, ntt_size)[0];
+  size_t modulus = GeneratePrimes(1, 61, true, ntt_size)[0];
 
   AlignedVector64<uint64_t> input(ntt_size, 1);
   NTT ntt(ntt_size, modulus);
@@ -216,7 +216,7 @@ BENCHMARK(BM_FwdNTTInPlace)
 // state[0] is the degree
 static void BM_FwdNTTCopy(benchmark::State& state) {  //  NOLINT
   size_t ntt_size = state.range(0);
-  size_t modulus = GeneratePrimes(1, 45, ntt_size)[0];
+  size_t modulus = GeneratePrimes(1, 45, true, ntt_size)[0];
 
   AlignedVector64<uint64_t> input(ntt_size, 1);
   AlignedVector64<uint64_t> output(ntt_size, 1);
@@ -236,7 +236,7 @@ BENCHMARK(BM_FwdNTTCopy)
 // state[0] is the degree
 static void BM_InvNTTCopy(benchmark::State& state) {  //  NOLINT
   size_t ntt_size = state.range(0);
-  size_t modulus = GeneratePrimes(1, 45, ntt_size)[0];
+  size_t modulus = GeneratePrimes(1, 45, true, ntt_size)[0];
 
   AlignedVector64<uint64_t> input(ntt_size, 1);
   AlignedVector64<uint64_t> output(ntt_size, 1);
@@ -259,7 +259,7 @@ BENCHMARK(BM_InvNTTCopy)
 
 static void BM_InvNTTNativeRadix2(benchmark::State& state) {  //  NOLINT
   size_t ntt_size = state.range(0);
-  size_t modulus = GeneratePrimes(1, 45, ntt_size)[0];
+  size_t modulus = GeneratePrimes(1, 45, true, ntt_size)[0];
 
   AlignedVector64<uint64_t> input(ntt_size, 1);
   NTT ntt(ntt_size, modulus);
@@ -284,7 +284,7 @@ BENCHMARK(BM_InvNTTNativeRadix2)
 
 static void BM_InvNTTNativeRadix4(benchmark::State& state) {  //  NOLINT
   size_t ntt_size = state.range(0);
-  size_t modulus = GeneratePrimes(1, 45, ntt_size)[0];
+  size_t modulus = GeneratePrimes(1, 45, true, ntt_size)[0];
 
   AlignedVector64<uint64_t> input(ntt_size, 1);
   NTT ntt(ntt_size, modulus);
@@ -311,7 +311,7 @@ BENCHMARK(BM_InvNTTNativeRadix4)
 // state[0] is the degree
 static void BM_InvNTT_AVX512IFMA(benchmark::State& state) {  //  NOLINT
   size_t ntt_size = state.range(0);
-  size_t modulus = GeneratePrimes(1, 49, ntt_size)[0];
+  size_t modulus = GeneratePrimes(1, 49, true, ntt_size)[0];
 
   AlignedVector64<uint64_t> input(ntt_size, 1);
   NTT ntt(ntt_size, modulus);
@@ -337,7 +337,7 @@ BENCHMARK(BM_InvNTT_AVX512IFMA)
 // state[0] is the degree
 static void BM_InvNTT_AVX512IFMALazy(benchmark::State& state) {  //  NOLINT
   size_t ntt_size = state.range(0);
-  size_t modulus = GeneratePrimes(1, 49, ntt_size)[0];
+  size_t modulus = GeneratePrimes(1, 49, true, ntt_size)[0];
 
   AlignedVector64<uint64_t> input(ntt_size, 1);
   NTT ntt(ntt_size, modulus);
@@ -367,7 +367,7 @@ BENCHMARK(BM_InvNTT_AVX512IFMALazy)
 static void BM_InvNTT_AVX512DQ_32(benchmark::State& state) {  //  NOLINT
   size_t ntt_size = state.range(0);
   uint64_t output_mod_factor = state.range(1);
-  size_t modulus = GeneratePrimes(1, 30, ntt_size)[0];
+  size_t modulus = GeneratePrimes(1, 30, true, ntt_size)[0];
 
   AlignedVector64<uint64_t> input(ntt_size, 1);
   NTT ntt(ntt_size, modulus);
@@ -395,7 +395,7 @@ BENCHMARK(BM_InvNTT_AVX512DQ_32)
 static void BM_InvNTT_AVX512DQ_64(benchmark::State& state) {  //  NOLINT
   size_t ntt_size = state.range(0);
   uint64_t output_mod_factor = state.range(1);
-  size_t modulus = GeneratePrimes(1, 61, ntt_size)[0];
+  size_t modulus = GeneratePrimes(1, 61, true, ntt_size)[0];
 
   AlignedVector64<uint64_t> input(ntt_size, 1);
   NTT ntt(ntt_size, modulus);
diff --git a/hexl/CMakeLists.txt b/hexl/CMakeLists.txt
@@ -76,6 +76,8 @@ endif()
 if (CMAKE_CXX_COMPILER_ID MATCHES "GNU|Clang")
     target_compile_options(hexl PRIVATE -Wall -Wconversion -Wshadow -pedantic -Wextra
         -Wno-unknown-pragmas -march=native -O3 -fomit-frame-pointer
+        -Wno-sign-conversion
+        -Wno-implicit-int-conversion
     )
     # Avoid 3rd-party dependency warnings when including HEXL as a dependency
     target_compile_options(hexl PUBLIC
diff --git a/hexl/include/hexl/number-theory/number-theory.hpp b/hexl/include/hexl/number-theory/number-theory.hpp
@@ -176,14 +176,17 @@ inline unsigned char AddUInt64(uint64_t operand1, uint64_t operand2,
 /// @brief Returns whether or not the input is prime
 bool IsPrime(uint64_t n);
 
-/// @brief Generates a list of num_primes primes in the range [2^(bit_size,
+/// @brief Generates a list of num_primes primes in the range [2^(bit_size),
 // 2^(bit_size+1)]. Ensures each prime q satisfies
 // q % (2*ntt_size+1)) == 1
 /// @param[in] num_primes Number of primes to generate
 /// @param[in] bit_size Bit size of each prime
+/// @param[in] prefer_small_primes When true, returns primes starting from
+/// 2^(bit_size); when false, returns primes starting from 2^(bit_size+1)
 /// @param[in] ntt_size N such that each prime q satisfies q % (2N) == 1. N must
-/// be a power of two
+/// be a power of two less than 2^bit_size.
 std::vector<uint64_t> GeneratePrimes(size_t num_primes, size_t bit_size,
+                                     bool prefer_small_primes,
                                      size_t ntt_size = 1);
 
 /// @brief Returns input mod modulus, computed via 64-bit Barrett reduction
diff --git a/hexl/ntt/fwd-ntt-avx512.cpp b/hexl/ntt/fwd-ntt-avx512.cpp
@@ -266,7 +266,7 @@ void ForwardTransformToBitReverseAVX512(
       const uint64_t* W = &root_of_unity_powers[W_idx];
       const uint64_t* W_precon = &precon_root_of_unity_powers[W_idx];
 
-      if (input_mod_factor <= 2) {
+      if ((input_mod_factor <= 2) && (recursion_depth == 0)) {
         FwdT8<BitShift, true>(operand, v_neg_modulus, v_twice_mod, t, m, W,
                               W_precon);
       } else {
diff --git a/hexl/ntt/inv-ntt-avx512.cpp b/hexl/ntt/inv-ntt-avx512.cpp
@@ -260,7 +260,7 @@ void InverseTransformFromBitReverseAVX512(
       // t = 1
       const uint64_t* W = &inv_root_of_unity_powers[W_idx];
       const uint64_t* W_precon = &precon_inv_root_of_unity_powers[W_idx];
-      if (input_mod_factor == 1) {
+      if ((input_mod_factor == 1) && (recursion_depth == 0)) {
         InvT1<BitShift, true>(operand, v_neg_modulus, v_twice_mod, m, W,
                               W_precon);
       } else {
diff --git a/hexl/number-theory/number-theory.cpp b/hexl/number-theory/number-theory.cpp
@@ -223,6 +223,7 @@ bool IsPrime(uint64_t n) {
 }
 
 std::vector<uint64_t> GeneratePrimes(size_t num_primes, size_t bit_size,
+                                     bool prefer_small_primes,
                                      size_t ntt_size) {
   HEXL_CHECK(num_primes > 0, "num_primes == 0");
   HEXL_CHECK(IsPowerOfTwo(ntt_size),
@@ -231,18 +232,39 @@ std::vector<uint64_t> GeneratePrimes(size_t num_primes, size_t bit_size,
              "log2(ntt_size) " << Log2(ntt_size)
                                << " should be less than bit_size " << bit_size);
 
-  uint64_t value = (1ULL << bit_size) + 1;
+  int64_t prime_lower_bound = (1LL << bit_size) + 1LL;
+  int64_t prime_upper_bound = (1LL << (bit_size + 1LL)) - 1LL;
+
+  // Keep signed to enable negative step
+  int64_t prime_candidate =
+      prefer_small_primes
+          ? prime_lower_bound
+          : prime_upper_bound - (prime_upper_bound % (2 * ntt_size)) + 1;
+  HEXL_CHECK(prime_candidate % (2 * ntt_size) == 1, "bad prime candidate");
+
+  // Ensure prime % 2 * ntt_size == 1
+  int64_t prime_candidate_step =
+      (prefer_small_primes ? 1 : -1) * 2 * static_cast<int64_t>(ntt_size);
+
+  auto continue_condition = [&](int64_t local_candidate_prime) {
+    if (prefer_small_primes) {
+      return local_candidate_prime < prime_upper_bound;
+    } else {
+      return local_candidate_prime > prime_lower_bound;
+    }
+  };
 
   std::vector<uint64_t> ret;
 
-  while (value < (1ULL << (bit_size + 1))) {
-    if (IsPrime(value)) {
-      ret.emplace_back(value);
+  while (continue_condition(prime_candidate)) {
+    if (IsPrime(prime_candidate)) {
+      HEXL_CHECK(prime_candidate % (2 * ntt_size) == 1, "bad prime candidate");
+      ret.emplace_back(static_cast<uint64_t>(prime_candidate));
       if (ret.size() == num_primes) {
         return ret;
       }
     }
-    value += 2 * ntt_size;
+    prime_candidate += prime_candidate_step;
   }
 
   HEXL_CHECK(false, "Failed to find enough primes");
diff --git a/test/test-eltwise-add-mod-avx512.cpp b/test/test-eltwise-add-mod-avx512.cpp
@@ -52,7 +52,7 @@ TEST(EltwiseAddMod, vector_vector_avx512_big) {
     GTEST_SKIP();
   }
 
-  uint64_t modulus = GeneratePrimes(1, 60, 1024)[0];
+  uint64_t modulus = GeneratePrimes(1, 60, true, 1024)[0];
 
   std::vector<uint64_t> op1{modulus - 1, modulus - 1, modulus - 2, modulus - 2,
                             modulus - 3, modulus - 3, modulus - 4, modulus - 4};
@@ -72,7 +72,7 @@ TEST(EltwiseAddMod, vector_scalar_avx512_big) {
     GTEST_SKIP();
   }
 
-  uint64_t modulus = GeneratePrimes(1, 60, 1024)[0];
+  uint64_t modulus = GeneratePrimes(1, 60, true, 1024)[0];
 
   std::vector<uint64_t> op1{modulus - 1, modulus - 1, modulus - 2, modulus - 2,
                             modulus - 3, modulus - 3, modulus - 4, modulus - 4};
diff --git a/test/test-eltwise-add-mod.cpp b/test/test-eltwise-add-mod.cpp
@@ -81,7 +81,7 @@ TEST(EltwiseAddMod, vector_scalar_native_small) {
 }
 
 TEST(EltwiseAddMod, vector_vector_native_big) {
-  uint64_t modulus = GeneratePrimes(1, 60, 1024)[0];
+  uint64_t modulus = GeneratePrimes(1, 60, true, 1024)[0];
 
   std::vector<uint64_t> op1{modulus - 1, modulus - 1, modulus - 2, modulus - 2,
                             modulus - 3, modulus - 3, modulus - 4, modulus - 4};
@@ -97,7 +97,7 @@ TEST(EltwiseAddMod, vector_vector_native_big) {
 }
 
 TEST(EltwiseAddMod, vector_scalar_native_big) {
-  uint64_t modulus = GeneratePrimes(1, 60, 1024)[0];
+  uint64_t modulus = GeneratePrimes(1, 60, true, 1024)[0];
 
   std::vector<uint64_t> op1{modulus - 1, modulus - 1, modulus - 2, modulus - 2,
                             modulus - 3, modulus - 3, modulus - 4, modulus - 4};
diff --git a/test/test-eltwise-cmp-sub-mod-avx512.cpp b/test/test-eltwise-cmp-sub-mod-avx512.cpp
@@ -31,7 +31,7 @@ TEST(EltwiseCmpSubMod, AVX512) {
 
   for (size_t cmp = 0; cmp < 8; ++cmp) {
     for (size_t bits = 48; bits <= 51; ++bits) {
-      uint64_t modulus = GeneratePrimes(1, bits, 1024)[0];
+      uint64_t modulus = GeneratePrimes(1, bits, true, 1024)[0];
       std::uniform_int_distribution<uint64_t> distrib(0, modulus - 1);
 
       for (size_t trial = 0; trial < 200; ++trial) {
diff --git a/test/test-eltwise-fma-mod-avx512.cpp b/test/test-eltwise-fma-mod-avx512.cpp
@@ -229,7 +229,7 @@ TEST(EltwiseFMAMod, AVX512IFMA) {
   constexpr uint64_t input_mod_factor = 8;
 
   for (size_t bits = 48; bits <= 51; ++bits) {
-    uint64_t modulus = GeneratePrimes(1, bits, length)[0];
+    uint64_t modulus = GeneratePrimes(1, bits, true, length)[0];
     std::uniform_int_distribution<uint64_t> distrib(
         0, input_mod_factor * modulus - 1);
 
diff --git a/test/test-eltwise-mult-mod-avx512.cpp b/test/test-eltwise-mult-mod-avx512.cpp
@@ -39,7 +39,7 @@ TEST(EltwiseMultMod, avx512_int2) {
   if (!has_avx512dq) {
     GTEST_SKIP();
   }
-  uint64_t modulus = GeneratePrimes(1, 60, 1024)[0];
+  uint64_t modulus = GeneratePrimes(1, 60, true, 1024)[0];
 
   std::vector<uint64_t> op1{modulus - 3, 1, 1, 1, 1, 1, 1, 1};
   std::vector<uint64_t> op2{modulus - 4, 1, 1, 1, 1, 1, 1, 1};
diff --git a/test/test-eltwise-mult-mod.cpp b/test/test-eltwise-mult-mod.cpp
@@ -77,7 +77,7 @@ TEST(EltwiseMultModInPlace, 8_bounds) {
 #endif
 
 TEST(EltwiseMultModInPlace, 9) {
-  uint64_t modulus = GeneratePrimes(1, 51, 1024)[0];
+  uint64_t modulus = GeneratePrimes(1, 51, true, 1024)[0];
 
   std::vector<uint64_t> op1{modulus - 3, 1, 2, 3, 4, 5, 6, 7, 8};
   std::vector<uint64_t> op2{modulus - 4, 8, 7, 6, 5, 4, 3, 2, 1};
@@ -105,7 +105,7 @@ TEST(EltwiseMultMod, native_mult2) {
 }
 
 TEST(EltwiseMultMod, native2_big) {
-  uint64_t modulus = GeneratePrimes(1, 60, 1024)[0];
+  uint64_t modulus = GeneratePrimes(1, 60, true, 1024)[0];
 
   std::vector<uint64_t> op1{modulus - 3, 1, 1, 1, 1, 1, 1, 1};
   std::vector<uint64_t> op2{modulus - 4, 1, 1, 1, 1, 1, 1, 1};
@@ -119,7 +119,7 @@ TEST(EltwiseMultMod, native2_big) {
 }
 
 TEST(EltwiseMultMod, 8big) {
-  uint64_t modulus = GeneratePrimes(1, 48, 1024)[0];
+  uint64_t modulus = GeneratePrimes(1, 48, true, 1024)[0];
 
   std::vector<uint64_t> op1{modulus - 1, 1, 1, 1, 1, 1, 1, 1};
   std::vector<uint64_t> op2{modulus - 1, 1, 1, 1, 1, 1, 1, 1};
@@ -198,7 +198,7 @@ TEST(EltwiseMultMod, 8_bounds) {
 #endif
 
 TEST(EltwiseMultMod, 9) {
-  uint64_t modulus = GeneratePrimes(1, 51, 1024)[0];
+  uint64_t modulus = GeneratePrimes(1, 51, true, 1024)[0];
 
   std::vector<uint64_t> op1{modulus - 3, 1, 2, 3, 4, 5, 6, 7, 8};
   std::vector<uint64_t> op2{modulus - 4, 8, 7, 6, 5, 4, 3, 2, 1};
diff --git a/test/test-eltwise-reduce-mod-avx512.cpp b/test/test-eltwise-reduce-mod-avx512.cpp
diff --git a/test/test-eltwise-sub-mod-avx512.cpp b/test/test-eltwise-sub-mod-avx512.cpp
diff --git a/test/test-eltwise-sub-mod.cpp b/test/test-eltwise-sub-mod.cpp
diff --git a/test/test-ntt-avx512.cpp b/test/test-ntt-avx512.cpp
diff --git a/test/test-ntt.cpp b/test/test-ntt.cpp
diff --git a/test/test-number-theory.cpp b/test/test-number-theory.cpp

Original file line number	Diff line number	Diff line change
`@@ -76,6 +76,8 @@ endif()`
`76`	`76`	`if (CMAKE_CXX_COMPILER_ID MATCHES "GNU\|Clang")`
`77`	`77`	`target_compile_options(hexl PRIVATE -Wall -Wconversion -Wshadow -pedantic -Wextra`
`78`	`78`	`-Wno-unknown-pragmas -march=native -O3 -fomit-frame-pointer`
	`79`	`+ -Wno-sign-conversion`
	`80`	`+ -Wno-implicit-int-conversion`
`79`	`81`	`)`
`80`	`82`	`# Avoid 3rd-party dependency warnings when including HEXL as a dependency`
`81`	`83`	`target_compile_options(hexl PUBLIC`
Original file line number	Diff line number	Diff line change
`@@ -52,7 +52,7 @@ TEST(EltwiseAddMod, vector_vector_avx512_big) {`
`52`	`52`	`GTEST_SKIP();`
`53`	`53`	`}`
`54`	`54`
`55`		`- uint64_t modulus = GeneratePrimes(1, 60, 1024)[0];`
	`55`	`+ uint64_t modulus = GeneratePrimes(1, 60, true, 1024)[0];`
`56`	`56`
`57`	`57`	`std::vector<uint64_t> op1{modulus - 1, modulus - 1, modulus - 2, modulus - 2,`
`58`	`58`	`modulus - 3, modulus - 3, modulus - 4, modulus - 4};`
`@@ -72,7 +72,7 @@ TEST(EltwiseAddMod, vector_scalar_avx512_big) {`
`72`	`72`	`GTEST_SKIP();`
`73`	`73`	`}`
`74`	`74`
`75`		`- uint64_t modulus = GeneratePrimes(1, 60, 1024)[0];`
	`75`	`+ uint64_t modulus = GeneratePrimes(1, 60, true, 1024)[0];`
`76`	`76`
`77`	`77`	`std::vector<uint64_t> op1{modulus - 1, modulus - 1, modulus - 2, modulus - 2,`
`78`	`78`	`modulus - 3, modulus - 3, modulus - 4, modulus - 4};`
Original file line number	Diff line number	Diff line change
`@@ -81,7 +81,7 @@ TEST(EltwiseAddMod, vector_scalar_native_small) {`
`81`	`81`	`}`
`82`	`82`
`83`	`83`	`TEST(EltwiseAddMod, vector_vector_native_big) {`
`84`		`- uint64_t modulus = GeneratePrimes(1, 60, 1024)[0];`
	`84`	`+ uint64_t modulus = GeneratePrimes(1, 60, true, 1024)[0];`
`85`	`85`
`86`	`86`	`std::vector<uint64_t> op1{modulus - 1, modulus - 1, modulus - 2, modulus - 2,`
`87`	`87`	`modulus - 3, modulus - 3, modulus - 4, modulus - 4};`
`@@ -97,7 +97,7 @@ TEST(EltwiseAddMod, vector_vector_native_big) {`
`97`	`97`	`}`
`98`	`98`
`99`	`99`	`TEST(EltwiseAddMod, vector_scalar_native_big) {`
`100`		`- uint64_t modulus = GeneratePrimes(1, 60, 1024)[0];`
	`100`	`+ uint64_t modulus = GeneratePrimes(1, 60, true, 1024)[0];`
`101`	`101`
`102`	`102`	`std::vector<uint64_t> op1{modulus - 1, modulus - 1, modulus - 2, modulus - 2,`
`103`	`103`	`modulus - 3, modulus - 3, modulus - 4, modulus - 4};`
Original file line number	Diff line number	Diff line change
`@@ -39,7 +39,7 @@ TEST(EltwiseMultMod, avx512_int2) {`
`39`	`39`	`if (!has_avx512dq) {`
`40`	`40`	`GTEST_SKIP();`
`41`	`41`	`}`
`42`		`- uint64_t modulus = GeneratePrimes(1, 60, 1024)[0];`
	`42`	`+ uint64_t modulus = GeneratePrimes(1, 60, true, 1024)[0];`
`43`	`43`
`44`	`44`	`std::vector<uint64_t> op1{modulus - 3, 1, 1, 1, 1, 1, 1, 1};`
`45`	`45`	`std::vector<uint64_t> op2{modulus - 4, 1, 1, 1, 1, 1, 1, 1};`