crypto: x86/aes-xts - wire up VAES + AVX10/512 implementation

author Eric Biggers <ebiggers@google.com>

Fri, 29 Mar 2024 08:03:54 +0000 (01:03 -0700)

committer Herbert Xu <herbert@gondor.apana.org.au>

Fri, 5 Apr 2024 07:46:33 +0000 (15:46 +0800)
author Eric Biggers <ebiggers@google.com>
Fri, 29 Mar 2024 08:03:54 +0000 (01:03 -0700)
committer Herbert Xu <herbert@gondor.apana.org.au>
Fri, 5 Apr 2024 07:46:33 +0000 (15:46 +0800)
diff --git a/arch/x86/crypto/aes-xts-avx-x86_64.S b/arch/x86/crypto/aes-xts-avx-x86_64.S

index 71be474b22dae6f9e262924d62241bb11756082d..b8005d0205f89ff36ae7ea5385affc249170cc8f 100644 (file)
--- a/arch/x86/crypto/aes-xts-avx-x86_64.S
+++ b/arch/x86/crypto/aes-xts-avx-x86_64.S
@@ -826,4 +826,13 @@ SYM_FUNC_END(aes_xts_encrypt_vaes_avx10_256)
  SYM_TYPED_FUNC_START(aes_xts_decrypt_vaes_avx10_256)
         _aes_xts_crypt  0
  SYM_FUNC_END(aes_xts_decrypt_vaes_avx10_256)
+
+.set   VL, 64
+.set   USE_AVX10, 1
+SYM_TYPED_FUNC_START(aes_xts_encrypt_vaes_avx10_512)
+       _aes_xts_crypt  1
+SYM_FUNC_END(aes_xts_encrypt_vaes_avx10_512)
+SYM_TYPED_FUNC_START(aes_xts_decrypt_vaes_avx10_512)
+       _aes_xts_crypt  0
+SYM_FUNC_END(aes_xts_decrypt_vaes_avx10_512)
  #endif /* CONFIG_AS_VAES && CONFIG_AS_VPCLMULQDQ */
diff --git a/arch/x86/crypto/aesni-intel_glue.c b/arch/x86/crypto/aesni-intel_glue.c

index fce7947589375724593e3d4e9cf637d79cc228a4..0b37a470325b5c2700faf27ca2a6e2604e35387c 100644 (file)
--- a/arch/x86/crypto/aesni-intel_glue.c
+++ b/arch/x86/crypto/aesni-intel_glue.c
@@ -1298,8 +1298,29 @@ DEFINE_XTS_ALG(aesni_avx, "xts-aes-aesni-avx", 500);
  #if defined(CONFIG_AS_VAES) && defined(CONFIG_AS_VPCLMULQDQ)
  DEFINE_XTS_ALG(vaes_avx2, "xts-aes-vaes-avx2", 600);
  DEFINE_XTS_ALG(vaes_avx10_256, "xts-aes-vaes-avx10_256", 700);
+DEFINE_XTS_ALG(vaes_avx10_512, "xts-aes-vaes-avx10_512", 800);
  #endif
  
+/*
+ * This is a list of CPU models that are known to suffer from downclocking when
+ * zmm registers (512-bit vectors) are used.  On these CPUs, the AES-XTS
+ * implementation with zmm registers won't be used by default.  An
+ * implementation with ymm registers (256-bit vectors) will be used instead.
+ */
+static const struct x86_cpu_id zmm_exclusion_list[] = {
+       { .vendor = X86_VENDOR_INTEL, .family = 6, .model = INTEL_FAM6_SKYLAKE_X },
+       { .vendor = X86_VENDOR_INTEL, .family = 6, .model = INTEL_FAM6_ICELAKE_X },
+       { .vendor = X86_VENDOR_INTEL, .family = 6, .model = INTEL_FAM6_ICELAKE_D },
+       { .vendor = X86_VENDOR_INTEL, .family = 6, .model = INTEL_FAM6_ICELAKE },
+       { .vendor = X86_VENDOR_INTEL, .family = 6, .model = INTEL_FAM6_ICELAKE_L },
+       { .vendor = X86_VENDOR_INTEL, .family = 6, .model = INTEL_FAM6_ICELAKE_NNPI },
+       { .vendor = X86_VENDOR_INTEL, .family = 6, .model = INTEL_FAM6_TIGERLAKE_L },
+       { .vendor = X86_VENDOR_INTEL, .family = 6, .model = INTEL_FAM6_TIGERLAKE },
+       /* Allow Rocket Lake and later, and Sapphire Rapids and later. */
+       /* Also allow AMD CPUs (starting with Zen 4, the first with AVX-512). */
+       {},
+};
+
  static int __init register_xts_algs(void)
  {
         int err;
@@ -1333,6 +1354,14 @@ static int __init register_xts_algs(void)
                                              &aes_xts_simdalg_vaes_avx10_256);
         if (err)
                 return err;
+
+       if (x86_match_cpu(zmm_exclusion_list))
+               aes_xts_alg_vaes_avx10_512.base.cra_priority = 1;
+
+       err = simd_register_skciphers_compat(&aes_xts_alg_vaes_avx10_512, 1,
+                                            &aes_xts_simdalg_vaes_avx10_512);
+       if (err)
+               return err;
  #endif /* CONFIG_AS_VAES && CONFIG_AS_VPCLMULQDQ */
         return 0;
  }
@@ -1349,6 +1378,9 @@ static void unregister_xts_algs(void)
         if (aes_xts_simdalg_vaes_avx10_256)
                 simd_unregister_skciphers(&aes_xts_alg_vaes_avx10_256, 1,
                                           &aes_xts_simdalg_vaes_avx10_256);
+       if (aes_xts_simdalg_vaes_avx10_512)
+               simd_unregister_skciphers(&aes_xts_alg_vaes_avx10_512, 1,
+                                         &aes_xts_simdalg_vaes_avx10_512);
  #endif
  }
  #else /* CONFIG_X86_64 */
author	Eric Biggers <ebiggers@google.com>
	Fri, 29 Mar 2024 08:03:54 +0000 (01:03 -0700)
committer	Herbert Xu <herbert@gondor.apana.org.au>
	Fri, 5 Apr 2024 07:46:33 +0000 (15:46 +0800)
arch/x86/crypto/aes-xts-avx-x86_64.S		patch \| blob \| blame \| history
arch/x86/crypto/aesni-intel_glue.c		patch \| blob \| blame \| history