x86/cpu: Use common topology code for AMD
authorThomas Gleixner <tglx@linutronix.de>
Tue, 13 Feb 2024 21:04:14 +0000 (22:04 +0100)
committerThomas Gleixner <tglx@linutronix.de>
Thu, 15 Feb 2024 21:07:38 +0000 (22:07 +0100)
Switch it over to the new topology evaluation mechanism and remove the
random bits and pieces which are sprinkled all over the place.

No functional change intended.

Signed-off-by: Thomas Gleixner <tglx@linutronix.de>
Tested-by: Juergen Gross <jgross@suse.com>
Tested-by: Sohil Mehta <sohil.mehta@intel.com>
Tested-by: Michael Kelley <mhklinux@outlook.com>
Tested-by: Zhang Rui <rui.zhang@intel.com>
Tested-by: Wang Wendy <wendy.wang@intel.com>
Tested-by: K Prateek Nayak <kprateek.nayak@amd.com>
Link: https://lore.kernel.org/r/20240212153625.145745053@linutronix.de
arch/x86/include/asm/processor.h
arch/x86/kernel/cpu/amd.c
arch/x86/kernel/cpu/mce/inject.c
arch/x86/kernel/cpu/topology_common.c

index 26a6001ddafd3fed2d531693f36d8381aad3533c..4fbeffd678e26486905d1900674477ae46acd219 100644 (file)
@@ -707,12 +707,10 @@ static inline u32 per_cpu_l2c_id(unsigned int cpu)
 }
 
 #ifdef CONFIG_CPU_SUP_AMD
-extern u32 amd_get_nodes_per_socket(void);
 extern u32 amd_get_highest_perf(void);
 extern void amd_clear_divider(void);
 extern void amd_check_microcode(void);
 #else
-static inline u32 amd_get_nodes_per_socket(void)       { return 0; }
 static inline u32 amd_get_highest_perf(void)           { return 0; }
 static inline void amd_clear_divider(void)             { }
 static inline void amd_check_microcode(void)           { }
index a6b58200f9632f312878b02d1743af99b31c2b71..c82069e5f3419aa574ba187f259e3823d14d26de 100644 (file)
 
 #include "cpu.h"
 
-/*
- * nodes_per_socket: Stores the number of nodes per socket.
- * Refer to Fam15h Models 00-0fh BKDG - CPUID Fn8000_001E_ECX
- * Node Identifiers[10:8]
- */
-static u32 nodes_per_socket = 1;
-
 static inline int rdmsrl_amd_safe(unsigned msr, unsigned long long *p)
 {
        u32 gprs[8] = { 0 };
@@ -300,97 +293,6 @@ static int nearby_node(int apicid)
 }
 #endif
 
-/*
- * Fix up topo::core_id for pre-F17h systems to be in the
- * [0 .. cores_per_node - 1] range. Not really needed but
- * kept so as not to break existing setups.
- */
-static void legacy_fixup_core_id(struct cpuinfo_x86 *c)
-{
-       u32 cus_per_node;
-
-       if (c->x86 >= 0x17)
-               return;
-
-       cus_per_node = c->x86_max_cores / nodes_per_socket;
-       c->topo.core_id %= cus_per_node;
-}
-
-/*
- * Fixup core topology information for
- * (1) AMD multi-node processors
- *     Assumption: Number of cores in each internal node is the same.
- * (2) AMD processors supporting compute units
- */
-static void amd_get_topology(struct cpuinfo_x86 *c)
-{
-       /* get information required for multi-node processors */
-       if (boot_cpu_has(X86_FEATURE_TOPOEXT)) {
-               int err;
-               u32 eax, ebx, ecx, edx;
-
-               cpuid(0x8000001e, &eax, &ebx, &ecx, &edx);
-
-               c->topo.die_id  = ecx & 0xff;
-
-               if (c->x86 == 0x15)
-                       c->topo.cu_id = ebx & 0xff;
-
-               if (c->x86 >= 0x17) {
-                       c->topo.core_id = ebx & 0xff;
-
-                       if (smp_num_siblings > 1)
-                               c->x86_max_cores /= smp_num_siblings;
-               }
-
-               /*
-                * In case leaf B is available, use it to derive
-                * topology information.
-                */
-               err = detect_extended_topology(c);
-               if (!err)
-                       c->x86_coreid_bits = get_count_order(c->x86_max_cores);
-
-               cacheinfo_amd_init_llc_id(c, c->topo.die_id);
-
-       } else if (cpu_has(c, X86_FEATURE_NODEID_MSR)) {
-               u64 value;
-
-               rdmsrl(MSR_FAM10H_NODE_ID, value);
-               c->topo.die_id = value & 7;
-               c->topo.llc_id = c->topo.die_id;
-       } else
-               return;
-
-       if (nodes_per_socket > 1) {
-               set_cpu_cap(c, X86_FEATURE_AMD_DCM);
-               legacy_fixup_core_id(c);
-       }
-}
-
-/*
- * On a AMD dual core setup the lower bits of the APIC id distinguish the cores.
- * Assumes number of cores is a power of two.
- */
-static void amd_detect_cmp(struct cpuinfo_x86 *c)
-{
-       unsigned bits;
-
-       bits = c->x86_coreid_bits;
-       /* Low order bits define the core id (index of core in socket) */
-       c->topo.core_id = c->topo.initial_apicid & ((1 << bits)-1);
-       /* Convert the initial APIC ID into the socket ID */
-       c->topo.pkg_id = c->topo.initial_apicid >> bits;
-       /* use socket ID also for last level cache */
-       c->topo.llc_id = c->topo.die_id = c->topo.pkg_id;
-}
-
-u32 amd_get_nodes_per_socket(void)
-{
-       return nodes_per_socket;
-}
-EXPORT_SYMBOL_GPL(amd_get_nodes_per_socket);
-
 static void srat_detect_node(struct cpuinfo_x86 *c)
 {
 #ifdef CONFIG_NUMA
@@ -442,32 +344,6 @@ static void srat_detect_node(struct cpuinfo_x86 *c)
 #endif
 }
 
-static void early_init_amd_mc(struct cpuinfo_x86 *c)
-{
-#ifdef CONFIG_SMP
-       unsigned bits, ecx;
-
-       /* Multi core CPU? */
-       if (c->extended_cpuid_level < 0x80000008)
-               return;
-
-       ecx = cpuid_ecx(0x80000008);
-
-       c->x86_max_cores = (ecx & 0xff) + 1;
-
-       /* CPU telling us the core id bits shift? */
-       bits = (ecx >> 12) & 0xF;
-
-       /* Otherwise recompute */
-       if (bits == 0) {
-               while ((1 << bits) < c->x86_max_cores)
-                       bits++;
-       }
-
-       c->x86_coreid_bits = bits;
-#endif
-}
-
 static void bsp_init_amd(struct cpuinfo_x86 *c)
 {
        if (cpu_has(c, X86_FEATURE_CONSTANT_TSC)) {
@@ -500,18 +376,6 @@ static void bsp_init_amd(struct cpuinfo_x86 *c)
        if (cpu_has(c, X86_FEATURE_MWAITX))
                use_mwaitx_delay();
 
-       if (boot_cpu_has(X86_FEATURE_TOPOEXT)) {
-               u32 ecx;
-
-               ecx = cpuid_ecx(0x8000001e);
-               __max_die_per_package = nodes_per_socket = ((ecx >> 8) & 7) + 1;
-       } else if (boot_cpu_has(X86_FEATURE_NODEID_MSR)) {
-               u64 value;
-
-               rdmsrl(MSR_FAM10H_NODE_ID, value);
-               __max_die_per_package = nodes_per_socket = ((value >> 3) & 7) + 1;
-       }
-
        if (!boot_cpu_has(X86_FEATURE_AMD_SSBD) &&
            !boot_cpu_has(X86_FEATURE_VIRT_SSBD) &&
            c->x86 >= 0x15 && c->x86 <= 0x17) {
@@ -649,8 +513,6 @@ static void early_init_amd(struct cpuinfo_x86 *c)
        u64 value;
        u32 dummy;
 
-       early_init_amd_mc(c);
-
        if (c->x86 >= 0xf)
                set_cpu_cap(c, X86_FEATURE_K8);
 
@@ -730,9 +592,6 @@ static void early_init_amd(struct cpuinfo_x86 *c)
                }
        }
 
-       if (cpu_has(c, X86_FEATURE_TOPOEXT))
-               smp_num_siblings = ((cpuid_ebx(0x8000001e) >> 8) & 0xff) + 1;
-
        if (!cpu_has(c, X86_FEATURE_HYPERVISOR) && !cpu_has(c, X86_FEATURE_IBPB_BRTYPE)) {
                if (c->x86 == 0x17 && boot_cpu_has(X86_FEATURE_AMD_IBPB))
                        setup_force_cpu_cap(X86_FEATURE_IBPB_BRTYPE);
@@ -1076,9 +935,6 @@ static void init_amd(struct cpuinfo_x86 *c)
        if (cpu_has(c, X86_FEATURE_FSRM))
                set_cpu_cap(c, X86_FEATURE_FSRS);
 
-       /* get apicid instead of initial apic id from cpuid */
-       c->topo.apicid = read_apic_id();
-
        /* K6s reports MCEs but don't actually have all the MSRs */
        if (c->x86 < 6)
                clear_cpu_cap(c, X86_FEATURE_MCE);
@@ -1114,8 +970,6 @@ static void init_amd(struct cpuinfo_x86 *c)
 
        cpu_detect_cache_sizes(c);
 
-       amd_detect_cmp(c);
-       amd_get_topology(c);
        srat_detect_node(c);
 
        init_amd_cacheinfo(c);
index 308c5b5e0bbebbd26c2d9f337af903805a95dc0e..2b290452e1940732ebfa7211bec2706b5a073293 100644 (file)
@@ -433,8 +433,7 @@ static u32 get_nbc_for_node(int node_id)
        struct cpuinfo_x86 *c = &boot_cpu_data;
        u32 cores_per_node;
 
-       cores_per_node = (c->x86_max_cores * smp_num_siblings) / amd_get_nodes_per_socket();
-
+       cores_per_node = (c->x86_max_cores * smp_num_siblings) / topology_amd_nodes_per_pkg();
        return cores_per_node * node_id;
 }
 
index e1d1a7b7c8a95f2398c73e4342ab0b860cf8674e..3c69229ba154ff24a5008c37e45717003b15d983 100644 (file)
@@ -72,7 +72,6 @@ bool topo_is_converted(struct cpuinfo_x86 *c)
 {
        /* Temporary until everything is converted over. */
        switch (boot_cpu_data.x86_vendor) {
-       case X86_VENDOR_AMD:
        case X86_VENDOR_HYGON:
                return false;
        default:
@@ -133,6 +132,10 @@ static void parse_topology(struct topo_scan *tscan, bool early)
        tscan->ebx1_nproc_shift = get_count_order(ebx.nproc);
 
        switch (c->x86_vendor) {
+       case X86_VENDOR_AMD:
+               if (IS_ENABLED(CONFIG_CPU_SUP_AMD))
+                       cpu_parse_topology_amd(tscan);
+               break;
        case X86_VENDOR_CENTAUR:
        case X86_VENDOR_ZHAOXIN:
                parse_legacy(tscan);