x86: Remove dynamic NOP selection
authorPeter Zijlstra <peterz@infradead.org>
Fri, 12 Mar 2021 11:32:54 +0000 (12:32 +0100)
committerBorislav Petkov <bp@suse.de>
Mon, 15 Mar 2021 15:24:59 +0000 (16:24 +0100)
commita89dfde3dc3c2dbf56910af75e2d8b11ec5308f6
tree1f5d63a4ea45af7d513ce044362993174ad52694
parent59eca2fa1934de42d8aa44d3bef655c92ea69703
x86: Remove dynamic NOP selection

This ensures that a NOP is a NOP and not a random other instruction that
is also a NOP. It allows simplification of dynamic code patching that
wants to verify existing code before writing new instructions (ftrace,
jump_label, static_call, etc..).

Differentiating on NOPs is not a feature.

This pessimises 32bit (DONTCARE) and 32bit on 64bit CPUs (CARELESS).
32bit is not a performance target.

Everything x86_64 since AMD K10 (2007) and Intel IvyBridge (2012) is
fine with using NOPL (as opposed to prefix NOP). And per FEATURE_NOPL
being required for x86_64, all x86_64 CPUs can use NOPL. So stop
caring about NOPs, simplify things and get on with life.

[ The problem seems to be that some uarchs can only decode NOPL on a
single front-end port while others have severe decode penalties for
excessive prefixes. All modern uarchs can handle both, except Atom,
which has prefix penalties. ]

[ Also, much doubt you can actually measure any of this on normal
workloads. ]

After this, FEATURE_NOPL is unused except for required-features for
x86_64. FEATURE_K8 is only used for PTI.

 [ bp: Kernel build measurements showed ~0.3s slowdown on Sandybridge
   which is hardly a slowdown. Get rid of X86_FEATURE_K7, while at it. ]

Signed-off-by: Peter Zijlstra (Intel) <peterz@infradead.org>
Signed-off-by: Borislav Petkov <bp@suse.de>
Acked-by: Alexei Starovoitov <alexei.starovoitov@gmail.com> # bpf
Acked-by: Linus Torvalds <torvalds@linuxfoundation.org>
Link: https://lkml.kernel.org/r/20210312115749.065275711@infradead.org
12 files changed:
arch/x86/include/asm/cpufeatures.h
arch/x86/include/asm/jump_label.h
arch/x86/include/asm/nops.h
arch/x86/include/asm/special_insns.h
arch/x86/kernel/alternative.c
arch/x86/kernel/cpu/amd.c
arch/x86/kernel/ftrace.c
arch/x86/kernel/jump_label.c
arch/x86/kernel/kprobes/core.c
arch/x86/kernel/setup.c
arch/x86/kernel/static_call.c
arch/x86/net/bpf_jit_comp.c