Merge branch 'hash-rethink'
authorDavid S. Miller <davem@davemloft.net>
Mon, 31 Jan 2022 15:05:25 +0000 (15:05 +0000)
committerDavid S. Miller <davem@davemloft.net>
Mon, 31 Jan 2022 15:05:25 +0000 (15:05 +0000)
commit01b2a995156d11166da00ce254d59bd7f7cefb92
tree7211b0a22e1a7011c1210fbfad9a0695f5a9bd93
parent678dfd5280341d877ca646499bfdc82a3d8b4356
parentcb6cd2cec799356e5e2f75a8591894599a6ad49d
Merge branch 'hash-rethink'

Akhmat Karakotov says:

====================
Make hash rethink configurable

As it was shown in the report by Alexander Azimov, hash rethink at the
client-side may lead to connection timeout toward stateful anycast
services. Tom Herbert created a patchset to address this issue by applying
hash rethink only after a negative routing event (3RTOs) [1]. This change
also affects server-side behavior, which we found undesirable. This
patchset changes defaults in a way to make them safe: hash rethink at the
client-side is disabled and enabled at the server-side upon each RTO
event or in case of duplicate acknowledgments.

This patchset provides two options to change default behaviour. The hash
rethink may be disabled at the server-side by the new sysctl option.
Changes in the sysctl option don't affect default behavior at the
client-side.

Hash rethink can also be enabled/disabled with socket option or bpf
syscalls which ovewrite both default and sysctl settings. This socket
option is available on both client and server-side. This should provide
mechanics to enable hash rethink inside administrative domain, such as DC,
where hash rethink at the client-side can be desirable.

[1] https://lore.kernel.org/netdev/20210809185314.38187-1-tom@herbertland.com/

v2:
- Changed sysctl default to ENABLED in all patches. Reduced sysctl
  and socket option size to u8. Fixed netns bug reported by kernel
  test robot.

v3:
- Fixed bug with bad u8 comparison. Moved sk_txrehash to use less
  bytes in struct. Added WRITE_ONCE() in setsockopt in and
  READ_ONCE() in tcp_rtx_synack.

v4:
- Rebase and add documentation for sysctl option.

v5:
- Move sk_txrehash out of busy poll ifdef.
====================

Signed-off-by: David S. Miller <davem@davemloft.net>