afs: Fix server list handling
authorDavid Howells <dhowells@redhat.com>
Tue, 6 Feb 2018 14:12:32 +0000 (14:12 +0000)
committerDavid Howells <dhowells@redhat.com>
Tue, 6 Feb 2018 14:36:54 +0000 (14:36 +0000)
commit45df8462730d2149834980d3db16e2d2b9daaf60
treeb884a2ea9e5c704a5ec90caf905a3a1902f7ce74
parent8305e579c653b127b292fcdce551e930f9560260
afs: Fix server list handling

Fix server list handling in the following ways:

 (1) In afs_alloc_volume(), remove duplicate server list build code.  This
     was already done by afs_alloc_server_list() which afs_alloc_volume()
     previously called.  This just results in twice as many VL RPCs.

 (2) In afs_deliver_vl_get_entry_by_name_u(), use the number of server
     records indicated by ->nServers in the UVLDB record returned by the
     VL.GetEntryByNameU RPC call rather than scanning all NMAXNSERVERS
     slots.  Unused slots may contain garbage.

 (3) In afs_alloc_server_list(), don't stop converting a UVLDB record into
     a server list just because we can't look up one of the servers.  Just
     skip that server and go on to the next.  If we can't look up any of
     the servers then we'll fail at the end.

Without this patch, an attempt to view the umich.edu root cell using
something like "ls /afs/umich.edu" on a dynamic root (future patch) mount
or an autocell mount will result in ENOMEDIUM.  The failure is due to kafs
not stopping after nServers'worth of records have been read, but then
trying to access a server with a garbage UUID and getting an error, which
aborts the server list build.

Fixes: d2ddc776a458 ("afs: Overhaul volume and server record caching and fileserver rotation")
Reported-by: Jonathan Billings <jsbillings@jsbillings.org>
Signed-off-by: David Howells <dhowells@redhat.com>
cc: stable@vger.kernel.org
fs/afs/server_list.c
fs/afs/vlclient.c
fs/afs/volume.c