btrfs: ensure fiemap doesn't race with writes when FIEMAP_FLAG_SYNC is given
authorFilipe Manana <fdmanana@suse.com>
Thu, 22 Feb 2024 12:29:34 +0000 (12:29 +0000)
committerDavid Sterba <dsterba@suse.com>
Thu, 29 Feb 2024 21:34:07 +0000 (22:34 +0100)
commit418b09027743d9a9fb39116bed46a192f868a3c3
tree903c9728c6e7ba9d4728fde36217f9a54c206817
parenta1a4a9ca77f143c00fce69c1239887ff8b813bec
btrfs: ensure fiemap doesn't race with writes when FIEMAP_FLAG_SYNC is given

When FIEMAP_FLAG_SYNC is given to fiemap the expectation is that that
are no concurrent writes and we get a stable view of the inode's extent
layout.

When the flag is given we flush all IO (and wait for ordered extents to
complete) and then lock the inode in shared mode, however that leaves open
the possibility that a write might happen right after the flushing and
before locking the inode. So fix this by flushing again after locking the
inode - we leave the initial flushing before locking the inode to avoid
holding the lock and blocking other RO operations while waiting for IO
and ordered extents to complete. The second flushing while holding the
inode's lock will most of the time do nothing or very little since the
time window for new writes to have happened is small.

Reviewed-by: Josef Bacik <josef@toxicpanda.com>
Signed-off-by: Filipe Manana <fdmanana@suse.com>
Signed-off-by: David Sterba <dsterba@suse.com>
fs/btrfs/extent_io.c
fs/btrfs/inode.c