mm: userfaultfd: move_pages_pte() use pte_offset_map_rw_nolock()
authorQi Zheng <zhengqi.arch@bytedance.com>
Thu, 26 Sep 2024 06:46:24 +0000 (14:46 +0800)
committerAndrew Morton <akpm@linux-foundation.org>
Wed, 6 Nov 2024 00:56:28 +0000 (16:56 -0800)
In move_pages_pte(), we may modify the dst_pte and src_pte after acquiring
the ptl, so convert it to using pte_offset_map_rw_nolock().  But since we
will use pte_same() to detect the change of the pte entry, there is no
need to get pmdval, so just pass a dummy variable to it.

Link: https://lkml.kernel.org/r/1530e8fdbfc72eacf3b095babe139ce3d715600a.1727332572.git.zhengqi.arch@bytedance.com
Signed-off-by: Qi Zheng <zhengqi.arch@bytedance.com>
Reviewed-by: Muchun Song <muchun.song@linux.dev>
Cc: David Hildenbrand <david@redhat.com>
Cc: Hugh Dickins <hughd@google.com>
Cc: Matthew Wilcox <willy@infradead.org>
Cc: Mike Rapoport (Microsoft) <rppt@kernel.org>
Cc: Peter Xu <peterx@redhat.com>
Cc: Ryan Roberts <ryan.roberts@arm.com>
Cc: Vishal Moola (Oracle) <vishal.moola@gmail.com>
Signed-off-by: Andrew Morton <akpm@linux-foundation.org>
mm/userfaultfd.c

index ce13c40626472a006848135cf161b91c78f3c89e..48b87c62fc3dd9376d1cb233fe966784daa2e492 100644 (file)
@@ -1135,7 +1135,7 @@ static int move_pages_pte(struct mm_struct *mm, pmd_t *dst_pmd, pmd_t *src_pmd,
        spinlock_t *src_ptl, *dst_ptl;
        pte_t *src_pte = NULL;
        pte_t *dst_pte = NULL;
-
+       pmd_t dummy_pmdval;
        struct folio *src_folio = NULL;
        struct anon_vma *src_anon_vma = NULL;
        struct mmu_notifier_range range;
@@ -1146,7 +1146,14 @@ static int move_pages_pte(struct mm_struct *mm, pmd_t *dst_pmd, pmd_t *src_pmd,
                                src_addr, src_addr + PAGE_SIZE);
        mmu_notifier_invalidate_range_start(&range);
 retry:
-       dst_pte = pte_offset_map_nolock(mm, dst_pmd, dst_addr, &dst_ptl);
+       /*
+        * Use the maywrite version to indicate that dst_pte will be modified,
+        * but since we will use pte_same() to detect the change of the pte
+        * entry, there is no need to get pmdval, so just pass a dummy variable
+        * to it.
+        */
+       dst_pte = pte_offset_map_rw_nolock(mm, dst_pmd, dst_addr, &dummy_pmdval,
+                                          &dst_ptl);
 
        /* Retry if a huge pmd materialized from under us */
        if (unlikely(!dst_pte)) {
@@ -1154,7 +1161,9 @@ retry:
                goto out;
        }
 
-       src_pte = pte_offset_map_nolock(mm, src_pmd, src_addr, &src_ptl);
+       /* same as dst_pte */
+       src_pte = pte_offset_map_rw_nolock(mm, src_pmd, src_addr, &dummy_pmdval,
+                                          &src_ptl);
 
        /*
         * We held the mmap_lock for reading so MADV_DONTNEED