drm/amdgpu: Add EXT_COHERENT support for APU and NUMA systems

author David Francis <David.Francis@amd.com>

Thu, 12 Oct 2023 14:35:20 +0000 (10:35 -0400)

committer Alex Deucher <alexander.deucher@amd.com>

Fri, 27 Oct 2023 18:15:16 +0000 (14:15 -0400)
author David Francis <David.Francis@amd.com>
Thu, 12 Oct 2023 14:35:20 +0000 (10:35 -0400)
committer Alex Deucher <alexander.deucher@amd.com>
Fri, 27 Oct 2023 18:15:16 +0000 (14:15 -0400)
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.c

index f3c9f93d8899c82c4d0bbbbd70a5f55fde352c9b..3cd5977c0709a66634991714a43def35b3e962d4 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.c
@@ -844,6 +844,7 @@ static void amdgpu_vm_tlb_seq_cb(struct dma_fence *fence,
   * @immediate: immediate submission in a page fault
   * @unlocked: unlocked invalidation during MM callback
   * @flush_tlb: trigger tlb invalidation after update completed
+ * @allow_override: change MTYPE for local NUMA nodes
   * @resv: fences we need to sync to
   * @start: start of mapped range
   * @last: last mapped entry
@@ -860,7 +861,7 @@ static void amdgpu_vm_tlb_seq_cb(struct dma_fence *fence,
   * 0 for success, negative erro code for failure.
   */
  int amdgpu_vm_update_range(struct amdgpu_device *adev, struct amdgpu_vm *vm,
-                          bool immediate, bool unlocked, bool flush_tlb,
+                          bool immediate, bool unlocked, bool flush_tlb, bool allow_override,
                            struct dma_resv *resv, uint64_t start, uint64_t last,
                            uint64_t flags, uint64_t offset, uint64_t vram_base,
                            struct ttm_resource *res, dma_addr_t *pages_addr,
@@ -898,6 +899,7 @@ int amdgpu_vm_update_range(struct amdgpu_device *adev, struct amdgpu_vm *vm,
         params.immediate = immediate;
         params.pages_addr = pages_addr;
         params.unlocked = unlocked;
+       params.allow_override = allow_override;
  
         /* Implicitly sync to command submissions in the same VM before
          * unmapping. Sync to moving fences before mapping.
@@ -1073,6 +1075,7 @@ int amdgpu_vm_bo_update(struct amdgpu_device *adev, struct amdgpu_bo_va *bo_va,
         struct ttm_resource *mem;
         struct dma_fence **last_update;
         bool flush_tlb = clear;
+       bool uncached;
         struct dma_resv *resv;
         uint64_t vram_base;
         uint64_t flags;
@@ -1110,9 +1113,11 @@ int amdgpu_vm_bo_update(struct amdgpu_device *adev, struct amdgpu_bo_va *bo_va,
  
                 bo_adev = amdgpu_ttm_adev(bo->tbo.bdev);
                 vram_base = bo_adev->vm_manager.vram_base_offset;
+               uncached = (bo->flags & AMDGPU_GEM_CREATE_UNCACHED) != 0;
         } else {
                 flags = 0x0;
                 vram_base = 0;
+               uncached = false;
         }
  
         if (clear || (bo && bo->tbo.base.resv ==
@@ -1146,7 +1151,7 @@ int amdgpu_vm_bo_update(struct amdgpu_device *adev, struct amdgpu_bo_va *bo_va,
                 trace_amdgpu_vm_bo_update(mapping);
  
                 r = amdgpu_vm_update_range(adev, vm, false, false, flush_tlb,
-                                          resv, mapping->start, mapping->last,
+                                          !uncached, resv, mapping->start, mapping->last,
                                            update_flags, mapping->offset,
                                            vram_base, mem, pages_addr,
                                            last_update);
@@ -1341,8 +1346,8 @@ int amdgpu_vm_clear_freed(struct amdgpu_device *adev,
                     mapping->start < AMDGPU_GMC_HOLE_START)
                         init_pte_value = AMDGPU_PTE_DEFAULT_ATC;
  
-               r = amdgpu_vm_update_range(adev, vm, false, false, true, resv,
-                                          mapping->start, mapping->last,
+               r = amdgpu_vm_update_range(adev, vm, false, false, true, false,
+                                          resv, mapping->start, mapping->last,
                                            init_pte_value, 0, 0, NULL, NULL,
                                            &f);
                 amdgpu_vm_free_mapping(adev, vm, mapping, f);
@@ -2618,8 +2623,8 @@ bool amdgpu_vm_handle_fault(struct amdgpu_device *adev, u32 pasid,
                 goto error_unlock;
         }
  
-       r = amdgpu_vm_update_range(adev, vm, true, false, false, NULL, addr,
-                                  addr, flags, value, 0, NULL, NULL, NULL);
+       r = amdgpu_vm_update_range(adev, vm, true, false, false, false,
+                                  NULL, addr, addr, flags, value, 0, NULL, NULL, NULL);
         if (r)
                 goto error_unlock;
  
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.h b/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.h

index 411d42fecfb6773610006a80cc540441b50f869d..9c7b5d33b56e9368acd3c55ce2e702400df24c9f 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.h
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_vm.h
@@ -246,6 +246,12 @@ struct amdgpu_vm_update_params {
          * @table_freed: return true if page table is freed when updating
          */
         bool table_freed;
+
+       /**
+        * @allow_override: true for memory that is not uncached: allows MTYPE
+        * to be overridden for NUMA local memory.
+        */
+       bool allow_override;
  };
  
  struct amdgpu_vm_update_funcs {
@@ -441,7 +447,7 @@ int amdgpu_vm_handle_moved(struct amdgpu_device *adev,
  void amdgpu_vm_bo_base_init(struct amdgpu_vm_bo_base *base,
                             struct amdgpu_vm *vm, struct amdgpu_bo *bo);
  int amdgpu_vm_update_range(struct amdgpu_device *adev, struct amdgpu_vm *vm,
-                          bool immediate, bool unlocked, bool flush_tlb,
+                          bool immediate, bool unlocked, bool flush_tlb, bool allow_override,
                            struct dma_resv *resv, uint64_t start, uint64_t last,
                            uint64_t flags, uint64_t offset, uint64_t vram_base,
                            struct ttm_resource *res, dma_addr_t *pages_addr,
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_vm_pt.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_vm_pt.c

index 9b025fd17b842b92c66c79efa5407d5e8588903d..a2287bb252235e8eb9a906a9216bbf568a68fd33 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_vm_pt.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_vm_pt.c
@@ -843,7 +843,7 @@ static void amdgpu_vm_pte_update_flags(struct amdgpu_vm_update_params *params,
          */
         if ((flags & AMDGPU_PTE_SYSTEM) && (adev->flags & AMD_IS_APU) &&
             adev->gmc.gmc_funcs->override_vm_pte_flags &&
-           num_possible_nodes() > 1 && !params->pages_addr)
+           num_possible_nodes() > 1 && !params->pages_addr && params->allow_override)
                 amdgpu_gmc_override_vm_pte_flags(adev, params->vm, addr, &flags);
  
         params->vm->update_funcs->update(params, pt, pe, addr, count, incr,
diff --git a/drivers/gpu/drm/amd/amdgpu/gmc_v9_0.c b/drivers/gpu/drm/amd/amdgpu/gmc_v9_0.c

index fee3141bb607b0f84faef737f85e2e359a174b41..b66c5f7e1c56572e183f3aed4ffd105526c26f98 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/gmc_v9_0.c
+++ b/drivers/gpu/drm/amd/amdgpu/gmc_v9_0.c
@@ -1251,12 +1251,15 @@ static void gmc_v9_0_override_vm_pte_flags(struct amdgpu_device *adev,
                 return;
         }
  
-       /* Only override mappings with MTYPE_NC, which is the safe default for
-        * cacheable memory.
+       /* MTYPE_NC is the same default and can be overridden.
+        * MTYPE_UC will be present if the memory is extended-coherent
+        * and can also be overridden.
          */
         if ((*flags & AMDGPU_PTE_MTYPE_VG10_MASK) !=
-           AMDGPU_PTE_MTYPE_VG10(MTYPE_NC)) {
-               dev_dbg_ratelimited(adev->dev, "MTYPE is not NC\n");
+           AMDGPU_PTE_MTYPE_VG10(MTYPE_NC) &&
+           (*flags & AMDGPU_PTE_MTYPE_VG10_MASK) !=
+           AMDGPU_PTE_MTYPE_VG10(MTYPE_UC)) {
+               dev_dbg_ratelimited(adev->dev, "MTYPE is not NC or UC\n");
                 return;
         }
  
@@ -1283,15 +1286,23 @@ static void gmc_v9_0_override_vm_pte_flags(struct amdgpu_device *adev,
                             vm->mem_id, local_node, nid);
         if (nid == local_node) {
                 uint64_t old_flags = *flags;
-               unsigned int mtype_local = MTYPE_RW;
+               if ((*flags & AMDGPU_PTE_MTYPE_VG10_MASK) ==
+                       AMDGPU_PTE_MTYPE_VG10(MTYPE_NC)) {
+                       unsigned int mtype_local = MTYPE_RW;
  
-               if (amdgpu_mtype_local == 1)
-                       mtype_local = MTYPE_NC;
-               else if (amdgpu_mtype_local == 2)
-                       mtype_local = MTYPE_CC;
+                       if (amdgpu_mtype_local == 1)
+                               mtype_local = MTYPE_NC;
+                       else if (amdgpu_mtype_local == 2)
+                               mtype_local = MTYPE_CC;
+
+                       *flags = (*flags & ~AMDGPU_PTE_MTYPE_VG10_MASK) |
+                                AMDGPU_PTE_MTYPE_VG10(mtype_local);
+               } else {
+                       /* MTYPE_UC case */
+                       *flags = (*flags & ~AMDGPU_PTE_MTYPE_VG10_MASK) |
+                                AMDGPU_PTE_MTYPE_VG10(MTYPE_CC);
+               }
  
-               *flags = (*flags & ~AMDGPU_PTE_MTYPE_VG10_MASK) |
-                        AMDGPU_PTE_MTYPE_VG10(mtype_local);
                 dev_dbg_ratelimited(adev->dev, "flags updated from %llx to %llx\n",
                                     old_flags, *flags);
         }
diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_svm.c b/drivers/gpu/drm/amd/amdkfd/kfd_svm.c

index 3560a5a5809020b70ecb8cc231a003dd49a129c9..e67d06a4280954f545cb88c34219e38af7cab9a1 100644 (file)
--- a/drivers/gpu/drm/amd/amdkfd/kfd_svm.c
+++ b/drivers/gpu/drm/amd/amdkfd/kfd_svm.c
@@ -1282,7 +1282,7 @@ svm_range_get_pte_flags(struct kfd_node *node,
                         if (num_possible_nodes() <= 1)
                                 mapping_flags |= mtype_local;
                         else
-                               mapping_flags |= AMDGPU_VM_MTYPE_NC;
+                               mapping_flags |= ext_coherent ? AMDGPU_VM_MTYPE_UC : AMDGPU_VM_MTYPE_NC;
                 /* system memory accessed by the dGPU */
                 } else {
                         mapping_flags |= AMDGPU_VM_MTYPE_UC;
@@ -1317,7 +1317,7 @@ svm_range_unmap_from_gpu(struct amdgpu_device *adev, struct amdgpu_vm *vm,
  
         pr_debug("[0x%llx 0x%llx]\n", start, last);
  
-       return amdgpu_vm_update_range(adev, vm, false, true, true, NULL, start,
+       return amdgpu_vm_update_range(adev, vm, false, true, true, false, NULL, start,
                                       last, init_pte_value, 0, 0, NULL, NULL,
                                       fence);
  }
@@ -1424,8 +1424,8 @@ svm_range_map_to_gpu(struct kfd_process_device *pdd, struct svm_range *prange,
                  * different memory partition based on fpfn/lpfn, we should use
                  * same vm_manager.vram_base_offset regardless memory partition.
                  */
-               r = amdgpu_vm_update_range(adev, vm, false, false, flush_tlb, NULL,
-                                          last_start, prange->start + i,
+               r = amdgpu_vm_update_range(adev, vm, false, false, flush_tlb, true,
+                                          NULL, last_start, prange->start + i,
                                            pte_flags,
                                            (last_start - prange->start) << PAGE_SHIFT,
                                            bo_adev ? bo_adev->vm_manager.vram_base_offset : 0,
author	David Francis <David.Francis@amd.com>
	Thu, 12 Oct 2023 14:35:20 +0000 (10:35 -0400)
committer	Alex Deucher <alexander.deucher@amd.com>
	Fri, 27 Oct 2023 18:15:16 +0000 (14:15 -0400)
drivers/gpu/drm/amd/amdgpu/amdgpu_vm.c		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_vm.h		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_vm_pt.c		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdgpu/gmc_v9_0.c		patch \| blob \| blame \| history
drivers/gpu/drm/amd/amdkfd/kfd_svm.c		patch \| blob \| blame \| history