drm/amdgpu: Fix SDMA engine reset with logical instance ID
authorJesse Zhang <jesse.zhang@amd.com>
Wed, 11 Jun 2025 07:02:09 +0000 (15:02 +0800)
committerAlex Deucher <alexander.deucher@amd.com>
Wed, 18 Jun 2025 17:10:44 +0000 (13:10 -0400)
This commit makes the following improvements to SDMA engine reset handling:

1. Clarifies in the function documentation that instance_id refers to a logical ID
2. Adds conversion from logical to physical instance ID before performing reset
   using GET_INST(SDMA0, instance_id) macro
3. Improves error messaging to indicate when a logical instance reset fails
4. Adds better code organization with blank lines for readability

The change ensures proper SDMA engine reset by using the correct physical
instance ID while maintaining the logical ID interface for callers.

V2: Remove harvest_config check and convert directly to physical instance (Lijo)

Suggested-by: Jonathan Kim <jonathan.kim@amd.com>
Signed-off-by: Jesse Zhang <Jesse.Zhang@amd.com>
Reviewed-by: Alex Deucher <alexander.deucher@amd.com>
Signed-off-by: Alex Deucher <alexander.deucher@amd.com>
(cherry picked from commit 5efa6217c239ed1ceec0f0414f9b6f6927387dfc)
Cc: stable@vger.kernel.org
drivers/gpu/drm/amd/amdgpu/amdgpu_sdma.c

index 6716ac281c49863dfd403cd0b45c5de2e92d5c82..9b54a1ece447fb98c596e660df8dc653f1f73703 100644 (file)
@@ -540,8 +540,10 @@ static int amdgpu_sdma_soft_reset(struct amdgpu_device *adev, u32 instance_id)
        case IP_VERSION(4, 4, 2):
        case IP_VERSION(4, 4, 4):
        case IP_VERSION(4, 4, 5):
-               /* For SDMA 4.x, use the existing DPM interface for backward compatibility */
-               r = amdgpu_dpm_reset_sdma(adev, 1 << instance_id);
+               /* For SDMA 4.x, use the existing DPM interface for backward compatibility,
+                * we need to convert the logical instance ID to physical instance ID before reset.
+                */
+               r = amdgpu_dpm_reset_sdma(adev, 1 << GET_INST(SDMA0, instance_id));
                break;
        case IP_VERSION(5, 0, 0):
        case IP_VERSION(5, 0, 1):
@@ -568,7 +570,7 @@ static int amdgpu_sdma_soft_reset(struct amdgpu_device *adev, u32 instance_id)
 /**
  * amdgpu_sdma_reset_engine - Reset a specific SDMA engine
  * @adev: Pointer to the AMDGPU device
- * @instance_id: ID of the SDMA engine instance to reset
+ * @instance_id: Logical ID of the SDMA engine instance to reset
  *
  * Returns: 0 on success, or a negative error code on failure.
  */
@@ -601,7 +603,7 @@ int amdgpu_sdma_reset_engine(struct amdgpu_device *adev, uint32_t instance_id)
        /* Perform the SDMA reset for the specified instance */
        ret = amdgpu_sdma_soft_reset(adev, instance_id);
        if (ret) {
-               dev_err(adev->dev, "Failed to reset SDMA instance %u\n", instance_id);
+               dev_err(adev->dev, "Failed to reset SDMA logical instance %u\n", instance_id);
                goto exit;
        }