cxl: Return error to PSL if IRQ demultiplexing fails & print clearer warning
authorIan Munsie <imunsie@au1.ibm.com>
Fri, 14 Nov 2014 06:37:50 +0000 (17:37 +1100)
committerMichael Ellerman <mpe@ellerman.id.au>
Tue, 18 Nov 2014 01:58:38 +0000 (12:58 +1100)
commitbc78b05bb412fad135715551fc536ca511a3cff2
treebf855a2e5fab58f19e678971296b72a195c2eabb
parent16b1d26e77b142546e2b9b6dc3b5aa5c44ae3b77
cxl: Return error to PSL if IRQ demultiplexing fails & print clearer warning

If an AFU has a hardware bug that causes it to acknowledge a context
terminate or remove while that context has outstanding transactions, it
is possible for the kernel to receive an interrupt for that context
after we have removed it from the context list.

The kernel will not be able to demultiplex the interrupt (or worse - if
we have already reallocated the process handle we could mis-attribute it
to the new context), and printed a big scary warning.

It did not acknowledge the interrupt, which would effectively halt
further translation fault processing on the PSL.

This patch makes the warning clearer about the likely cause of the issue
(i.e. hardware bug) to make it obvious to future AFU designers of what
needs to be fixed. It also prints out the process handle which can then
be matched up with hardware and software traces for debugging.

It also acknowledges the interrupt to the PSL with either an address
error or acknowledge, so that the PSL can continue with other
translations.

Signed-off-by: Ian Munsie <imunsie@au1.ibm.com>
Signed-off-by: Michael Ellerman <mpe@ellerman.id.au>
drivers/misc/cxl/cxl.h
drivers/misc/cxl/irq.c
drivers/misc/cxl/native.c