rcu: Eliminate deadlock between CPU hotplug and expedited grace periods
authorPaul E. McKenney <paulmck@linux.vnet.ibm.com>
Tue, 26 Aug 2014 03:25:06 +0000 (20:25 -0700)
committerPaul E. McKenney <paulmck@linux.vnet.ibm.com>
Thu, 18 Sep 2014 23:22:27 +0000 (16:22 -0700)
commitdd56af42bd829c6e770ed69812bd65a04eaeb1e4
tree6d510ac693c3dfb05dcc383cb60acd3e1e8cab6c
parentec4518aad8329364af373f4bf7f4eff25a01a339
rcu: Eliminate deadlock between CPU hotplug and expedited grace periods

Currently, the expedited grace-period primitives do get_online_cpus().
This greatly simplifies their implementation, but means that calls
to them holding locks that are acquired by CPU-hotplug notifiers (to
say nothing of calls to these primitives from CPU-hotplug notifiers)
can deadlock.  But this is starting to become inconvenient, as can be
seen here: https://lkml.org/lkml/2014/8/5/754.  The problem in this
case is that some developers need to acquire a mutex from a CPU-hotplug
notifier, but also need to hold it across a synchronize_rcu_expedited().
As noted above, this currently results in deadlock.

This commit avoids the deadlock and retains the simplicity by creating
a try_get_online_cpus(), which returns false if the get_online_cpus()
reference count could not immediately be incremented.  If a call to
try_get_online_cpus() returns true, the expedited primitives operate as
before.  If a call returns false, the expedited primitives fall back to
normal grace-period operations.  This falling back of course results in
increased grace-period latency, but only during times when CPU hotplug
operations are actually in flight.  The effect should therefore be
negligible during normal operation.

Signed-off-by: Paul E. McKenney <paulmck@linux.vnet.ibm.com>
Cc: Josh Triplett <josh@joshtriplett.org>
Cc: "Rafael J. Wysocki" <rjw@rjwysocki.net>
Tested-by: Lan Tianyu <tianyu.lan@intel.com>
include/linux/cpu.h
include/linux/lockdep.h
kernel/cpu.c
kernel/rcu/tree.c
kernel/rcu/tree_plugin.h