hrtimer: migration: do not check expiry time on current CPU
authorThomas Gleixner <tglx@linutronix.de>
Thu, 9 Jul 2009 11:52:32 +0000 (13:52 +0200)
committerThomas Gleixner <tglx@linutronix.de>
Fri, 10 Jul 2009 15:22:20 +0000 (17:22 +0200)
The timer migration code needs to check whether the expiry time of the
timer is before the programmed clock event expiry time when the timer
is enqueued on another CPU because we can not reprogram the timer
device on the other CPU. The current logic checks the expiry time even
if we enqueue on the current CPU when nohz_get_load_balancer() returns
current CPU. This might lead to an endless loop in the expiry check
code when the expiry time of the timer is before the current
programmed next event.

Check whether nohz_get_load_balancer() returns current CPU and skip
the expiry check if this is the case.

The bug was triggered from the networking code. The patch fixes the
regression http://bugzilla.kernel.org/show_bug.cgi?id=13738
(Soft-Lockup/Race in networking in 2.6.31-rc1+195)

Cc: Arun Bharadwaj <arun@linux.vnet.ibm.com
Tested-by: Joao Correia <joaomiguelcorreia@gmail.com>
Tested-by: Andres Freund <andres@anarazel.de>
Signed-off-by: Thomas Gleixner <tglx@linutronix.de>
kernel/hrtimer.c

index 9002958a96e70ef0f8acc70ceeccac5327efae9e..126b9808f28793596eee3202273ac742b59b3633 100644 (file)
@@ -206,8 +206,19 @@ switch_hrtimer_base(struct hrtimer *timer, struct hrtimer_clock_base *base,
 #if defined(CONFIG_NO_HZ) && defined(CONFIG_SMP)
        if (!pinned && get_sysctl_timer_migration() && idle_cpu(cpu)) {
                preferred_cpu = get_nohz_load_balancer();
-               if (preferred_cpu >= 0)
-                       cpu = preferred_cpu;
+               if (preferred_cpu >= 0) {
+                       /*
+                        * We must not check the expiry value when
+                        * preferred_cpu is the current cpu. If base
+                        * != new_base we would loop forever when the
+                        * timer expires before the current programmed
+                        * next timer event.
+                        */
+                       if (preferred_cpu != cpu)
+                               cpu = preferred_cpu;
+                       else
+                               preferred_cpu = -1;
+               }
        }
 #endif