2e7218869fe981776ea8fc186f2e78448434c252
[linux-2.6-block.git] / kernel / trace / ftrace.c
1 /*
2  * Infrastructure for profiling code inserted by 'gcc -pg'.
3  *
4  * Copyright (C) 2007-2008 Steven Rostedt <srostedt@redhat.com>
5  * Copyright (C) 2004-2008 Ingo Molnar <mingo@redhat.com>
6  *
7  * Originally ported from the -rt patch by:
8  *   Copyright (C) 2007 Arnaldo Carvalho de Melo <acme@redhat.com>
9  *
10  * Based on code in the latency_tracer, that is:
11  *
12  *  Copyright (C) 2004-2006 Ingo Molnar
13  *  Copyright (C) 2004 William Lee Irwin III
14  */
15
16 #include <linux/stop_machine.h>
17 #include <linux/clocksource.h>
18 #include <linux/kallsyms.h>
19 #include <linux/seq_file.h>
20 #include <linux/suspend.h>
21 #include <linux/debugfs.h>
22 #include <linux/hardirq.h>
23 #include <linux/kthread.h>
24 #include <linux/uaccess.h>
25 #include <linux/module.h>
26 #include <linux/ftrace.h>
27 #include <linux/sysctl.h>
28 #include <linux/slab.h>
29 #include <linux/ctype.h>
30 #include <linux/list.h>
31 #include <linux/hash.h>
32 #include <linux/rcupdate.h>
33
34 #include <trace/events/sched.h>
35
36 #include <asm/setup.h>
37
38 #include "trace_output.h"
39 #include "trace_stat.h"
40
41 #define FTRACE_WARN_ON(cond)                    \
42         ({                                      \
43                 int ___r = cond;                \
44                 if (WARN_ON(___r))              \
45                         ftrace_kill();          \
46                 ___r;                           \
47         })
48
49 #define FTRACE_WARN_ON_ONCE(cond)               \
50         ({                                      \
51                 int ___r = cond;                \
52                 if (WARN_ON_ONCE(___r))         \
53                         ftrace_kill();          \
54                 ___r;                           \
55         })
56
57 /* hash bits for specific function selection */
58 #define FTRACE_HASH_BITS 7
59 #define FTRACE_FUNC_HASHSIZE (1 << FTRACE_HASH_BITS)
60 #define FTRACE_HASH_DEFAULT_BITS 10
61 #define FTRACE_HASH_MAX_BITS 12
62
63 /* ftrace_enabled is a method to turn ftrace on or off */
64 int ftrace_enabled __read_mostly;
65 static int last_ftrace_enabled;
66
67 /* Quick disabling of function tracer. */
68 int function_trace_stop;
69
70 /* List for set_ftrace_pid's pids. */
71 LIST_HEAD(ftrace_pids);
72 struct ftrace_pid {
73         struct list_head list;
74         struct pid *pid;
75 };
76
77 /*
78  * ftrace_disabled is set when an anomaly is discovered.
79  * ftrace_disabled is much stronger than ftrace_enabled.
80  */
81 static int ftrace_disabled __read_mostly;
82
83 static DEFINE_MUTEX(ftrace_lock);
84
85 static struct ftrace_ops ftrace_list_end __read_mostly = {
86         .func           = ftrace_stub,
87 };
88
89 static struct ftrace_ops *ftrace_global_list __read_mostly = &ftrace_list_end;
90 static struct ftrace_ops *ftrace_ops_list __read_mostly = &ftrace_list_end;
91 ftrace_func_t ftrace_trace_function __read_mostly = ftrace_stub;
92 static ftrace_func_t __ftrace_trace_function_delay __read_mostly = ftrace_stub;
93 ftrace_func_t __ftrace_trace_function __read_mostly = ftrace_stub;
94 ftrace_func_t ftrace_pid_function __read_mostly = ftrace_stub;
95 static struct ftrace_ops global_ops;
96
97 static void
98 ftrace_ops_list_func(unsigned long ip, unsigned long parent_ip);
99
100 /*
101  * Traverse the ftrace_global_list, invoking all entries.  The reason that we
102  * can use rcu_dereference_raw() is that elements removed from this list
103  * are simply leaked, so there is no need to interact with a grace-period
104  * mechanism.  The rcu_dereference_raw() calls are needed to handle
105  * concurrent insertions into the ftrace_global_list.
106  *
107  * Silly Alpha and silly pointer-speculation compiler optimizations!
108  */
109 static void ftrace_global_list_func(unsigned long ip,
110                                     unsigned long parent_ip)
111 {
112         struct ftrace_ops *op;
113
114         if (unlikely(trace_recursion_test(TRACE_GLOBAL_BIT)))
115                 return;
116
117         trace_recursion_set(TRACE_GLOBAL_BIT);
118         op = rcu_dereference_raw(ftrace_global_list); /*see above*/
119         while (op != &ftrace_list_end) {
120                 op->func(ip, parent_ip);
121                 op = rcu_dereference_raw(op->next); /*see above*/
122         };
123         trace_recursion_clear(TRACE_GLOBAL_BIT);
124 }
125
126 static void ftrace_pid_func(unsigned long ip, unsigned long parent_ip)
127 {
128         if (!test_tsk_trace_trace(current))
129                 return;
130
131         ftrace_pid_function(ip, parent_ip);
132 }
133
134 static void set_ftrace_pid_function(ftrace_func_t func)
135 {
136         /* do not set ftrace_pid_function to itself! */
137         if (func != ftrace_pid_func)
138                 ftrace_pid_function = func;
139 }
140
141 /**
142  * clear_ftrace_function - reset the ftrace function
143  *
144  * This NULLs the ftrace function and in essence stops
145  * tracing.  There may be lag
146  */
147 void clear_ftrace_function(void)
148 {
149         ftrace_trace_function = ftrace_stub;
150         __ftrace_trace_function = ftrace_stub;
151         __ftrace_trace_function_delay = ftrace_stub;
152         ftrace_pid_function = ftrace_stub;
153 }
154
155 #ifndef CONFIG_HAVE_FUNCTION_TRACE_MCOUNT_TEST
156 /*
157  * For those archs that do not test ftrace_trace_stop in their
158  * mcount call site, we need to do it from C.
159  */
160 static void ftrace_test_stop_func(unsigned long ip, unsigned long parent_ip)
161 {
162         if (function_trace_stop)
163                 return;
164
165         __ftrace_trace_function(ip, parent_ip);
166 }
167 #endif
168
169 static void update_global_ops(void)
170 {
171         ftrace_func_t func;
172
173         /*
174          * If there's only one function registered, then call that
175          * function directly. Otherwise, we need to iterate over the
176          * registered callers.
177          */
178         if (ftrace_global_list == &ftrace_list_end ||
179             ftrace_global_list->next == &ftrace_list_end)
180                 func = ftrace_global_list->func;
181         else
182                 func = ftrace_global_list_func;
183
184         /* If we filter on pids, update to use the pid function */
185         if (!list_empty(&ftrace_pids)) {
186                 set_ftrace_pid_function(func);
187                 func = ftrace_pid_func;
188         }
189
190         global_ops.func = func;
191 }
192
193 static void update_ftrace_function(void)
194 {
195         ftrace_func_t func;
196
197         update_global_ops();
198
199         /*
200          * If we are at the end of the list and this ops is
201          * not dynamic, then have the mcount trampoline call
202          * the function directly
203          */
204         if (ftrace_ops_list == &ftrace_list_end ||
205             (ftrace_ops_list->next == &ftrace_list_end &&
206              !(ftrace_ops_list->flags & FTRACE_OPS_FL_DYNAMIC)))
207                 func = ftrace_ops_list->func;
208         else
209                 func = ftrace_ops_list_func;
210
211 #ifdef CONFIG_HAVE_FUNCTION_TRACE_MCOUNT_TEST
212         ftrace_trace_function = func;
213 #else
214 #ifdef CONFIG_DYNAMIC_FTRACE
215         /* do not update till all functions have been modified */
216         __ftrace_trace_function_delay = func;
217 #else
218         __ftrace_trace_function = func;
219 #endif
220         ftrace_trace_function = ftrace_test_stop_func;
221 #endif
222 }
223
224 static void add_ftrace_ops(struct ftrace_ops **list, struct ftrace_ops *ops)
225 {
226         ops->next = *list;
227         /*
228          * We are entering ops into the list but another
229          * CPU might be walking that list. We need to make sure
230          * the ops->next pointer is valid before another CPU sees
231          * the ops pointer included into the list.
232          */
233         rcu_assign_pointer(*list, ops);
234 }
235
236 static int remove_ftrace_ops(struct ftrace_ops **list, struct ftrace_ops *ops)
237 {
238         struct ftrace_ops **p;
239
240         /*
241          * If we are removing the last function, then simply point
242          * to the ftrace_stub.
243          */
244         if (*list == ops && ops->next == &ftrace_list_end) {
245                 *list = &ftrace_list_end;
246                 return 0;
247         }
248
249         for (p = list; *p != &ftrace_list_end; p = &(*p)->next)
250                 if (*p == ops)
251                         break;
252
253         if (*p != ops)
254                 return -1;
255
256         *p = (*p)->next;
257         return 0;
258 }
259
260 static int __register_ftrace_function(struct ftrace_ops *ops)
261 {
262         if (ftrace_disabled)
263                 return -ENODEV;
264
265         if (FTRACE_WARN_ON(ops == &global_ops))
266                 return -EINVAL;
267
268         if (WARN_ON(ops->flags & FTRACE_OPS_FL_ENABLED))
269                 return -EBUSY;
270
271         if (!core_kernel_data((unsigned long)ops))
272                 ops->flags |= FTRACE_OPS_FL_DYNAMIC;
273
274         if (ops->flags & FTRACE_OPS_FL_GLOBAL) {
275                 int first = ftrace_global_list == &ftrace_list_end;
276                 add_ftrace_ops(&ftrace_global_list, ops);
277                 ops->flags |= FTRACE_OPS_FL_ENABLED;
278                 if (first)
279                         add_ftrace_ops(&ftrace_ops_list, &global_ops);
280         } else
281                 add_ftrace_ops(&ftrace_ops_list, ops);
282
283         if (ftrace_enabled)
284                 update_ftrace_function();
285
286         return 0;
287 }
288
289 static int __unregister_ftrace_function(struct ftrace_ops *ops)
290 {
291         int ret;
292
293         if (ftrace_disabled)
294                 return -ENODEV;
295
296         if (WARN_ON(!(ops->flags & FTRACE_OPS_FL_ENABLED)))
297                 return -EBUSY;
298
299         if (FTRACE_WARN_ON(ops == &global_ops))
300                 return -EINVAL;
301
302         if (ops->flags & FTRACE_OPS_FL_GLOBAL) {
303                 ret = remove_ftrace_ops(&ftrace_global_list, ops);
304                 if (!ret && ftrace_global_list == &ftrace_list_end)
305                         ret = remove_ftrace_ops(&ftrace_ops_list, &global_ops);
306                 if (!ret)
307                         ops->flags &= ~FTRACE_OPS_FL_ENABLED;
308         } else
309                 ret = remove_ftrace_ops(&ftrace_ops_list, ops);
310
311         if (ret < 0)
312                 return ret;
313
314         if (ftrace_enabled)
315                 update_ftrace_function();
316
317         /*
318          * Dynamic ops may be freed, we must make sure that all
319          * callers are done before leaving this function.
320          */
321         if (ops->flags & FTRACE_OPS_FL_DYNAMIC)
322                 synchronize_sched();
323
324         return 0;
325 }
326
327 static void ftrace_update_pid_func(void)
328 {
329         /* Only do something if we are tracing something */
330         if (ftrace_trace_function == ftrace_stub)
331                 return;
332
333         update_ftrace_function();
334 }
335
336 #ifdef CONFIG_FUNCTION_PROFILER
337 struct ftrace_profile {
338         struct hlist_node               node;
339         unsigned long                   ip;
340         unsigned long                   counter;
341 #ifdef CONFIG_FUNCTION_GRAPH_TRACER
342         unsigned long long              time;
343         unsigned long long              time_squared;
344 #endif
345 };
346
347 struct ftrace_profile_page {
348         struct ftrace_profile_page      *next;
349         unsigned long                   index;
350         struct ftrace_profile           records[];
351 };
352
353 struct ftrace_profile_stat {
354         atomic_t                        disabled;
355         struct hlist_head               *hash;
356         struct ftrace_profile_page      *pages;
357         struct ftrace_profile_page      *start;
358         struct tracer_stat              stat;
359 };
360
361 #define PROFILE_RECORDS_SIZE                                            \
362         (PAGE_SIZE - offsetof(struct ftrace_profile_page, records))
363
364 #define PROFILES_PER_PAGE                                       \
365         (PROFILE_RECORDS_SIZE / sizeof(struct ftrace_profile))
366
367 static int ftrace_profile_bits __read_mostly;
368 static int ftrace_profile_enabled __read_mostly;
369
370 /* ftrace_profile_lock - synchronize the enable and disable of the profiler */
371 static DEFINE_MUTEX(ftrace_profile_lock);
372
373 static DEFINE_PER_CPU(struct ftrace_profile_stat, ftrace_profile_stats);
374
375 #define FTRACE_PROFILE_HASH_SIZE 1024 /* must be power of 2 */
376
377 static void *
378 function_stat_next(void *v, int idx)
379 {
380         struct ftrace_profile *rec = v;
381         struct ftrace_profile_page *pg;
382
383         pg = (struct ftrace_profile_page *)((unsigned long)rec & PAGE_MASK);
384
385  again:
386         if (idx != 0)
387                 rec++;
388
389         if ((void *)rec >= (void *)&pg->records[pg->index]) {
390                 pg = pg->next;
391                 if (!pg)
392                         return NULL;
393                 rec = &pg->records[0];
394                 if (!rec->counter)
395                         goto again;
396         }
397
398         return rec;
399 }
400
401 static void *function_stat_start(struct tracer_stat *trace)
402 {
403         struct ftrace_profile_stat *stat =
404                 container_of(trace, struct ftrace_profile_stat, stat);
405
406         if (!stat || !stat->start)
407                 return NULL;
408
409         return function_stat_next(&stat->start->records[0], 0);
410 }
411
412 #ifdef CONFIG_FUNCTION_GRAPH_TRACER
413 /* function graph compares on total time */
414 static int function_stat_cmp(void *p1, void *p2)
415 {
416         struct ftrace_profile *a = p1;
417         struct ftrace_profile *b = p2;
418
419         if (a->time < b->time)
420                 return -1;
421         if (a->time > b->time)
422                 return 1;
423         else
424                 return 0;
425 }
426 #else
427 /* not function graph compares against hits */
428 static int function_stat_cmp(void *p1, void *p2)
429 {
430         struct ftrace_profile *a = p1;
431         struct ftrace_profile *b = p2;
432
433         if (a->counter < b->counter)
434                 return -1;
435         if (a->counter > b->counter)
436                 return 1;
437         else
438                 return 0;
439 }
440 #endif
441
442 static int function_stat_headers(struct seq_file *m)
443 {
444 #ifdef CONFIG_FUNCTION_GRAPH_TRACER
445         seq_printf(m, "  Function                               "
446                    "Hit    Time            Avg             s^2\n"
447                       "  --------                               "
448                    "---    ----            ---             ---\n");
449 #else
450         seq_printf(m, "  Function                               Hit\n"
451                       "  --------                               ---\n");
452 #endif
453         return 0;
454 }
455
456 static int function_stat_show(struct seq_file *m, void *v)
457 {
458         struct ftrace_profile *rec = v;
459         char str[KSYM_SYMBOL_LEN];
460         int ret = 0;
461 #ifdef CONFIG_FUNCTION_GRAPH_TRACER
462         static struct trace_seq s;
463         unsigned long long avg;
464         unsigned long long stddev;
465 #endif
466         mutex_lock(&ftrace_profile_lock);
467
468         /* we raced with function_profile_reset() */
469         if (unlikely(rec->counter == 0)) {
470                 ret = -EBUSY;
471                 goto out;
472         }
473
474         kallsyms_lookup(rec->ip, NULL, NULL, NULL, str);
475         seq_printf(m, "  %-30.30s  %10lu", str, rec->counter);
476
477 #ifdef CONFIG_FUNCTION_GRAPH_TRACER
478         seq_printf(m, "    ");
479         avg = rec->time;
480         do_div(avg, rec->counter);
481
482         /* Sample standard deviation (s^2) */
483         if (rec->counter <= 1)
484                 stddev = 0;
485         else {
486                 stddev = rec->time_squared - rec->counter * avg * avg;
487                 /*
488                  * Divide only 1000 for ns^2 -> us^2 conversion.
489                  * trace_print_graph_duration will divide 1000 again.
490                  */
491                 do_div(stddev, (rec->counter - 1) * 1000);
492         }
493
494         trace_seq_init(&s);
495         trace_print_graph_duration(rec->time, &s);
496         trace_seq_puts(&s, "    ");
497         trace_print_graph_duration(avg, &s);
498         trace_seq_puts(&s, "    ");
499         trace_print_graph_duration(stddev, &s);
500         trace_print_seq(m, &s);
501 #endif
502         seq_putc(m, '\n');
503 out:
504         mutex_unlock(&ftrace_profile_lock);
505
506         return ret;
507 }
508
509 static void ftrace_profile_reset(struct ftrace_profile_stat *stat)
510 {
511         struct ftrace_profile_page *pg;
512
513         pg = stat->pages = stat->start;
514
515         while (pg) {
516                 memset(pg->records, 0, PROFILE_RECORDS_SIZE);
517                 pg->index = 0;
518                 pg = pg->next;
519         }
520
521         memset(stat->hash, 0,
522                FTRACE_PROFILE_HASH_SIZE * sizeof(struct hlist_head));
523 }
524
525 int ftrace_profile_pages_init(struct ftrace_profile_stat *stat)
526 {
527         struct ftrace_profile_page *pg;
528         int functions;
529         int pages;
530         int i;
531
532         /* If we already allocated, do nothing */
533         if (stat->pages)
534                 return 0;
535
536         stat->pages = (void *)get_zeroed_page(GFP_KERNEL);
537         if (!stat->pages)
538                 return -ENOMEM;
539
540 #ifdef CONFIG_DYNAMIC_FTRACE
541         functions = ftrace_update_tot_cnt;
542 #else
543         /*
544          * We do not know the number of functions that exist because
545          * dynamic tracing is what counts them. With past experience
546          * we have around 20K functions. That should be more than enough.
547          * It is highly unlikely we will execute every function in
548          * the kernel.
549          */
550         functions = 20000;
551 #endif
552
553         pg = stat->start = stat->pages;
554
555         pages = DIV_ROUND_UP(functions, PROFILES_PER_PAGE);
556
557         for (i = 0; i < pages; i++) {
558                 pg->next = (void *)get_zeroed_page(GFP_KERNEL);
559                 if (!pg->next)
560                         goto out_free;
561                 pg = pg->next;
562         }
563
564         return 0;
565
566  out_free:
567         pg = stat->start;
568         while (pg) {
569                 unsigned long tmp = (unsigned long)pg;
570
571                 pg = pg->next;
572                 free_page(tmp);
573         }
574
575         free_page((unsigned long)stat->pages);
576         stat->pages = NULL;
577         stat->start = NULL;
578
579         return -ENOMEM;
580 }
581
582 static int ftrace_profile_init_cpu(int cpu)
583 {
584         struct ftrace_profile_stat *stat;
585         int size;
586
587         stat = &per_cpu(ftrace_profile_stats, cpu);
588
589         if (stat->hash) {
590                 /* If the profile is already created, simply reset it */
591                 ftrace_profile_reset(stat);
592                 return 0;
593         }
594
595         /*
596          * We are profiling all functions, but usually only a few thousand
597          * functions are hit. We'll make a hash of 1024 items.
598          */
599         size = FTRACE_PROFILE_HASH_SIZE;
600
601         stat->hash = kzalloc(sizeof(struct hlist_head) * size, GFP_KERNEL);
602
603         if (!stat->hash)
604                 return -ENOMEM;
605
606         if (!ftrace_profile_bits) {
607                 size--;
608
609                 for (; size; size >>= 1)
610                         ftrace_profile_bits++;
611         }
612
613         /* Preallocate the function profiling pages */
614         if (ftrace_profile_pages_init(stat) < 0) {
615                 kfree(stat->hash);
616                 stat->hash = NULL;
617                 return -ENOMEM;
618         }
619
620         return 0;
621 }
622
623 static int ftrace_profile_init(void)
624 {
625         int cpu;
626         int ret = 0;
627
628         for_each_online_cpu(cpu) {
629                 ret = ftrace_profile_init_cpu(cpu);
630                 if (ret)
631                         break;
632         }
633
634         return ret;
635 }
636
637 /* interrupts must be disabled */
638 static struct ftrace_profile *
639 ftrace_find_profiled_func(struct ftrace_profile_stat *stat, unsigned long ip)
640 {
641         struct ftrace_profile *rec;
642         struct hlist_head *hhd;
643         struct hlist_node *n;
644         unsigned long key;
645
646         key = hash_long(ip, ftrace_profile_bits);
647         hhd = &stat->hash[key];
648
649         if (hlist_empty(hhd))
650                 return NULL;
651
652         hlist_for_each_entry_rcu(rec, n, hhd, node) {
653                 if (rec->ip == ip)
654                         return rec;
655         }
656
657         return NULL;
658 }
659
660 static void ftrace_add_profile(struct ftrace_profile_stat *stat,
661                                struct ftrace_profile *rec)
662 {
663         unsigned long key;
664
665         key = hash_long(rec->ip, ftrace_profile_bits);
666         hlist_add_head_rcu(&rec->node, &stat->hash[key]);
667 }
668
669 /*
670  * The memory is already allocated, this simply finds a new record to use.
671  */
672 static struct ftrace_profile *
673 ftrace_profile_alloc(struct ftrace_profile_stat *stat, unsigned long ip)
674 {
675         struct ftrace_profile *rec = NULL;
676
677         /* prevent recursion (from NMIs) */
678         if (atomic_inc_return(&stat->disabled) != 1)
679                 goto out;
680
681         /*
682          * Try to find the function again since an NMI
683          * could have added it
684          */
685         rec = ftrace_find_profiled_func(stat, ip);
686         if (rec)
687                 goto out;
688
689         if (stat->pages->index == PROFILES_PER_PAGE) {
690                 if (!stat->pages->next)
691                         goto out;
692                 stat->pages = stat->pages->next;
693         }
694
695         rec = &stat->pages->records[stat->pages->index++];
696         rec->ip = ip;
697         ftrace_add_profile(stat, rec);
698
699  out:
700         atomic_dec(&stat->disabled);
701
702         return rec;
703 }
704
705 static void
706 function_profile_call(unsigned long ip, unsigned long parent_ip)
707 {
708         struct ftrace_profile_stat *stat;
709         struct ftrace_profile *rec;
710         unsigned long flags;
711
712         if (!ftrace_profile_enabled)
713                 return;
714
715         local_irq_save(flags);
716
717         stat = &__get_cpu_var(ftrace_profile_stats);
718         if (!stat->hash || !ftrace_profile_enabled)
719                 goto out;
720
721         rec = ftrace_find_profiled_func(stat, ip);
722         if (!rec) {
723                 rec = ftrace_profile_alloc(stat, ip);
724                 if (!rec)
725                         goto out;
726         }
727
728         rec->counter++;
729  out:
730         local_irq_restore(flags);
731 }
732
733 #ifdef CONFIG_FUNCTION_GRAPH_TRACER
734 static int profile_graph_entry(struct ftrace_graph_ent *trace)
735 {
736         function_profile_call(trace->func, 0);
737         return 1;
738 }
739
740 static void profile_graph_return(struct ftrace_graph_ret *trace)
741 {
742         struct ftrace_profile_stat *stat;
743         unsigned long long calltime;
744         struct ftrace_profile *rec;
745         unsigned long flags;
746
747         local_irq_save(flags);
748         stat = &__get_cpu_var(ftrace_profile_stats);
749         if (!stat->hash || !ftrace_profile_enabled)
750                 goto out;
751
752         /* If the calltime was zero'd ignore it */
753         if (!trace->calltime)
754                 goto out;
755
756         calltime = trace->rettime - trace->calltime;
757
758         if (!(trace_flags & TRACE_ITER_GRAPH_TIME)) {
759                 int index;
760
761                 index = trace->depth;
762
763                 /* Append this call time to the parent time to subtract */
764                 if (index)
765                         current->ret_stack[index - 1].subtime += calltime;
766
767                 if (current->ret_stack[index].subtime < calltime)
768                         calltime -= current->ret_stack[index].subtime;
769                 else
770                         calltime = 0;
771         }
772
773         rec = ftrace_find_profiled_func(stat, trace->func);
774         if (rec) {
775                 rec->time += calltime;
776                 rec->time_squared += calltime * calltime;
777         }
778
779  out:
780         local_irq_restore(flags);
781 }
782
783 static int register_ftrace_profiler(void)
784 {
785         return register_ftrace_graph(&profile_graph_return,
786                                      &profile_graph_entry);
787 }
788
789 static void unregister_ftrace_profiler(void)
790 {
791         unregister_ftrace_graph();
792 }
793 #else
794 static struct ftrace_ops ftrace_profile_ops __read_mostly = {
795         .func           = function_profile_call,
796 };
797
798 static int register_ftrace_profiler(void)
799 {
800         return register_ftrace_function(&ftrace_profile_ops);
801 }
802
803 static void unregister_ftrace_profiler(void)
804 {
805         unregister_ftrace_function(&ftrace_profile_ops);
806 }
807 #endif /* CONFIG_FUNCTION_GRAPH_TRACER */
808
809 static ssize_t
810 ftrace_profile_write(struct file *filp, const char __user *ubuf,
811                      size_t cnt, loff_t *ppos)
812 {
813         unsigned long val;
814         int ret;
815
816         ret = kstrtoul_from_user(ubuf, cnt, 10, &val);
817         if (ret)
818                 return ret;
819
820         val = !!val;
821
822         mutex_lock(&ftrace_profile_lock);
823         if (ftrace_profile_enabled ^ val) {
824                 if (val) {
825                         ret = ftrace_profile_init();
826                         if (ret < 0) {
827                                 cnt = ret;
828                                 goto out;
829                         }
830
831                         ret = register_ftrace_profiler();
832                         if (ret < 0) {
833                                 cnt = ret;
834                                 goto out;
835                         }
836                         ftrace_profile_enabled = 1;
837                 } else {
838                         ftrace_profile_enabled = 0;
839                         /*
840                          * unregister_ftrace_profiler calls stop_machine
841                          * so this acts like an synchronize_sched.
842                          */
843                         unregister_ftrace_profiler();
844                 }
845         }
846  out:
847         mutex_unlock(&ftrace_profile_lock);
848
849         *ppos += cnt;
850
851         return cnt;
852 }
853
854 static ssize_t
855 ftrace_profile_read(struct file *filp, char __user *ubuf,
856                      size_t cnt, loff_t *ppos)
857 {
858         char buf[64];           /* big enough to hold a number */
859         int r;
860
861         r = sprintf(buf, "%u\n", ftrace_profile_enabled);
862         return simple_read_from_buffer(ubuf, cnt, ppos, buf, r);
863 }
864
865 static const struct file_operations ftrace_profile_fops = {
866         .open           = tracing_open_generic,
867         .read           = ftrace_profile_read,
868         .write          = ftrace_profile_write,
869         .llseek         = default_llseek,
870 };
871
872 /* used to initialize the real stat files */
873 static struct tracer_stat function_stats __initdata = {
874         .name           = "functions",
875         .stat_start     = function_stat_start,
876         .stat_next      = function_stat_next,
877         .stat_cmp       = function_stat_cmp,
878         .stat_headers   = function_stat_headers,
879         .stat_show      = function_stat_show
880 };
881
882 static __init void ftrace_profile_debugfs(struct dentry *d_tracer)
883 {
884         struct ftrace_profile_stat *stat;
885         struct dentry *entry;
886         char *name;
887         int ret;
888         int cpu;
889
890         for_each_possible_cpu(cpu) {
891                 stat = &per_cpu(ftrace_profile_stats, cpu);
892
893                 /* allocate enough for function name + cpu number */
894                 name = kmalloc(32, GFP_KERNEL);
895                 if (!name) {
896                         /*
897                          * The files created are permanent, if something happens
898                          * we still do not free memory.
899                          */
900                         WARN(1,
901                              "Could not allocate stat file for cpu %d\n",
902                              cpu);
903                         return;
904                 }
905                 stat->stat = function_stats;
906                 snprintf(name, 32, "function%d", cpu);
907                 stat->stat.name = name;
908                 ret = register_stat_tracer(&stat->stat);
909                 if (ret) {
910                         WARN(1,
911                              "Could not register function stat for cpu %d\n",
912                              cpu);
913                         kfree(name);
914                         return;
915                 }
916         }
917
918         entry = debugfs_create_file("function_profile_enabled", 0644,
919                                     d_tracer, NULL, &ftrace_profile_fops);
920         if (!entry)
921                 pr_warning("Could not create debugfs "
922                            "'function_profile_enabled' entry\n");
923 }
924
925 #else /* CONFIG_FUNCTION_PROFILER */
926 static __init void ftrace_profile_debugfs(struct dentry *d_tracer)
927 {
928 }
929 #endif /* CONFIG_FUNCTION_PROFILER */
930
931 static struct pid * const ftrace_swapper_pid = &init_struct_pid;
932
933 #ifdef CONFIG_DYNAMIC_FTRACE
934
935 #ifndef CONFIG_FTRACE_MCOUNT_RECORD
936 # error Dynamic ftrace depends on MCOUNT_RECORD
937 #endif
938
939 static struct hlist_head ftrace_func_hash[FTRACE_FUNC_HASHSIZE] __read_mostly;
940
941 struct ftrace_func_probe {
942         struct hlist_node       node;
943         struct ftrace_probe_ops *ops;
944         unsigned long           flags;
945         unsigned long           ip;
946         void                    *data;
947         struct rcu_head         rcu;
948 };
949
950 struct ftrace_func_entry {
951         struct hlist_node hlist;
952         unsigned long ip;
953 };
954
955 struct ftrace_hash {
956         unsigned long           size_bits;
957         struct hlist_head       *buckets;
958         unsigned long           count;
959         struct rcu_head         rcu;
960 };
961
962 /*
963  * We make these constant because no one should touch them,
964  * but they are used as the default "empty hash", to avoid allocating
965  * it all the time. These are in a read only section such that if
966  * anyone does try to modify it, it will cause an exception.
967  */
968 static const struct hlist_head empty_buckets[1];
969 static const struct ftrace_hash empty_hash = {
970         .buckets = (struct hlist_head *)empty_buckets,
971 };
972 #define EMPTY_HASH      ((struct ftrace_hash *)&empty_hash)
973
974 static struct ftrace_ops global_ops = {
975         .func                   = ftrace_stub,
976         .notrace_hash           = EMPTY_HASH,
977         .filter_hash            = EMPTY_HASH,
978 };
979
980 static struct dyn_ftrace *ftrace_new_addrs;
981
982 static DEFINE_MUTEX(ftrace_regex_lock);
983
984 struct ftrace_page {
985         struct ftrace_page      *next;
986         struct dyn_ftrace       *records;
987         int                     index;
988         int                     size;
989 };
990
991 #define ENTRY_SIZE sizeof(struct dyn_ftrace)
992 #define ENTRIES_PER_PAGE (PAGE_SIZE / ENTRY_SIZE)
993
994 /* estimate from running different kernels */
995 #define NR_TO_INIT              10000
996
997 static struct ftrace_page       *ftrace_pages_start;
998 static struct ftrace_page       *ftrace_pages;
999
1000 static struct ftrace_func_entry *
1001 ftrace_lookup_ip(struct ftrace_hash *hash, unsigned long ip)
1002 {
1003         unsigned long key;
1004         struct ftrace_func_entry *entry;
1005         struct hlist_head *hhd;
1006         struct hlist_node *n;
1007
1008         if (!hash->count)
1009                 return NULL;
1010
1011         if (hash->size_bits > 0)
1012                 key = hash_long(ip, hash->size_bits);
1013         else
1014                 key = 0;
1015
1016         hhd = &hash->buckets[key];
1017
1018         hlist_for_each_entry_rcu(entry, n, hhd, hlist) {
1019                 if (entry->ip == ip)
1020                         return entry;
1021         }
1022         return NULL;
1023 }
1024
1025 static void __add_hash_entry(struct ftrace_hash *hash,
1026                              struct ftrace_func_entry *entry)
1027 {
1028         struct hlist_head *hhd;
1029         unsigned long key;
1030
1031         if (hash->size_bits)
1032                 key = hash_long(entry->ip, hash->size_bits);
1033         else
1034                 key = 0;
1035
1036         hhd = &hash->buckets[key];
1037         hlist_add_head(&entry->hlist, hhd);
1038         hash->count++;
1039 }
1040
1041 static int add_hash_entry(struct ftrace_hash *hash, unsigned long ip)
1042 {
1043         struct ftrace_func_entry *entry;
1044
1045         entry = kmalloc(sizeof(*entry), GFP_KERNEL);
1046         if (!entry)
1047                 return -ENOMEM;
1048
1049         entry->ip = ip;
1050         __add_hash_entry(hash, entry);
1051
1052         return 0;
1053 }
1054
1055 static void
1056 free_hash_entry(struct ftrace_hash *hash,
1057                   struct ftrace_func_entry *entry)
1058 {
1059         hlist_del(&entry->hlist);
1060         kfree(entry);
1061         hash->count--;
1062 }
1063
1064 static void
1065 remove_hash_entry(struct ftrace_hash *hash,
1066                   struct ftrace_func_entry *entry)
1067 {
1068         hlist_del(&entry->hlist);
1069         hash->count--;
1070 }
1071
1072 static void ftrace_hash_clear(struct ftrace_hash *hash)
1073 {
1074         struct hlist_head *hhd;
1075         struct hlist_node *tp, *tn;
1076         struct ftrace_func_entry *entry;
1077         int size = 1 << hash->size_bits;
1078         int i;
1079
1080         if (!hash->count)
1081                 return;
1082
1083         for (i = 0; i < size; i++) {
1084                 hhd = &hash->buckets[i];
1085                 hlist_for_each_entry_safe(entry, tp, tn, hhd, hlist)
1086                         free_hash_entry(hash, entry);
1087         }
1088         FTRACE_WARN_ON(hash->count);
1089 }
1090
1091 static void free_ftrace_hash(struct ftrace_hash *hash)
1092 {
1093         if (!hash || hash == EMPTY_HASH)
1094                 return;
1095         ftrace_hash_clear(hash);
1096         kfree(hash->buckets);
1097         kfree(hash);
1098 }
1099
1100 static void __free_ftrace_hash_rcu(struct rcu_head *rcu)
1101 {
1102         struct ftrace_hash *hash;
1103
1104         hash = container_of(rcu, struct ftrace_hash, rcu);
1105         free_ftrace_hash(hash);
1106 }
1107
1108 static void free_ftrace_hash_rcu(struct ftrace_hash *hash)
1109 {
1110         if (!hash || hash == EMPTY_HASH)
1111                 return;
1112         call_rcu_sched(&hash->rcu, __free_ftrace_hash_rcu);
1113 }
1114
1115 static struct ftrace_hash *alloc_ftrace_hash(int size_bits)
1116 {
1117         struct ftrace_hash *hash;
1118         int size;
1119
1120         hash = kzalloc(sizeof(*hash), GFP_KERNEL);
1121         if (!hash)
1122                 return NULL;
1123
1124         size = 1 << size_bits;
1125         hash->buckets = kzalloc(sizeof(*hash->buckets) * size, GFP_KERNEL);
1126
1127         if (!hash->buckets) {
1128                 kfree(hash);
1129                 return NULL;
1130         }
1131
1132         hash->size_bits = size_bits;
1133
1134         return hash;
1135 }
1136
1137 static struct ftrace_hash *
1138 alloc_and_copy_ftrace_hash(int size_bits, struct ftrace_hash *hash)
1139 {
1140         struct ftrace_func_entry *entry;
1141         struct ftrace_hash *new_hash;
1142         struct hlist_node *tp;
1143         int size;
1144         int ret;
1145         int i;
1146
1147         new_hash = alloc_ftrace_hash(size_bits);
1148         if (!new_hash)
1149                 return NULL;
1150
1151         /* Empty hash? */
1152         if (!hash || !hash->count)
1153                 return new_hash;
1154
1155         size = 1 << hash->size_bits;
1156         for (i = 0; i < size; i++) {
1157                 hlist_for_each_entry(entry, tp, &hash->buckets[i], hlist) {
1158                         ret = add_hash_entry(new_hash, entry->ip);
1159                         if (ret < 0)
1160                                 goto free_hash;
1161                 }
1162         }
1163
1164         FTRACE_WARN_ON(new_hash->count != hash->count);
1165
1166         return new_hash;
1167
1168  free_hash:
1169         free_ftrace_hash(new_hash);
1170         return NULL;
1171 }
1172
1173 static void
1174 ftrace_hash_rec_disable(struct ftrace_ops *ops, int filter_hash);
1175 static void
1176 ftrace_hash_rec_enable(struct ftrace_ops *ops, int filter_hash);
1177
1178 static int
1179 ftrace_hash_move(struct ftrace_ops *ops, int enable,
1180                  struct ftrace_hash **dst, struct ftrace_hash *src)
1181 {
1182         struct ftrace_func_entry *entry;
1183         struct hlist_node *tp, *tn;
1184         struct hlist_head *hhd;
1185         struct ftrace_hash *old_hash;
1186         struct ftrace_hash *new_hash;
1187         unsigned long key;
1188         int size = src->count;
1189         int bits = 0;
1190         int ret;
1191         int i;
1192
1193         /*
1194          * Remove the current set, update the hash and add
1195          * them back.
1196          */
1197         ftrace_hash_rec_disable(ops, enable);
1198
1199         /*
1200          * If the new source is empty, just free dst and assign it
1201          * the empty_hash.
1202          */
1203         if (!src->count) {
1204                 free_ftrace_hash_rcu(*dst);
1205                 rcu_assign_pointer(*dst, EMPTY_HASH);
1206                 /* still need to update the function records */
1207                 ret = 0;
1208                 goto out;
1209         }
1210
1211         /*
1212          * Make the hash size about 1/2 the # found
1213          */
1214         for (size /= 2; size; size >>= 1)
1215                 bits++;
1216
1217         /* Don't allocate too much */
1218         if (bits > FTRACE_HASH_MAX_BITS)
1219                 bits = FTRACE_HASH_MAX_BITS;
1220
1221         ret = -ENOMEM;
1222         new_hash = alloc_ftrace_hash(bits);
1223         if (!new_hash)
1224                 goto out;
1225
1226         size = 1 << src->size_bits;
1227         for (i = 0; i < size; i++) {
1228                 hhd = &src->buckets[i];
1229                 hlist_for_each_entry_safe(entry, tp, tn, hhd, hlist) {
1230                         if (bits > 0)
1231                                 key = hash_long(entry->ip, bits);
1232                         else
1233                                 key = 0;
1234                         remove_hash_entry(src, entry);
1235                         __add_hash_entry(new_hash, entry);
1236                 }
1237         }
1238
1239         old_hash = *dst;
1240         rcu_assign_pointer(*dst, new_hash);
1241         free_ftrace_hash_rcu(old_hash);
1242
1243         ret = 0;
1244  out:
1245         /*
1246          * Enable regardless of ret:
1247          *  On success, we enable the new hash.
1248          *  On failure, we re-enable the original hash.
1249          */
1250         ftrace_hash_rec_enable(ops, enable);
1251
1252         return ret;
1253 }
1254
1255 /*
1256  * Test the hashes for this ops to see if we want to call
1257  * the ops->func or not.
1258  *
1259  * It's a match if the ip is in the ops->filter_hash or
1260  * the filter_hash does not exist or is empty,
1261  *  AND
1262  * the ip is not in the ops->notrace_hash.
1263  *
1264  * This needs to be called with preemption disabled as
1265  * the hashes are freed with call_rcu_sched().
1266  */
1267 static int
1268 ftrace_ops_test(struct ftrace_ops *ops, unsigned long ip)
1269 {
1270         struct ftrace_hash *filter_hash;
1271         struct ftrace_hash *notrace_hash;
1272         int ret;
1273
1274         filter_hash = rcu_dereference_raw(ops->filter_hash);
1275         notrace_hash = rcu_dereference_raw(ops->notrace_hash);
1276
1277         if ((!filter_hash || !filter_hash->count ||
1278              ftrace_lookup_ip(filter_hash, ip)) &&
1279             (!notrace_hash || !notrace_hash->count ||
1280              !ftrace_lookup_ip(notrace_hash, ip)))
1281                 ret = 1;
1282         else
1283                 ret = 0;
1284
1285         return ret;
1286 }
1287
1288 /*
1289  * This is a double for. Do not use 'break' to break out of the loop,
1290  * you must use a goto.
1291  */
1292 #define do_for_each_ftrace_rec(pg, rec)                                 \
1293         for (pg = ftrace_pages_start; pg; pg = pg->next) {              \
1294                 int _____i;                                             \
1295                 for (_____i = 0; _____i < pg->index; _____i++) {        \
1296                         rec = &pg->records[_____i];
1297
1298 #define while_for_each_ftrace_rec()             \
1299                 }                               \
1300         }
1301
1302 /**
1303  * ftrace_location - return true if the ip giving is a traced location
1304  * @ip: the instruction pointer to check
1305  *
1306  * Returns 1 if @ip given is a pointer to a ftrace location.
1307  * That is, the instruction that is either a NOP or call to
1308  * the function tracer. It checks the ftrace internal tables to
1309  * determine if the address belongs or not.
1310  */
1311 int ftrace_location(unsigned long ip)
1312 {
1313         struct ftrace_page *pg;
1314         struct dyn_ftrace *rec;
1315
1316         do_for_each_ftrace_rec(pg, rec) {
1317                 if (rec->ip == ip)
1318                         return 1;
1319         } while_for_each_ftrace_rec();
1320
1321         return 0;
1322 }
1323
1324 static void __ftrace_hash_rec_update(struct ftrace_ops *ops,
1325                                      int filter_hash,
1326                                      bool inc)
1327 {
1328         struct ftrace_hash *hash;
1329         struct ftrace_hash *other_hash;
1330         struct ftrace_page *pg;
1331         struct dyn_ftrace *rec;
1332         int count = 0;
1333         int all = 0;
1334
1335         /* Only update if the ops has been registered */
1336         if (!(ops->flags & FTRACE_OPS_FL_ENABLED))
1337                 return;
1338
1339         /*
1340          * In the filter_hash case:
1341          *   If the count is zero, we update all records.
1342          *   Otherwise we just update the items in the hash.
1343          *
1344          * In the notrace_hash case:
1345          *   We enable the update in the hash.
1346          *   As disabling notrace means enabling the tracing,
1347          *   and enabling notrace means disabling, the inc variable
1348          *   gets inversed.
1349          */
1350         if (filter_hash) {
1351                 hash = ops->filter_hash;
1352                 other_hash = ops->notrace_hash;
1353                 if (!hash || !hash->count)
1354                         all = 1;
1355         } else {
1356                 inc = !inc;
1357                 hash = ops->notrace_hash;
1358                 other_hash = ops->filter_hash;
1359                 /*
1360                  * If the notrace hash has no items,
1361                  * then there's nothing to do.
1362                  */
1363                 if (hash && !hash->count)
1364                         return;
1365         }
1366
1367         do_for_each_ftrace_rec(pg, rec) {
1368                 int in_other_hash = 0;
1369                 int in_hash = 0;
1370                 int match = 0;
1371
1372                 if (all) {
1373                         /*
1374                          * Only the filter_hash affects all records.
1375                          * Update if the record is not in the notrace hash.
1376                          */
1377                         if (!other_hash || !ftrace_lookup_ip(other_hash, rec->ip))
1378                                 match = 1;
1379                 } else {
1380                         in_hash = hash && !!ftrace_lookup_ip(hash, rec->ip);
1381                         in_other_hash = other_hash && !!ftrace_lookup_ip(other_hash, rec->ip);
1382
1383                         /*
1384                          *
1385                          */
1386                         if (filter_hash && in_hash && !in_other_hash)
1387                                 match = 1;
1388                         else if (!filter_hash && in_hash &&
1389                                  (in_other_hash || !other_hash->count))
1390                                 match = 1;
1391                 }
1392                 if (!match)
1393                         continue;
1394
1395                 if (inc) {
1396                         rec->flags++;
1397                         if (FTRACE_WARN_ON((rec->flags & ~FTRACE_FL_MASK) == FTRACE_REF_MAX))
1398                                 return;
1399                 } else {
1400                         if (FTRACE_WARN_ON((rec->flags & ~FTRACE_FL_MASK) == 0))
1401                                 return;
1402                         rec->flags--;
1403                 }
1404                 count++;
1405                 /* Shortcut, if we handled all records, we are done. */
1406                 if (!all && count == hash->count)
1407                         return;
1408         } while_for_each_ftrace_rec();
1409 }
1410
1411 static void ftrace_hash_rec_disable(struct ftrace_ops *ops,
1412                                     int filter_hash)
1413 {
1414         __ftrace_hash_rec_update(ops, filter_hash, 0);
1415 }
1416
1417 static void ftrace_hash_rec_enable(struct ftrace_ops *ops,
1418                                    int filter_hash)
1419 {
1420         __ftrace_hash_rec_update(ops, filter_hash, 1);
1421 }
1422
1423 static struct dyn_ftrace *ftrace_alloc_dyn_node(unsigned long ip)
1424 {
1425         if (ftrace_pages->index == ftrace_pages->size) {
1426                 /* We should have allocated enough */
1427                 if (WARN_ON(!ftrace_pages->next))
1428                         return NULL;
1429                 ftrace_pages = ftrace_pages->next;
1430         }
1431
1432         return &ftrace_pages->records[ftrace_pages->index++];
1433 }
1434
1435 static struct dyn_ftrace *
1436 ftrace_record_ip(unsigned long ip)
1437 {
1438         struct dyn_ftrace *rec;
1439
1440         if (ftrace_disabled)
1441                 return NULL;
1442
1443         rec = ftrace_alloc_dyn_node(ip);
1444         if (!rec)
1445                 return NULL;
1446
1447         rec->ip = ip;
1448         rec->newlist = ftrace_new_addrs;
1449         ftrace_new_addrs = rec;
1450
1451         return rec;
1452 }
1453
1454 static void print_ip_ins(const char *fmt, unsigned char *p)
1455 {
1456         int i;
1457
1458         printk(KERN_CONT "%s", fmt);
1459
1460         for (i = 0; i < MCOUNT_INSN_SIZE; i++)
1461                 printk(KERN_CONT "%s%02x", i ? ":" : "", p[i]);
1462 }
1463
1464 /**
1465  * ftrace_bug - report and shutdown function tracer
1466  * @failed: The failed type (EFAULT, EINVAL, EPERM)
1467  * @ip: The address that failed
1468  *
1469  * The arch code that enables or disables the function tracing
1470  * can call ftrace_bug() when it has detected a problem in
1471  * modifying the code. @failed should be one of either:
1472  * EFAULT - if the problem happens on reading the @ip address
1473  * EINVAL - if what is read at @ip is not what was expected
1474  * EPERM - if the problem happens on writting to the @ip address
1475  */
1476 void ftrace_bug(int failed, unsigned long ip)
1477 {
1478         switch (failed) {
1479         case -EFAULT:
1480                 FTRACE_WARN_ON_ONCE(1);
1481                 pr_info("ftrace faulted on modifying ");
1482                 print_ip_sym(ip);
1483                 break;
1484         case -EINVAL:
1485                 FTRACE_WARN_ON_ONCE(1);
1486                 pr_info("ftrace failed to modify ");
1487                 print_ip_sym(ip);
1488                 print_ip_ins(" actual: ", (unsigned char *)ip);
1489                 printk(KERN_CONT "\n");
1490                 break;
1491         case -EPERM:
1492                 FTRACE_WARN_ON_ONCE(1);
1493                 pr_info("ftrace faulted on writing ");
1494                 print_ip_sym(ip);
1495                 break;
1496         default:
1497                 FTRACE_WARN_ON_ONCE(1);
1498                 pr_info("ftrace faulted on unknown error ");
1499                 print_ip_sym(ip);
1500         }
1501 }
1502
1503
1504 /* Return 1 if the address range is reserved for ftrace */
1505 int ftrace_text_reserved(void *start, void *end)
1506 {
1507         struct dyn_ftrace *rec;
1508         struct ftrace_page *pg;
1509
1510         do_for_each_ftrace_rec(pg, rec) {
1511                 if (rec->ip <= (unsigned long)end &&
1512                     rec->ip + MCOUNT_INSN_SIZE > (unsigned long)start)
1513                         return 1;
1514         } while_for_each_ftrace_rec();
1515         return 0;
1516 }
1517
1518 static int ftrace_check_record(struct dyn_ftrace *rec, int enable, int update)
1519 {
1520         unsigned long flag = 0UL;
1521
1522         /*
1523          * If we are updating calls:
1524          *
1525          *   If the record has a ref count, then we need to enable it
1526          *   because someone is using it.
1527          *
1528          *   Otherwise we make sure its disabled.
1529          *
1530          * If we are disabling calls, then disable all records that
1531          * are enabled.
1532          */
1533         if (enable && (rec->flags & ~FTRACE_FL_MASK))
1534                 flag = FTRACE_FL_ENABLED;
1535
1536         /* If the state of this record hasn't changed, then do nothing */
1537         if ((rec->flags & FTRACE_FL_ENABLED) == flag)
1538                 return FTRACE_UPDATE_IGNORE;
1539
1540         if (flag) {
1541                 if (update)
1542                         rec->flags |= FTRACE_FL_ENABLED;
1543                 return FTRACE_UPDATE_MAKE_CALL;
1544         }
1545
1546         if (update)
1547                 rec->flags &= ~FTRACE_FL_ENABLED;
1548
1549         return FTRACE_UPDATE_MAKE_NOP;
1550 }
1551
1552 /**
1553  * ftrace_update_record, set a record that now is tracing or not
1554  * @rec: the record to update
1555  * @enable: set to 1 if the record is tracing, zero to force disable
1556  *
1557  * The records that represent all functions that can be traced need
1558  * to be updated when tracing has been enabled.
1559  */
1560 int ftrace_update_record(struct dyn_ftrace *rec, int enable)
1561 {
1562         return ftrace_check_record(rec, enable, 1);
1563 }
1564
1565 /**
1566  * ftrace_test_record, check if the record has been enabled or not
1567  * @rec: the record to test
1568  * @enable: set to 1 to check if enabled, 0 if it is disabled
1569  *
1570  * The arch code may need to test if a record is already set to
1571  * tracing to determine how to modify the function code that it
1572  * represents.
1573  */
1574 int ftrace_test_record(struct dyn_ftrace *rec, int enable)
1575 {
1576         return ftrace_check_record(rec, enable, 0);
1577 }
1578
1579 static int
1580 __ftrace_replace_code(struct dyn_ftrace *rec, int enable)
1581 {
1582         unsigned long ftrace_addr;
1583         int ret;
1584
1585         ftrace_addr = (unsigned long)FTRACE_ADDR;
1586
1587         ret = ftrace_update_record(rec, enable);
1588
1589         switch (ret) {
1590         case FTRACE_UPDATE_IGNORE:
1591                 return 0;
1592
1593         case FTRACE_UPDATE_MAKE_CALL:
1594                 return ftrace_make_call(rec, ftrace_addr);
1595
1596         case FTRACE_UPDATE_MAKE_NOP:
1597                 return ftrace_make_nop(NULL, rec, ftrace_addr);
1598         }
1599
1600         return -1; /* unknow ftrace bug */
1601 }
1602
1603 static void ftrace_replace_code(int update)
1604 {
1605         struct dyn_ftrace *rec;
1606         struct ftrace_page *pg;
1607         int failed;
1608
1609         if (unlikely(ftrace_disabled))
1610                 return;
1611
1612         do_for_each_ftrace_rec(pg, rec) {
1613                 failed = __ftrace_replace_code(rec, update);
1614                 if (failed) {
1615                         ftrace_bug(failed, rec->ip);
1616                         /* Stop processing */
1617                         return;
1618                 }
1619         } while_for_each_ftrace_rec();
1620 }
1621
1622 struct ftrace_rec_iter {
1623         struct ftrace_page      *pg;
1624         int                     index;
1625 };
1626
1627 /**
1628  * ftrace_rec_iter_start, start up iterating over traced functions
1629  *
1630  * Returns an iterator handle that is used to iterate over all
1631  * the records that represent address locations where functions
1632  * are traced.
1633  *
1634  * May return NULL if no records are available.
1635  */
1636 struct ftrace_rec_iter *ftrace_rec_iter_start(void)
1637 {
1638         /*
1639          * We only use a single iterator.
1640          * Protected by the ftrace_lock mutex.
1641          */
1642         static struct ftrace_rec_iter ftrace_rec_iter;
1643         struct ftrace_rec_iter *iter = &ftrace_rec_iter;
1644
1645         iter->pg = ftrace_pages_start;
1646         iter->index = 0;
1647
1648         /* Could have empty pages */
1649         while (iter->pg && !iter->pg->index)
1650                 iter->pg = iter->pg->next;
1651
1652         if (!iter->pg)
1653                 return NULL;
1654
1655         return iter;
1656 }
1657
1658 /**
1659  * ftrace_rec_iter_next, get the next record to process.
1660  * @iter: The handle to the iterator.
1661  *
1662  * Returns the next iterator after the given iterator @iter.
1663  */
1664 struct ftrace_rec_iter *ftrace_rec_iter_next(struct ftrace_rec_iter *iter)
1665 {
1666         iter->index++;
1667
1668         if (iter->index >= iter->pg->index) {
1669                 iter->pg = iter->pg->next;
1670                 iter->index = 0;
1671
1672                 /* Could have empty pages */
1673                 while (iter->pg && !iter->pg->index)
1674                         iter->pg = iter->pg->next;
1675         }
1676
1677         if (!iter->pg)
1678                 return NULL;
1679
1680         return iter;
1681 }
1682
1683 /**
1684  * ftrace_rec_iter_record, get the record at the iterator location
1685  * @iter: The current iterator location
1686  *
1687  * Returns the record that the current @iter is at.
1688  */
1689 struct dyn_ftrace *ftrace_rec_iter_record(struct ftrace_rec_iter *iter)
1690 {
1691         return &iter->pg->records[iter->index];
1692 }
1693
1694 static int
1695 ftrace_code_disable(struct module *mod, struct dyn_ftrace *rec)
1696 {
1697         unsigned long ip;
1698         int ret;
1699
1700         ip = rec->ip;
1701
1702         if (unlikely(ftrace_disabled))
1703                 return 0;
1704
1705         ret = ftrace_make_nop(mod, rec, MCOUNT_ADDR);
1706         if (ret) {
1707                 ftrace_bug(ret, ip);
1708                 return 0;
1709         }
1710         return 1;
1711 }
1712
1713 /*
1714  * archs can override this function if they must do something
1715  * before the modifying code is performed.
1716  */
1717 int __weak ftrace_arch_code_modify_prepare(void)
1718 {
1719         return 0;
1720 }
1721
1722 /*
1723  * archs can override this function if they must do something
1724  * after the modifying code is performed.
1725  */
1726 int __weak ftrace_arch_code_modify_post_process(void)
1727 {
1728         return 0;
1729 }
1730
1731 static int __ftrace_modify_code(void *data)
1732 {
1733         int *command = data;
1734
1735         if (*command & FTRACE_UPDATE_CALLS)
1736                 ftrace_replace_code(1);
1737         else if (*command & FTRACE_DISABLE_CALLS)
1738                 ftrace_replace_code(0);
1739
1740         if (*command & FTRACE_UPDATE_TRACE_FUNC)
1741                 ftrace_update_ftrace_func(ftrace_trace_function);
1742
1743         if (*command & FTRACE_START_FUNC_RET)
1744                 ftrace_enable_ftrace_graph_caller();
1745         else if (*command & FTRACE_STOP_FUNC_RET)
1746                 ftrace_disable_ftrace_graph_caller();
1747
1748         return 0;
1749 }
1750
1751 /**
1752  * ftrace_run_stop_machine, go back to the stop machine method
1753  * @command: The command to tell ftrace what to do
1754  *
1755  * If an arch needs to fall back to the stop machine method, the
1756  * it can call this function.
1757  */
1758 void ftrace_run_stop_machine(int command)
1759 {
1760         stop_machine(__ftrace_modify_code, &command, NULL);
1761 }
1762
1763 /**
1764  * arch_ftrace_update_code, modify the code to trace or not trace
1765  * @command: The command that needs to be done
1766  *
1767  * Archs can override this function if it does not need to
1768  * run stop_machine() to modify code.
1769  */
1770 void __weak arch_ftrace_update_code(int command)
1771 {
1772         ftrace_run_stop_machine(command);
1773 }
1774
1775 static void ftrace_run_update_code(int command)
1776 {
1777         int ret;
1778
1779         ret = ftrace_arch_code_modify_prepare();
1780         FTRACE_WARN_ON(ret);
1781         if (ret)
1782                 return;
1783         /*
1784          * Do not call function tracer while we update the code.
1785          * We are in stop machine.
1786          */
1787         function_trace_stop++;
1788
1789         /*
1790          * By default we use stop_machine() to modify the code.
1791          * But archs can do what ever they want as long as it
1792          * is safe. The stop_machine() is the safest, but also
1793          * produces the most overhead.
1794          */
1795         arch_ftrace_update_code(command);
1796
1797 #ifndef CONFIG_HAVE_FUNCTION_TRACE_MCOUNT_TEST
1798         /*
1799          * For archs that call ftrace_test_stop_func(), we must
1800          * wait till after we update all the function callers
1801          * before we update the callback. This keeps different
1802          * ops that record different functions from corrupting
1803          * each other.
1804          */
1805         __ftrace_trace_function = __ftrace_trace_function_delay;
1806 #endif
1807         function_trace_stop--;
1808
1809         ret = ftrace_arch_code_modify_post_process();
1810         FTRACE_WARN_ON(ret);
1811 }
1812
1813 static ftrace_func_t saved_ftrace_func;
1814 static int ftrace_start_up;
1815 static int global_start_up;
1816
1817 static void ftrace_startup_enable(int command)
1818 {
1819         if (saved_ftrace_func != ftrace_trace_function) {
1820                 saved_ftrace_func = ftrace_trace_function;
1821                 command |= FTRACE_UPDATE_TRACE_FUNC;
1822         }
1823
1824         if (!command || !ftrace_enabled)
1825                 return;
1826
1827         ftrace_run_update_code(command);
1828 }
1829
1830 static int ftrace_startup(struct ftrace_ops *ops, int command)
1831 {
1832         bool hash_enable = true;
1833
1834         if (unlikely(ftrace_disabled))
1835                 return -ENODEV;
1836
1837         ftrace_start_up++;
1838         command |= FTRACE_UPDATE_CALLS;
1839
1840         /* ops marked global share the filter hashes */
1841         if (ops->flags & FTRACE_OPS_FL_GLOBAL) {
1842                 ops = &global_ops;
1843                 /* Don't update hash if global is already set */
1844                 if (global_start_up)
1845                         hash_enable = false;
1846                 global_start_up++;
1847         }
1848
1849         ops->flags |= FTRACE_OPS_FL_ENABLED;
1850         if (hash_enable)
1851                 ftrace_hash_rec_enable(ops, 1);
1852
1853         ftrace_startup_enable(command);
1854
1855         return 0;
1856 }
1857
1858 static void ftrace_shutdown(struct ftrace_ops *ops, int command)
1859 {
1860         bool hash_disable = true;
1861
1862         if (unlikely(ftrace_disabled))
1863                 return;
1864
1865         ftrace_start_up--;
1866         /*
1867          * Just warn in case of unbalance, no need to kill ftrace, it's not
1868          * critical but the ftrace_call callers may be never nopped again after
1869          * further ftrace uses.
1870          */
1871         WARN_ON_ONCE(ftrace_start_up < 0);
1872
1873         if (ops->flags & FTRACE_OPS_FL_GLOBAL) {
1874                 ops = &global_ops;
1875                 global_start_up--;
1876                 WARN_ON_ONCE(global_start_up < 0);
1877                 /* Don't update hash if global still has users */
1878                 if (global_start_up) {
1879                         WARN_ON_ONCE(!ftrace_start_up);
1880                         hash_disable = false;
1881                 }
1882         }
1883
1884         if (hash_disable)
1885                 ftrace_hash_rec_disable(ops, 1);
1886
1887         if (ops != &global_ops || !global_start_up)
1888                 ops->flags &= ~FTRACE_OPS_FL_ENABLED;
1889
1890         command |= FTRACE_UPDATE_CALLS;
1891
1892         if (saved_ftrace_func != ftrace_trace_function) {
1893                 saved_ftrace_func = ftrace_trace_function;
1894                 command |= FTRACE_UPDATE_TRACE_FUNC;
1895         }
1896
1897         if (!command || !ftrace_enabled)
1898                 return;
1899
1900         ftrace_run_update_code(command);
1901 }
1902
1903 static void ftrace_startup_sysctl(void)
1904 {
1905         if (unlikely(ftrace_disabled))
1906                 return;
1907
1908         /* Force update next time */
1909         saved_ftrace_func = NULL;
1910         /* ftrace_start_up is true if we want ftrace running */
1911         if (ftrace_start_up)
1912                 ftrace_run_update_code(FTRACE_UPDATE_CALLS);
1913 }
1914
1915 static void ftrace_shutdown_sysctl(void)
1916 {
1917         if (unlikely(ftrace_disabled))
1918                 return;
1919
1920         /* ftrace_start_up is true if ftrace is running */
1921         if (ftrace_start_up)
1922                 ftrace_run_update_code(FTRACE_DISABLE_CALLS);
1923 }
1924
1925 static cycle_t          ftrace_update_time;
1926 static unsigned long    ftrace_update_cnt;
1927 unsigned long           ftrace_update_tot_cnt;
1928
1929 static int ops_traces_mod(struct ftrace_ops *ops)
1930 {
1931         struct ftrace_hash *hash;
1932
1933         hash = ops->filter_hash;
1934         return !!(!hash || !hash->count);
1935 }
1936
1937 static int ftrace_update_code(struct module *mod)
1938 {
1939         struct dyn_ftrace *p;
1940         cycle_t start, stop;
1941         unsigned long ref = 0;
1942
1943         /*
1944          * When adding a module, we need to check if tracers are
1945          * currently enabled and if they are set to trace all functions.
1946          * If they are, we need to enable the module functions as well
1947          * as update the reference counts for those function records.
1948          */
1949         if (mod) {
1950                 struct ftrace_ops *ops;
1951
1952                 for (ops = ftrace_ops_list;
1953                      ops != &ftrace_list_end; ops = ops->next) {
1954                         if (ops->flags & FTRACE_OPS_FL_ENABLED &&
1955                             ops_traces_mod(ops))
1956                                 ref++;
1957                 }
1958         }
1959
1960         start = ftrace_now(raw_smp_processor_id());
1961         ftrace_update_cnt = 0;
1962
1963         while (ftrace_new_addrs) {
1964
1965                 /* If something went wrong, bail without enabling anything */
1966                 if (unlikely(ftrace_disabled))
1967                         return -1;
1968
1969                 p = ftrace_new_addrs;
1970                 ftrace_new_addrs = p->newlist;
1971                 p->flags = ref;
1972
1973                 /*
1974                  * Do the initial record conversion from mcount jump
1975                  * to the NOP instructions.
1976                  */
1977                 if (!ftrace_code_disable(mod, p))
1978                         break;
1979
1980                 ftrace_update_cnt++;
1981
1982                 /*
1983                  * If the tracing is enabled, go ahead and enable the record.
1984                  *
1985                  * The reason not to enable the record immediatelly is the
1986                  * inherent check of ftrace_make_nop/ftrace_make_call for
1987                  * correct previous instructions.  Making first the NOP
1988                  * conversion puts the module to the correct state, thus
1989                  * passing the ftrace_make_call check.
1990                  */
1991                 if (ftrace_start_up && ref) {
1992                         int failed = __ftrace_replace_code(p, 1);
1993                         if (failed)
1994                                 ftrace_bug(failed, p->ip);
1995                 }
1996         }
1997
1998         stop = ftrace_now(raw_smp_processor_id());
1999         ftrace_update_time = stop - start;
2000         ftrace_update_tot_cnt += ftrace_update_cnt;
2001
2002         return 0;
2003 }
2004
2005 static int ftrace_allocate_records(struct ftrace_page *pg, int count)
2006 {
2007         int order;
2008         int cnt;
2009
2010         if (WARN_ON(!count))
2011                 return -EINVAL;
2012
2013         order = get_count_order(DIV_ROUND_UP(count, ENTRIES_PER_PAGE));
2014
2015         /*
2016          * We want to fill as much as possible. No more than a page
2017          * may be empty.
2018          */
2019         while ((PAGE_SIZE << order) / ENTRY_SIZE >= count + ENTRIES_PER_PAGE)
2020                 order--;
2021
2022  again:
2023         pg->records = (void *)__get_free_pages(GFP_KERNEL | __GFP_ZERO, order);
2024
2025         if (!pg->records) {
2026                 /* if we can't allocate this size, try something smaller */
2027                 if (!order)
2028                         return -ENOMEM;
2029                 order >>= 1;
2030                 goto again;
2031         }
2032
2033         cnt = (PAGE_SIZE << order) / ENTRY_SIZE;
2034         pg->size = cnt;
2035
2036         if (cnt > count)
2037                 cnt = count;
2038
2039         return cnt;
2040 }
2041
2042 static struct ftrace_page *
2043 ftrace_allocate_pages(unsigned long num_to_init)
2044 {
2045         struct ftrace_page *start_pg;
2046         struct ftrace_page *pg;
2047         int order;
2048         int cnt;
2049
2050         if (!num_to_init)
2051                 return 0;
2052
2053         start_pg = pg = kzalloc(sizeof(*pg), GFP_KERNEL);
2054         if (!pg)
2055                 return NULL;
2056
2057         /*
2058          * Try to allocate as much as possible in one continues
2059          * location that fills in all of the space. We want to
2060          * waste as little space as possible.
2061          */
2062         for (;;) {
2063                 cnt = ftrace_allocate_records(pg, num_to_init);
2064                 if (cnt < 0)
2065                         goto free_pages;
2066
2067                 num_to_init -= cnt;
2068                 if (!num_to_init)
2069                         break;
2070
2071                 pg->next = kzalloc(sizeof(*pg), GFP_KERNEL);
2072                 if (!pg->next)
2073                         goto free_pages;
2074
2075                 pg = pg->next;
2076         }
2077
2078         return start_pg;
2079
2080  free_pages:
2081         while (start_pg) {
2082                 order = get_count_order(pg->size / ENTRIES_PER_PAGE);
2083                 free_pages((unsigned long)pg->records, order);
2084                 start_pg = pg->next;
2085                 kfree(pg);
2086                 pg = start_pg;
2087         }
2088         pr_info("ftrace: FAILED to allocate memory for functions\n");
2089         return NULL;
2090 }
2091
2092 static int __init ftrace_dyn_table_alloc(unsigned long num_to_init)
2093 {
2094         int cnt;
2095
2096         if (!num_to_init) {
2097                 pr_info("ftrace: No functions to be traced?\n");
2098                 return -1;
2099         }
2100
2101         cnt = num_to_init / ENTRIES_PER_PAGE;
2102         pr_info("ftrace: allocating %ld entries in %d pages\n",
2103                 num_to_init, cnt + 1);
2104
2105         return 0;
2106 }
2107
2108 enum {
2109         FTRACE_ITER_FILTER      = (1 << 0),
2110         FTRACE_ITER_NOTRACE     = (1 << 1),
2111         FTRACE_ITER_PRINTALL    = (1 << 2),
2112         FTRACE_ITER_HASH        = (1 << 3),
2113         FTRACE_ITER_ENABLED     = (1 << 4),
2114 };
2115
2116 #define FTRACE_BUFF_MAX (KSYM_SYMBOL_LEN+4) /* room for wildcards */
2117
2118 struct ftrace_iterator {
2119         loff_t                          pos;
2120         loff_t                          func_pos;
2121         struct ftrace_page              *pg;
2122         struct dyn_ftrace               *func;
2123         struct ftrace_func_probe        *probe;
2124         struct trace_parser             parser;
2125         struct ftrace_hash              *hash;
2126         struct ftrace_ops               *ops;
2127         int                             hidx;
2128         int                             idx;
2129         unsigned                        flags;
2130 };
2131
2132 static void *
2133 t_hash_next(struct seq_file *m, loff_t *pos)
2134 {
2135         struct ftrace_iterator *iter = m->private;
2136         struct hlist_node *hnd = NULL;
2137         struct hlist_head *hhd;
2138
2139         (*pos)++;
2140         iter->pos = *pos;
2141
2142         if (iter->probe)
2143                 hnd = &iter->probe->node;
2144  retry:
2145         if (iter->hidx >= FTRACE_FUNC_HASHSIZE)
2146                 return NULL;
2147
2148         hhd = &ftrace_func_hash[iter->hidx];
2149
2150         if (hlist_empty(hhd)) {
2151                 iter->hidx++;
2152                 hnd = NULL;
2153                 goto retry;
2154         }
2155
2156         if (!hnd)
2157                 hnd = hhd->first;
2158         else {
2159                 hnd = hnd->next;
2160                 if (!hnd) {
2161                         iter->hidx++;
2162                         goto retry;
2163                 }
2164         }
2165
2166         if (WARN_ON_ONCE(!hnd))
2167                 return NULL;
2168
2169         iter->probe = hlist_entry(hnd, struct ftrace_func_probe, node);
2170
2171         return iter;
2172 }
2173
2174 static void *t_hash_start(struct seq_file *m, loff_t *pos)
2175 {
2176         struct ftrace_iterator *iter = m->private;
2177         void *p = NULL;
2178         loff_t l;
2179
2180         if (iter->func_pos > *pos)
2181                 return NULL;
2182
2183         iter->hidx = 0;
2184         for (l = 0; l <= (*pos - iter->func_pos); ) {
2185                 p = t_hash_next(m, &l);
2186                 if (!p)
2187                         break;
2188         }
2189         if (!p)
2190                 return NULL;
2191
2192         /* Only set this if we have an item */
2193         iter->flags |= FTRACE_ITER_HASH;
2194
2195         return iter;
2196 }
2197
2198 static int
2199 t_hash_show(struct seq_file *m, struct ftrace_iterator *iter)
2200 {
2201         struct ftrace_func_probe *rec;
2202
2203         rec = iter->probe;
2204         if (WARN_ON_ONCE(!rec))
2205                 return -EIO;
2206
2207         if (rec->ops->print)
2208                 return rec->ops->print(m, rec->ip, rec->ops, rec->data);
2209
2210         seq_printf(m, "%ps:%ps", (void *)rec->ip, (void *)rec->ops->func);
2211
2212         if (rec->data)
2213                 seq_printf(m, ":%p", rec->data);
2214         seq_putc(m, '\n');
2215
2216         return 0;
2217 }
2218
2219 static void *
2220 t_next(struct seq_file *m, void *v, loff_t *pos)
2221 {
2222         struct ftrace_iterator *iter = m->private;
2223         struct ftrace_ops *ops = &global_ops;
2224         struct dyn_ftrace *rec = NULL;
2225
2226         if (unlikely(ftrace_disabled))
2227                 return NULL;
2228
2229         if (iter->flags & FTRACE_ITER_HASH)
2230                 return t_hash_next(m, pos);
2231
2232         (*pos)++;
2233         iter->pos = iter->func_pos = *pos;
2234
2235         if (iter->flags & FTRACE_ITER_PRINTALL)
2236                 return t_hash_start(m, pos);
2237
2238  retry:
2239         if (iter->idx >= iter->pg->index) {
2240                 if (iter->pg->next) {
2241                         iter->pg = iter->pg->next;
2242                         iter->idx = 0;
2243                         goto retry;
2244                 }
2245         } else {
2246                 rec = &iter->pg->records[iter->idx++];
2247                 if (((iter->flags & FTRACE_ITER_FILTER) &&
2248                      !(ftrace_lookup_ip(ops->filter_hash, rec->ip))) ||
2249
2250                     ((iter->flags & FTRACE_ITER_NOTRACE) &&
2251                      !ftrace_lookup_ip(ops->notrace_hash, rec->ip)) ||
2252
2253                     ((iter->flags & FTRACE_ITER_ENABLED) &&
2254                      !(rec->flags & ~FTRACE_FL_MASK))) {
2255
2256                         rec = NULL;
2257                         goto retry;
2258                 }
2259         }
2260
2261         if (!rec)
2262                 return t_hash_start(m, pos);
2263
2264         iter->func = rec;
2265
2266         return iter;
2267 }
2268
2269 static void reset_iter_read(struct ftrace_iterator *iter)
2270 {
2271         iter->pos = 0;
2272         iter->func_pos = 0;
2273         iter->flags &= ~(FTRACE_ITER_PRINTALL & FTRACE_ITER_HASH);
2274 }
2275
2276 static void *t_start(struct seq_file *m, loff_t *pos)
2277 {
2278         struct ftrace_iterator *iter = m->private;
2279         struct ftrace_ops *ops = &global_ops;
2280         void *p = NULL;
2281         loff_t l;
2282
2283         mutex_lock(&ftrace_lock);
2284
2285         if (unlikely(ftrace_disabled))
2286                 return NULL;
2287
2288         /*
2289          * If an lseek was done, then reset and start from beginning.
2290          */
2291         if (*pos < iter->pos)
2292                 reset_iter_read(iter);
2293
2294         /*
2295          * For set_ftrace_filter reading, if we have the filter
2296          * off, we can short cut and just print out that all
2297          * functions are enabled.
2298          */
2299         if (iter->flags & FTRACE_ITER_FILTER && !ops->filter_hash->count) {
2300                 if (*pos > 0)
2301                         return t_hash_start(m, pos);
2302                 iter->flags |= FTRACE_ITER_PRINTALL;
2303                 /* reset in case of seek/pread */
2304                 iter->flags &= ~FTRACE_ITER_HASH;
2305                 return iter;
2306         }
2307
2308         if (iter->flags & FTRACE_ITER_HASH)
2309                 return t_hash_start(m, pos);
2310
2311         /*
2312          * Unfortunately, we need to restart at ftrace_pages_start
2313          * every time we let go of the ftrace_mutex. This is because
2314          * those pointers can change without the lock.
2315          */
2316         iter->pg = ftrace_pages_start;
2317         iter->idx = 0;
2318         for (l = 0; l <= *pos; ) {
2319                 p = t_next(m, p, &l);
2320                 if (!p)
2321                         break;
2322         }
2323
2324         if (!p) {
2325                 if (iter->flags & FTRACE_ITER_FILTER)
2326                         return t_hash_start(m, pos);
2327
2328                 return NULL;
2329         }
2330
2331         return iter;
2332 }
2333
2334 static void t_stop(struct seq_file *m, void *p)
2335 {
2336         mutex_unlock(&ftrace_lock);
2337 }
2338
2339 static int t_show(struct seq_file *m, void *v)
2340 {
2341         struct ftrace_iterator *iter = m->private;
2342         struct dyn_ftrace *rec;
2343
2344         if (iter->flags & FTRACE_ITER_HASH)
2345                 return t_hash_show(m, iter);
2346
2347         if (iter->flags & FTRACE_ITER_PRINTALL) {
2348                 seq_printf(m, "#### all functions enabled ####\n");
2349                 return 0;
2350         }
2351
2352         rec = iter->func;
2353
2354         if (!rec)
2355                 return 0;
2356
2357         seq_printf(m, "%ps", (void *)rec->ip);
2358         if (iter->flags & FTRACE_ITER_ENABLED)
2359                 seq_printf(m, " (%ld)",
2360                            rec->flags & ~FTRACE_FL_MASK);
2361         seq_printf(m, "\n");
2362
2363         return 0;
2364 }
2365
2366 static const struct seq_operations show_ftrace_seq_ops = {
2367         .start = t_start,
2368         .next = t_next,
2369         .stop = t_stop,
2370         .show = t_show,
2371 };
2372
2373 static int
2374 ftrace_avail_open(struct inode *inode, struct file *file)
2375 {
2376         struct ftrace_iterator *iter;
2377         int ret;
2378
2379         if (unlikely(ftrace_disabled))
2380                 return -ENODEV;
2381
2382         iter = kzalloc(sizeof(*iter), GFP_KERNEL);
2383         if (!iter)
2384                 return -ENOMEM;
2385
2386         iter->pg = ftrace_pages_start;
2387
2388         ret = seq_open(file, &show_ftrace_seq_ops);
2389         if (!ret) {
2390                 struct seq_file *m = file->private_data;
2391
2392                 m->private = iter;
2393         } else {
2394                 kfree(iter);
2395         }
2396
2397         return ret;
2398 }
2399
2400 static int
2401 ftrace_enabled_open(struct inode *inode, struct file *file)
2402 {
2403         struct ftrace_iterator *iter;
2404         int ret;
2405
2406         if (unlikely(ftrace_disabled))
2407                 return -ENODEV;
2408
2409         iter = kzalloc(sizeof(*iter), GFP_KERNEL);
2410         if (!iter)
2411                 return -ENOMEM;
2412
2413         iter->pg = ftrace_pages_start;
2414         iter->flags = FTRACE_ITER_ENABLED;
2415
2416         ret = seq_open(file, &show_ftrace_seq_ops);
2417         if (!ret) {
2418                 struct seq_file *m = file->private_data;
2419
2420                 m->private = iter;
2421         } else {
2422                 kfree(iter);
2423         }
2424
2425         return ret;
2426 }
2427
2428 static void ftrace_filter_reset(struct ftrace_hash *hash)
2429 {
2430         mutex_lock(&ftrace_lock);
2431         ftrace_hash_clear(hash);
2432         mutex_unlock(&ftrace_lock);
2433 }
2434
2435 static int
2436 ftrace_regex_open(struct ftrace_ops *ops, int flag,
2437                   struct inode *inode, struct file *file)
2438 {
2439         struct ftrace_iterator *iter;
2440         struct ftrace_hash *hash;
2441         int ret = 0;
2442
2443         if (unlikely(ftrace_disabled))
2444                 return -ENODEV;
2445
2446         iter = kzalloc(sizeof(*iter), GFP_KERNEL);
2447         if (!iter)
2448                 return -ENOMEM;
2449
2450         if (trace_parser_get_init(&iter->parser, FTRACE_BUFF_MAX)) {
2451                 kfree(iter);
2452                 return -ENOMEM;
2453         }
2454
2455         if (flag & FTRACE_ITER_NOTRACE)
2456                 hash = ops->notrace_hash;
2457         else
2458                 hash = ops->filter_hash;
2459
2460         iter->ops = ops;
2461         iter->flags = flag;
2462
2463         if (file->f_mode & FMODE_WRITE) {
2464                 mutex_lock(&ftrace_lock);
2465                 iter->hash = alloc_and_copy_ftrace_hash(FTRACE_HASH_DEFAULT_BITS, hash);
2466                 mutex_unlock(&ftrace_lock);
2467
2468                 if (!iter->hash) {
2469                         trace_parser_put(&iter->parser);
2470                         kfree(iter);
2471                         return -ENOMEM;
2472                 }
2473         }
2474
2475         mutex_lock(&ftrace_regex_lock);
2476
2477         if ((file->f_mode & FMODE_WRITE) &&
2478             (file->f_flags & O_TRUNC))
2479                 ftrace_filter_reset(iter->hash);
2480
2481         if (file->f_mode & FMODE_READ) {
2482                 iter->pg = ftrace_pages_start;
2483
2484                 ret = seq_open(file, &show_ftrace_seq_ops);
2485                 if (!ret) {
2486                         struct seq_file *m = file->private_data;
2487                         m->private = iter;
2488                 } else {
2489                         /* Failed */
2490                         free_ftrace_hash(iter->hash);
2491                         trace_parser_put(&iter->parser);
2492                         kfree(iter);
2493                 }
2494         } else
2495                 file->private_data = iter;
2496         mutex_unlock(&ftrace_regex_lock);
2497
2498         return ret;
2499 }
2500
2501 static int
2502 ftrace_filter_open(struct inode *inode, struct file *file)
2503 {
2504         return ftrace_regex_open(&global_ops, FTRACE_ITER_FILTER,
2505                                  inode, file);
2506 }
2507
2508 static int
2509 ftrace_notrace_open(struct inode *inode, struct file *file)
2510 {
2511         return ftrace_regex_open(&global_ops, FTRACE_ITER_NOTRACE,
2512                                  inode, file);
2513 }
2514
2515 static loff_t
2516 ftrace_regex_lseek(struct file *file, loff_t offset, int origin)
2517 {
2518         loff_t ret;
2519
2520         if (file->f_mode & FMODE_READ)
2521                 ret = seq_lseek(file, offset, origin);
2522         else
2523                 file->f_pos = ret = 1;
2524
2525         return ret;
2526 }
2527
2528 static int ftrace_match(char *str, char *regex, int len, int type)
2529 {
2530         int matched = 0;
2531         int slen;
2532
2533         switch (type) {
2534         case MATCH_FULL:
2535                 if (strcmp(str, regex) == 0)
2536                         matched = 1;
2537                 break;
2538         case MATCH_FRONT_ONLY:
2539                 if (strncmp(str, regex, len) == 0)
2540                         matched = 1;
2541                 break;
2542         case MATCH_MIDDLE_ONLY:
2543                 if (strstr(str, regex))
2544                         matched = 1;
2545                 break;
2546         case MATCH_END_ONLY:
2547                 slen = strlen(str);
2548                 if (slen >= len && memcmp(str + slen - len, regex, len) == 0)
2549                         matched = 1;
2550                 break;
2551         }
2552
2553         return matched;
2554 }
2555
2556 static int
2557 enter_record(struct ftrace_hash *hash, struct dyn_ftrace *rec, int not)
2558 {
2559         struct ftrace_func_entry *entry;
2560         int ret = 0;
2561
2562         entry = ftrace_lookup_ip(hash, rec->ip);
2563         if (not) {
2564                 /* Do nothing if it doesn't exist */
2565                 if (!entry)
2566                         return 0;
2567
2568                 free_hash_entry(hash, entry);
2569         } else {
2570                 /* Do nothing if it exists */
2571                 if (entry)
2572                         return 0;
2573
2574                 ret = add_hash_entry(hash, rec->ip);
2575         }
2576         return ret;
2577 }
2578
2579 static int
2580 ftrace_match_record(struct dyn_ftrace *rec, char *mod,
2581                     char *regex, int len, int type)
2582 {
2583         char str[KSYM_SYMBOL_LEN];
2584         char *modname;
2585
2586         kallsyms_lookup(rec->ip, NULL, NULL, &modname, str);
2587
2588         if (mod) {
2589                 /* module lookup requires matching the module */
2590                 if (!modname || strcmp(modname, mod))
2591                         return 0;
2592
2593                 /* blank search means to match all funcs in the mod */
2594                 if (!len)
2595                         return 1;
2596         }
2597
2598         return ftrace_match(str, regex, len, type);
2599 }
2600
2601 static int
2602 match_records(struct ftrace_hash *hash, char *buff,
2603               int len, char *mod, int not)
2604 {
2605         unsigned search_len = 0;
2606         struct ftrace_page *pg;
2607         struct dyn_ftrace *rec;
2608         int type = MATCH_FULL;
2609         char *search = buff;
2610         int found = 0;
2611         int ret;
2612
2613         if (len) {
2614                 type = filter_parse_regex(buff, len, &search, &not);
2615                 search_len = strlen(search);
2616         }
2617
2618         mutex_lock(&ftrace_lock);
2619
2620         if (unlikely(ftrace_disabled))
2621                 goto out_unlock;
2622
2623         do_for_each_ftrace_rec(pg, rec) {
2624                 if (ftrace_match_record(rec, mod, search, search_len, type)) {
2625                         ret = enter_record(hash, rec, not);
2626                         if (ret < 0) {
2627                                 found = ret;
2628                                 goto out_unlock;
2629                         }
2630                         found = 1;
2631                 }
2632         } while_for_each_ftrace_rec();
2633  out_unlock:
2634         mutex_unlock(&ftrace_lock);
2635
2636         return found;
2637 }
2638
2639 static int
2640 ftrace_match_records(struct ftrace_hash *hash, char *buff, int len)
2641 {
2642         return match_records(hash, buff, len, NULL, 0);
2643 }
2644
2645 static int
2646 ftrace_match_module_records(struct ftrace_hash *hash, char *buff, char *mod)
2647 {
2648         int not = 0;
2649
2650         /* blank or '*' mean the same */
2651         if (strcmp(buff, "*") == 0)
2652                 buff[0] = 0;
2653
2654         /* handle the case of 'dont filter this module' */
2655         if (strcmp(buff, "!") == 0 || strcmp(buff, "!*") == 0) {
2656                 buff[0] = 0;
2657                 not = 1;
2658         }
2659
2660         return match_records(hash, buff, strlen(buff), mod, not);
2661 }
2662
2663 /*
2664  * We register the module command as a template to show others how
2665  * to register the a command as well.
2666  */
2667
2668 static int
2669 ftrace_mod_callback(struct ftrace_hash *hash,
2670                     char *func, char *cmd, char *param, int enable)
2671 {
2672         char *mod;
2673         int ret = -EINVAL;
2674
2675         /*
2676          * cmd == 'mod' because we only registered this func
2677          * for the 'mod' ftrace_func_command.
2678          * But if you register one func with multiple commands,
2679          * you can tell which command was used by the cmd
2680          * parameter.
2681          */
2682
2683         /* we must have a module name */
2684         if (!param)
2685                 return ret;
2686
2687         mod = strsep(&param, ":");
2688         if (!strlen(mod))
2689                 return ret;
2690
2691         ret = ftrace_match_module_records(hash, func, mod);
2692         if (!ret)
2693                 ret = -EINVAL;
2694         if (ret < 0)
2695                 return ret;
2696
2697         return 0;
2698 }
2699
2700 static struct ftrace_func_command ftrace_mod_cmd = {
2701         .name                   = "mod",
2702         .func                   = ftrace_mod_callback,
2703 };
2704
2705 static int __init ftrace_mod_cmd_init(void)
2706 {
2707         return register_ftrace_command(&ftrace_mod_cmd);
2708 }
2709 device_initcall(ftrace_mod_cmd_init);
2710
2711 static void
2712 function_trace_probe_call(unsigned long ip, unsigned long parent_ip)
2713 {
2714         struct ftrace_func_probe *entry;
2715         struct hlist_head *hhd;
2716         struct hlist_node *n;
2717         unsigned long key;
2718
2719         key = hash_long(ip, FTRACE_HASH_BITS);
2720
2721         hhd = &ftrace_func_hash[key];
2722
2723         if (hlist_empty(hhd))
2724                 return;
2725
2726         /*
2727          * Disable preemption for these calls to prevent a RCU grace
2728          * period. This syncs the hash iteration and freeing of items
2729          * on the hash. rcu_read_lock is too dangerous here.
2730          */
2731         preempt_disable_notrace();
2732         hlist_for_each_entry_rcu(entry, n, hhd, node) {
2733                 if (entry->ip == ip)
2734                         entry->ops->func(ip, parent_ip, &entry->data);
2735         }
2736         preempt_enable_notrace();
2737 }
2738
2739 static struct ftrace_ops trace_probe_ops __read_mostly =
2740 {
2741         .func           = function_trace_probe_call,
2742 };
2743
2744 static int ftrace_probe_registered;
2745
2746 static void __enable_ftrace_function_probe(void)
2747 {
2748         int ret;
2749         int i;
2750
2751         if (ftrace_probe_registered)
2752                 return;
2753
2754         for (i = 0; i < FTRACE_FUNC_HASHSIZE; i++) {
2755                 struct hlist_head *hhd = &ftrace_func_hash[i];
2756                 if (hhd->first)
2757                         break;
2758         }
2759         /* Nothing registered? */
2760         if (i == FTRACE_FUNC_HASHSIZE)
2761                 return;
2762
2763         ret = __register_ftrace_function(&trace_probe_ops);
2764         if (!ret)
2765                 ret = ftrace_startup(&trace_probe_ops, 0);
2766
2767         ftrace_probe_registered = 1;
2768 }
2769
2770 static void __disable_ftrace_function_probe(void)
2771 {
2772         int ret;
2773         int i;
2774
2775         if (!ftrace_probe_registered)
2776                 return;
2777
2778         for (i = 0; i < FTRACE_FUNC_HASHSIZE; i++) {
2779                 struct hlist_head *hhd = &ftrace_func_hash[i];
2780                 if (hhd->first)
2781                         return;
2782         }
2783
2784         /* no more funcs left */
2785         ret = __unregister_ftrace_function(&trace_probe_ops);
2786         if (!ret)
2787                 ftrace_shutdown(&trace_probe_ops, 0);
2788
2789         ftrace_probe_registered = 0;
2790 }
2791
2792
2793 static void ftrace_free_entry_rcu(struct rcu_head *rhp)
2794 {
2795         struct ftrace_func_probe *entry =
2796                 container_of(rhp, struct ftrace_func_probe, rcu);
2797
2798         if (entry->ops->free)
2799                 entry->ops->free(&entry->data);
2800         kfree(entry);
2801 }
2802
2803
2804 int
2805 register_ftrace_function_probe(char *glob, struct ftrace_probe_ops *ops,
2806                               void *data)
2807 {
2808         struct ftrace_func_probe *entry;
2809         struct ftrace_page *pg;
2810         struct dyn_ftrace *rec;
2811         int type, len, not;
2812         unsigned long key;
2813         int count = 0;
2814         char *search;
2815
2816         type = filter_parse_regex(glob, strlen(glob), &search, &not);
2817         len = strlen(search);
2818
2819         /* we do not support '!' for function probes */
2820         if (WARN_ON(not))
2821                 return -EINVAL;
2822
2823         mutex_lock(&ftrace_lock);
2824
2825         if (unlikely(ftrace_disabled))
2826                 goto out_unlock;
2827
2828         do_for_each_ftrace_rec(pg, rec) {
2829
2830                 if (!ftrace_match_record(rec, NULL, search, len, type))
2831                         continue;
2832
2833                 entry = kmalloc(sizeof(*entry), GFP_KERNEL);
2834                 if (!entry) {
2835                         /* If we did not process any, then return error */
2836                         if (!count)
2837                                 count = -ENOMEM;
2838                         goto out_unlock;
2839                 }
2840
2841                 count++;
2842
2843                 entry->data = data;
2844
2845                 /*
2846                  * The caller might want to do something special
2847                  * for each function we find. We call the callback
2848                  * to give the caller an opportunity to do so.
2849                  */
2850                 if (ops->callback) {
2851                         if (ops->callback(rec->ip, &entry->data) < 0) {
2852                                 /* caller does not like this func */
2853                                 kfree(entry);
2854                                 continue;
2855                         }
2856                 }
2857
2858                 entry->ops = ops;
2859                 entry->ip = rec->ip;
2860
2861                 key = hash_long(entry->ip, FTRACE_HASH_BITS);
2862                 hlist_add_head_rcu(&entry->node, &ftrace_func_hash[key]);
2863
2864         } while_for_each_ftrace_rec();
2865         __enable_ftrace_function_probe();
2866
2867  out_unlock:
2868         mutex_unlock(&ftrace_lock);
2869
2870         return count;
2871 }
2872
2873 enum {
2874         PROBE_TEST_FUNC         = 1,
2875         PROBE_TEST_DATA         = 2
2876 };
2877
2878 static void
2879 __unregister_ftrace_function_probe(char *glob, struct ftrace_probe_ops *ops,
2880                                   void *data, int flags)
2881 {
2882         struct ftrace_func_probe *entry;
2883         struct hlist_node *n, *tmp;
2884         char str[KSYM_SYMBOL_LEN];
2885         int type = MATCH_FULL;
2886         int i, len = 0;
2887         char *search;
2888
2889         if (glob && (strcmp(glob, "*") == 0 || !strlen(glob)))
2890                 glob = NULL;
2891         else if (glob) {
2892                 int not;
2893
2894                 type = filter_parse_regex(glob, strlen(glob), &search, &not);
2895                 len = strlen(search);
2896
2897                 /* we do not support '!' for function probes */
2898                 if (WARN_ON(not))
2899                         return;
2900         }
2901
2902         mutex_lock(&ftrace_lock);
2903         for (i = 0; i < FTRACE_FUNC_HASHSIZE; i++) {
2904                 struct hlist_head *hhd = &ftrace_func_hash[i];
2905
2906                 hlist_for_each_entry_safe(entry, n, tmp, hhd, node) {
2907
2908                         /* break up if statements for readability */
2909                         if ((flags & PROBE_TEST_FUNC) && entry->ops != ops)
2910                                 continue;
2911
2912                         if ((flags & PROBE_TEST_DATA) && entry->data != data)
2913                                 continue;
2914
2915                         /* do this last, since it is the most expensive */
2916                         if (glob) {
2917                                 kallsyms_lookup(entry->ip, NULL, NULL,
2918                                                 NULL, str);
2919                                 if (!ftrace_match(str, glob, len, type))
2920                                         continue;
2921                         }
2922
2923                         hlist_del(&entry->node);
2924                         call_rcu(&entry->rcu, ftrace_free_entry_rcu);
2925                 }
2926         }
2927         __disable_ftrace_function_probe();
2928         mutex_unlock(&ftrace_lock);
2929 }
2930
2931 void
2932 unregister_ftrace_function_probe(char *glob, struct ftrace_probe_ops *ops,
2933                                 void *data)
2934 {
2935         __unregister_ftrace_function_probe(glob, ops, data,
2936                                           PROBE_TEST_FUNC | PROBE_TEST_DATA);
2937 }
2938
2939 void
2940 unregister_ftrace_function_probe_func(char *glob, struct ftrace_probe_ops *ops)
2941 {
2942         __unregister_ftrace_function_probe(glob, ops, NULL, PROBE_TEST_FUNC);
2943 }
2944
2945 void unregister_ftrace_function_probe_all(char *glob)
2946 {
2947         __unregister_ftrace_function_probe(glob, NULL, NULL, 0);
2948 }
2949
2950 static LIST_HEAD(ftrace_commands);
2951 static DEFINE_MUTEX(ftrace_cmd_mutex);
2952
2953 int register_ftrace_command(struct ftrace_func_command *cmd)
2954 {
2955         struct ftrace_func_command *p;
2956         int ret = 0;
2957
2958         mutex_lock(&ftrace_cmd_mutex);
2959         list_for_each_entry(p, &ftrace_commands, list) {
2960                 if (strcmp(cmd->name, p->name) == 0) {
2961                         ret = -EBUSY;
2962                         goto out_unlock;
2963                 }
2964         }
2965         list_add(&cmd->list, &ftrace_commands);
2966  out_unlock:
2967         mutex_unlock(&ftrace_cmd_mutex);
2968
2969         return ret;
2970 }
2971
2972 int unregister_ftrace_command(struct ftrace_func_command *cmd)
2973 {
2974         struct ftrace_func_command *p, *n;
2975         int ret = -ENODEV;
2976
2977         mutex_lock(&ftrace_cmd_mutex);
2978         list_for_each_entry_safe(p, n, &ftrace_commands, list) {
2979                 if (strcmp(cmd->name, p->name) == 0) {
2980                         ret = 0;
2981                         list_del_init(&p->list);
2982                         goto out_unlock;
2983                 }
2984         }
2985  out_unlock:
2986         mutex_unlock(&ftrace_cmd_mutex);
2987
2988         return ret;
2989 }
2990
2991 static int ftrace_process_regex(struct ftrace_hash *hash,
2992                                 char *buff, int len, int enable)
2993 {
2994         char *func, *command, *next = buff;
2995         struct ftrace_func_command *p;
2996         int ret = -EINVAL;
2997
2998         func = strsep(&next, ":");
2999
3000         if (!next) {
3001                 ret = ftrace_match_records(hash, func, len);
3002                 if (!ret)
3003                         ret = -EINVAL;
3004                 if (ret < 0)
3005                         return ret;
3006                 return 0;
3007         }
3008
3009         /* command found */
3010
3011         command = strsep(&next, ":");
3012
3013         mutex_lock(&ftrace_cmd_mutex);
3014         list_for_each_entry(p, &ftrace_commands, list) {
3015                 if (strcmp(p->name, command) == 0) {
3016                         ret = p->func(hash, func, command, next, enable);
3017                         goto out_unlock;
3018                 }
3019         }
3020  out_unlock:
3021         mutex_unlock(&ftrace_cmd_mutex);
3022
3023         return ret;
3024 }
3025
3026 static ssize_t
3027 ftrace_regex_write(struct file *file, const char __user *ubuf,
3028                    size_t cnt, loff_t *ppos, int enable)
3029 {
3030         struct ftrace_iterator *iter;
3031         struct trace_parser *parser;
3032         ssize_t ret, read;
3033
3034         if (!cnt)
3035                 return 0;
3036
3037         mutex_lock(&ftrace_regex_lock);
3038
3039         ret = -ENODEV;
3040         if (unlikely(ftrace_disabled))
3041                 goto out_unlock;
3042
3043         if (file->f_mode & FMODE_READ) {
3044                 struct seq_file *m = file->private_data;
3045                 iter = m->private;
3046         } else
3047                 iter = file->private_data;
3048
3049         parser = &iter->parser;
3050         read = trace_get_user(parser, ubuf, cnt, ppos);
3051
3052         if (read >= 0 && trace_parser_loaded(parser) &&
3053             !trace_parser_cont(parser)) {
3054                 ret = ftrace_process_regex(iter->hash, parser->buffer,
3055                                            parser->idx, enable);
3056                 trace_parser_clear(parser);
3057                 if (ret)
3058                         goto out_unlock;
3059         }
3060
3061         ret = read;
3062 out_unlock:
3063         mutex_unlock(&ftrace_regex_lock);
3064
3065         return ret;
3066 }
3067
3068 static ssize_t
3069 ftrace_filter_write(struct file *file, const char __user *ubuf,
3070                     size_t cnt, loff_t *ppos)
3071 {
3072         return ftrace_regex_write(file, ubuf, cnt, ppos, 1);
3073 }
3074
3075 static ssize_t
3076 ftrace_notrace_write(struct file *file, const char __user *ubuf,
3077                      size_t cnt, loff_t *ppos)
3078 {
3079         return ftrace_regex_write(file, ubuf, cnt, ppos, 0);
3080 }
3081
3082 static int
3083 ftrace_set_regex(struct ftrace_ops *ops, unsigned char *buf, int len,
3084                  int reset, int enable)
3085 {
3086         struct ftrace_hash **orig_hash;
3087         struct ftrace_hash *hash;
3088         int ret;
3089
3090         /* All global ops uses the global ops filters */
3091         if (ops->flags & FTRACE_OPS_FL_GLOBAL)
3092                 ops = &global_ops;
3093
3094         if (unlikely(ftrace_disabled))
3095                 return -ENODEV;
3096
3097         if (enable)
3098                 orig_hash = &ops->filter_hash;
3099         else
3100                 orig_hash = &ops->notrace_hash;
3101
3102         hash = alloc_and_copy_ftrace_hash(FTRACE_HASH_DEFAULT_BITS, *orig_hash);
3103         if (!hash)
3104                 return -ENOMEM;
3105
3106         mutex_lock(&ftrace_regex_lock);
3107         if (reset)
3108                 ftrace_filter_reset(hash);
3109         if (buf)
3110                 ftrace_match_records(hash, buf, len);
3111
3112         mutex_lock(&ftrace_lock);
3113         ret = ftrace_hash_move(ops, enable, orig_hash, hash);
3114         if (!ret && ops->flags & FTRACE_OPS_FL_ENABLED
3115             && ftrace_enabled)
3116                 ftrace_run_update_code(FTRACE_UPDATE_CALLS);
3117
3118         mutex_unlock(&ftrace_lock);
3119
3120         mutex_unlock(&ftrace_regex_lock);
3121
3122         free_ftrace_hash(hash);
3123         return ret;
3124 }
3125
3126 /**
3127  * ftrace_set_filter - set a function to filter on in ftrace
3128  * @ops - the ops to set the filter with
3129  * @buf - the string that holds the function filter text.
3130  * @len - the length of the string.
3131  * @reset - non zero to reset all filters before applying this filter.
3132  *
3133  * Filters denote which functions should be enabled when tracing is enabled.
3134  * If @buf is NULL and reset is set, all functions will be enabled for tracing.
3135  */
3136 void ftrace_set_filter(struct ftrace_ops *ops, unsigned char *buf,
3137                        int len, int reset)
3138 {
3139         ftrace_set_regex(ops, buf, len, reset, 1);
3140 }
3141 EXPORT_SYMBOL_GPL(ftrace_set_filter);
3142
3143 /**
3144  * ftrace_set_notrace - set a function to not trace in ftrace
3145  * @ops - the ops to set the notrace filter with
3146  * @buf - the string that holds the function notrace text.
3147  * @len - the length of the string.
3148  * @reset - non zero to reset all filters before applying this filter.
3149  *
3150  * Notrace Filters denote which functions should not be enabled when tracing
3151  * is enabled. If @buf is NULL and reset is set, all functions will be enabled
3152  * for tracing.
3153  */
3154 void ftrace_set_notrace(struct ftrace_ops *ops, unsigned char *buf,
3155                         int len, int reset)
3156 {
3157         ftrace_set_regex(ops, buf, len, reset, 0);
3158 }
3159 EXPORT_SYMBOL_GPL(ftrace_set_notrace);
3160 /**
3161  * ftrace_set_filter - set a function to filter on in ftrace
3162  * @ops - the ops to set the filter with
3163  * @buf - the string that holds the function filter text.
3164  * @len - the length of the string.
3165  * @reset - non zero to reset all filters before applying this filter.
3166  *
3167  * Filters denote which functions should be enabled when tracing is enabled.
3168  * If @buf is NULL and reset is set, all functions will be enabled for tracing.
3169  */
3170 void ftrace_set_global_filter(unsigned char *buf, int len, int reset)
3171 {
3172         ftrace_set_regex(&global_ops, buf, len, reset, 1);
3173 }
3174 EXPORT_SYMBOL_GPL(ftrace_set_global_filter);
3175
3176 /**
3177  * ftrace_set_notrace - set a function to not trace in ftrace
3178  * @ops - the ops to set the notrace filter with
3179  * @buf - the string that holds the function notrace text.
3180  * @len - the length of the string.
3181  * @reset - non zero to reset all filters before applying this filter.
3182  *
3183  * Notrace Filters denote which functions should not be enabled when tracing
3184  * is enabled. If @buf is NULL and reset is set, all functions will be enabled
3185  * for tracing.
3186  */
3187 void ftrace_set_global_notrace(unsigned char *buf, int len, int reset)
3188 {
3189         ftrace_set_regex(&global_ops, buf, len, reset, 0);
3190 }
3191 EXPORT_SYMBOL_GPL(ftrace_set_global_notrace);
3192
3193 /*
3194  * command line interface to allow users to set filters on boot up.
3195  */
3196 #define FTRACE_FILTER_SIZE              COMMAND_LINE_SIZE
3197 static char ftrace_notrace_buf[FTRACE_FILTER_SIZE] __initdata;
3198 static char ftrace_filter_buf[FTRACE_FILTER_SIZE] __initdata;
3199
3200 static int __init set_ftrace_notrace(char *str)
3201 {
3202         strncpy(ftrace_notrace_buf, str, FTRACE_FILTER_SIZE);
3203         return 1;
3204 }
3205 __setup("ftrace_notrace=", set_ftrace_notrace);
3206
3207 static int __init set_ftrace_filter(char *str)
3208 {
3209         strncpy(ftrace_filter_buf, str, FTRACE_FILTER_SIZE);
3210         return 1;
3211 }
3212 __setup("ftrace_filter=", set_ftrace_filter);
3213
3214 #ifdef CONFIG_FUNCTION_GRAPH_TRACER
3215 static char ftrace_graph_buf[FTRACE_FILTER_SIZE] __initdata;
3216 static int ftrace_set_func(unsigned long *array, int *idx, char *buffer);
3217
3218 static int __init set_graph_function(char *str)
3219 {
3220         strlcpy(ftrace_graph_buf, str, FTRACE_FILTER_SIZE);
3221         return 1;
3222 }
3223 __setup("ftrace_graph_filter=", set_graph_function);
3224
3225 static void __init set_ftrace_early_graph(char *buf)
3226 {
3227         int ret;
3228         char *func;
3229
3230         while (buf) {
3231                 func = strsep(&buf, ",");
3232                 /* we allow only one expression at a time */
3233                 ret = ftrace_set_func(ftrace_graph_funcs, &ftrace_graph_count,
3234                                       func);
3235                 if (ret)
3236                         printk(KERN_DEBUG "ftrace: function %s not "
3237                                           "traceable\n", func);
3238         }
3239 }
3240 #endif /* CONFIG_FUNCTION_GRAPH_TRACER */
3241
3242 static void __init
3243 set_ftrace_early_filter(struct ftrace_ops *ops, char *buf, int enable)
3244 {
3245         char *func;
3246
3247         while (buf) {
3248                 func = strsep(&buf, ",");
3249                 ftrace_set_regex(ops, func, strlen(func), 0, enable);
3250         }
3251 }
3252
3253 static void __init set_ftrace_early_filters(void)
3254 {
3255         if (ftrace_filter_buf[0])
3256                 set_ftrace_early_filter(&global_ops, ftrace_filter_buf, 1);
3257         if (ftrace_notrace_buf[0])
3258                 set_ftrace_early_filter(&global_ops, ftrace_notrace_buf, 0);
3259 #ifdef CONFIG_FUNCTION_GRAPH_TRACER
3260         if (ftrace_graph_buf[0])
3261                 set_ftrace_early_graph(ftrace_graph_buf);
3262 #endif /* CONFIG_FUNCTION_GRAPH_TRACER */
3263 }
3264
3265 static int
3266 ftrace_regex_release(struct inode *inode, struct file *file)
3267 {
3268         struct seq_file *m = (struct seq_file *)file->private_data;
3269         struct ftrace_iterator *iter;
3270         struct ftrace_hash **orig_hash;
3271         struct trace_parser *parser;
3272         int filter_hash;
3273         int ret;
3274
3275         mutex_lock(&ftrace_regex_lock);
3276         if (file->f_mode & FMODE_READ) {
3277                 iter = m->private;
3278
3279                 seq_release(inode, file);
3280         } else
3281                 iter = file->private_data;
3282
3283         parser = &iter->parser;
3284         if (trace_parser_loaded(parser)) {
3285                 parser->buffer[parser->idx] = 0;
3286                 ftrace_match_records(iter->hash, parser->buffer, parser->idx);
3287         }
3288
3289         trace_parser_put(parser);
3290
3291         if (file->f_mode & FMODE_WRITE) {
3292                 filter_hash = !!(iter->flags & FTRACE_ITER_FILTER);
3293
3294                 if (filter_hash)
3295                         orig_hash = &iter->ops->filter_hash;
3296                 else
3297                         orig_hash = &iter->ops->notrace_hash;
3298
3299                 mutex_lock(&ftrace_lock);
3300                 ret = ftrace_hash_move(iter->ops, filter_hash,
3301                                        orig_hash, iter->hash);
3302                 if (!ret && (iter->ops->flags & FTRACE_OPS_FL_ENABLED)
3303                     && ftrace_enabled)
3304                         ftrace_run_update_code(FTRACE_UPDATE_CALLS);
3305
3306                 mutex_unlock(&ftrace_lock);
3307         }
3308         free_ftrace_hash(iter->hash);
3309         kfree(iter);
3310
3311         mutex_unlock(&ftrace_regex_lock);
3312         return 0;
3313 }
3314
3315 static const struct file_operations ftrace_avail_fops = {
3316         .open = ftrace_avail_open,
3317         .read = seq_read,
3318         .llseek = seq_lseek,
3319         .release = seq_release_private,
3320 };
3321
3322 static const struct file_operations ftrace_enabled_fops = {
3323         .open = ftrace_enabled_open,
3324         .read = seq_read,
3325         .llseek = seq_lseek,
3326         .release = seq_release_private,
3327 };
3328
3329 static const struct file_operations ftrace_filter_fops = {
3330         .open = ftrace_filter_open,
3331         .read = seq_read,
3332         .write = ftrace_filter_write,
3333         .llseek = ftrace_regex_lseek,
3334         .release = ftrace_regex_release,
3335 };
3336
3337 static const struct file_operations ftrace_notrace_fops = {
3338         .open = ftrace_notrace_open,
3339         .read = seq_read,
3340         .write = ftrace_notrace_write,
3341         .llseek = ftrace_regex_lseek,
3342         .release = ftrace_regex_release,
3343 };
3344
3345 #ifdef CONFIG_FUNCTION_GRAPH_TRACER
3346
3347 static DEFINE_MUTEX(graph_lock);
3348
3349 int ftrace_graph_count;
3350 int ftrace_graph_filter_enabled;
3351 unsigned long ftrace_graph_funcs[FTRACE_GRAPH_MAX_FUNCS] __read_mostly;
3352
3353 static void *
3354 __g_next(struct seq_file *m, loff_t *pos)
3355 {
3356         if (*pos >= ftrace_graph_count)
3357                 return NULL;
3358         return &ftrace_graph_funcs[*pos];
3359 }
3360
3361 static void *
3362 g_next(struct seq_file *m, void *v, loff_t *pos)
3363 {
3364         (*pos)++;
3365         return __g_next(m, pos);
3366 }
3367
3368 static void *g_start(struct seq_file *m, loff_t *pos)
3369 {
3370         mutex_lock(&graph_lock);
3371
3372         /* Nothing, tell g_show to print all functions are enabled */
3373         if (!ftrace_graph_filter_enabled && !*pos)
3374                 return (void *)1;
3375
3376         return __g_next(m, pos);
3377 }
3378
3379 static void g_stop(struct seq_file *m, void *p)
3380 {
3381         mutex_unlock(&graph_lock);
3382 }
3383
3384 static int g_show(struct seq_file *m, void *v)
3385 {
3386         unsigned long *ptr = v;
3387
3388         if (!ptr)
3389                 return 0;
3390
3391         if (ptr == (unsigned long *)1) {
3392                 seq_printf(m, "#### all functions enabled ####\n");
3393                 return 0;
3394         }
3395
3396         seq_printf(m, "%ps\n", (void *)*ptr);
3397
3398         return 0;
3399 }
3400
3401 static const struct seq_operations ftrace_graph_seq_ops = {
3402         .start = g_start,
3403         .next = g_next,
3404         .stop = g_stop,
3405         .show = g_show,
3406 };
3407
3408 static int
3409 ftrace_graph_open(struct inode *inode, struct file *file)
3410 {
3411         int ret = 0;
3412
3413         if (unlikely(ftrace_disabled))
3414                 return -ENODEV;
3415
3416         mutex_lock(&graph_lock);
3417         if ((file->f_mode & FMODE_WRITE) &&
3418             (file->f_flags & O_TRUNC)) {
3419                 ftrace_graph_filter_enabled = 0;
3420                 ftrace_graph_count = 0;
3421                 memset(ftrace_graph_funcs, 0, sizeof(ftrace_graph_funcs));
3422         }
3423         mutex_unlock(&graph_lock);
3424
3425         if (file->f_mode & FMODE_READ)
3426                 ret = seq_open(file, &ftrace_graph_seq_ops);
3427
3428         return ret;
3429 }
3430
3431 static int
3432 ftrace_graph_release(struct inode *inode, struct file *file)
3433 {
3434         if (file->f_mode & FMODE_READ)
3435                 seq_release(inode, file);
3436         return 0;
3437 }
3438
3439 static int
3440 ftrace_set_func(unsigned long *array, int *idx, char *buffer)
3441 {
3442         struct dyn_ftrace *rec;
3443         struct ftrace_page *pg;
3444         int search_len;
3445         int fail = 1;
3446         int type, not;
3447         char *search;
3448         bool exists;
3449         int i;
3450
3451         /* decode regex */
3452         type = filter_parse_regex(buffer, strlen(buffer), &search, &not);
3453         if (!not && *idx >= FTRACE_GRAPH_MAX_FUNCS)
3454                 return -EBUSY;
3455
3456         search_len = strlen(search);
3457
3458         mutex_lock(&ftrace_lock);
3459
3460         if (unlikely(ftrace_disabled)) {
3461                 mutex_unlock(&ftrace_lock);
3462                 return -ENODEV;
3463         }
3464
3465         do_for_each_ftrace_rec(pg, rec) {
3466
3467                 if (ftrace_match_record(rec, NULL, search, search_len, type)) {
3468                         /* if it is in the array */
3469                         exists = false;
3470                         for (i = 0; i < *idx; i++) {
3471                                 if (array[i] == rec->ip) {
3472                                         exists = true;
3473                                         break;
3474                                 }
3475                         }
3476
3477                         if (!not) {
3478                                 fail = 0;
3479                                 if (!exists) {
3480                                         array[(*idx)++] = rec->ip;
3481                                         if (*idx >= FTRACE_GRAPH_MAX_FUNCS)
3482                                                 goto out;
3483                                 }
3484                         } else {
3485                                 if (exists) {
3486                                         array[i] = array[--(*idx)];
3487                                         array[*idx] = 0;
3488                                         fail = 0;
3489                                 }
3490                         }
3491                 }
3492         } while_for_each_ftrace_rec();
3493 out:
3494         mutex_unlock(&ftrace_lock);
3495
3496         if (fail)
3497                 return -EINVAL;
3498
3499         ftrace_graph_filter_enabled = 1;
3500         return 0;
3501 }
3502
3503 static ssize_t
3504 ftrace_graph_write(struct file *file, const char __user *ubuf,
3505                    size_t cnt, loff_t *ppos)
3506 {
3507         struct trace_parser parser;
3508         ssize_t read, ret;
3509
3510         if (!cnt)
3511                 return 0;
3512
3513         mutex_lock(&graph_lock);
3514
3515         if (trace_parser_get_init(&parser, FTRACE_BUFF_MAX)) {
3516                 ret = -ENOMEM;
3517                 goto out_unlock;
3518         }
3519
3520         read = trace_get_user(&parser, ubuf, cnt, ppos);
3521
3522         if (read >= 0 && trace_parser_loaded((&parser))) {
3523                 parser.buffer[parser.idx] = 0;
3524
3525                 /* we allow only one expression at a time */
3526                 ret = ftrace_set_func(ftrace_graph_funcs, &ftrace_graph_count,
3527                                         parser.buffer);
3528                 if (ret)
3529                         goto out_free;
3530         }
3531
3532         ret = read;
3533
3534 out_free:
3535         trace_parser_put(&parser);
3536 out_unlock:
3537         mutex_unlock(&graph_lock);
3538
3539         return ret;
3540 }
3541
3542 static const struct file_operations ftrace_graph_fops = {
3543         .open           = ftrace_graph_open,
3544         .read           = seq_read,
3545         .write          = ftrace_graph_write,
3546         .release        = ftrace_graph_release,
3547         .llseek         = seq_lseek,
3548 };
3549 #endif /* CONFIG_FUNCTION_GRAPH_TRACER */
3550
3551 static __init int ftrace_init_dyn_debugfs(struct dentry *d_tracer)
3552 {
3553
3554         trace_create_file("available_filter_functions", 0444,
3555                         d_tracer, NULL, &ftrace_avail_fops);
3556
3557         trace_create_file("enabled_functions", 0444,
3558                         d_tracer, NULL, &ftrace_enabled_fops);
3559
3560         trace_create_file("set_ftrace_filter", 0644, d_tracer,
3561                         NULL, &ftrace_filter_fops);
3562
3563         trace_create_file("set_ftrace_notrace", 0644, d_tracer,
3564                                     NULL, &ftrace_notrace_fops);
3565
3566 #ifdef CONFIG_FUNCTION_GRAPH_TRACER
3567         trace_create_file("set_graph_function", 0444, d_tracer,
3568                                     NULL,
3569                                     &ftrace_graph_fops);
3570 #endif /* CONFIG_FUNCTION_GRAPH_TRACER */
3571
3572         return 0;
3573 }
3574
3575 static int ftrace_process_locs(struct module *mod,
3576                                unsigned long *start,
3577                                unsigned long *end)
3578 {
3579         struct ftrace_page *pg;
3580         unsigned long count;
3581         unsigned long *p;
3582         unsigned long addr;
3583         unsigned long flags = 0; /* Shut up gcc */
3584         int ret = -ENOMEM;
3585
3586         count = end - start;
3587
3588         if (!count)
3589                 return 0;
3590
3591         pg = ftrace_allocate_pages(count);
3592         if (!pg)
3593                 return -ENOMEM;
3594
3595         mutex_lock(&ftrace_lock);
3596
3597         /*
3598          * Core and each module needs their own pages, as
3599          * modules will free them when they are removed.
3600          * Force a new page to be allocated for modules.
3601          */
3602         if (!mod) {
3603                 WARN_ON(ftrace_pages || ftrace_pages_start);
3604                 /* First initialization */
3605                 ftrace_pages = ftrace_pages_start = pg;
3606         } else {
3607                 if (!ftrace_pages)
3608                         goto out;
3609
3610                 if (WARN_ON(ftrace_pages->next)) {
3611                         /* Hmm, we have free pages? */
3612                         while (ftrace_pages->next)
3613                                 ftrace_pages = ftrace_pages->next;
3614                 }
3615
3616                 ftrace_pages->next = pg;
3617                 ftrace_pages = pg;
3618         }
3619
3620         p = start;
3621         while (p < end) {
3622                 addr = ftrace_call_adjust(*p++);
3623                 /*
3624                  * Some architecture linkers will pad between
3625                  * the different mcount_loc sections of different
3626                  * object files to satisfy alignments.
3627                  * Skip any NULL pointers.
3628                  */
3629                 if (!addr)
3630                         continue;
3631                 if (!ftrace_record_ip(addr))
3632                         break;
3633         }
3634
3635         /*
3636          * We only need to disable interrupts on start up
3637          * because we are modifying code that an interrupt
3638          * may execute, and the modification is not atomic.
3639          * But for modules, nothing runs the code we modify
3640          * until we are finished with it, and there's no
3641          * reason to cause large interrupt latencies while we do it.
3642          */
3643         if (!mod)
3644                 local_irq_save(flags);
3645         ftrace_update_code(mod);
3646         if (!mod)
3647                 local_irq_restore(flags);
3648         ret = 0;
3649  out:
3650         mutex_unlock(&ftrace_lock);
3651
3652         return ret;
3653 }
3654
3655 #ifdef CONFIG_MODULES
3656
3657 #define next_to_ftrace_page(p) container_of(p, struct ftrace_page, next)
3658
3659 void ftrace_release_mod(struct module *mod)
3660 {
3661         struct dyn_ftrace *rec;
3662         struct ftrace_page **last_pg;
3663         struct ftrace_page *pg;
3664         int order;
3665
3666         mutex_lock(&ftrace_lock);
3667
3668         if (ftrace_disabled)
3669                 goto out_unlock;
3670
3671         /*
3672          * Each module has its own ftrace_pages, remove
3673          * them from the list.
3674          */
3675         last_pg = &ftrace_pages_start;
3676         for (pg = ftrace_pages_start; pg; pg = *last_pg) {
3677                 rec = &pg->records[0];
3678                 if (within_module_core(rec->ip, mod)) {
3679                         /*
3680                          * As core pages are first, the first
3681                          * page should never be a module page.
3682                          */
3683                         if (WARN_ON(pg == ftrace_pages_start))
3684                                 goto out_unlock;
3685
3686                         /* Check if we are deleting the last page */
3687                         if (pg == ftrace_pages)
3688                                 ftrace_pages = next_to_ftrace_page(last_pg);
3689
3690                         *last_pg = pg->next;
3691                         order = get_count_order(pg->size / ENTRIES_PER_PAGE);
3692                         free_pages((unsigned long)pg->records, order);
3693                         kfree(pg);
3694                 } else
3695                         last_pg = &pg->next;
3696         }
3697  out_unlock:
3698         mutex_unlock(&ftrace_lock);
3699 }
3700
3701 static void ftrace_init_module(struct module *mod,
3702                                unsigned long *start, unsigned long *end)
3703 {
3704         if (ftrace_disabled || start == end)
3705                 return;
3706         ftrace_process_locs(mod, start, end);
3707 }
3708
3709 static int ftrace_module_notify(struct notifier_block *self,
3710                                 unsigned long val, void *data)
3711 {
3712         struct module *mod = data;
3713
3714         switch (val) {
3715         case MODULE_STATE_COMING:
3716                 ftrace_init_module(mod, mod->ftrace_callsites,
3717                                    mod->ftrace_callsites +
3718                                    mod->num_ftrace_callsites);
3719                 break;
3720         case MODULE_STATE_GOING:
3721                 ftrace_release_mod(mod);
3722                 break;
3723         }
3724
3725         return 0;
3726 }
3727 #else
3728 static int ftrace_module_notify(struct notifier_block *self,
3729                                 unsigned long val, void *data)
3730 {
3731         return 0;
3732 }
3733 #endif /* CONFIG_MODULES */
3734
3735 struct notifier_block ftrace_module_nb = {
3736         .notifier_call = ftrace_module_notify,
3737         .priority = 0,
3738 };
3739
3740 extern unsigned long __start_mcount_loc[];
3741 extern unsigned long __stop_mcount_loc[];
3742
3743 void __init ftrace_init(void)
3744 {
3745         unsigned long count, addr, flags;
3746         int ret;
3747
3748         /* Keep the ftrace pointer to the stub */
3749         addr = (unsigned long)ftrace_stub;
3750
3751         local_irq_save(flags);
3752         ftrace_dyn_arch_init(&addr);
3753         local_irq_restore(flags);
3754
3755         /* ftrace_dyn_arch_init places the return code in addr */
3756         if (addr)
3757                 goto failed;
3758
3759         count = __stop_mcount_loc - __start_mcount_loc;
3760
3761         ret = ftrace_dyn_table_alloc(count);
3762         if (ret)
3763                 goto failed;
3764
3765         last_ftrace_enabled = ftrace_enabled = 1;
3766
3767         ret = ftrace_process_locs(NULL,
3768                                   __start_mcount_loc,
3769                                   __stop_mcount_loc);
3770
3771         ret = register_module_notifier(&ftrace_module_nb);
3772         if (ret)
3773                 pr_warning("Failed to register trace ftrace module notifier\n");
3774
3775         set_ftrace_early_filters();
3776
3777         return;
3778  failed:
3779         ftrace_disabled = 1;
3780 }
3781
3782 #else
3783
3784 static struct ftrace_ops global_ops = {
3785         .func                   = ftrace_stub,
3786 };
3787
3788 static int __init ftrace_nodyn_init(void)
3789 {
3790         ftrace_enabled = 1;
3791         return 0;
3792 }
3793 device_initcall(ftrace_nodyn_init);
3794
3795 static inline int ftrace_init_dyn_debugfs(struct dentry *d_tracer) { return 0; }
3796 static inline void ftrace_startup_enable(int command) { }
3797 /* Keep as macros so we do not need to define the commands */
3798 # define ftrace_startup(ops, command)                   \
3799         ({                                              \
3800                 (ops)->flags |= FTRACE_OPS_FL_ENABLED;  \
3801                 0;                                      \
3802         })
3803 # define ftrace_shutdown(ops, command)  do { } while (0)
3804 # define ftrace_startup_sysctl()        do { } while (0)
3805 # define ftrace_shutdown_sysctl()       do { } while (0)
3806
3807 static inline int
3808 ftrace_ops_test(struct ftrace_ops *ops, unsigned long ip)
3809 {
3810         return 1;
3811 }
3812
3813 #endif /* CONFIG_DYNAMIC_FTRACE */
3814
3815 static void
3816 ftrace_ops_list_func(unsigned long ip, unsigned long parent_ip)
3817 {
3818         struct ftrace_ops *op;
3819
3820         if (unlikely(trace_recursion_test(TRACE_INTERNAL_BIT)))
3821                 return;
3822
3823         trace_recursion_set(TRACE_INTERNAL_BIT);
3824         /*
3825          * Some of the ops may be dynamically allocated,
3826          * they must be freed after a synchronize_sched().
3827          */
3828         preempt_disable_notrace();
3829         op = rcu_dereference_raw(ftrace_ops_list);
3830         while (op != &ftrace_list_end) {
3831                 if (ftrace_ops_test(op, ip))
3832                         op->func(ip, parent_ip);
3833                 op = rcu_dereference_raw(op->next);
3834         };
3835         preempt_enable_notrace();
3836         trace_recursion_clear(TRACE_INTERNAL_BIT);
3837 }
3838
3839 static void clear_ftrace_swapper(void)
3840 {
3841         struct task_struct *p;
3842         int cpu;
3843
3844         get_online_cpus();
3845         for_each_online_cpu(cpu) {
3846                 p = idle_task(cpu);
3847                 clear_tsk_trace_trace(p);
3848         }
3849         put_online_cpus();
3850 }
3851
3852 static void set_ftrace_swapper(void)
3853 {
3854         struct task_struct *p;
3855         int cpu;
3856
3857         get_online_cpus();
3858         for_each_online_cpu(cpu) {
3859                 p = idle_task(cpu);
3860                 set_tsk_trace_trace(p);
3861         }
3862         put_online_cpus();
3863 }
3864
3865 static void clear_ftrace_pid(struct pid *pid)
3866 {
3867         struct task_struct *p;
3868
3869         rcu_read_lock();
3870         do_each_pid_task(pid, PIDTYPE_PID, p) {
3871                 clear_tsk_trace_trace(p);
3872         } while_each_pid_task(pid, PIDTYPE_PID, p);
3873         rcu_read_unlock();
3874
3875         put_pid(pid);
3876 }
3877
3878 static void set_ftrace_pid(struct pid *pid)
3879 {
3880         struct task_struct *p;
3881
3882         rcu_read_lock();
3883         do_each_pid_task(pid, PIDTYPE_PID, p) {
3884                 set_tsk_trace_trace(p);
3885         } while_each_pid_task(pid, PIDTYPE_PID, p);
3886         rcu_read_unlock();
3887 }
3888
3889 static void clear_ftrace_pid_task(struct pid *pid)
3890 {
3891         if (pid == ftrace_swapper_pid)
3892                 clear_ftrace_swapper();
3893         else
3894                 clear_ftrace_pid(pid);
3895 }
3896
3897 static void set_ftrace_pid_task(struct pid *pid)
3898 {
3899         if (pid == ftrace_swapper_pid)
3900                 set_ftrace_swapper();
3901         else
3902                 set_ftrace_pid(pid);
3903 }
3904
3905 static int ftrace_pid_add(int p)
3906 {
3907         struct pid *pid;
3908         struct ftrace_pid *fpid;
3909         int ret = -EINVAL;
3910
3911         mutex_lock(&ftrace_lock);
3912
3913         if (!p)
3914                 pid = ftrace_swapper_pid;
3915         else
3916                 pid = find_get_pid(p);
3917
3918         if (!pid)
3919                 goto out;
3920
3921         ret = 0;
3922
3923         list_for_each_entry(fpid, &ftrace_pids, list)
3924                 if (fpid->pid == pid)
3925                         goto out_put;
3926
3927         ret = -ENOMEM;
3928
3929         fpid = kmalloc(sizeof(*fpid), GFP_KERNEL);
3930         if (!fpid)
3931                 goto out_put;
3932
3933         list_add(&fpid->list, &ftrace_pids);
3934         fpid->pid = pid;
3935
3936         set_ftrace_pid_task(pid);
3937
3938         ftrace_update_pid_func();
3939         ftrace_startup_enable(0);
3940
3941         mutex_unlock(&ftrace_lock);
3942         return 0;
3943
3944 out_put:
3945         if (pid != ftrace_swapper_pid)
3946                 put_pid(pid);
3947
3948 out:
3949         mutex_unlock(&ftrace_lock);
3950         return ret;
3951 }
3952
3953 static void ftrace_pid_reset(void)
3954 {
3955         struct ftrace_pid *fpid, *safe;
3956
3957         mutex_lock(&ftrace_lock);
3958         list_for_each_entry_safe(fpid, safe, &ftrace_pids, list) {
3959                 struct pid *pid = fpid->pid;
3960
3961                 clear_ftrace_pid_task(pid);
3962
3963                 list_del(&fpid->list);
3964                 kfree(fpid);
3965         }
3966
3967         ftrace_update_pid_func();
3968         ftrace_startup_enable(0);
3969
3970         mutex_unlock(&ftrace_lock);
3971 }
3972
3973 static void *fpid_start(struct seq_file *m, loff_t *pos)
3974 {
3975         mutex_lock(&ftrace_lock);
3976
3977         if (list_empty(&ftrace_pids) && (!*pos))
3978                 return (void *) 1;
3979
3980         return seq_list_start(&ftrace_pids, *pos);
3981 }
3982
3983 static void *fpid_next(struct seq_file *m, void *v, loff_t *pos)
3984 {
3985         if (v == (void *)1)
3986                 return NULL;
3987
3988         return seq_list_next(v, &ftrace_pids, pos);
3989 }
3990
3991 static void fpid_stop(struct seq_file *m, void *p)
3992 {
3993         mutex_unlock(&ftrace_lock);
3994 }
3995
3996 static int fpid_show(struct seq_file *m, void *v)
3997 {
3998         const struct ftrace_pid *fpid = list_entry(v, struct ftrace_pid, list);
3999
4000         if (v == (void *)1) {
4001                 seq_printf(m, "no pid\n");
4002                 return 0;
4003         }
4004
4005         if (fpid->pid == ftrace_swapper_pid)
4006                 seq_printf(m, "swapper tasks\n");
4007         else
4008                 seq_printf(m, "%u\n", pid_vnr(fpid->pid));
4009
4010         return 0;
4011 }
4012
4013 static const struct seq_operations ftrace_pid_sops = {
4014         .start = fpid_start,
4015         .next = fpid_next,
4016         .stop = fpid_stop,
4017         .show = fpid_show,
4018 };
4019
4020 static int
4021 ftrace_pid_open(struct inode *inode, struct file *file)
4022 {
4023         int ret = 0;
4024
4025         if ((file->f_mode & FMODE_WRITE) &&
4026             (file->f_flags & O_TRUNC))
4027                 ftrace_pid_reset();
4028
4029         if (file->f_mode & FMODE_READ)
4030                 ret = seq_open(file, &ftrace_pid_sops);
4031
4032         return ret;
4033 }
4034
4035 static ssize_t
4036 ftrace_pid_write(struct file *filp, const char __user *ubuf,
4037                    size_t cnt, loff_t *ppos)
4038 {
4039         char buf[64], *tmp;
4040         long val;
4041         int ret;
4042
4043         if (cnt >= sizeof(buf))
4044                 return -EINVAL;
4045
4046         if (copy_from_user(&buf, ubuf, cnt))
4047                 return -EFAULT;
4048
4049         buf[cnt] = 0;
4050
4051         /*
4052          * Allow "echo > set_ftrace_pid" or "echo -n '' > set_ftrace_pid"
4053          * to clean the filter quietly.
4054          */
4055         tmp = strstrip(buf);
4056         if (strlen(tmp) == 0)
4057                 return 1;
4058
4059         ret = strict_strtol(tmp, 10, &val);
4060         if (ret < 0)
4061                 return ret;
4062
4063         ret = ftrace_pid_add(val);
4064
4065         return ret ? ret : cnt;
4066 }
4067
4068 static int
4069 ftrace_pid_release(struct inode *inode, struct file *file)
4070 {
4071         if (file->f_mode & FMODE_READ)
4072                 seq_release(inode, file);
4073
4074         return 0;
4075 }
4076
4077 static const struct file_operations ftrace_pid_fops = {
4078         .open           = ftrace_pid_open,
4079         .write          = ftrace_pid_write,
4080         .read           = seq_read,
4081         .llseek         = seq_lseek,
4082         .release        = ftrace_pid_release,
4083 };
4084
4085 static __init int ftrace_init_debugfs(void)
4086 {
4087         struct dentry *d_tracer;
4088
4089         d_tracer = tracing_init_dentry();
4090         if (!d_tracer)
4091                 return 0;
4092
4093         ftrace_init_dyn_debugfs(d_tracer);
4094
4095         trace_create_file("set_ftrace_pid", 0644, d_tracer,
4096                             NULL, &ftrace_pid_fops);
4097
4098         ftrace_profile_debugfs(d_tracer);
4099
4100         return 0;
4101 }
4102 fs_initcall(ftrace_init_debugfs);
4103
4104 /**
4105  * ftrace_kill - kill ftrace
4106  *
4107  * This function should be used by panic code. It stops ftrace
4108  * but in a not so nice way. If you need to simply kill ftrace
4109  * from a non-atomic section, use ftrace_kill.
4110  */
4111 void ftrace_kill(void)
4112 {
4113         ftrace_disabled = 1;
4114         ftrace_enabled = 0;
4115         clear_ftrace_function();
4116 }
4117
4118 /**
4119  * Test if ftrace is dead or not.
4120  */
4121 int ftrace_is_dead(void)
4122 {
4123         return ftrace_disabled;
4124 }
4125
4126 /**
4127  * register_ftrace_function - register a function for profiling
4128  * @ops - ops structure that holds the function for profiling.
4129  *
4130  * Register a function to be called by all functions in the
4131  * kernel.
4132  *
4133  * Note: @ops->func and all the functions it calls must be labeled
4134  *       with "notrace", otherwise it will go into a
4135  *       recursive loop.
4136  */
4137 int register_ftrace_function(struct ftrace_ops *ops)
4138 {
4139         int ret = -1;
4140
4141         mutex_lock(&ftrace_lock);
4142
4143         if (unlikely(ftrace_disabled))
4144                 goto out_unlock;
4145
4146         ret = __register_ftrace_function(ops);
4147         if (!ret)
4148                 ret = ftrace_startup(ops, 0);
4149
4150
4151  out_unlock:
4152         mutex_unlock(&ftrace_lock);
4153         return ret;
4154 }
4155 EXPORT_SYMBOL_GPL(register_ftrace_function);
4156
4157 /**
4158  * unregister_ftrace_function - unregister a function for profiling.
4159  * @ops - ops structure that holds the function to unregister
4160  *
4161  * Unregister a function that was added to be called by ftrace profiling.
4162  */
4163 int unregister_ftrace_function(struct ftrace_ops *ops)
4164 {
4165         int ret;
4166
4167         mutex_lock(&ftrace_lock);
4168         ret = __unregister_ftrace_function(ops);
4169         if (!ret)
4170                 ftrace_shutdown(ops, 0);
4171         mutex_unlock(&ftrace_lock);
4172
4173         return ret;
4174 }
4175 EXPORT_SYMBOL_GPL(unregister_ftrace_function);
4176
4177 int
4178 ftrace_enable_sysctl(struct ctl_table *table, int write,
4179                      void __user *buffer, size_t *lenp,
4180                      loff_t *ppos)
4181 {
4182         int ret = -ENODEV;
4183
4184         mutex_lock(&ftrace_lock);
4185
4186         if (unlikely(ftrace_disabled))
4187                 goto out;
4188
4189         ret = proc_dointvec(table, write, buffer, lenp, ppos);
4190
4191         if (ret || !write || (last_ftrace_enabled == !!ftrace_enabled))
4192                 goto out;
4193
4194         last_ftrace_enabled = !!ftrace_enabled;
4195
4196         if (ftrace_enabled) {
4197
4198                 ftrace_startup_sysctl();
4199
4200                 /* we are starting ftrace again */
4201                 if (ftrace_ops_list != &ftrace_list_end) {
4202                         if (ftrace_ops_list->next == &ftrace_list_end)
4203                                 ftrace_trace_function = ftrace_ops_list->func;
4204                         else
4205                                 ftrace_trace_function = ftrace_ops_list_func;
4206                 }
4207
4208         } else {
4209                 /* stopping ftrace calls (just send to ftrace_stub) */
4210                 ftrace_trace_function = ftrace_stub;
4211
4212                 ftrace_shutdown_sysctl();
4213         }
4214
4215  out:
4216         mutex_unlock(&ftrace_lock);
4217         return ret;
4218 }
4219
4220 #ifdef CONFIG_FUNCTION_GRAPH_TRACER
4221
4222 static int ftrace_graph_active;
4223 static struct notifier_block ftrace_suspend_notifier;
4224
4225 int ftrace_graph_entry_stub(struct ftrace_graph_ent *trace)
4226 {
4227         return 0;
4228 }
4229
4230 /* The callbacks that hook a function */
4231 trace_func_graph_ret_t ftrace_graph_return =
4232                         (trace_func_graph_ret_t)ftrace_stub;
4233 trace_func_graph_ent_t ftrace_graph_entry = ftrace_graph_entry_stub;
4234
4235 /* Try to assign a return stack array on FTRACE_RETSTACK_ALLOC_SIZE tasks. */
4236 static int alloc_retstack_tasklist(struct ftrace_ret_stack **ret_stack_list)
4237 {
4238         int i;
4239         int ret = 0;
4240         unsigned long flags;
4241         int start = 0, end = FTRACE_RETSTACK_ALLOC_SIZE;
4242         struct task_struct *g, *t;
4243
4244         for (i = 0; i < FTRACE_RETSTACK_ALLOC_SIZE; i++) {
4245                 ret_stack_list[i] = kmalloc(FTRACE_RETFUNC_DEPTH
4246                                         * sizeof(struct ftrace_ret_stack),
4247                                         GFP_KERNEL);
4248                 if (!ret_stack_list[i]) {
4249                         start = 0;
4250                         end = i;
4251                         ret = -ENOMEM;
4252                         goto free;
4253                 }
4254         }
4255
4256         read_lock_irqsave(&tasklist_lock, flags);
4257         do_each_thread(g, t) {
4258                 if (start == end) {
4259                         ret = -EAGAIN;
4260                         goto unlock;
4261                 }
4262
4263                 if (t->ret_stack == NULL) {
4264                         atomic_set(&t->tracing_graph_pause, 0);
4265                         atomic_set(&t->trace_overrun, 0);
4266                         t->curr_ret_stack = -1;
4267                         /* Make sure the tasks see the -1 first: */
4268                         smp_wmb();
4269                         t->ret_stack = ret_stack_list[start++];
4270                 }
4271         } while_each_thread(g, t);
4272
4273 unlock:
4274         read_unlock_irqrestore(&tasklist_lock, flags);
4275 free:
4276         for (i = start; i < end; i++)
4277                 kfree(ret_stack_list[i]);
4278         return ret;
4279 }
4280
4281 static void
4282 ftrace_graph_probe_sched_switch(void *ignore,
4283                         struct task_struct *prev, struct task_struct *next)
4284 {
4285         unsigned long long timestamp;
4286         int index;
4287
4288         /*
4289          * Does the user want to count the time a function was asleep.
4290          * If so, do not update the time stamps.
4291          */
4292         if (trace_flags & TRACE_ITER_SLEEP_TIME)
4293                 return;
4294
4295         timestamp = trace_clock_local();
4296
4297         prev->ftrace_timestamp = timestamp;
4298
4299         /* only process tasks that we timestamped */
4300         if (!next->ftrace_timestamp)
4301                 return;
4302
4303         /*
4304          * Update all the counters in next to make up for the
4305          * time next was sleeping.
4306          */
4307         timestamp -= next->ftrace_timestamp;
4308
4309         for (index = next->curr_ret_stack; index >= 0; index--)
4310                 next->ret_stack[index].calltime += timestamp;
4311 }
4312
4313 /* Allocate a return stack for each task */
4314 static int start_graph_tracing(void)
4315 {
4316         struct ftrace_ret_stack **ret_stack_list;
4317         int ret, cpu;
4318
4319         ret_stack_list = kmalloc(FTRACE_RETSTACK_ALLOC_SIZE *
4320                                 sizeof(struct ftrace_ret_stack *),
4321                                 GFP_KERNEL);
4322
4323         if (!ret_stack_list)
4324                 return -ENOMEM;
4325
4326         /* The cpu_boot init_task->ret_stack will never be freed */
4327         for_each_online_cpu(cpu) {
4328                 if (!idle_task(cpu)->ret_stack)
4329                         ftrace_graph_init_idle_task(idle_task(cpu), cpu);
4330         }
4331
4332         do {
4333                 ret = alloc_retstack_tasklist(ret_stack_list);
4334         } while (ret == -EAGAIN);
4335
4336         if (!ret) {
4337                 ret = register_trace_sched_switch(ftrace_graph_probe_sched_switch, NULL);
4338                 if (ret)
4339                         pr_info("ftrace_graph: Couldn't activate tracepoint"
4340                                 " probe to kernel_sched_switch\n");
4341         }
4342
4343         kfree(ret_stack_list);
4344         return ret;
4345 }
4346
4347 /*
4348  * Hibernation protection.
4349  * The state of the current task is too much unstable during
4350  * suspend/restore to disk. We want to protect against that.
4351  */
4352 static int
4353 ftrace_suspend_notifier_call(struct notifier_block *bl, unsigned long state,
4354                                                         void *unused)
4355 {
4356         switch (state) {
4357         case PM_HIBERNATION_PREPARE:
4358                 pause_graph_tracing();
4359                 break;
4360
4361         case PM_POST_HIBERNATION:
4362                 unpause_graph_tracing();
4363                 break;
4364         }
4365         return NOTIFY_DONE;
4366 }
4367
4368 int register_ftrace_graph(trace_func_graph_ret_t retfunc,
4369                         trace_func_graph_ent_t entryfunc)
4370 {
4371         int ret = 0;
4372
4373         mutex_lock(&ftrace_lock);
4374
4375         /* we currently allow only one tracer registered at a time */
4376         if (ftrace_graph_active) {
4377                 ret = -EBUSY;
4378                 goto out;
4379         }
4380
4381         ftrace_suspend_notifier.notifier_call = ftrace_suspend_notifier_call;
4382         register_pm_notifier(&ftrace_suspend_notifier);
4383
4384         ftrace_graph_active++;
4385         ret = start_graph_tracing();
4386         if (ret) {
4387                 ftrace_graph_active--;
4388                 goto out;
4389         }
4390
4391         ftrace_graph_return = retfunc;
4392         ftrace_graph_entry = entryfunc;
4393
4394         ret = ftrace_startup(&global_ops, FTRACE_START_FUNC_RET);
4395
4396 out:
4397         mutex_unlock(&ftrace_lock);
4398         return ret;
4399 }
4400
4401 void unregister_ftrace_graph(void)
4402 {
4403         mutex_lock(&ftrace_lock);
4404
4405         if (unlikely(!ftrace_graph_active))
4406                 goto out;
4407
4408         ftrace_graph_active--;
4409         ftrace_graph_return = (trace_func_graph_ret_t)ftrace_stub;
4410         ftrace_graph_entry = ftrace_graph_entry_stub;
4411         ftrace_shutdown(&global_ops, FTRACE_STOP_FUNC_RET);
4412         unregister_pm_notifier(&ftrace_suspend_notifier);
4413         unregister_trace_sched_switch(ftrace_graph_probe_sched_switch, NULL);
4414
4415  out:
4416         mutex_unlock(&ftrace_lock);
4417 }
4418
4419 static DEFINE_PER_CPU(struct ftrace_ret_stack *, idle_ret_stack);
4420
4421 static void
4422 graph_init_task(struct task_struct *t, struct ftrace_ret_stack *ret_stack)
4423 {
4424         atomic_set(&t->tracing_graph_pause, 0);
4425         atomic_set(&t->trace_overrun, 0);
4426         t->ftrace_timestamp = 0;
4427         /* make curr_ret_stack visible before we add the ret_stack */
4428         smp_wmb();
4429         t->ret_stack = ret_stack;
4430 }
4431
4432 /*
4433  * Allocate a return stack for the idle task. May be the first
4434  * time through, or it may be done by CPU hotplug online.
4435  */
4436 void ftrace_graph_init_idle_task(struct task_struct *t, int cpu)
4437 {
4438         t->curr_ret_stack = -1;
4439         /*
4440          * The idle task has no parent, it either has its own
4441          * stack or no stack at all.
4442          */
4443         if (t->ret_stack)
4444                 WARN_ON(t->ret_stack != per_cpu(idle_ret_stack, cpu));
4445
4446         if (ftrace_graph_active) {
4447                 struct ftrace_ret_stack *ret_stack;
4448
4449                 ret_stack = per_cpu(idle_ret_stack, cpu);
4450                 if (!ret_stack) {
4451                         ret_stack = kmalloc(FTRACE_RETFUNC_DEPTH
4452                                             * sizeof(struct ftrace_ret_stack),
4453                                             GFP_KERNEL);
4454                         if (!ret_stack)
4455                                 return;
4456                         per_cpu(idle_ret_stack, cpu) = ret_stack;
4457                 }
4458                 graph_init_task(t, ret_stack);
4459         }
4460 }
4461
4462 /* Allocate a return stack for newly created task */
4463 void ftrace_graph_init_task(struct task_struct *t)
4464 {
4465         /* Make sure we do not use the parent ret_stack */
4466         t->ret_stack = NULL;
4467         t->curr_ret_stack = -1;
4468
4469         if (ftrace_graph_active) {
4470                 struct ftrace_ret_stack *ret_stack;
4471
4472                 ret_stack = kmalloc(FTRACE_RETFUNC_DEPTH
4473                                 * sizeof(struct ftrace_ret_stack),
4474                                 GFP_KERNEL);
4475                 if (!ret_stack)
4476                         return;
4477                 graph_init_task(t, ret_stack);
4478         }
4479 }
4480
4481 void ftrace_graph_exit_task(struct task_struct *t)
4482 {
4483         struct ftrace_ret_stack *ret_stack = t->ret_stack;
4484
4485         t->ret_stack = NULL;
4486         /* NULL must become visible to IRQs before we free it: */
4487         barrier();
4488
4489         kfree(ret_stack);
4490 }
4491
4492 void ftrace_graph_stop(void)
4493 {
4494         ftrace_stop();
4495 }
4496 #endif