powerpc/mm: Add support for handling > 512TB address in SLB miss
[linux-2.6-block.git] / arch / powerpc / include / asm / processor.h
1 #ifndef _ASM_POWERPC_PROCESSOR_H
2 #define _ASM_POWERPC_PROCESSOR_H
3
4 /*
5  * Copyright (C) 2001 PPC 64 Team, IBM Corp
6  *
7  * This program is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU General Public License
9  * as published by the Free Software Foundation; either version
10  * 2 of the License, or (at your option) any later version.
11  */
12
13 #include <asm/reg.h>
14
15 #ifdef CONFIG_VSX
16 #define TS_FPRWIDTH 2
17
18 #ifdef __BIG_ENDIAN__
19 #define TS_FPROFFSET 0
20 #define TS_VSRLOWOFFSET 1
21 #else
22 #define TS_FPROFFSET 1
23 #define TS_VSRLOWOFFSET 0
24 #endif
25
26 #else
27 #define TS_FPRWIDTH 1
28 #define TS_FPROFFSET 0
29 #endif
30
31 #ifdef CONFIG_PPC64
32 /* Default SMT priority is set to 3. Use 11- 13bits to save priority. */
33 #define PPR_PRIORITY 3
34 #ifdef __ASSEMBLY__
35 #define INIT_PPR (PPR_PRIORITY << 50)
36 #else
37 #define INIT_PPR ((u64)PPR_PRIORITY << 50)
38 #endif /* __ASSEMBLY__ */
39 #endif /* CONFIG_PPC64 */
40
41 #ifndef __ASSEMBLY__
42 #include <linux/compiler.h>
43 #include <linux/cache.h>
44 #include <asm/ptrace.h>
45 #include <asm/types.h>
46 #include <asm/hw_breakpoint.h>
47
48 /* We do _not_ want to define new machine types at all, those must die
49  * in favor of using the device-tree
50  * -- BenH.
51  */
52
53 /* PREP sub-platform types. Unused */
54 #define _PREP_Motorola  0x01    /* motorola prep */
55 #define _PREP_Firm      0x02    /* firmworks prep */
56 #define _PREP_IBM       0x00    /* ibm prep */
57 #define _PREP_Bull      0x03    /* bull prep */
58
59 /* CHRP sub-platform types. These are arbitrary */
60 #define _CHRP_Motorola  0x04    /* motorola chrp, the cobra */
61 #define _CHRP_IBM       0x05    /* IBM chrp, the longtrail and longtrail 2 */
62 #define _CHRP_Pegasos   0x06    /* Genesi/bplan's Pegasos and Pegasos2 */
63 #define _CHRP_briq      0x07    /* TotalImpact's briQ */
64
65 #if defined(__KERNEL__) && defined(CONFIG_PPC32)
66
67 extern int _chrp_type;
68
69 #endif /* defined(__KERNEL__) && defined(CONFIG_PPC32) */
70
71 /*
72  * Default implementation of macro that returns current
73  * instruction pointer ("program counter").
74  */
75 #define current_text_addr() ({ __label__ _l; _l: &&_l;})
76
77 /* Macros for adjusting thread priority (hardware multi-threading) */
78 #define HMT_very_low()   asm volatile("or 31,31,31   # very low priority")
79 #define HMT_low()        asm volatile("or 1,1,1      # low priority")
80 #define HMT_medium_low() asm volatile("or 6,6,6      # medium low priority")
81 #define HMT_medium()     asm volatile("or 2,2,2      # medium priority")
82 #define HMT_medium_high() asm volatile("or 5,5,5      # medium high priority")
83 #define HMT_high()       asm volatile("or 3,3,3      # high priority")
84
85 #ifdef __KERNEL__
86
87 struct task_struct;
88 void start_thread(struct pt_regs *regs, unsigned long fdptr, unsigned long sp);
89 void release_thread(struct task_struct *);
90
91 #ifdef CONFIG_PPC32
92
93 #if CONFIG_TASK_SIZE > CONFIG_KERNEL_START
94 #error User TASK_SIZE overlaps with KERNEL_START address
95 #endif
96 #define TASK_SIZE       (CONFIG_TASK_SIZE)
97
98 /* This decides where the kernel will search for a free chunk of vm
99  * space during mmap's.
100  */
101 #define TASK_UNMAPPED_BASE      (TASK_SIZE / 8 * 3)
102 #endif
103
104 #ifdef CONFIG_PPC64
105 /*
106  * 64-bit user address space can have multiple limits
107  * For now supported values are:
108  */
109 #define TASK_SIZE_64TB  (0x0000400000000000UL)
110 #define TASK_SIZE_128TB (0x0000800000000000UL)
111 #define TASK_SIZE_512TB (0x0002000000000000UL)
112
113 /*
114  * For now 512TB is only supported with book3s and 64K linux page size.
115  */
116 #if defined(CONFIG_PPC_BOOK3S_64) && defined(CONFIG_PPC_64K_PAGES)
117 /*
118  * Max value currently used:
119  */
120 #define TASK_SIZE_USER64                TASK_SIZE_512TB
121 #define DEFAULT_MAP_WINDOW_USER64       TASK_SIZE_128TB
122 #define TASK_CONTEXT_SIZE               TASK_SIZE_512TB
123 #else
124 #define TASK_SIZE_USER64                TASK_SIZE_64TB
125 #define DEFAULT_MAP_WINDOW_USER64       TASK_SIZE_64TB
126 /*
127  * We don't need to allocate extended context ids for 4K page size, because
128  * we limit the max effective address on this config to 64TB.
129  */
130 #define TASK_CONTEXT_SIZE               TASK_SIZE_64TB
131 #endif
132
133 /*
134  * 32-bit user address space is 4GB - 1 page
135  * (this 1 page is needed so referencing of 0xFFFFFFFF generates EFAULT
136  */
137 #define TASK_SIZE_USER32 (0x0000000100000000UL - (1*PAGE_SIZE))
138
139 #define TASK_SIZE_OF(tsk) (test_tsk_thread_flag(tsk, TIF_32BIT) ? \
140                 TASK_SIZE_USER32 : TASK_SIZE_USER64)
141 #define TASK_SIZE         TASK_SIZE_OF(current)
142 /* This decides where the kernel will search for a free chunk of vm
143  * space during mmap's.
144  */
145 #define TASK_UNMAPPED_BASE_USER32 (PAGE_ALIGN(TASK_SIZE_USER32 / 4))
146 #define TASK_UNMAPPED_BASE_USER64 (PAGE_ALIGN(DEFAULT_MAP_WINDOW_USER64 / 4))
147
148 #define TASK_UNMAPPED_BASE ((is_32bit_task()) ? \
149                 TASK_UNMAPPED_BASE_USER32 : TASK_UNMAPPED_BASE_USER64 )
150 #endif
151
152 /*
153  * Initial task size value for user applications. For book3s 64 we start
154  * with 128TB and conditionally enable upto 512TB
155  */
156 #ifdef CONFIG_PPC_BOOK3S_64
157 #define DEFAULT_MAP_WINDOW      ((is_32bit_task()) ?                    \
158                                  TASK_SIZE_USER32 : DEFAULT_MAP_WINDOW_USER64)
159 #else
160 #define DEFAULT_MAP_WINDOW      TASK_SIZE
161 #endif
162
163 #ifdef __powerpc64__
164
165 #define STACK_TOP_USER64 DEFAULT_MAP_WINDOW_USER64
166 #define STACK_TOP_USER32 TASK_SIZE_USER32
167
168 #define STACK_TOP (is_32bit_task() ? \
169                    STACK_TOP_USER32 : STACK_TOP_USER64)
170
171 #define STACK_TOP_MAX TASK_SIZE_USER64
172
173 #else /* __powerpc64__ */
174
175 #define STACK_TOP TASK_SIZE
176 #define STACK_TOP_MAX   STACK_TOP
177
178 #endif /* __powerpc64__ */
179
180 typedef struct {
181         unsigned long seg;
182 } mm_segment_t;
183
184 #define TS_FPR(i) fp_state.fpr[i][TS_FPROFFSET]
185 #define TS_CKFPR(i) ckfp_state.fpr[i][TS_FPROFFSET]
186
187 /* FP and VSX 0-31 register set */
188 struct thread_fp_state {
189         u64     fpr[32][TS_FPRWIDTH] __attribute__((aligned(16)));
190         u64     fpscr;          /* Floating point status */
191 };
192
193 /* Complete AltiVec register set including VSCR */
194 struct thread_vr_state {
195         vector128       vr[32] __attribute__((aligned(16)));
196         vector128       vscr __attribute__((aligned(16)));
197 };
198
199 struct debug_reg {
200 #ifdef CONFIG_PPC_ADV_DEBUG_REGS
201         /*
202          * The following help to manage the use of Debug Control Registers
203          * om the BookE platforms.
204          */
205         uint32_t        dbcr0;
206         uint32_t        dbcr1;
207 #ifdef CONFIG_BOOKE
208         uint32_t        dbcr2;
209 #endif
210         /*
211          * The stored value of the DBSR register will be the value at the
212          * last debug interrupt. This register can only be read from the
213          * user (will never be written to) and has value while helping to
214          * describe the reason for the last debug trap.  Torez
215          */
216         uint32_t        dbsr;
217         /*
218          * The following will contain addresses used by debug applications
219          * to help trace and trap on particular address locations.
220          * The bits in the Debug Control Registers above help define which
221          * of the following registers will contain valid data and/or addresses.
222          */
223         unsigned long   iac1;
224         unsigned long   iac2;
225 #if CONFIG_PPC_ADV_DEBUG_IACS > 2
226         unsigned long   iac3;
227         unsigned long   iac4;
228 #endif
229         unsigned long   dac1;
230         unsigned long   dac2;
231 #if CONFIG_PPC_ADV_DEBUG_DVCS > 0
232         unsigned long   dvc1;
233         unsigned long   dvc2;
234 #endif
235 #endif
236 };
237
238 struct thread_struct {
239         unsigned long   ksp;            /* Kernel stack pointer */
240
241 #ifdef CONFIG_PPC64
242         unsigned long   ksp_vsid;
243 #endif
244         struct pt_regs  *regs;          /* Pointer to saved register state */
245         mm_segment_t    fs;             /* for get_fs() validation */
246 #ifdef CONFIG_BOOKE
247         /* BookE base exception scratch space; align on cacheline */
248         unsigned long   normsave[8] ____cacheline_aligned;
249 #endif
250 #ifdef CONFIG_PPC32
251         void            *pgdir;         /* root of page-table tree */
252         unsigned long   ksp_limit;      /* if ksp <= ksp_limit stack overflow */
253 #endif
254         /* Debug Registers */
255         struct debug_reg debug;
256         struct thread_fp_state  fp_state;
257         struct thread_fp_state  *fp_save_area;
258         int             fpexc_mode;     /* floating-point exception mode */
259         unsigned int    align_ctl;      /* alignment handling control */
260 #ifdef CONFIG_PPC64
261         unsigned long   start_tb;       /* Start purr when proc switched in */
262         unsigned long   accum_tb;       /* Total accumulated purr for process */
263 #endif
264 #ifdef CONFIG_HAVE_HW_BREAKPOINT
265         struct perf_event *ptrace_bps[HBP_NUM];
266         /*
267          * Helps identify source of single-step exception and subsequent
268          * hw-breakpoint enablement
269          */
270         struct perf_event *last_hit_ubp;
271 #endif /* CONFIG_HAVE_HW_BREAKPOINT */
272         struct arch_hw_breakpoint hw_brk; /* info on the hardware breakpoint */
273         unsigned long   trap_nr;        /* last trap # on this thread */
274         u8 load_fp;
275 #ifdef CONFIG_ALTIVEC
276         u8 load_vec;
277         struct thread_vr_state vr_state;
278         struct thread_vr_state *vr_save_area;
279         unsigned long   vrsave;
280         int             used_vr;        /* set if process has used altivec */
281 #endif /* CONFIG_ALTIVEC */
282 #ifdef CONFIG_VSX
283         /* VSR status */
284         int             used_vsr;       /* set if process has used VSX */
285 #endif /* CONFIG_VSX */
286 #ifdef CONFIG_SPE
287         unsigned long   evr[32];        /* upper 32-bits of SPE regs */
288         u64             acc;            /* Accumulator */
289         unsigned long   spefscr;        /* SPE & eFP status */
290         unsigned long   spefscr_last;   /* SPEFSCR value on last prctl
291                                            call or trap return */
292         int             used_spe;       /* set if process has used spe */
293 #endif /* CONFIG_SPE */
294 #ifdef CONFIG_PPC_TRANSACTIONAL_MEM
295         u8      load_tm;
296         u64             tm_tfhar;       /* Transaction fail handler addr */
297         u64             tm_texasr;      /* Transaction exception & summary */
298         u64             tm_tfiar;       /* Transaction fail instr address reg */
299         struct pt_regs  ckpt_regs;      /* Checkpointed registers */
300
301         unsigned long   tm_tar;
302         unsigned long   tm_ppr;
303         unsigned long   tm_dscr;
304
305         /*
306          * Checkpointed FP and VSX 0-31 register set.
307          *
308          * When a transaction is active/signalled/scheduled etc., *regs is the
309          * most recent set of/speculated GPRs with ckpt_regs being the older
310          * checkpointed regs to which we roll back if transaction aborts.
311          *
312          * These are analogous to how ckpt_regs and pt_regs work
313          */
314         struct thread_fp_state ckfp_state; /* Checkpointed FP state */
315         struct thread_vr_state ckvr_state; /* Checkpointed VR state */
316         unsigned long   ckvrsave; /* Checkpointed VRSAVE */
317 #endif /* CONFIG_PPC_TRANSACTIONAL_MEM */
318 #ifdef CONFIG_PPC_MEM_KEYS
319         unsigned long   amr;
320         unsigned long   iamr;
321         unsigned long   uamor;
322 #endif
323 #ifdef CONFIG_KVM_BOOK3S_32_HANDLER
324         void*           kvm_shadow_vcpu; /* KVM internal data */
325 #endif /* CONFIG_KVM_BOOK3S_32_HANDLER */
326 #if defined(CONFIG_KVM) && defined(CONFIG_BOOKE)
327         struct kvm_vcpu *kvm_vcpu;
328 #endif
329 #ifdef CONFIG_PPC64
330         unsigned long   dscr;
331         unsigned long   fscr;
332         /*
333          * This member element dscr_inherit indicates that the process
334          * has explicitly attempted and changed the DSCR register value
335          * for itself. Hence kernel wont use the default CPU DSCR value
336          * contained in the PACA structure anymore during process context
337          * switch. Once this variable is set, this behaviour will also be
338          * inherited to all the children of this process from that point
339          * onwards.
340          */
341         int             dscr_inherit;
342         unsigned long   ppr;    /* used to save/restore SMT priority */
343         unsigned long   tidr;
344 #endif
345 #ifdef CONFIG_PPC_BOOK3S_64
346         unsigned long   tar;
347         unsigned long   ebbrr;
348         unsigned long   ebbhr;
349         unsigned long   bescr;
350         unsigned long   siar;
351         unsigned long   sdar;
352         unsigned long   sier;
353         unsigned long   mmcr2;
354         unsigned        mmcr0;
355
356         unsigned        used_ebb;
357         unsigned int    used_vas;
358 #endif
359 };
360
361 #define ARCH_MIN_TASKALIGN 16
362
363 #define INIT_SP         (sizeof(init_stack) + (unsigned long) &init_stack)
364 #define INIT_SP_LIMIT \
365         (_ALIGN_UP(sizeof(init_thread_info), 16) + (unsigned long) &init_stack)
366
367 #ifdef CONFIG_SPE
368 #define SPEFSCR_INIT \
369         .spefscr = SPEFSCR_FINVE | SPEFSCR_FDBZE | SPEFSCR_FUNFE | SPEFSCR_FOVFE, \
370         .spefscr_last = SPEFSCR_FINVE | SPEFSCR_FDBZE | SPEFSCR_FUNFE | SPEFSCR_FOVFE,
371 #else
372 #define SPEFSCR_INIT
373 #endif
374
375 #ifdef CONFIG_PPC32
376 #define INIT_THREAD { \
377         .ksp = INIT_SP, \
378         .ksp_limit = INIT_SP_LIMIT, \
379         .fs = KERNEL_DS, \
380         .pgdir = swapper_pg_dir, \
381         .fpexc_mode = MSR_FE0 | MSR_FE1, \
382         SPEFSCR_INIT \
383 }
384 #else
385 #define INIT_THREAD  { \
386         .ksp = INIT_SP, \
387         .regs = (struct pt_regs *)INIT_SP - 1, /* XXX bogus, I think */ \
388         .fs = KERNEL_DS, \
389         .fpexc_mode = 0, \
390         .ppr = INIT_PPR, \
391         .fscr = FSCR_TAR | FSCR_EBB \
392 }
393 #endif
394
395 #define task_pt_regs(tsk)       ((struct pt_regs *)(tsk)->thread.regs)
396
397 unsigned long get_wchan(struct task_struct *p);
398
399 #define KSTK_EIP(tsk)  ((tsk)->thread.regs? (tsk)->thread.regs->nip: 0)
400 #define KSTK_ESP(tsk)  ((tsk)->thread.regs? (tsk)->thread.regs->gpr[1]: 0)
401
402 /* Get/set floating-point exception mode */
403 #define GET_FPEXC_CTL(tsk, adr) get_fpexc_mode((tsk), (adr))
404 #define SET_FPEXC_CTL(tsk, val) set_fpexc_mode((tsk), (val))
405
406 extern int get_fpexc_mode(struct task_struct *tsk, unsigned long adr);
407 extern int set_fpexc_mode(struct task_struct *tsk, unsigned int val);
408
409 #define GET_ENDIAN(tsk, adr) get_endian((tsk), (adr))
410 #define SET_ENDIAN(tsk, val) set_endian((tsk), (val))
411
412 extern int get_endian(struct task_struct *tsk, unsigned long adr);
413 extern int set_endian(struct task_struct *tsk, unsigned int val);
414
415 #define GET_UNALIGN_CTL(tsk, adr)       get_unalign_ctl((tsk), (adr))
416 #define SET_UNALIGN_CTL(tsk, val)       set_unalign_ctl((tsk), (val))
417
418 extern int get_unalign_ctl(struct task_struct *tsk, unsigned long adr);
419 extern int set_unalign_ctl(struct task_struct *tsk, unsigned int val);
420
421 extern void load_fp_state(struct thread_fp_state *fp);
422 extern void store_fp_state(struct thread_fp_state *fp);
423 extern void load_vr_state(struct thread_vr_state *vr);
424 extern void store_vr_state(struct thread_vr_state *vr);
425
426 static inline unsigned int __unpack_fe01(unsigned long msr_bits)
427 {
428         return ((msr_bits & MSR_FE0) >> 10) | ((msr_bits & MSR_FE1) >> 8);
429 }
430
431 static inline unsigned long __pack_fe01(unsigned int fpmode)
432 {
433         return ((fpmode << 10) & MSR_FE0) | ((fpmode << 8) & MSR_FE1);
434 }
435
436 #ifdef CONFIG_PPC64
437 #define cpu_relax()     do { HMT_low(); HMT_medium(); barrier(); } while (0)
438
439 #define spin_begin()    HMT_low()
440
441 #define spin_cpu_relax()        barrier()
442
443 #define spin_cpu_yield()        spin_cpu_relax()
444
445 #define spin_end()      HMT_medium()
446
447 #define spin_until_cond(cond)                                   \
448 do {                                                            \
449         if (unlikely(!(cond))) {                                \
450                 spin_begin();                                   \
451                 do {                                            \
452                         spin_cpu_relax();                       \
453                 } while (!(cond));                              \
454                 spin_end();                                     \
455         }                                                       \
456 } while (0)
457
458 #else
459 #define cpu_relax()     barrier()
460 #endif
461
462 /* Check that a certain kernel stack pointer is valid in task_struct p */
463 int validate_sp(unsigned long sp, struct task_struct *p,
464                        unsigned long nbytes);
465
466 /*
467  * Prefetch macros.
468  */
469 #define ARCH_HAS_PREFETCH
470 #define ARCH_HAS_PREFETCHW
471 #define ARCH_HAS_SPINLOCK_PREFETCH
472
473 static inline void prefetch(const void *x)
474 {
475         if (unlikely(!x))
476                 return;
477
478         __asm__ __volatile__ ("dcbt 0,%0" : : "r" (x));
479 }
480
481 static inline void prefetchw(const void *x)
482 {
483         if (unlikely(!x))
484                 return;
485
486         __asm__ __volatile__ ("dcbtst 0,%0" : : "r" (x));
487 }
488
489 #define spin_lock_prefetch(x)   prefetchw(x)
490
491 #define HAVE_ARCH_PICK_MMAP_LAYOUT
492
493 #ifdef CONFIG_PPC64
494 static inline unsigned long get_clean_sp(unsigned long sp, int is_32)
495 {
496         if (is_32)
497                 return sp & 0x0ffffffffUL;
498         return sp;
499 }
500 #else
501 static inline unsigned long get_clean_sp(unsigned long sp, int is_32)
502 {
503         return sp;
504 }
505 #endif
506
507 extern unsigned long cpuidle_disable;
508 enum idle_boot_override {IDLE_NO_OVERRIDE = 0, IDLE_POWERSAVE_OFF};
509
510 extern int powersave_nap;       /* set if nap mode can be used in idle loop */
511 extern unsigned long power7_idle_insn(unsigned long type); /* PNV_THREAD_NAP/etc*/
512 extern void power7_idle_type(unsigned long type);
513 extern unsigned long power9_idle_stop(unsigned long psscr_val);
514 extern void power9_idle_type(unsigned long stop_psscr_val,
515                               unsigned long stop_psscr_mask);
516
517 extern void flush_instruction_cache(void);
518 extern void hard_reset_now(void);
519 extern void poweroff_now(void);
520 extern int fix_alignment(struct pt_regs *);
521 extern void cvt_fd(float *from, double *to);
522 extern void cvt_df(double *from, float *to);
523 extern void _nmask_and_or_msr(unsigned long nmask, unsigned long or_val);
524
525 #ifdef CONFIG_PPC64
526 /*
527  * We handle most unaligned accesses in hardware. On the other hand 
528  * unaligned DMA can be very expensive on some ppc64 IO chips (it does
529  * powers of 2 writes until it reaches sufficient alignment).
530  *
531  * Based on this we disable the IP header alignment in network drivers.
532  */
533 #define NET_IP_ALIGN    0
534 #endif
535
536 #endif /* __KERNEL__ */
537 #endif /* __ASSEMBLY__ */
538 #endif /* _ASM_POWERPC_PROCESSOR_H */