mm/hugetlb: add cache of descriptors to resv_map for region_add
[linux-2.6-block.git] / include / linux / hugetlb.h
1 #ifndef _LINUX_HUGETLB_H
2 #define _LINUX_HUGETLB_H
3
4 #include <linux/mm_types.h>
5 #include <linux/mmdebug.h>
6 #include <linux/fs.h>
7 #include <linux/hugetlb_inline.h>
8 #include <linux/cgroup.h>
9 #include <linux/list.h>
10 #include <linux/kref.h>
11
12 struct ctl_table;
13 struct user_struct;
14 struct mmu_gather;
15
16 #ifdef CONFIG_HUGETLB_PAGE
17
18 #include <linux/mempolicy.h>
19 #include <linux/shm.h>
20 #include <asm/tlbflush.h>
21
22 struct hugepage_subpool {
23         spinlock_t lock;
24         long count;
25         long max_hpages;        /* Maximum huge pages or -1 if no maximum. */
26         long used_hpages;       /* Used count against maximum, includes */
27                                 /* both alloced and reserved pages. */
28         struct hstate *hstate;
29         long min_hpages;        /* Minimum huge pages or -1 if no minimum. */
30         long rsv_hpages;        /* Pages reserved against global pool to */
31                                 /* sasitfy minimum size. */
32 };
33
34 struct resv_map {
35         struct kref refs;
36         spinlock_t lock;
37         struct list_head regions;
38         long adds_in_progress;
39         struct list_head region_cache;
40         long region_cache_count;
41 };
42 extern struct resv_map *resv_map_alloc(void);
43 void resv_map_release(struct kref *ref);
44
45 extern spinlock_t hugetlb_lock;
46 extern int hugetlb_max_hstate __read_mostly;
47 #define for_each_hstate(h) \
48         for ((h) = hstates; (h) < &hstates[hugetlb_max_hstate]; (h)++)
49
50 struct hugepage_subpool *hugepage_new_subpool(struct hstate *h, long max_hpages,
51                                                 long min_hpages);
52 void hugepage_put_subpool(struct hugepage_subpool *spool);
53
54 void reset_vma_resv_huge_pages(struct vm_area_struct *vma);
55 int hugetlb_sysctl_handler(struct ctl_table *, int, void __user *, size_t *, loff_t *);
56 int hugetlb_overcommit_handler(struct ctl_table *, int, void __user *, size_t *, loff_t *);
57 int hugetlb_treat_movable_handler(struct ctl_table *, int, void __user *, size_t *, loff_t *);
58
59 #ifdef CONFIG_NUMA
60 int hugetlb_mempolicy_sysctl_handler(struct ctl_table *, int,
61                                         void __user *, size_t *, loff_t *);
62 #endif
63
64 int copy_hugetlb_page_range(struct mm_struct *, struct mm_struct *, struct vm_area_struct *);
65 long follow_hugetlb_page(struct mm_struct *, struct vm_area_struct *,
66                          struct page **, struct vm_area_struct **,
67                          unsigned long *, unsigned long *, long, unsigned int);
68 void unmap_hugepage_range(struct vm_area_struct *,
69                           unsigned long, unsigned long, struct page *);
70 void __unmap_hugepage_range_final(struct mmu_gather *tlb,
71                           struct vm_area_struct *vma,
72                           unsigned long start, unsigned long end,
73                           struct page *ref_page);
74 void __unmap_hugepage_range(struct mmu_gather *tlb, struct vm_area_struct *vma,
75                                 unsigned long start, unsigned long end,
76                                 struct page *ref_page);
77 void hugetlb_report_meminfo(struct seq_file *);
78 int hugetlb_report_node_meminfo(int, char *);
79 void hugetlb_show_meminfo(void);
80 unsigned long hugetlb_total_pages(void);
81 int hugetlb_fault(struct mm_struct *mm, struct vm_area_struct *vma,
82                         unsigned long address, unsigned int flags);
83 int hugetlb_reserve_pages(struct inode *inode, long from, long to,
84                                                 struct vm_area_struct *vma,
85                                                 vm_flags_t vm_flags);
86 void hugetlb_unreserve_pages(struct inode *inode, long offset, long freed);
87 int dequeue_hwpoisoned_huge_page(struct page *page);
88 bool isolate_huge_page(struct page *page, struct list_head *list);
89 void putback_active_hugepage(struct page *page);
90 void free_huge_page(struct page *page);
91
92 #ifdef CONFIG_ARCH_WANT_HUGE_PMD_SHARE
93 pte_t *huge_pmd_share(struct mm_struct *mm, unsigned long addr, pud_t *pud);
94 #endif
95
96 extern int hugepages_treat_as_movable;
97 extern int sysctl_hugetlb_shm_group;
98 extern struct list_head huge_boot_pages;
99
100 /* arch callbacks */
101
102 pte_t *huge_pte_alloc(struct mm_struct *mm,
103                         unsigned long addr, unsigned long sz);
104 pte_t *huge_pte_offset(struct mm_struct *mm, unsigned long addr);
105 int huge_pmd_unshare(struct mm_struct *mm, unsigned long *addr, pte_t *ptep);
106 struct page *follow_huge_addr(struct mm_struct *mm, unsigned long address,
107                               int write);
108 struct page *follow_huge_pmd(struct mm_struct *mm, unsigned long address,
109                                 pmd_t *pmd, int flags);
110 struct page *follow_huge_pud(struct mm_struct *mm, unsigned long address,
111                                 pud_t *pud, int flags);
112 int pmd_huge(pmd_t pmd);
113 int pud_huge(pud_t pmd);
114 unsigned long hugetlb_change_protection(struct vm_area_struct *vma,
115                 unsigned long address, unsigned long end, pgprot_t newprot);
116
117 #else /* !CONFIG_HUGETLB_PAGE */
118
119 static inline void reset_vma_resv_huge_pages(struct vm_area_struct *vma)
120 {
121 }
122
123 static inline unsigned long hugetlb_total_pages(void)
124 {
125         return 0;
126 }
127
128 #define follow_hugetlb_page(m,v,p,vs,a,b,i,w)   ({ BUG(); 0; })
129 #define follow_huge_addr(mm, addr, write)       ERR_PTR(-EINVAL)
130 #define copy_hugetlb_page_range(src, dst, vma)  ({ BUG(); 0; })
131 static inline void hugetlb_report_meminfo(struct seq_file *m)
132 {
133 }
134 #define hugetlb_report_node_meminfo(n, buf)     0
135 static inline void hugetlb_show_meminfo(void)
136 {
137 }
138 #define follow_huge_pmd(mm, addr, pmd, flags)   NULL
139 #define follow_huge_pud(mm, addr, pud, flags)   NULL
140 #define prepare_hugepage_range(file, addr, len) (-EINVAL)
141 #define pmd_huge(x)     0
142 #define pud_huge(x)     0
143 #define is_hugepage_only_range(mm, addr, len)   0
144 #define hugetlb_free_pgd_range(tlb, addr, end, floor, ceiling) ({BUG(); 0; })
145 #define hugetlb_fault(mm, vma, addr, flags)     ({ BUG(); 0; })
146 #define huge_pte_offset(mm, address)    0
147 static inline int dequeue_hwpoisoned_huge_page(struct page *page)
148 {
149         return 0;
150 }
151
152 static inline bool isolate_huge_page(struct page *page, struct list_head *list)
153 {
154         return false;
155 }
156 #define putback_active_hugepage(p)      do {} while (0)
157
158 static inline unsigned long hugetlb_change_protection(struct vm_area_struct *vma,
159                 unsigned long address, unsigned long end, pgprot_t newprot)
160 {
161         return 0;
162 }
163
164 static inline void __unmap_hugepage_range_final(struct mmu_gather *tlb,
165                         struct vm_area_struct *vma, unsigned long start,
166                         unsigned long end, struct page *ref_page)
167 {
168         BUG();
169 }
170
171 static inline void __unmap_hugepage_range(struct mmu_gather *tlb,
172                         struct vm_area_struct *vma, unsigned long start,
173                         unsigned long end, struct page *ref_page)
174 {
175         BUG();
176 }
177
178 #endif /* !CONFIG_HUGETLB_PAGE */
179 /*
180  * hugepages at page global directory. If arch support
181  * hugepages at pgd level, they need to define this.
182  */
183 #ifndef pgd_huge
184 #define pgd_huge(x)     0
185 #endif
186
187 #ifndef pgd_write
188 static inline int pgd_write(pgd_t pgd)
189 {
190         BUG();
191         return 0;
192 }
193 #endif
194
195 #ifndef pud_write
196 static inline int pud_write(pud_t pud)
197 {
198         BUG();
199         return 0;
200 }
201 #endif
202
203 #ifndef is_hugepd
204 /*
205  * Some architectures requires a hugepage directory format that is
206  * required to support multiple hugepage sizes. For example
207  * a4fe3ce76 "powerpc/mm: Allow more flexible layouts for hugepage pagetables"
208  * introduced the same on powerpc. This allows for a more flexible hugepage
209  * pagetable layout.
210  */
211 typedef struct { unsigned long pd; } hugepd_t;
212 #define is_hugepd(hugepd) (0)
213 #define __hugepd(x) ((hugepd_t) { (x) })
214 static inline int gup_huge_pd(hugepd_t hugepd, unsigned long addr,
215                               unsigned pdshift, unsigned long end,
216                               int write, struct page **pages, int *nr)
217 {
218         return 0;
219 }
220 #else
221 extern int gup_huge_pd(hugepd_t hugepd, unsigned long addr,
222                        unsigned pdshift, unsigned long end,
223                        int write, struct page **pages, int *nr);
224 #endif
225
226 #define HUGETLB_ANON_FILE "anon_hugepage"
227
228 enum {
229         /*
230          * The file will be used as an shm file so shmfs accounting rules
231          * apply
232          */
233         HUGETLB_SHMFS_INODE     = 1,
234         /*
235          * The file is being created on the internal vfs mount and shmfs
236          * accounting rules do not apply
237          */
238         HUGETLB_ANONHUGE_INODE  = 2,
239 };
240
241 #ifdef CONFIG_HUGETLBFS
242 struct hugetlbfs_sb_info {
243         long    max_inodes;   /* inodes allowed */
244         long    free_inodes;  /* inodes free */
245         spinlock_t      stat_lock;
246         struct hstate *hstate;
247         struct hugepage_subpool *spool;
248 };
249
250 static inline struct hugetlbfs_sb_info *HUGETLBFS_SB(struct super_block *sb)
251 {
252         return sb->s_fs_info;
253 }
254
255 extern const struct file_operations hugetlbfs_file_operations;
256 extern const struct vm_operations_struct hugetlb_vm_ops;
257 struct file *hugetlb_file_setup(const char *name, size_t size, vm_flags_t acct,
258                                 struct user_struct **user, int creat_flags,
259                                 int page_size_log);
260
261 static inline int is_file_hugepages(struct file *file)
262 {
263         if (file->f_op == &hugetlbfs_file_operations)
264                 return 1;
265         if (is_file_shm_hugepages(file))
266                 return 1;
267
268         return 0;
269 }
270
271
272 #else /* !CONFIG_HUGETLBFS */
273
274 #define is_file_hugepages(file)                 0
275 static inline struct file *
276 hugetlb_file_setup(const char *name, size_t size, vm_flags_t acctflag,
277                 struct user_struct **user, int creat_flags,
278                 int page_size_log)
279 {
280         return ERR_PTR(-ENOSYS);
281 }
282
283 #endif /* !CONFIG_HUGETLBFS */
284
285 #ifdef HAVE_ARCH_HUGETLB_UNMAPPED_AREA
286 unsigned long hugetlb_get_unmapped_area(struct file *file, unsigned long addr,
287                                         unsigned long len, unsigned long pgoff,
288                                         unsigned long flags);
289 #endif /* HAVE_ARCH_HUGETLB_UNMAPPED_AREA */
290
291 #ifdef CONFIG_HUGETLB_PAGE
292
293 #define HSTATE_NAME_LEN 32
294 /* Defines one hugetlb page size */
295 struct hstate {
296         int next_nid_to_alloc;
297         int next_nid_to_free;
298         unsigned int order;
299         unsigned long mask;
300         unsigned long max_huge_pages;
301         unsigned long nr_huge_pages;
302         unsigned long free_huge_pages;
303         unsigned long resv_huge_pages;
304         unsigned long surplus_huge_pages;
305         unsigned long nr_overcommit_huge_pages;
306         struct list_head hugepage_activelist;
307         struct list_head hugepage_freelists[MAX_NUMNODES];
308         unsigned int nr_huge_pages_node[MAX_NUMNODES];
309         unsigned int free_huge_pages_node[MAX_NUMNODES];
310         unsigned int surplus_huge_pages_node[MAX_NUMNODES];
311 #ifdef CONFIG_CGROUP_HUGETLB
312         /* cgroup control files */
313         struct cftype cgroup_files[5];
314 #endif
315         char name[HSTATE_NAME_LEN];
316 };
317
318 struct huge_bootmem_page {
319         struct list_head list;
320         struct hstate *hstate;
321 #ifdef CONFIG_HIGHMEM
322         phys_addr_t phys;
323 #endif
324 };
325
326 struct page *alloc_huge_page_node(struct hstate *h, int nid);
327 struct page *alloc_huge_page_noerr(struct vm_area_struct *vma,
328                                 unsigned long addr, int avoid_reserve);
329
330 /* arch callback */
331 int __init alloc_bootmem_huge_page(struct hstate *h);
332
333 void __init hugetlb_add_hstate(unsigned order);
334 struct hstate *size_to_hstate(unsigned long size);
335
336 #ifndef HUGE_MAX_HSTATE
337 #define HUGE_MAX_HSTATE 1
338 #endif
339
340 extern struct hstate hstates[HUGE_MAX_HSTATE];
341 extern unsigned int default_hstate_idx;
342
343 #define default_hstate (hstates[default_hstate_idx])
344
345 static inline struct hstate *hstate_inode(struct inode *i)
346 {
347         struct hugetlbfs_sb_info *hsb;
348         hsb = HUGETLBFS_SB(i->i_sb);
349         return hsb->hstate;
350 }
351
352 static inline struct hstate *hstate_file(struct file *f)
353 {
354         return hstate_inode(file_inode(f));
355 }
356
357 static inline struct hstate *hstate_sizelog(int page_size_log)
358 {
359         if (!page_size_log)
360                 return &default_hstate;
361
362         return size_to_hstate(1UL << page_size_log);
363 }
364
365 static inline struct hstate *hstate_vma(struct vm_area_struct *vma)
366 {
367         return hstate_file(vma->vm_file);
368 }
369
370 static inline unsigned long huge_page_size(struct hstate *h)
371 {
372         return (unsigned long)PAGE_SIZE << h->order;
373 }
374
375 extern unsigned long vma_kernel_pagesize(struct vm_area_struct *vma);
376
377 extern unsigned long vma_mmu_pagesize(struct vm_area_struct *vma);
378
379 static inline unsigned long huge_page_mask(struct hstate *h)
380 {
381         return h->mask;
382 }
383
384 static inline unsigned int huge_page_order(struct hstate *h)
385 {
386         return h->order;
387 }
388
389 static inline unsigned huge_page_shift(struct hstate *h)
390 {
391         return h->order + PAGE_SHIFT;
392 }
393
394 static inline bool hstate_is_gigantic(struct hstate *h)
395 {
396         return huge_page_order(h) >= MAX_ORDER;
397 }
398
399 static inline unsigned int pages_per_huge_page(struct hstate *h)
400 {
401         return 1 << h->order;
402 }
403
404 static inline unsigned int blocks_per_huge_page(struct hstate *h)
405 {
406         return huge_page_size(h) / 512;
407 }
408
409 #include <asm/hugetlb.h>
410
411 #ifndef arch_make_huge_pte
412 static inline pte_t arch_make_huge_pte(pte_t entry, struct vm_area_struct *vma,
413                                        struct page *page, int writable)
414 {
415         return entry;
416 }
417 #endif
418
419 static inline struct hstate *page_hstate(struct page *page)
420 {
421         VM_BUG_ON_PAGE(!PageHuge(page), page);
422         return size_to_hstate(PAGE_SIZE << compound_order(page));
423 }
424
425 static inline unsigned hstate_index_to_shift(unsigned index)
426 {
427         return hstates[index].order + PAGE_SHIFT;
428 }
429
430 static inline int hstate_index(struct hstate *h)
431 {
432         return h - hstates;
433 }
434
435 pgoff_t __basepage_index(struct page *page);
436
437 /* Return page->index in PAGE_SIZE units */
438 static inline pgoff_t basepage_index(struct page *page)
439 {
440         if (!PageCompound(page))
441                 return page->index;
442
443         return __basepage_index(page);
444 }
445
446 extern void dissolve_free_huge_pages(unsigned long start_pfn,
447                                      unsigned long end_pfn);
448 static inline int hugepage_migration_supported(struct hstate *h)
449 {
450 #ifdef CONFIG_ARCH_ENABLE_HUGEPAGE_MIGRATION
451         return huge_page_shift(h) == PMD_SHIFT;
452 #else
453         return 0;
454 #endif
455 }
456
457 static inline spinlock_t *huge_pte_lockptr(struct hstate *h,
458                                            struct mm_struct *mm, pte_t *pte)
459 {
460         if (huge_page_size(h) == PMD_SIZE)
461                 return pmd_lockptr(mm, (pmd_t *) pte);
462         VM_BUG_ON(huge_page_size(h) == PAGE_SIZE);
463         return &mm->page_table_lock;
464 }
465
466 #ifndef hugepages_supported
467 /*
468  * Some platform decide whether they support huge pages at boot
469  * time. Some of them, such as powerpc, set HPAGE_SHIFT to 0
470  * when there is no such support
471  */
472 #define hugepages_supported() (HPAGE_SHIFT != 0)
473 #endif
474
475 #else   /* CONFIG_HUGETLB_PAGE */
476 struct hstate {};
477 #define alloc_huge_page_node(h, nid) NULL
478 #define alloc_huge_page_noerr(v, a, r) NULL
479 #define alloc_bootmem_huge_page(h) NULL
480 #define hstate_file(f) NULL
481 #define hstate_sizelog(s) NULL
482 #define hstate_vma(v) NULL
483 #define hstate_inode(i) NULL
484 #define page_hstate(page) NULL
485 #define huge_page_size(h) PAGE_SIZE
486 #define huge_page_mask(h) PAGE_MASK
487 #define vma_kernel_pagesize(v) PAGE_SIZE
488 #define vma_mmu_pagesize(v) PAGE_SIZE
489 #define huge_page_order(h) 0
490 #define huge_page_shift(h) PAGE_SHIFT
491 static inline unsigned int pages_per_huge_page(struct hstate *h)
492 {
493         return 1;
494 }
495 #define hstate_index_to_shift(index) 0
496 #define hstate_index(h) 0
497
498 static inline pgoff_t basepage_index(struct page *page)
499 {
500         return page->index;
501 }
502 #define dissolve_free_huge_pages(s, e)  do {} while (0)
503 #define hugepage_migration_supported(h) 0
504
505 static inline spinlock_t *huge_pte_lockptr(struct hstate *h,
506                                            struct mm_struct *mm, pte_t *pte)
507 {
508         return &mm->page_table_lock;
509 }
510 #endif  /* CONFIG_HUGETLB_PAGE */
511
512 static inline spinlock_t *huge_pte_lock(struct hstate *h,
513                                         struct mm_struct *mm, pte_t *pte)
514 {
515         spinlock_t *ptl;
516
517         ptl = huge_pte_lockptr(h, mm, pte);
518         spin_lock(ptl);
519         return ptl;
520 }
521
522 #endif /* _LINUX_HUGETLB_H */