Merge branch 'amd-iommu/2.6.32' of git://git.kernel.org/pub/scm/linux/kernel/git...
[linux-2.6-block.git] / arch / x86 / kernel / pci-dma.c
1 #include <linux/dma-mapping.h>
2 #include <linux/dma-debug.h>
3 #include <linux/dmar.h>
4 #include <linux/bootmem.h>
5 #include <linux/pci.h>
6
7 #include <asm/proto.h>
8 #include <asm/dma.h>
9 #include <asm/iommu.h>
10 #include <asm/gart.h>
11 #include <asm/calgary.h>
12 #include <asm/amd_iommu.h>
13
14 static int forbid_dac __read_mostly;
15
16 struct dma_map_ops *dma_ops;
17 EXPORT_SYMBOL(dma_ops);
18
19 static int iommu_sac_force __read_mostly;
20
21 #ifdef CONFIG_IOMMU_DEBUG
22 int panic_on_overflow __read_mostly = 1;
23 int force_iommu __read_mostly = 1;
24 #else
25 int panic_on_overflow __read_mostly = 0;
26 int force_iommu __read_mostly = 0;
27 #endif
28
29 int iommu_merge __read_mostly = 0;
30
31 int no_iommu __read_mostly;
32 /* Set this to 1 if there is a HW IOMMU in the system */
33 int iommu_detected __read_mostly = 0;
34
35 /*
36  * This variable becomes 1 if iommu=pt is passed on the kernel command line.
37  * If this variable is 1, IOMMU implementations do no DMA ranslation for
38  * devices and allow every device to access to whole physical memory. This is
39  * useful if a user want to use an IOMMU only for KVM device assignment to
40  * guests and not for driver dma translation.
41  */
42 int iommu_pass_through __read_mostly;
43
44 dma_addr_t bad_dma_address __read_mostly = 0;
45 EXPORT_SYMBOL(bad_dma_address);
46
47 /* Dummy device used for NULL arguments (normally ISA). Better would
48    be probably a smaller DMA mask, but this is bug-to-bug compatible
49    to older i386. */
50 struct device x86_dma_fallback_dev = {
51         .init_name = "fallback device",
52         .coherent_dma_mask = DMA_BIT_MASK(32),
53         .dma_mask = &x86_dma_fallback_dev.coherent_dma_mask,
54 };
55 EXPORT_SYMBOL(x86_dma_fallback_dev);
56
57 /* Number of entries preallocated for DMA-API debugging */
58 #define PREALLOC_DMA_DEBUG_ENTRIES       32768
59
60 int dma_set_mask(struct device *dev, u64 mask)
61 {
62         if (!dev->dma_mask || !dma_supported(dev, mask))
63                 return -EIO;
64
65         *dev->dma_mask = mask;
66
67         return 0;
68 }
69 EXPORT_SYMBOL(dma_set_mask);
70
71 #ifdef CONFIG_X86_64
72 static __initdata void *dma32_bootmem_ptr;
73 static unsigned long dma32_bootmem_size __initdata = (128ULL<<20);
74
75 static int __init parse_dma32_size_opt(char *p)
76 {
77         if (!p)
78                 return -EINVAL;
79         dma32_bootmem_size = memparse(p, &p);
80         return 0;
81 }
82 early_param("dma32_size", parse_dma32_size_opt);
83
84 void __init dma32_reserve_bootmem(void)
85 {
86         unsigned long size, align;
87         if (max_pfn <= MAX_DMA32_PFN)
88                 return;
89
90         /*
91          * check aperture_64.c allocate_aperture() for reason about
92          * using 512M as goal
93          */
94         align = 64ULL<<20;
95         size = roundup(dma32_bootmem_size, align);
96         dma32_bootmem_ptr = __alloc_bootmem_nopanic(size, align,
97                                  512ULL<<20);
98         if (dma32_bootmem_ptr)
99                 dma32_bootmem_size = size;
100         else
101                 dma32_bootmem_size = 0;
102 }
103 static void __init dma32_free_bootmem(void)
104 {
105
106         if (max_pfn <= MAX_DMA32_PFN)
107                 return;
108
109         if (!dma32_bootmem_ptr)
110                 return;
111
112         free_bootmem(__pa(dma32_bootmem_ptr), dma32_bootmem_size);
113
114         dma32_bootmem_ptr = NULL;
115         dma32_bootmem_size = 0;
116 }
117 #endif
118
119 void __init pci_iommu_alloc(void)
120 {
121 #ifdef CONFIG_X86_64
122         /* free the range so iommu could get some range less than 4G */
123         dma32_free_bootmem();
124 #endif
125
126         /*
127          * The order of these functions is important for
128          * fall-back/fail-over reasons
129          */
130         gart_iommu_hole_init();
131
132         detect_calgary();
133
134         detect_intel_iommu();
135
136         amd_iommu_detect();
137
138         pci_swiotlb_init();
139 }
140
141 void *dma_generic_alloc_coherent(struct device *dev, size_t size,
142                                  dma_addr_t *dma_addr, gfp_t flag)
143 {
144         unsigned long dma_mask;
145         struct page *page;
146         dma_addr_t addr;
147
148         dma_mask = dma_alloc_coherent_mask(dev, flag);
149
150         flag |= __GFP_ZERO;
151 again:
152         page = alloc_pages_node(dev_to_node(dev), flag, get_order(size));
153         if (!page)
154                 return NULL;
155
156         addr = page_to_phys(page);
157         if (addr + size > dma_mask) {
158                 __free_pages(page, get_order(size));
159
160                 if (dma_mask < DMA_BIT_MASK(32) && !(flag & GFP_DMA)) {
161                         flag = (flag & ~GFP_DMA32) | GFP_DMA;
162                         goto again;
163                 }
164
165                 return NULL;
166         }
167
168         *dma_addr = addr;
169         return page_address(page);
170 }
171
172 /*
173  * See <Documentation/x86_64/boot-options.txt> for the iommu kernel parameter
174  * documentation.
175  */
176 static __init int iommu_setup(char *p)
177 {
178         iommu_merge = 1;
179
180         if (!p)
181                 return -EINVAL;
182
183         while (*p) {
184                 if (!strncmp(p, "off", 3))
185                         no_iommu = 1;
186                 /* gart_parse_options has more force support */
187                 if (!strncmp(p, "force", 5))
188                         force_iommu = 1;
189                 if (!strncmp(p, "noforce", 7)) {
190                         iommu_merge = 0;
191                         force_iommu = 0;
192                 }
193
194                 if (!strncmp(p, "biomerge", 8)) {
195                         iommu_merge = 1;
196                         force_iommu = 1;
197                 }
198                 if (!strncmp(p, "panic", 5))
199                         panic_on_overflow = 1;
200                 if (!strncmp(p, "nopanic", 7))
201                         panic_on_overflow = 0;
202                 if (!strncmp(p, "merge", 5)) {
203                         iommu_merge = 1;
204                         force_iommu = 1;
205                 }
206                 if (!strncmp(p, "nomerge", 7))
207                         iommu_merge = 0;
208                 if (!strncmp(p, "forcesac", 8))
209                         iommu_sac_force = 1;
210                 if (!strncmp(p, "allowdac", 8))
211                         forbid_dac = 0;
212                 if (!strncmp(p, "nodac", 5))
213                         forbid_dac = -1;
214                 if (!strncmp(p, "usedac", 6)) {
215                         forbid_dac = -1;
216                         return 1;
217                 }
218 #ifdef CONFIG_SWIOTLB
219                 if (!strncmp(p, "soft", 4))
220                         swiotlb = 1;
221 #endif
222                 if (!strncmp(p, "pt", 2)) {
223                         iommu_pass_through = 1;
224                         return 1;
225                 }
226
227                 gart_parse_options(p);
228
229 #ifdef CONFIG_CALGARY_IOMMU
230                 if (!strncmp(p, "calgary", 7))
231                         use_calgary = 1;
232 #endif /* CONFIG_CALGARY_IOMMU */
233
234                 p += strcspn(p, ",");
235                 if (*p == ',')
236                         ++p;
237         }
238         return 0;
239 }
240 early_param("iommu", iommu_setup);
241
242 int dma_supported(struct device *dev, u64 mask)
243 {
244         struct dma_map_ops *ops = get_dma_ops(dev);
245
246 #ifdef CONFIG_PCI
247         if (mask > 0xffffffff && forbid_dac > 0) {
248                 dev_info(dev, "PCI: Disallowing DAC for device\n");
249                 return 0;
250         }
251 #endif
252
253         if (ops->dma_supported)
254                 return ops->dma_supported(dev, mask);
255
256         /* Copied from i386. Doesn't make much sense, because it will
257            only work for pci_alloc_coherent.
258            The caller just has to use GFP_DMA in this case. */
259         if (mask < DMA_BIT_MASK(24))
260                 return 0;
261
262         /* Tell the device to use SAC when IOMMU force is on.  This
263            allows the driver to use cheaper accesses in some cases.
264
265            Problem with this is that if we overflow the IOMMU area and
266            return DAC as fallback address the device may not handle it
267            correctly.
268
269            As a special case some controllers have a 39bit address
270            mode that is as efficient as 32bit (aic79xx). Don't force
271            SAC for these.  Assume all masks <= 40 bits are of this
272            type. Normally this doesn't make any difference, but gives
273            more gentle handling of IOMMU overflow. */
274         if (iommu_sac_force && (mask >= DMA_BIT_MASK(40))) {
275                 dev_info(dev, "Force SAC with mask %Lx\n", mask);
276                 return 0;
277         }
278
279         return 1;
280 }
281 EXPORT_SYMBOL(dma_supported);
282
283 static int __init pci_iommu_init(void)
284 {
285         dma_debug_init(PREALLOC_DMA_DEBUG_ENTRIES);
286
287 #ifdef CONFIG_PCI
288         dma_debug_add_bus(&pci_bus_type);
289 #endif
290
291         calgary_iommu_init();
292
293         intel_iommu_init();
294
295         amd_iommu_init();
296
297         gart_iommu_init();
298
299         no_iommu_init();
300         return 0;
301 }
302
303 void pci_iommu_shutdown(void)
304 {
305         gart_iommu_shutdown();
306
307         amd_iommu_shutdown();
308 }
309 /* Must execute after PCI subsystem */
310 fs_initcall(pci_iommu_init);
311
312 #ifdef CONFIG_PCI
313 /* Many VIA bridges seem to corrupt data for DAC. Disable it here */
314
315 static __devinit void via_no_dac(struct pci_dev *dev)
316 {
317         if ((dev->class >> 8) == PCI_CLASS_BRIDGE_PCI && forbid_dac == 0) {
318                 dev_info(&dev->dev, "disabling DAC on VIA PCI bridge\n");
319                 forbid_dac = 1;
320         }
321 }
322 DECLARE_PCI_FIXUP_FINAL(PCI_VENDOR_ID_VIA, PCI_ANY_ID, via_no_dac);
323 #endif