PCI: Handle Enhanced Allocation capability for SR-IOV devices
[linux-2.6-block.git] / drivers / pci / pci.c
1 /*
2  *      PCI Bus Services, see include/linux/pci.h for further explanation.
3  *
4  *      Copyright 1993 -- 1997 Drew Eckhardt, Frederic Potter,
5  *      David Mosberger-Tang
6  *
7  *      Copyright 1997 -- 2000 Martin Mares <mj@ucw.cz>
8  */
9
10 #include <linux/kernel.h>
11 #include <linux/delay.h>
12 #include <linux/init.h>
13 #include <linux/of.h>
14 #include <linux/of_pci.h>
15 #include <linux/pci.h>
16 #include <linux/pm.h>
17 #include <linux/slab.h>
18 #include <linux/module.h>
19 #include <linux/spinlock.h>
20 #include <linux/string.h>
21 #include <linux/log2.h>
22 #include <linux/pci-aspm.h>
23 #include <linux/pm_wakeup.h>
24 #include <linux/interrupt.h>
25 #include <linux/device.h>
26 #include <linux/pm_runtime.h>
27 #include <linux/pci_hotplug.h>
28 #include <asm-generic/pci-bridge.h>
29 #include <asm/setup.h>
30 #include "pci.h"
31
32 const char *pci_power_names[] = {
33         "error", "D0", "D1", "D2", "D3hot", "D3cold", "unknown",
34 };
35 EXPORT_SYMBOL_GPL(pci_power_names);
36
37 int isa_dma_bridge_buggy;
38 EXPORT_SYMBOL(isa_dma_bridge_buggy);
39
40 int pci_pci_problems;
41 EXPORT_SYMBOL(pci_pci_problems);
42
43 unsigned int pci_pm_d3_delay;
44
45 static void pci_pme_list_scan(struct work_struct *work);
46
47 static LIST_HEAD(pci_pme_list);
48 static DEFINE_MUTEX(pci_pme_list_mutex);
49 static DECLARE_DELAYED_WORK(pci_pme_work, pci_pme_list_scan);
50
51 struct pci_pme_device {
52         struct list_head list;
53         struct pci_dev *dev;
54 };
55
56 #define PME_TIMEOUT 1000 /* How long between PME checks */
57
58 static void pci_dev_d3_sleep(struct pci_dev *dev)
59 {
60         unsigned int delay = dev->d3_delay;
61
62         if (delay < pci_pm_d3_delay)
63                 delay = pci_pm_d3_delay;
64
65         msleep(delay);
66 }
67
68 #ifdef CONFIG_PCI_DOMAINS
69 int pci_domains_supported = 1;
70 #endif
71
72 #define DEFAULT_CARDBUS_IO_SIZE         (256)
73 #define DEFAULT_CARDBUS_MEM_SIZE        (64*1024*1024)
74 /* pci=cbmemsize=nnM,cbiosize=nn can override this */
75 unsigned long pci_cardbus_io_size = DEFAULT_CARDBUS_IO_SIZE;
76 unsigned long pci_cardbus_mem_size = DEFAULT_CARDBUS_MEM_SIZE;
77
78 #define DEFAULT_HOTPLUG_IO_SIZE         (256)
79 #define DEFAULT_HOTPLUG_MEM_SIZE        (2*1024*1024)
80 /* pci=hpmemsize=nnM,hpiosize=nn can override this */
81 unsigned long pci_hotplug_io_size  = DEFAULT_HOTPLUG_IO_SIZE;
82 unsigned long pci_hotplug_mem_size = DEFAULT_HOTPLUG_MEM_SIZE;
83
84 enum pcie_bus_config_types pcie_bus_config = PCIE_BUS_DEFAULT;
85
86 /*
87  * The default CLS is used if arch didn't set CLS explicitly and not
88  * all pci devices agree on the same value.  Arch can override either
89  * the dfl or actual value as it sees fit.  Don't forget this is
90  * measured in 32-bit words, not bytes.
91  */
92 u8 pci_dfl_cache_line_size = L1_CACHE_BYTES >> 2;
93 u8 pci_cache_line_size;
94
95 /*
96  * If we set up a device for bus mastering, we need to check the latency
97  * timer as certain BIOSes forget to set it properly.
98  */
99 unsigned int pcibios_max_latency = 255;
100
101 /* If set, the PCIe ARI capability will not be used. */
102 static bool pcie_ari_disabled;
103
104 /**
105  * pci_bus_max_busnr - returns maximum PCI bus number of given bus' children
106  * @bus: pointer to PCI bus structure to search
107  *
108  * Given a PCI bus, returns the highest PCI bus number present in the set
109  * including the given PCI bus and its list of child PCI buses.
110  */
111 unsigned char pci_bus_max_busnr(struct pci_bus *bus)
112 {
113         struct pci_bus *tmp;
114         unsigned char max, n;
115
116         max = bus->busn_res.end;
117         list_for_each_entry(tmp, &bus->children, node) {
118                 n = pci_bus_max_busnr(tmp);
119                 if (n > max)
120                         max = n;
121         }
122         return max;
123 }
124 EXPORT_SYMBOL_GPL(pci_bus_max_busnr);
125
126 #ifdef CONFIG_HAS_IOMEM
127 void __iomem *pci_ioremap_bar(struct pci_dev *pdev, int bar)
128 {
129         struct resource *res = &pdev->resource[bar];
130
131         /*
132          * Make sure the BAR is actually a memory resource, not an IO resource
133          */
134         if (res->flags & IORESOURCE_UNSET || !(res->flags & IORESOURCE_MEM)) {
135                 dev_warn(&pdev->dev, "can't ioremap BAR %d: %pR\n", bar, res);
136                 return NULL;
137         }
138         return ioremap_nocache(res->start, resource_size(res));
139 }
140 EXPORT_SYMBOL_GPL(pci_ioremap_bar);
141
142 void __iomem *pci_ioremap_wc_bar(struct pci_dev *pdev, int bar)
143 {
144         /*
145          * Make sure the BAR is actually a memory resource, not an IO resource
146          */
147         if (!(pci_resource_flags(pdev, bar) & IORESOURCE_MEM)) {
148                 WARN_ON(1);
149                 return NULL;
150         }
151         return ioremap_wc(pci_resource_start(pdev, bar),
152                           pci_resource_len(pdev, bar));
153 }
154 EXPORT_SYMBOL_GPL(pci_ioremap_wc_bar);
155 #endif
156
157
158 static int __pci_find_next_cap_ttl(struct pci_bus *bus, unsigned int devfn,
159                                    u8 pos, int cap, int *ttl)
160 {
161         u8 id;
162         u16 ent;
163
164         pci_bus_read_config_byte(bus, devfn, pos, &pos);
165
166         while ((*ttl)--) {
167                 if (pos < 0x40)
168                         break;
169                 pos &= ~3;
170                 pci_bus_read_config_word(bus, devfn, pos, &ent);
171
172                 id = ent & 0xff;
173                 if (id == 0xff)
174                         break;
175                 if (id == cap)
176                         return pos;
177                 pos = (ent >> 8);
178         }
179         return 0;
180 }
181
182 static int __pci_find_next_cap(struct pci_bus *bus, unsigned int devfn,
183                                u8 pos, int cap)
184 {
185         int ttl = PCI_FIND_CAP_TTL;
186
187         return __pci_find_next_cap_ttl(bus, devfn, pos, cap, &ttl);
188 }
189
190 int pci_find_next_capability(struct pci_dev *dev, u8 pos, int cap)
191 {
192         return __pci_find_next_cap(dev->bus, dev->devfn,
193                                    pos + PCI_CAP_LIST_NEXT, cap);
194 }
195 EXPORT_SYMBOL_GPL(pci_find_next_capability);
196
197 static int __pci_bus_find_cap_start(struct pci_bus *bus,
198                                     unsigned int devfn, u8 hdr_type)
199 {
200         u16 status;
201
202         pci_bus_read_config_word(bus, devfn, PCI_STATUS, &status);
203         if (!(status & PCI_STATUS_CAP_LIST))
204                 return 0;
205
206         switch (hdr_type) {
207         case PCI_HEADER_TYPE_NORMAL:
208         case PCI_HEADER_TYPE_BRIDGE:
209                 return PCI_CAPABILITY_LIST;
210         case PCI_HEADER_TYPE_CARDBUS:
211                 return PCI_CB_CAPABILITY_LIST;
212         }
213
214         return 0;
215 }
216
217 /**
218  * pci_find_capability - query for devices' capabilities
219  * @dev: PCI device to query
220  * @cap: capability code
221  *
222  * Tell if a device supports a given PCI capability.
223  * Returns the address of the requested capability structure within the
224  * device's PCI configuration space or 0 in case the device does not
225  * support it.  Possible values for @cap:
226  *
227  *  %PCI_CAP_ID_PM           Power Management
228  *  %PCI_CAP_ID_AGP          Accelerated Graphics Port
229  *  %PCI_CAP_ID_VPD          Vital Product Data
230  *  %PCI_CAP_ID_SLOTID       Slot Identification
231  *  %PCI_CAP_ID_MSI          Message Signalled Interrupts
232  *  %PCI_CAP_ID_CHSWP        CompactPCI HotSwap
233  *  %PCI_CAP_ID_PCIX         PCI-X
234  *  %PCI_CAP_ID_EXP          PCI Express
235  */
236 int pci_find_capability(struct pci_dev *dev, int cap)
237 {
238         int pos;
239
240         pos = __pci_bus_find_cap_start(dev->bus, dev->devfn, dev->hdr_type);
241         if (pos)
242                 pos = __pci_find_next_cap(dev->bus, dev->devfn, pos, cap);
243
244         return pos;
245 }
246 EXPORT_SYMBOL(pci_find_capability);
247
248 /**
249  * pci_bus_find_capability - query for devices' capabilities
250  * @bus:   the PCI bus to query
251  * @devfn: PCI device to query
252  * @cap:   capability code
253  *
254  * Like pci_find_capability() but works for pci devices that do not have a
255  * pci_dev structure set up yet.
256  *
257  * Returns the address of the requested capability structure within the
258  * device's PCI configuration space or 0 in case the device does not
259  * support it.
260  */
261 int pci_bus_find_capability(struct pci_bus *bus, unsigned int devfn, int cap)
262 {
263         int pos;
264         u8 hdr_type;
265
266         pci_bus_read_config_byte(bus, devfn, PCI_HEADER_TYPE, &hdr_type);
267
268         pos = __pci_bus_find_cap_start(bus, devfn, hdr_type & 0x7f);
269         if (pos)
270                 pos = __pci_find_next_cap(bus, devfn, pos, cap);
271
272         return pos;
273 }
274 EXPORT_SYMBOL(pci_bus_find_capability);
275
276 /**
277  * pci_find_next_ext_capability - Find an extended capability
278  * @dev: PCI device to query
279  * @start: address at which to start looking (0 to start at beginning of list)
280  * @cap: capability code
281  *
282  * Returns the address of the next matching extended capability structure
283  * within the device's PCI configuration space or 0 if the device does
284  * not support it.  Some capabilities can occur several times, e.g., the
285  * vendor-specific capability, and this provides a way to find them all.
286  */
287 int pci_find_next_ext_capability(struct pci_dev *dev, int start, int cap)
288 {
289         u32 header;
290         int ttl;
291         int pos = PCI_CFG_SPACE_SIZE;
292
293         /* minimum 8 bytes per capability */
294         ttl = (PCI_CFG_SPACE_EXP_SIZE - PCI_CFG_SPACE_SIZE) / 8;
295
296         if (dev->cfg_size <= PCI_CFG_SPACE_SIZE)
297                 return 0;
298
299         if (start)
300                 pos = start;
301
302         if (pci_read_config_dword(dev, pos, &header) != PCIBIOS_SUCCESSFUL)
303                 return 0;
304
305         /*
306          * If we have no capabilities, this is indicated by cap ID,
307          * cap version and next pointer all being 0.
308          */
309         if (header == 0)
310                 return 0;
311
312         while (ttl-- > 0) {
313                 if (PCI_EXT_CAP_ID(header) == cap && pos != start)
314                         return pos;
315
316                 pos = PCI_EXT_CAP_NEXT(header);
317                 if (pos < PCI_CFG_SPACE_SIZE)
318                         break;
319
320                 if (pci_read_config_dword(dev, pos, &header) != PCIBIOS_SUCCESSFUL)
321                         break;
322         }
323
324         return 0;
325 }
326 EXPORT_SYMBOL_GPL(pci_find_next_ext_capability);
327
328 /**
329  * pci_find_ext_capability - Find an extended capability
330  * @dev: PCI device to query
331  * @cap: capability code
332  *
333  * Returns the address of the requested extended capability structure
334  * within the device's PCI configuration space or 0 if the device does
335  * not support it.  Possible values for @cap:
336  *
337  *  %PCI_EXT_CAP_ID_ERR         Advanced Error Reporting
338  *  %PCI_EXT_CAP_ID_VC          Virtual Channel
339  *  %PCI_EXT_CAP_ID_DSN         Device Serial Number
340  *  %PCI_EXT_CAP_ID_PWR         Power Budgeting
341  */
342 int pci_find_ext_capability(struct pci_dev *dev, int cap)
343 {
344         return pci_find_next_ext_capability(dev, 0, cap);
345 }
346 EXPORT_SYMBOL_GPL(pci_find_ext_capability);
347
348 static int __pci_find_next_ht_cap(struct pci_dev *dev, int pos, int ht_cap)
349 {
350         int rc, ttl = PCI_FIND_CAP_TTL;
351         u8 cap, mask;
352
353         if (ht_cap == HT_CAPTYPE_SLAVE || ht_cap == HT_CAPTYPE_HOST)
354                 mask = HT_3BIT_CAP_MASK;
355         else
356                 mask = HT_5BIT_CAP_MASK;
357
358         pos = __pci_find_next_cap_ttl(dev->bus, dev->devfn, pos,
359                                       PCI_CAP_ID_HT, &ttl);
360         while (pos) {
361                 rc = pci_read_config_byte(dev, pos + 3, &cap);
362                 if (rc != PCIBIOS_SUCCESSFUL)
363                         return 0;
364
365                 if ((cap & mask) == ht_cap)
366                         return pos;
367
368                 pos = __pci_find_next_cap_ttl(dev->bus, dev->devfn,
369                                               pos + PCI_CAP_LIST_NEXT,
370                                               PCI_CAP_ID_HT, &ttl);
371         }
372
373         return 0;
374 }
375 /**
376  * pci_find_next_ht_capability - query a device's Hypertransport capabilities
377  * @dev: PCI device to query
378  * @pos: Position from which to continue searching
379  * @ht_cap: Hypertransport capability code
380  *
381  * To be used in conjunction with pci_find_ht_capability() to search for
382  * all capabilities matching @ht_cap. @pos should always be a value returned
383  * from pci_find_ht_capability().
384  *
385  * NB. To be 100% safe against broken PCI devices, the caller should take
386  * steps to avoid an infinite loop.
387  */
388 int pci_find_next_ht_capability(struct pci_dev *dev, int pos, int ht_cap)
389 {
390         return __pci_find_next_ht_cap(dev, pos + PCI_CAP_LIST_NEXT, ht_cap);
391 }
392 EXPORT_SYMBOL_GPL(pci_find_next_ht_capability);
393
394 /**
395  * pci_find_ht_capability - query a device's Hypertransport capabilities
396  * @dev: PCI device to query
397  * @ht_cap: Hypertransport capability code
398  *
399  * Tell if a device supports a given Hypertransport capability.
400  * Returns an address within the device's PCI configuration space
401  * or 0 in case the device does not support the request capability.
402  * The address points to the PCI capability, of type PCI_CAP_ID_HT,
403  * which has a Hypertransport capability matching @ht_cap.
404  */
405 int pci_find_ht_capability(struct pci_dev *dev, int ht_cap)
406 {
407         int pos;
408
409         pos = __pci_bus_find_cap_start(dev->bus, dev->devfn, dev->hdr_type);
410         if (pos)
411                 pos = __pci_find_next_ht_cap(dev, pos, ht_cap);
412
413         return pos;
414 }
415 EXPORT_SYMBOL_GPL(pci_find_ht_capability);
416
417 /**
418  * pci_find_parent_resource - return resource region of parent bus of given region
419  * @dev: PCI device structure contains resources to be searched
420  * @res: child resource record for which parent is sought
421  *
422  *  For given resource region of given device, return the resource
423  *  region of parent bus the given region is contained in.
424  */
425 struct resource *pci_find_parent_resource(const struct pci_dev *dev,
426                                           struct resource *res)
427 {
428         const struct pci_bus *bus = dev->bus;
429         struct resource *r;
430         int i;
431
432         pci_bus_for_each_resource(bus, r, i) {
433                 if (!r)
434                         continue;
435                 if (res->start && resource_contains(r, res)) {
436
437                         /*
438                          * If the window is prefetchable but the BAR is
439                          * not, the allocator made a mistake.
440                          */
441                         if (r->flags & IORESOURCE_PREFETCH &&
442                             !(res->flags & IORESOURCE_PREFETCH))
443                                 return NULL;
444
445                         /*
446                          * If we're below a transparent bridge, there may
447                          * be both a positively-decoded aperture and a
448                          * subtractively-decoded region that contain the BAR.
449                          * We want the positively-decoded one, so this depends
450                          * on pci_bus_for_each_resource() giving us those
451                          * first.
452                          */
453                         return r;
454                 }
455         }
456         return NULL;
457 }
458 EXPORT_SYMBOL(pci_find_parent_resource);
459
460 /**
461  * pci_wait_for_pending - wait for @mask bit(s) to clear in status word @pos
462  * @dev: the PCI device to operate on
463  * @pos: config space offset of status word
464  * @mask: mask of bit(s) to care about in status word
465  *
466  * Return 1 when mask bit(s) in status word clear, 0 otherwise.
467  */
468 int pci_wait_for_pending(struct pci_dev *dev, int pos, u16 mask)
469 {
470         int i;
471
472         /* Wait for Transaction Pending bit clean */
473         for (i = 0; i < 4; i++) {
474                 u16 status;
475                 if (i)
476                         msleep((1 << (i - 1)) * 100);
477
478                 pci_read_config_word(dev, pos, &status);
479                 if (!(status & mask))
480                         return 1;
481         }
482
483         return 0;
484 }
485
486 /**
487  * pci_restore_bars - restore a devices BAR values (e.g. after wake-up)
488  * @dev: PCI device to have its BARs restored
489  *
490  * Restore the BAR values for a given device, so as to make it
491  * accessible by its driver.
492  */
493 static void pci_restore_bars(struct pci_dev *dev)
494 {
495         int i;
496
497         for (i = 0; i < PCI_BRIDGE_RESOURCES; i++)
498                 pci_update_resource(dev, i);
499 }
500
501 static struct pci_platform_pm_ops *pci_platform_pm;
502
503 int pci_set_platform_pm(struct pci_platform_pm_ops *ops)
504 {
505         if (!ops->is_manageable || !ops->set_state || !ops->choose_state
506             || !ops->sleep_wake)
507                 return -EINVAL;
508         pci_platform_pm = ops;
509         return 0;
510 }
511
512 static inline bool platform_pci_power_manageable(struct pci_dev *dev)
513 {
514         return pci_platform_pm ? pci_platform_pm->is_manageable(dev) : false;
515 }
516
517 static inline int platform_pci_set_power_state(struct pci_dev *dev,
518                                                pci_power_t t)
519 {
520         return pci_platform_pm ? pci_platform_pm->set_state(dev, t) : -ENOSYS;
521 }
522
523 static inline pci_power_t platform_pci_choose_state(struct pci_dev *dev)
524 {
525         return pci_platform_pm ?
526                         pci_platform_pm->choose_state(dev) : PCI_POWER_ERROR;
527 }
528
529 static inline int platform_pci_sleep_wake(struct pci_dev *dev, bool enable)
530 {
531         return pci_platform_pm ?
532                         pci_platform_pm->sleep_wake(dev, enable) : -ENODEV;
533 }
534
535 static inline int platform_pci_run_wake(struct pci_dev *dev, bool enable)
536 {
537         return pci_platform_pm ?
538                         pci_platform_pm->run_wake(dev, enable) : -ENODEV;
539 }
540
541 static inline bool platform_pci_need_resume(struct pci_dev *dev)
542 {
543         return pci_platform_pm ? pci_platform_pm->need_resume(dev) : false;
544 }
545
546 /**
547  * pci_raw_set_power_state - Use PCI PM registers to set the power state of
548  *                           given PCI device
549  * @dev: PCI device to handle.
550  * @state: PCI power state (D0, D1, D2, D3hot) to put the device into.
551  *
552  * RETURN VALUE:
553  * -EINVAL if the requested state is invalid.
554  * -EIO if device does not support PCI PM or its PM capabilities register has a
555  * wrong version, or device doesn't support the requested state.
556  * 0 if device already is in the requested state.
557  * 0 if device's power state has been successfully changed.
558  */
559 static int pci_raw_set_power_state(struct pci_dev *dev, pci_power_t state)
560 {
561         u16 pmcsr;
562         bool need_restore = false;
563
564         /* Check if we're already there */
565         if (dev->current_state == state)
566                 return 0;
567
568         if (!dev->pm_cap)
569                 return -EIO;
570
571         if (state < PCI_D0 || state > PCI_D3hot)
572                 return -EINVAL;
573
574         /* Validate current state:
575          * Can enter D0 from any state, but if we can only go deeper
576          * to sleep if we're already in a low power state
577          */
578         if (state != PCI_D0 && dev->current_state <= PCI_D3cold
579             && dev->current_state > state) {
580                 dev_err(&dev->dev, "invalid power transition (from state %d to %d)\n",
581                         dev->current_state, state);
582                 return -EINVAL;
583         }
584
585         /* check if this device supports the desired state */
586         if ((state == PCI_D1 && !dev->d1_support)
587            || (state == PCI_D2 && !dev->d2_support))
588                 return -EIO;
589
590         pci_read_config_word(dev, dev->pm_cap + PCI_PM_CTRL, &pmcsr);
591
592         /* If we're (effectively) in D3, force entire word to 0.
593          * This doesn't affect PME_Status, disables PME_En, and
594          * sets PowerState to 0.
595          */
596         switch (dev->current_state) {
597         case PCI_D0:
598         case PCI_D1:
599         case PCI_D2:
600                 pmcsr &= ~PCI_PM_CTRL_STATE_MASK;
601                 pmcsr |= state;
602                 break;
603         case PCI_D3hot:
604         case PCI_D3cold:
605         case PCI_UNKNOWN: /* Boot-up */
606                 if ((pmcsr & PCI_PM_CTRL_STATE_MASK) == PCI_D3hot
607                  && !(pmcsr & PCI_PM_CTRL_NO_SOFT_RESET))
608                         need_restore = true;
609                 /* Fall-through: force to D0 */
610         default:
611                 pmcsr = 0;
612                 break;
613         }
614
615         /* enter specified state */
616         pci_write_config_word(dev, dev->pm_cap + PCI_PM_CTRL, pmcsr);
617
618         /* Mandatory power management transition delays */
619         /* see PCI PM 1.1 5.6.1 table 18 */
620         if (state == PCI_D3hot || dev->current_state == PCI_D3hot)
621                 pci_dev_d3_sleep(dev);
622         else if (state == PCI_D2 || dev->current_state == PCI_D2)
623                 udelay(PCI_PM_D2_DELAY);
624
625         pci_read_config_word(dev, dev->pm_cap + PCI_PM_CTRL, &pmcsr);
626         dev->current_state = (pmcsr & PCI_PM_CTRL_STATE_MASK);
627         if (dev->current_state != state && printk_ratelimit())
628                 dev_info(&dev->dev, "Refused to change power state, currently in D%d\n",
629                          dev->current_state);
630
631         /*
632          * According to section 5.4.1 of the "PCI BUS POWER MANAGEMENT
633          * INTERFACE SPECIFICATION, REV. 1.2", a device transitioning
634          * from D3hot to D0 _may_ perform an internal reset, thereby
635          * going to "D0 Uninitialized" rather than "D0 Initialized".
636          * For example, at least some versions of the 3c905B and the
637          * 3c556B exhibit this behaviour.
638          *
639          * At least some laptop BIOSen (e.g. the Thinkpad T21) leave
640          * devices in a D3hot state at boot.  Consequently, we need to
641          * restore at least the BARs so that the device will be
642          * accessible to its driver.
643          */
644         if (need_restore)
645                 pci_restore_bars(dev);
646
647         if (dev->bus->self)
648                 pcie_aspm_pm_state_change(dev->bus->self);
649
650         return 0;
651 }
652
653 /**
654  * pci_update_current_state - Read PCI power state of given device from its
655  *                            PCI PM registers and cache it
656  * @dev: PCI device to handle.
657  * @state: State to cache in case the device doesn't have the PM capability
658  */
659 void pci_update_current_state(struct pci_dev *dev, pci_power_t state)
660 {
661         if (dev->pm_cap) {
662                 u16 pmcsr;
663
664                 /*
665                  * Configuration space is not accessible for device in
666                  * D3cold, so just keep or set D3cold for safety
667                  */
668                 if (dev->current_state == PCI_D3cold)
669                         return;
670                 if (state == PCI_D3cold) {
671                         dev->current_state = PCI_D3cold;
672                         return;
673                 }
674                 pci_read_config_word(dev, dev->pm_cap + PCI_PM_CTRL, &pmcsr);
675                 dev->current_state = (pmcsr & PCI_PM_CTRL_STATE_MASK);
676         } else {
677                 dev->current_state = state;
678         }
679 }
680
681 /**
682  * pci_power_up - Put the given device into D0 forcibly
683  * @dev: PCI device to power up
684  */
685 void pci_power_up(struct pci_dev *dev)
686 {
687         if (platform_pci_power_manageable(dev))
688                 platform_pci_set_power_state(dev, PCI_D0);
689
690         pci_raw_set_power_state(dev, PCI_D0);
691         pci_update_current_state(dev, PCI_D0);
692 }
693
694 /**
695  * pci_platform_power_transition - Use platform to change device power state
696  * @dev: PCI device to handle.
697  * @state: State to put the device into.
698  */
699 static int pci_platform_power_transition(struct pci_dev *dev, pci_power_t state)
700 {
701         int error;
702
703         if (platform_pci_power_manageable(dev)) {
704                 error = platform_pci_set_power_state(dev, state);
705                 if (!error)
706                         pci_update_current_state(dev, state);
707         } else
708                 error = -ENODEV;
709
710         if (error && !dev->pm_cap) /* Fall back to PCI_D0 */
711                 dev->current_state = PCI_D0;
712
713         return error;
714 }
715
716 /**
717  * pci_wakeup - Wake up a PCI device
718  * @pci_dev: Device to handle.
719  * @ign: ignored parameter
720  */
721 static int pci_wakeup(struct pci_dev *pci_dev, void *ign)
722 {
723         pci_wakeup_event(pci_dev);
724         pm_request_resume(&pci_dev->dev);
725         return 0;
726 }
727
728 /**
729  * pci_wakeup_bus - Walk given bus and wake up devices on it
730  * @bus: Top bus of the subtree to walk.
731  */
732 static void pci_wakeup_bus(struct pci_bus *bus)
733 {
734         if (bus)
735                 pci_walk_bus(bus, pci_wakeup, NULL);
736 }
737
738 /**
739  * __pci_start_power_transition - Start power transition of a PCI device
740  * @dev: PCI device to handle.
741  * @state: State to put the device into.
742  */
743 static void __pci_start_power_transition(struct pci_dev *dev, pci_power_t state)
744 {
745         if (state == PCI_D0) {
746                 pci_platform_power_transition(dev, PCI_D0);
747                 /*
748                  * Mandatory power management transition delays, see
749                  * PCI Express Base Specification Revision 2.0 Section
750                  * 6.6.1: Conventional Reset.  Do not delay for
751                  * devices powered on/off by corresponding bridge,
752                  * because have already delayed for the bridge.
753                  */
754                 if (dev->runtime_d3cold) {
755                         msleep(dev->d3cold_delay);
756                         /*
757                          * When powering on a bridge from D3cold, the
758                          * whole hierarchy may be powered on into
759                          * D0uninitialized state, resume them to give
760                          * them a chance to suspend again
761                          */
762                         pci_wakeup_bus(dev->subordinate);
763                 }
764         }
765 }
766
767 /**
768  * __pci_dev_set_current_state - Set current state of a PCI device
769  * @dev: Device to handle
770  * @data: pointer to state to be set
771  */
772 static int __pci_dev_set_current_state(struct pci_dev *dev, void *data)
773 {
774         pci_power_t state = *(pci_power_t *)data;
775
776         dev->current_state = state;
777         return 0;
778 }
779
780 /**
781  * __pci_bus_set_current_state - Walk given bus and set current state of devices
782  * @bus: Top bus of the subtree to walk.
783  * @state: state to be set
784  */
785 static void __pci_bus_set_current_state(struct pci_bus *bus, pci_power_t state)
786 {
787         if (bus)
788                 pci_walk_bus(bus, __pci_dev_set_current_state, &state);
789 }
790
791 /**
792  * __pci_complete_power_transition - Complete power transition of a PCI device
793  * @dev: PCI device to handle.
794  * @state: State to put the device into.
795  *
796  * This function should not be called directly by device drivers.
797  */
798 int __pci_complete_power_transition(struct pci_dev *dev, pci_power_t state)
799 {
800         int ret;
801
802         if (state <= PCI_D0)
803                 return -EINVAL;
804         ret = pci_platform_power_transition(dev, state);
805         /* Power off the bridge may power off the whole hierarchy */
806         if (!ret && state == PCI_D3cold)
807                 __pci_bus_set_current_state(dev->subordinate, PCI_D3cold);
808         return ret;
809 }
810 EXPORT_SYMBOL_GPL(__pci_complete_power_transition);
811
812 /**
813  * pci_set_power_state - Set the power state of a PCI device
814  * @dev: PCI device to handle.
815  * @state: PCI power state (D0, D1, D2, D3hot) to put the device into.
816  *
817  * Transition a device to a new power state, using the platform firmware and/or
818  * the device's PCI PM registers.
819  *
820  * RETURN VALUE:
821  * -EINVAL if the requested state is invalid.
822  * -EIO if device does not support PCI PM or its PM capabilities register has a
823  * wrong version, or device doesn't support the requested state.
824  * 0 if device already is in the requested state.
825  * 0 if device's power state has been successfully changed.
826  */
827 int pci_set_power_state(struct pci_dev *dev, pci_power_t state)
828 {
829         int error;
830
831         /* bound the state we're entering */
832         if (state > PCI_D3cold)
833                 state = PCI_D3cold;
834         else if (state < PCI_D0)
835                 state = PCI_D0;
836         else if ((state == PCI_D1 || state == PCI_D2) && pci_no_d1d2(dev))
837                 /*
838                  * If the device or the parent bridge do not support PCI PM,
839                  * ignore the request if we're doing anything other than putting
840                  * it into D0 (which would only happen on boot).
841                  */
842                 return 0;
843
844         /* Check if we're already there */
845         if (dev->current_state == state)
846                 return 0;
847
848         __pci_start_power_transition(dev, state);
849
850         /* This device is quirked not to be put into D3, so
851            don't put it in D3 */
852         if (state >= PCI_D3hot && (dev->dev_flags & PCI_DEV_FLAGS_NO_D3))
853                 return 0;
854
855         /*
856          * To put device in D3cold, we put device into D3hot in native
857          * way, then put device into D3cold with platform ops
858          */
859         error = pci_raw_set_power_state(dev, state > PCI_D3hot ?
860                                         PCI_D3hot : state);
861
862         if (!__pci_complete_power_transition(dev, state))
863                 error = 0;
864
865         return error;
866 }
867 EXPORT_SYMBOL(pci_set_power_state);
868
869 /**
870  * pci_choose_state - Choose the power state of a PCI device
871  * @dev: PCI device to be suspended
872  * @state: target sleep state for the whole system. This is the value
873  *      that is passed to suspend() function.
874  *
875  * Returns PCI power state suitable for given device and given system
876  * message.
877  */
878
879 pci_power_t pci_choose_state(struct pci_dev *dev, pm_message_t state)
880 {
881         pci_power_t ret;
882
883         if (!dev->pm_cap)
884                 return PCI_D0;
885
886         ret = platform_pci_choose_state(dev);
887         if (ret != PCI_POWER_ERROR)
888                 return ret;
889
890         switch (state.event) {
891         case PM_EVENT_ON:
892                 return PCI_D0;
893         case PM_EVENT_FREEZE:
894         case PM_EVENT_PRETHAW:
895                 /* REVISIT both freeze and pre-thaw "should" use D0 */
896         case PM_EVENT_SUSPEND:
897         case PM_EVENT_HIBERNATE:
898                 return PCI_D3hot;
899         default:
900                 dev_info(&dev->dev, "unrecognized suspend event %d\n",
901                          state.event);
902                 BUG();
903         }
904         return PCI_D0;
905 }
906 EXPORT_SYMBOL(pci_choose_state);
907
908 #define PCI_EXP_SAVE_REGS       7
909
910 static struct pci_cap_saved_state *_pci_find_saved_cap(struct pci_dev *pci_dev,
911                                                        u16 cap, bool extended)
912 {
913         struct pci_cap_saved_state *tmp;
914
915         hlist_for_each_entry(tmp, &pci_dev->saved_cap_space, next) {
916                 if (tmp->cap.cap_extended == extended && tmp->cap.cap_nr == cap)
917                         return tmp;
918         }
919         return NULL;
920 }
921
922 struct pci_cap_saved_state *pci_find_saved_cap(struct pci_dev *dev, char cap)
923 {
924         return _pci_find_saved_cap(dev, cap, false);
925 }
926
927 struct pci_cap_saved_state *pci_find_saved_ext_cap(struct pci_dev *dev, u16 cap)
928 {
929         return _pci_find_saved_cap(dev, cap, true);
930 }
931
932 static int pci_save_pcie_state(struct pci_dev *dev)
933 {
934         int i = 0;
935         struct pci_cap_saved_state *save_state;
936         u16 *cap;
937
938         if (!pci_is_pcie(dev))
939                 return 0;
940
941         save_state = pci_find_saved_cap(dev, PCI_CAP_ID_EXP);
942         if (!save_state) {
943                 dev_err(&dev->dev, "buffer not found in %s\n", __func__);
944                 return -ENOMEM;
945         }
946
947         cap = (u16 *)&save_state->cap.data[0];
948         pcie_capability_read_word(dev, PCI_EXP_DEVCTL, &cap[i++]);
949         pcie_capability_read_word(dev, PCI_EXP_LNKCTL, &cap[i++]);
950         pcie_capability_read_word(dev, PCI_EXP_SLTCTL, &cap[i++]);
951         pcie_capability_read_word(dev, PCI_EXP_RTCTL,  &cap[i++]);
952         pcie_capability_read_word(dev, PCI_EXP_DEVCTL2, &cap[i++]);
953         pcie_capability_read_word(dev, PCI_EXP_LNKCTL2, &cap[i++]);
954         pcie_capability_read_word(dev, PCI_EXP_SLTCTL2, &cap[i++]);
955
956         return 0;
957 }
958
959 static void pci_restore_pcie_state(struct pci_dev *dev)
960 {
961         int i = 0;
962         struct pci_cap_saved_state *save_state;
963         u16 *cap;
964
965         save_state = pci_find_saved_cap(dev, PCI_CAP_ID_EXP);
966         if (!save_state)
967                 return;
968
969         cap = (u16 *)&save_state->cap.data[0];
970         pcie_capability_write_word(dev, PCI_EXP_DEVCTL, cap[i++]);
971         pcie_capability_write_word(dev, PCI_EXP_LNKCTL, cap[i++]);
972         pcie_capability_write_word(dev, PCI_EXP_SLTCTL, cap[i++]);
973         pcie_capability_write_word(dev, PCI_EXP_RTCTL, cap[i++]);
974         pcie_capability_write_word(dev, PCI_EXP_DEVCTL2, cap[i++]);
975         pcie_capability_write_word(dev, PCI_EXP_LNKCTL2, cap[i++]);
976         pcie_capability_write_word(dev, PCI_EXP_SLTCTL2, cap[i++]);
977 }
978
979
980 static int pci_save_pcix_state(struct pci_dev *dev)
981 {
982         int pos;
983         struct pci_cap_saved_state *save_state;
984
985         pos = pci_find_capability(dev, PCI_CAP_ID_PCIX);
986         if (!pos)
987                 return 0;
988
989         save_state = pci_find_saved_cap(dev, PCI_CAP_ID_PCIX);
990         if (!save_state) {
991                 dev_err(&dev->dev, "buffer not found in %s\n", __func__);
992                 return -ENOMEM;
993         }
994
995         pci_read_config_word(dev, pos + PCI_X_CMD,
996                              (u16 *)save_state->cap.data);
997
998         return 0;
999 }
1000
1001 static void pci_restore_pcix_state(struct pci_dev *dev)
1002 {
1003         int i = 0, pos;
1004         struct pci_cap_saved_state *save_state;
1005         u16 *cap;
1006
1007         save_state = pci_find_saved_cap(dev, PCI_CAP_ID_PCIX);
1008         pos = pci_find_capability(dev, PCI_CAP_ID_PCIX);
1009         if (!save_state || !pos)
1010                 return;
1011         cap = (u16 *)&save_state->cap.data[0];
1012
1013         pci_write_config_word(dev, pos + PCI_X_CMD, cap[i++]);
1014 }
1015
1016
1017 /**
1018  * pci_save_state - save the PCI configuration space of a device before suspending
1019  * @dev: - PCI device that we're dealing with
1020  */
1021 int pci_save_state(struct pci_dev *dev)
1022 {
1023         int i;
1024         /* XXX: 100% dword access ok here? */
1025         for (i = 0; i < 16; i++)
1026                 pci_read_config_dword(dev, i * 4, &dev->saved_config_space[i]);
1027         dev->state_saved = true;
1028
1029         i = pci_save_pcie_state(dev);
1030         if (i != 0)
1031                 return i;
1032
1033         i = pci_save_pcix_state(dev);
1034         if (i != 0)
1035                 return i;
1036
1037         return pci_save_vc_state(dev);
1038 }
1039 EXPORT_SYMBOL(pci_save_state);
1040
1041 static void pci_restore_config_dword(struct pci_dev *pdev, int offset,
1042                                      u32 saved_val, int retry)
1043 {
1044         u32 val;
1045
1046         pci_read_config_dword(pdev, offset, &val);
1047         if (val == saved_val)
1048                 return;
1049
1050         for (;;) {
1051                 dev_dbg(&pdev->dev, "restoring config space at offset %#x (was %#x, writing %#x)\n",
1052                         offset, val, saved_val);
1053                 pci_write_config_dword(pdev, offset, saved_val);
1054                 if (retry-- <= 0)
1055                         return;
1056
1057                 pci_read_config_dword(pdev, offset, &val);
1058                 if (val == saved_val)
1059                         return;
1060
1061                 mdelay(1);
1062         }
1063 }
1064
1065 static void pci_restore_config_space_range(struct pci_dev *pdev,
1066                                            int start, int end, int retry)
1067 {
1068         int index;
1069
1070         for (index = end; index >= start; index--)
1071                 pci_restore_config_dword(pdev, 4 * index,
1072                                          pdev->saved_config_space[index],
1073                                          retry);
1074 }
1075
1076 static void pci_restore_config_space(struct pci_dev *pdev)
1077 {
1078         if (pdev->hdr_type == PCI_HEADER_TYPE_NORMAL) {
1079                 pci_restore_config_space_range(pdev, 10, 15, 0);
1080                 /* Restore BARs before the command register. */
1081                 pci_restore_config_space_range(pdev, 4, 9, 10);
1082                 pci_restore_config_space_range(pdev, 0, 3, 0);
1083         } else {
1084                 pci_restore_config_space_range(pdev, 0, 15, 0);
1085         }
1086 }
1087
1088 /**
1089  * pci_restore_state - Restore the saved state of a PCI device
1090  * @dev: - PCI device that we're dealing with
1091  */
1092 void pci_restore_state(struct pci_dev *dev)
1093 {
1094         if (!dev->state_saved)
1095                 return;
1096
1097         /* PCI Express register must be restored first */
1098         pci_restore_pcie_state(dev);
1099         pci_restore_ats_state(dev);
1100         pci_restore_vc_state(dev);
1101
1102         pci_restore_config_space(dev);
1103
1104         pci_restore_pcix_state(dev);
1105         pci_restore_msi_state(dev);
1106
1107         /* Restore ACS and IOV configuration state */
1108         pci_enable_acs(dev);
1109         pci_restore_iov_state(dev);
1110
1111         dev->state_saved = false;
1112 }
1113 EXPORT_SYMBOL(pci_restore_state);
1114
1115 struct pci_saved_state {
1116         u32 config_space[16];
1117         struct pci_cap_saved_data cap[0];
1118 };
1119
1120 /**
1121  * pci_store_saved_state - Allocate and return an opaque struct containing
1122  *                         the device saved state.
1123  * @dev: PCI device that we're dealing with
1124  *
1125  * Return NULL if no state or error.
1126  */
1127 struct pci_saved_state *pci_store_saved_state(struct pci_dev *dev)
1128 {
1129         struct pci_saved_state *state;
1130         struct pci_cap_saved_state *tmp;
1131         struct pci_cap_saved_data *cap;
1132         size_t size;
1133
1134         if (!dev->state_saved)
1135                 return NULL;
1136
1137         size = sizeof(*state) + sizeof(struct pci_cap_saved_data);
1138
1139         hlist_for_each_entry(tmp, &dev->saved_cap_space, next)
1140                 size += sizeof(struct pci_cap_saved_data) + tmp->cap.size;
1141
1142         state = kzalloc(size, GFP_KERNEL);
1143         if (!state)
1144                 return NULL;
1145
1146         memcpy(state->config_space, dev->saved_config_space,
1147                sizeof(state->config_space));
1148
1149         cap = state->cap;
1150         hlist_for_each_entry(tmp, &dev->saved_cap_space, next) {
1151                 size_t len = sizeof(struct pci_cap_saved_data) + tmp->cap.size;
1152                 memcpy(cap, &tmp->cap, len);
1153                 cap = (struct pci_cap_saved_data *)((u8 *)cap + len);
1154         }
1155         /* Empty cap_save terminates list */
1156
1157         return state;
1158 }
1159 EXPORT_SYMBOL_GPL(pci_store_saved_state);
1160
1161 /**
1162  * pci_load_saved_state - Reload the provided save state into struct pci_dev.
1163  * @dev: PCI device that we're dealing with
1164  * @state: Saved state returned from pci_store_saved_state()
1165  */
1166 int pci_load_saved_state(struct pci_dev *dev,
1167                          struct pci_saved_state *state)
1168 {
1169         struct pci_cap_saved_data *cap;
1170
1171         dev->state_saved = false;
1172
1173         if (!state)
1174                 return 0;
1175
1176         memcpy(dev->saved_config_space, state->config_space,
1177                sizeof(state->config_space));
1178
1179         cap = state->cap;
1180         while (cap->size) {
1181                 struct pci_cap_saved_state *tmp;
1182
1183                 tmp = _pci_find_saved_cap(dev, cap->cap_nr, cap->cap_extended);
1184                 if (!tmp || tmp->cap.size != cap->size)
1185                         return -EINVAL;
1186
1187                 memcpy(tmp->cap.data, cap->data, tmp->cap.size);
1188                 cap = (struct pci_cap_saved_data *)((u8 *)cap +
1189                        sizeof(struct pci_cap_saved_data) + cap->size);
1190         }
1191
1192         dev->state_saved = true;
1193         return 0;
1194 }
1195 EXPORT_SYMBOL_GPL(pci_load_saved_state);
1196
1197 /**
1198  * pci_load_and_free_saved_state - Reload the save state pointed to by state,
1199  *                                 and free the memory allocated for it.
1200  * @dev: PCI device that we're dealing with
1201  * @state: Pointer to saved state returned from pci_store_saved_state()
1202  */
1203 int pci_load_and_free_saved_state(struct pci_dev *dev,
1204                                   struct pci_saved_state **state)
1205 {
1206         int ret = pci_load_saved_state(dev, *state);
1207         kfree(*state);
1208         *state = NULL;
1209         return ret;
1210 }
1211 EXPORT_SYMBOL_GPL(pci_load_and_free_saved_state);
1212
1213 int __weak pcibios_enable_device(struct pci_dev *dev, int bars)
1214 {
1215         return pci_enable_resources(dev, bars);
1216 }
1217
1218 static int do_pci_enable_device(struct pci_dev *dev, int bars)
1219 {
1220         int err;
1221         struct pci_dev *bridge;
1222         u16 cmd;
1223         u8 pin;
1224
1225         err = pci_set_power_state(dev, PCI_D0);
1226         if (err < 0 && err != -EIO)
1227                 return err;
1228
1229         bridge = pci_upstream_bridge(dev);
1230         if (bridge)
1231                 pcie_aspm_powersave_config_link(bridge);
1232
1233         err = pcibios_enable_device(dev, bars);
1234         if (err < 0)
1235                 return err;
1236         pci_fixup_device(pci_fixup_enable, dev);
1237
1238         if (dev->msi_enabled || dev->msix_enabled)
1239                 return 0;
1240
1241         pci_read_config_byte(dev, PCI_INTERRUPT_PIN, &pin);
1242         if (pin) {
1243                 pci_read_config_word(dev, PCI_COMMAND, &cmd);
1244                 if (cmd & PCI_COMMAND_INTX_DISABLE)
1245                         pci_write_config_word(dev, PCI_COMMAND,
1246                                               cmd & ~PCI_COMMAND_INTX_DISABLE);
1247         }
1248
1249         return 0;
1250 }
1251
1252 /**
1253  * pci_reenable_device - Resume abandoned device
1254  * @dev: PCI device to be resumed
1255  *
1256  *  Note this function is a backend of pci_default_resume and is not supposed
1257  *  to be called by normal code, write proper resume handler and use it instead.
1258  */
1259 int pci_reenable_device(struct pci_dev *dev)
1260 {
1261         if (pci_is_enabled(dev))
1262                 return do_pci_enable_device(dev, (1 << PCI_NUM_RESOURCES) - 1);
1263         return 0;
1264 }
1265 EXPORT_SYMBOL(pci_reenable_device);
1266
1267 static void pci_enable_bridge(struct pci_dev *dev)
1268 {
1269         struct pci_dev *bridge;
1270         int retval;
1271
1272         bridge = pci_upstream_bridge(dev);
1273         if (bridge)
1274                 pci_enable_bridge(bridge);
1275
1276         if (pci_is_enabled(dev)) {
1277                 if (!dev->is_busmaster)
1278                         pci_set_master(dev);
1279                 return;
1280         }
1281
1282         retval = pci_enable_device(dev);
1283         if (retval)
1284                 dev_err(&dev->dev, "Error enabling bridge (%d), continuing\n",
1285                         retval);
1286         pci_set_master(dev);
1287 }
1288
1289 static int pci_enable_device_flags(struct pci_dev *dev, unsigned long flags)
1290 {
1291         struct pci_dev *bridge;
1292         int err;
1293         int i, bars = 0;
1294
1295         /*
1296          * Power state could be unknown at this point, either due to a fresh
1297          * boot or a device removal call.  So get the current power state
1298          * so that things like MSI message writing will behave as expected
1299          * (e.g. if the device really is in D0 at enable time).
1300          */
1301         if (dev->pm_cap) {
1302                 u16 pmcsr;
1303                 pci_read_config_word(dev, dev->pm_cap + PCI_PM_CTRL, &pmcsr);
1304                 dev->current_state = (pmcsr & PCI_PM_CTRL_STATE_MASK);
1305         }
1306
1307         if (atomic_inc_return(&dev->enable_cnt) > 1)
1308                 return 0;               /* already enabled */
1309
1310         bridge = pci_upstream_bridge(dev);
1311         if (bridge)
1312                 pci_enable_bridge(bridge);
1313
1314         /* only skip sriov related */
1315         for (i = 0; i <= PCI_ROM_RESOURCE; i++)
1316                 if (dev->resource[i].flags & flags)
1317                         bars |= (1 << i);
1318         for (i = PCI_BRIDGE_RESOURCES; i < DEVICE_COUNT_RESOURCE; i++)
1319                 if (dev->resource[i].flags & flags)
1320                         bars |= (1 << i);
1321
1322         err = do_pci_enable_device(dev, bars);
1323         if (err < 0)
1324                 atomic_dec(&dev->enable_cnt);
1325         return err;
1326 }
1327
1328 /**
1329  * pci_enable_device_io - Initialize a device for use with IO space
1330  * @dev: PCI device to be initialized
1331  *
1332  *  Initialize device before it's used by a driver. Ask low-level code
1333  *  to enable I/O resources. Wake up the device if it was suspended.
1334  *  Beware, this function can fail.
1335  */
1336 int pci_enable_device_io(struct pci_dev *dev)
1337 {
1338         return pci_enable_device_flags(dev, IORESOURCE_IO);
1339 }
1340 EXPORT_SYMBOL(pci_enable_device_io);
1341
1342 /**
1343  * pci_enable_device_mem - Initialize a device for use with Memory space
1344  * @dev: PCI device to be initialized
1345  *
1346  *  Initialize device before it's used by a driver. Ask low-level code
1347  *  to enable Memory resources. Wake up the device if it was suspended.
1348  *  Beware, this function can fail.
1349  */
1350 int pci_enable_device_mem(struct pci_dev *dev)
1351 {
1352         return pci_enable_device_flags(dev, IORESOURCE_MEM);
1353 }
1354 EXPORT_SYMBOL(pci_enable_device_mem);
1355
1356 /**
1357  * pci_enable_device - Initialize device before it's used by a driver.
1358  * @dev: PCI device to be initialized
1359  *
1360  *  Initialize device before it's used by a driver. Ask low-level code
1361  *  to enable I/O and memory. Wake up the device if it was suspended.
1362  *  Beware, this function can fail.
1363  *
1364  *  Note we don't actually enable the device many times if we call
1365  *  this function repeatedly (we just increment the count).
1366  */
1367 int pci_enable_device(struct pci_dev *dev)
1368 {
1369         return pci_enable_device_flags(dev, IORESOURCE_MEM | IORESOURCE_IO);
1370 }
1371 EXPORT_SYMBOL(pci_enable_device);
1372
1373 /*
1374  * Managed PCI resources.  This manages device on/off, intx/msi/msix
1375  * on/off and BAR regions.  pci_dev itself records msi/msix status, so
1376  * there's no need to track it separately.  pci_devres is initialized
1377  * when a device is enabled using managed PCI device enable interface.
1378  */
1379 struct pci_devres {
1380         unsigned int enabled:1;
1381         unsigned int pinned:1;
1382         unsigned int orig_intx:1;
1383         unsigned int restore_intx:1;
1384         u32 region_mask;
1385 };
1386
1387 static void pcim_release(struct device *gendev, void *res)
1388 {
1389         struct pci_dev *dev = container_of(gendev, struct pci_dev, dev);
1390         struct pci_devres *this = res;
1391         int i;
1392
1393         if (dev->msi_enabled)
1394                 pci_disable_msi(dev);
1395         if (dev->msix_enabled)
1396                 pci_disable_msix(dev);
1397
1398         for (i = 0; i < DEVICE_COUNT_RESOURCE; i++)
1399                 if (this->region_mask & (1 << i))
1400                         pci_release_region(dev, i);
1401
1402         if (this->restore_intx)
1403                 pci_intx(dev, this->orig_intx);
1404
1405         if (this->enabled && !this->pinned)
1406                 pci_disable_device(dev);
1407 }
1408
1409 static struct pci_devres *get_pci_dr(struct pci_dev *pdev)
1410 {
1411         struct pci_devres *dr, *new_dr;
1412
1413         dr = devres_find(&pdev->dev, pcim_release, NULL, NULL);
1414         if (dr)
1415                 return dr;
1416
1417         new_dr = devres_alloc(pcim_release, sizeof(*new_dr), GFP_KERNEL);
1418         if (!new_dr)
1419                 return NULL;
1420         return devres_get(&pdev->dev, new_dr, NULL, NULL);
1421 }
1422
1423 static struct pci_devres *find_pci_dr(struct pci_dev *pdev)
1424 {
1425         if (pci_is_managed(pdev))
1426                 return devres_find(&pdev->dev, pcim_release, NULL, NULL);
1427         return NULL;
1428 }
1429
1430 /**
1431  * pcim_enable_device - Managed pci_enable_device()
1432  * @pdev: PCI device to be initialized
1433  *
1434  * Managed pci_enable_device().
1435  */
1436 int pcim_enable_device(struct pci_dev *pdev)
1437 {
1438         struct pci_devres *dr;
1439         int rc;
1440
1441         dr = get_pci_dr(pdev);
1442         if (unlikely(!dr))
1443                 return -ENOMEM;
1444         if (dr->enabled)
1445                 return 0;
1446
1447         rc = pci_enable_device(pdev);
1448         if (!rc) {
1449                 pdev->is_managed = 1;
1450                 dr->enabled = 1;
1451         }
1452         return rc;
1453 }
1454 EXPORT_SYMBOL(pcim_enable_device);
1455
1456 /**
1457  * pcim_pin_device - Pin managed PCI device
1458  * @pdev: PCI device to pin
1459  *
1460  * Pin managed PCI device @pdev.  Pinned device won't be disabled on
1461  * driver detach.  @pdev must have been enabled with
1462  * pcim_enable_device().
1463  */
1464 void pcim_pin_device(struct pci_dev *pdev)
1465 {
1466         struct pci_devres *dr;
1467
1468         dr = find_pci_dr(pdev);
1469         WARN_ON(!dr || !dr->enabled);
1470         if (dr)
1471                 dr->pinned = 1;
1472 }
1473 EXPORT_SYMBOL(pcim_pin_device);
1474
1475 /*
1476  * pcibios_add_device - provide arch specific hooks when adding device dev
1477  * @dev: the PCI device being added
1478  *
1479  * Permits the platform to provide architecture specific functionality when
1480  * devices are added. This is the default implementation. Architecture
1481  * implementations can override this.
1482  */
1483 int __weak pcibios_add_device(struct pci_dev *dev)
1484 {
1485         return 0;
1486 }
1487
1488 /**
1489  * pcibios_release_device - provide arch specific hooks when releasing device dev
1490  * @dev: the PCI device being released
1491  *
1492  * Permits the platform to provide architecture specific functionality when
1493  * devices are released. This is the default implementation. Architecture
1494  * implementations can override this.
1495  */
1496 void __weak pcibios_release_device(struct pci_dev *dev) {}
1497
1498 /**
1499  * pcibios_disable_device - disable arch specific PCI resources for device dev
1500  * @dev: the PCI device to disable
1501  *
1502  * Disables architecture specific PCI resources for the device. This
1503  * is the default implementation. Architecture implementations can
1504  * override this.
1505  */
1506 void __weak pcibios_disable_device (struct pci_dev *dev) {}
1507
1508 /**
1509  * pcibios_penalize_isa_irq - penalize an ISA IRQ
1510  * @irq: ISA IRQ to penalize
1511  * @active: IRQ active or not
1512  *
1513  * Permits the platform to provide architecture-specific functionality when
1514  * penalizing ISA IRQs. This is the default implementation. Architecture
1515  * implementations can override this.
1516  */
1517 void __weak pcibios_penalize_isa_irq(int irq, int active) {}
1518
1519 static void do_pci_disable_device(struct pci_dev *dev)
1520 {
1521         u16 pci_command;
1522
1523         pci_read_config_word(dev, PCI_COMMAND, &pci_command);
1524         if (pci_command & PCI_COMMAND_MASTER) {
1525                 pci_command &= ~PCI_COMMAND_MASTER;
1526                 pci_write_config_word(dev, PCI_COMMAND, pci_command);
1527         }
1528
1529         pcibios_disable_device(dev);
1530 }
1531
1532 /**
1533  * pci_disable_enabled_device - Disable device without updating enable_cnt
1534  * @dev: PCI device to disable
1535  *
1536  * NOTE: This function is a backend of PCI power management routines and is
1537  * not supposed to be called drivers.
1538  */
1539 void pci_disable_enabled_device(struct pci_dev *dev)
1540 {
1541         if (pci_is_enabled(dev))
1542                 do_pci_disable_device(dev);
1543 }
1544
1545 /**
1546  * pci_disable_device - Disable PCI device after use
1547  * @dev: PCI device to be disabled
1548  *
1549  * Signal to the system that the PCI device is not in use by the system
1550  * anymore.  This only involves disabling PCI bus-mastering, if active.
1551  *
1552  * Note we don't actually disable the device until all callers of
1553  * pci_enable_device() have called pci_disable_device().
1554  */
1555 void pci_disable_device(struct pci_dev *dev)
1556 {
1557         struct pci_devres *dr;
1558
1559         dr = find_pci_dr(dev);
1560         if (dr)
1561                 dr->enabled = 0;
1562
1563         dev_WARN_ONCE(&dev->dev, atomic_read(&dev->enable_cnt) <= 0,
1564                       "disabling already-disabled device");
1565
1566         if (atomic_dec_return(&dev->enable_cnt) != 0)
1567                 return;
1568
1569         do_pci_disable_device(dev);
1570
1571         dev->is_busmaster = 0;
1572 }
1573 EXPORT_SYMBOL(pci_disable_device);
1574
1575 /**
1576  * pcibios_set_pcie_reset_state - set reset state for device dev
1577  * @dev: the PCIe device reset
1578  * @state: Reset state to enter into
1579  *
1580  *
1581  * Sets the PCIe reset state for the device. This is the default
1582  * implementation. Architecture implementations can override this.
1583  */
1584 int __weak pcibios_set_pcie_reset_state(struct pci_dev *dev,
1585                                         enum pcie_reset_state state)
1586 {
1587         return -EINVAL;
1588 }
1589
1590 /**
1591  * pci_set_pcie_reset_state - set reset state for device dev
1592  * @dev: the PCIe device reset
1593  * @state: Reset state to enter into
1594  *
1595  *
1596  * Sets the PCI reset state for the device.
1597  */
1598 int pci_set_pcie_reset_state(struct pci_dev *dev, enum pcie_reset_state state)
1599 {
1600         return pcibios_set_pcie_reset_state(dev, state);
1601 }
1602 EXPORT_SYMBOL_GPL(pci_set_pcie_reset_state);
1603
1604 /**
1605  * pci_check_pme_status - Check if given device has generated PME.
1606  * @dev: Device to check.
1607  *
1608  * Check the PME status of the device and if set, clear it and clear PME enable
1609  * (if set).  Return 'true' if PME status and PME enable were both set or
1610  * 'false' otherwise.
1611  */
1612 bool pci_check_pme_status(struct pci_dev *dev)
1613 {
1614         int pmcsr_pos;
1615         u16 pmcsr;
1616         bool ret = false;
1617
1618         if (!dev->pm_cap)
1619                 return false;
1620
1621         pmcsr_pos = dev->pm_cap + PCI_PM_CTRL;
1622         pci_read_config_word(dev, pmcsr_pos, &pmcsr);
1623         if (!(pmcsr & PCI_PM_CTRL_PME_STATUS))
1624                 return false;
1625
1626         /* Clear PME status. */
1627         pmcsr |= PCI_PM_CTRL_PME_STATUS;
1628         if (pmcsr & PCI_PM_CTRL_PME_ENABLE) {
1629                 /* Disable PME to avoid interrupt flood. */
1630                 pmcsr &= ~PCI_PM_CTRL_PME_ENABLE;
1631                 ret = true;
1632         }
1633
1634         pci_write_config_word(dev, pmcsr_pos, pmcsr);
1635
1636         return ret;
1637 }
1638
1639 /**
1640  * pci_pme_wakeup - Wake up a PCI device if its PME Status bit is set.
1641  * @dev: Device to handle.
1642  * @pme_poll_reset: Whether or not to reset the device's pme_poll flag.
1643  *
1644  * Check if @dev has generated PME and queue a resume request for it in that
1645  * case.
1646  */
1647 static int pci_pme_wakeup(struct pci_dev *dev, void *pme_poll_reset)
1648 {
1649         if (pme_poll_reset && dev->pme_poll)
1650                 dev->pme_poll = false;
1651
1652         if (pci_check_pme_status(dev)) {
1653                 pci_wakeup_event(dev);
1654                 pm_request_resume(&dev->dev);
1655         }
1656         return 0;
1657 }
1658
1659 /**
1660  * pci_pme_wakeup_bus - Walk given bus and wake up devices on it, if necessary.
1661  * @bus: Top bus of the subtree to walk.
1662  */
1663 void pci_pme_wakeup_bus(struct pci_bus *bus)
1664 {
1665         if (bus)
1666                 pci_walk_bus(bus, pci_pme_wakeup, (void *)true);
1667 }
1668
1669
1670 /**
1671  * pci_pme_capable - check the capability of PCI device to generate PME#
1672  * @dev: PCI device to handle.
1673  * @state: PCI state from which device will issue PME#.
1674  */
1675 bool pci_pme_capable(struct pci_dev *dev, pci_power_t state)
1676 {
1677         if (!dev->pm_cap)
1678                 return false;
1679
1680         return !!(dev->pme_support & (1 << state));
1681 }
1682 EXPORT_SYMBOL(pci_pme_capable);
1683
1684 static void pci_pme_list_scan(struct work_struct *work)
1685 {
1686         struct pci_pme_device *pme_dev, *n;
1687
1688         mutex_lock(&pci_pme_list_mutex);
1689         list_for_each_entry_safe(pme_dev, n, &pci_pme_list, list) {
1690                 if (pme_dev->dev->pme_poll) {
1691                         struct pci_dev *bridge;
1692
1693                         bridge = pme_dev->dev->bus->self;
1694                         /*
1695                          * If bridge is in low power state, the
1696                          * configuration space of subordinate devices
1697                          * may be not accessible
1698                          */
1699                         if (bridge && bridge->current_state != PCI_D0)
1700                                 continue;
1701                         pci_pme_wakeup(pme_dev->dev, NULL);
1702                 } else {
1703                         list_del(&pme_dev->list);
1704                         kfree(pme_dev);
1705                 }
1706         }
1707         if (!list_empty(&pci_pme_list))
1708                 schedule_delayed_work(&pci_pme_work,
1709                                       msecs_to_jiffies(PME_TIMEOUT));
1710         mutex_unlock(&pci_pme_list_mutex);
1711 }
1712
1713 /**
1714  * pci_pme_active - enable or disable PCI device's PME# function
1715  * @dev: PCI device to handle.
1716  * @enable: 'true' to enable PME# generation; 'false' to disable it.
1717  *
1718  * The caller must verify that the device is capable of generating PME# before
1719  * calling this function with @enable equal to 'true'.
1720  */
1721 void pci_pme_active(struct pci_dev *dev, bool enable)
1722 {
1723         u16 pmcsr;
1724
1725         if (!dev->pme_support)
1726                 return;
1727
1728         pci_read_config_word(dev, dev->pm_cap + PCI_PM_CTRL, &pmcsr);
1729         /* Clear PME_Status by writing 1 to it and enable PME# */
1730         pmcsr |= PCI_PM_CTRL_PME_STATUS | PCI_PM_CTRL_PME_ENABLE;
1731         if (!enable)
1732                 pmcsr &= ~PCI_PM_CTRL_PME_ENABLE;
1733
1734         pci_write_config_word(dev, dev->pm_cap + PCI_PM_CTRL, pmcsr);
1735
1736         /*
1737          * PCI (as opposed to PCIe) PME requires that the device have
1738          * its PME# line hooked up correctly. Not all hardware vendors
1739          * do this, so the PME never gets delivered and the device
1740          * remains asleep. The easiest way around this is to
1741          * periodically walk the list of suspended devices and check
1742          * whether any have their PME flag set. The assumption is that
1743          * we'll wake up often enough anyway that this won't be a huge
1744          * hit, and the power savings from the devices will still be a
1745          * win.
1746          *
1747          * Although PCIe uses in-band PME message instead of PME# line
1748          * to report PME, PME does not work for some PCIe devices in
1749          * reality.  For example, there are devices that set their PME
1750          * status bits, but don't really bother to send a PME message;
1751          * there are PCI Express Root Ports that don't bother to
1752          * trigger interrupts when they receive PME messages from the
1753          * devices below.  So PME poll is used for PCIe devices too.
1754          */
1755
1756         if (dev->pme_poll) {
1757                 struct pci_pme_device *pme_dev;
1758                 if (enable) {
1759                         pme_dev = kmalloc(sizeof(struct pci_pme_device),
1760                                           GFP_KERNEL);
1761                         if (!pme_dev) {
1762                                 dev_warn(&dev->dev, "can't enable PME#\n");
1763                                 return;
1764                         }
1765                         pme_dev->dev = dev;
1766                         mutex_lock(&pci_pme_list_mutex);
1767                         list_add(&pme_dev->list, &pci_pme_list);
1768                         if (list_is_singular(&pci_pme_list))
1769                                 schedule_delayed_work(&pci_pme_work,
1770                                                       msecs_to_jiffies(PME_TIMEOUT));
1771                         mutex_unlock(&pci_pme_list_mutex);
1772                 } else {
1773                         mutex_lock(&pci_pme_list_mutex);
1774                         list_for_each_entry(pme_dev, &pci_pme_list, list) {
1775                                 if (pme_dev->dev == dev) {
1776                                         list_del(&pme_dev->list);
1777                                         kfree(pme_dev);
1778                                         break;
1779                                 }
1780                         }
1781                         mutex_unlock(&pci_pme_list_mutex);
1782                 }
1783         }
1784
1785         dev_dbg(&dev->dev, "PME# %s\n", enable ? "enabled" : "disabled");
1786 }
1787 EXPORT_SYMBOL(pci_pme_active);
1788
1789 /**
1790  * __pci_enable_wake - enable PCI device as wakeup event source
1791  * @dev: PCI device affected
1792  * @state: PCI state from which device will issue wakeup events
1793  * @runtime: True if the events are to be generated at run time
1794  * @enable: True to enable event generation; false to disable
1795  *
1796  * This enables the device as a wakeup event source, or disables it.
1797  * When such events involves platform-specific hooks, those hooks are
1798  * called automatically by this routine.
1799  *
1800  * Devices with legacy power management (no standard PCI PM capabilities)
1801  * always require such platform hooks.
1802  *
1803  * RETURN VALUE:
1804  * 0 is returned on success
1805  * -EINVAL is returned if device is not supposed to wake up the system
1806  * Error code depending on the platform is returned if both the platform and
1807  * the native mechanism fail to enable the generation of wake-up events
1808  */
1809 int __pci_enable_wake(struct pci_dev *dev, pci_power_t state,
1810                       bool runtime, bool enable)
1811 {
1812         int ret = 0;
1813
1814         if (enable && !runtime && !device_may_wakeup(&dev->dev))
1815                 return -EINVAL;
1816
1817         /* Don't do the same thing twice in a row for one device. */
1818         if (!!enable == !!dev->wakeup_prepared)
1819                 return 0;
1820
1821         /*
1822          * According to "PCI System Architecture" 4th ed. by Tom Shanley & Don
1823          * Anderson we should be doing PME# wake enable followed by ACPI wake
1824          * enable.  To disable wake-up we call the platform first, for symmetry.
1825          */
1826
1827         if (enable) {
1828                 int error;
1829
1830                 if (pci_pme_capable(dev, state))
1831                         pci_pme_active(dev, true);
1832                 else
1833                         ret = 1;
1834                 error = runtime ? platform_pci_run_wake(dev, true) :
1835                                         platform_pci_sleep_wake(dev, true);
1836                 if (ret)
1837                         ret = error;
1838                 if (!ret)
1839                         dev->wakeup_prepared = true;
1840         } else {
1841                 if (runtime)
1842                         platform_pci_run_wake(dev, false);
1843                 else
1844                         platform_pci_sleep_wake(dev, false);
1845                 pci_pme_active(dev, false);
1846                 dev->wakeup_prepared = false;
1847         }
1848
1849         return ret;
1850 }
1851 EXPORT_SYMBOL(__pci_enable_wake);
1852
1853 /**
1854  * pci_wake_from_d3 - enable/disable device to wake up from D3_hot or D3_cold
1855  * @dev: PCI device to prepare
1856  * @enable: True to enable wake-up event generation; false to disable
1857  *
1858  * Many drivers want the device to wake up the system from D3_hot or D3_cold
1859  * and this function allows them to set that up cleanly - pci_enable_wake()
1860  * should not be called twice in a row to enable wake-up due to PCI PM vs ACPI
1861  * ordering constraints.
1862  *
1863  * This function only returns error code if the device is not capable of
1864  * generating PME# from both D3_hot and D3_cold, and the platform is unable to
1865  * enable wake-up power for it.
1866  */
1867 int pci_wake_from_d3(struct pci_dev *dev, bool enable)
1868 {
1869         return pci_pme_capable(dev, PCI_D3cold) ?
1870                         pci_enable_wake(dev, PCI_D3cold, enable) :
1871                         pci_enable_wake(dev, PCI_D3hot, enable);
1872 }
1873 EXPORT_SYMBOL(pci_wake_from_d3);
1874
1875 /**
1876  * pci_target_state - find an appropriate low power state for a given PCI dev
1877  * @dev: PCI device
1878  *
1879  * Use underlying platform code to find a supported low power state for @dev.
1880  * If the platform can't manage @dev, return the deepest state from which it
1881  * can generate wake events, based on any available PME info.
1882  */
1883 static pci_power_t pci_target_state(struct pci_dev *dev)
1884 {
1885         pci_power_t target_state = PCI_D3hot;
1886
1887         if (platform_pci_power_manageable(dev)) {
1888                 /*
1889                  * Call the platform to choose the target state of the device
1890                  * and enable wake-up from this state if supported.
1891                  */
1892                 pci_power_t state = platform_pci_choose_state(dev);
1893
1894                 switch (state) {
1895                 case PCI_POWER_ERROR:
1896                 case PCI_UNKNOWN:
1897                         break;
1898                 case PCI_D1:
1899                 case PCI_D2:
1900                         if (pci_no_d1d2(dev))
1901                                 break;
1902                 default:
1903                         target_state = state;
1904                 }
1905         } else if (!dev->pm_cap) {
1906                 target_state = PCI_D0;
1907         } else if (device_may_wakeup(&dev->dev)) {
1908                 /*
1909                  * Find the deepest state from which the device can generate
1910                  * wake-up events, make it the target state and enable device
1911                  * to generate PME#.
1912                  */
1913                 if (dev->pme_support) {
1914                         while (target_state
1915                               && !(dev->pme_support & (1 << target_state)))
1916                                 target_state--;
1917                 }
1918         }
1919
1920         return target_state;
1921 }
1922
1923 /**
1924  * pci_prepare_to_sleep - prepare PCI device for system-wide transition into a sleep state
1925  * @dev: Device to handle.
1926  *
1927  * Choose the power state appropriate for the device depending on whether
1928  * it can wake up the system and/or is power manageable by the platform
1929  * (PCI_D3hot is the default) and put the device into that state.
1930  */
1931 int pci_prepare_to_sleep(struct pci_dev *dev)
1932 {
1933         pci_power_t target_state = pci_target_state(dev);
1934         int error;
1935
1936         if (target_state == PCI_POWER_ERROR)
1937                 return -EIO;
1938
1939         pci_enable_wake(dev, target_state, device_may_wakeup(&dev->dev));
1940
1941         error = pci_set_power_state(dev, target_state);
1942
1943         if (error)
1944                 pci_enable_wake(dev, target_state, false);
1945
1946         return error;
1947 }
1948 EXPORT_SYMBOL(pci_prepare_to_sleep);
1949
1950 /**
1951  * pci_back_from_sleep - turn PCI device on during system-wide transition into working state
1952  * @dev: Device to handle.
1953  *
1954  * Disable device's system wake-up capability and put it into D0.
1955  */
1956 int pci_back_from_sleep(struct pci_dev *dev)
1957 {
1958         pci_enable_wake(dev, PCI_D0, false);
1959         return pci_set_power_state(dev, PCI_D0);
1960 }
1961 EXPORT_SYMBOL(pci_back_from_sleep);
1962
1963 /**
1964  * pci_finish_runtime_suspend - Carry out PCI-specific part of runtime suspend.
1965  * @dev: PCI device being suspended.
1966  *
1967  * Prepare @dev to generate wake-up events at run time and put it into a low
1968  * power state.
1969  */
1970 int pci_finish_runtime_suspend(struct pci_dev *dev)
1971 {
1972         pci_power_t target_state = pci_target_state(dev);
1973         int error;
1974
1975         if (target_state == PCI_POWER_ERROR)
1976                 return -EIO;
1977
1978         dev->runtime_d3cold = target_state == PCI_D3cold;
1979
1980         __pci_enable_wake(dev, target_state, true, pci_dev_run_wake(dev));
1981
1982         error = pci_set_power_state(dev, target_state);
1983
1984         if (error) {
1985                 __pci_enable_wake(dev, target_state, true, false);
1986                 dev->runtime_d3cold = false;
1987         }
1988
1989         return error;
1990 }
1991
1992 /**
1993  * pci_dev_run_wake - Check if device can generate run-time wake-up events.
1994  * @dev: Device to check.
1995  *
1996  * Return true if the device itself is capable of generating wake-up events
1997  * (through the platform or using the native PCIe PME) or if the device supports
1998  * PME and one of its upstream bridges can generate wake-up events.
1999  */
2000 bool pci_dev_run_wake(struct pci_dev *dev)
2001 {
2002         struct pci_bus *bus = dev->bus;
2003
2004         if (device_run_wake(&dev->dev))
2005                 return true;
2006
2007         if (!dev->pme_support)
2008                 return false;
2009
2010         while (bus->parent) {
2011                 struct pci_dev *bridge = bus->self;
2012
2013                 if (device_run_wake(&bridge->dev))
2014                         return true;
2015
2016                 bus = bus->parent;
2017         }
2018
2019         /* We have reached the root bus. */
2020         if (bus->bridge)
2021                 return device_run_wake(bus->bridge);
2022
2023         return false;
2024 }
2025 EXPORT_SYMBOL_GPL(pci_dev_run_wake);
2026
2027 /**
2028  * pci_dev_keep_suspended - Check if the device can stay in the suspended state.
2029  * @pci_dev: Device to check.
2030  *
2031  * Return 'true' if the device is runtime-suspended, it doesn't have to be
2032  * reconfigured due to wakeup settings difference between system and runtime
2033  * suspend and the current power state of it is suitable for the upcoming
2034  * (system) transition.
2035  */
2036 bool pci_dev_keep_suspended(struct pci_dev *pci_dev)
2037 {
2038         struct device *dev = &pci_dev->dev;
2039
2040         if (!pm_runtime_suspended(dev)
2041             || (device_can_wakeup(dev) && !device_may_wakeup(dev))
2042             || platform_pci_need_resume(pci_dev))
2043                 return false;
2044
2045         return pci_target_state(pci_dev) == pci_dev->current_state;
2046 }
2047
2048 void pci_config_pm_runtime_get(struct pci_dev *pdev)
2049 {
2050         struct device *dev = &pdev->dev;
2051         struct device *parent = dev->parent;
2052
2053         if (parent)
2054                 pm_runtime_get_sync(parent);
2055         pm_runtime_get_noresume(dev);
2056         /*
2057          * pdev->current_state is set to PCI_D3cold during suspending,
2058          * so wait until suspending completes
2059          */
2060         pm_runtime_barrier(dev);
2061         /*
2062          * Only need to resume devices in D3cold, because config
2063          * registers are still accessible for devices suspended but
2064          * not in D3cold.
2065          */
2066         if (pdev->current_state == PCI_D3cold)
2067                 pm_runtime_resume(dev);
2068 }
2069
2070 void pci_config_pm_runtime_put(struct pci_dev *pdev)
2071 {
2072         struct device *dev = &pdev->dev;
2073         struct device *parent = dev->parent;
2074
2075         pm_runtime_put(dev);
2076         if (parent)
2077                 pm_runtime_put_sync(parent);
2078 }
2079
2080 /**
2081  * pci_pm_init - Initialize PM functions of given PCI device
2082  * @dev: PCI device to handle.
2083  */
2084 void pci_pm_init(struct pci_dev *dev)
2085 {
2086         int pm;
2087         u16 pmc;
2088
2089         pm_runtime_forbid(&dev->dev);
2090         pm_runtime_set_active(&dev->dev);
2091         pm_runtime_enable(&dev->dev);
2092         device_enable_async_suspend(&dev->dev);
2093         dev->wakeup_prepared = false;
2094
2095         dev->pm_cap = 0;
2096         dev->pme_support = 0;
2097
2098         /* find PCI PM capability in list */
2099         pm = pci_find_capability(dev, PCI_CAP_ID_PM);
2100         if (!pm)
2101                 return;
2102         /* Check device's ability to generate PME# */
2103         pci_read_config_word(dev, pm + PCI_PM_PMC, &pmc);
2104
2105         if ((pmc & PCI_PM_CAP_VER_MASK) > 3) {
2106                 dev_err(&dev->dev, "unsupported PM cap regs version (%u)\n",
2107                         pmc & PCI_PM_CAP_VER_MASK);
2108                 return;
2109         }
2110
2111         dev->pm_cap = pm;
2112         dev->d3_delay = PCI_PM_D3_WAIT;
2113         dev->d3cold_delay = PCI_PM_D3COLD_WAIT;
2114         dev->d3cold_allowed = true;
2115
2116         dev->d1_support = false;
2117         dev->d2_support = false;
2118         if (!pci_no_d1d2(dev)) {
2119                 if (pmc & PCI_PM_CAP_D1)
2120                         dev->d1_support = true;
2121                 if (pmc & PCI_PM_CAP_D2)
2122                         dev->d2_support = true;
2123
2124                 if (dev->d1_support || dev->d2_support)
2125                         dev_printk(KERN_DEBUG, &dev->dev, "supports%s%s\n",
2126                                    dev->d1_support ? " D1" : "",
2127                                    dev->d2_support ? " D2" : "");
2128         }
2129
2130         pmc &= PCI_PM_CAP_PME_MASK;
2131         if (pmc) {
2132                 dev_printk(KERN_DEBUG, &dev->dev,
2133                          "PME# supported from%s%s%s%s%s\n",
2134                          (pmc & PCI_PM_CAP_PME_D0) ? " D0" : "",
2135                          (pmc & PCI_PM_CAP_PME_D1) ? " D1" : "",
2136                          (pmc & PCI_PM_CAP_PME_D2) ? " D2" : "",
2137                          (pmc & PCI_PM_CAP_PME_D3) ? " D3hot" : "",
2138                          (pmc & PCI_PM_CAP_PME_D3cold) ? " D3cold" : "");
2139                 dev->pme_support = pmc >> PCI_PM_CAP_PME_SHIFT;
2140                 dev->pme_poll = true;
2141                 /*
2142                  * Make device's PM flags reflect the wake-up capability, but
2143                  * let the user space enable it to wake up the system as needed.
2144                  */
2145                 device_set_wakeup_capable(&dev->dev, true);
2146                 /* Disable the PME# generation functionality */
2147                 pci_pme_active(dev, false);
2148         }
2149 }
2150
2151 static unsigned long pci_ea_flags(struct pci_dev *dev, u8 prop)
2152 {
2153         unsigned long flags = IORESOURCE_PCI_FIXED;
2154
2155         switch (prop) {
2156         case PCI_EA_P_MEM:
2157         case PCI_EA_P_VF_MEM:
2158                 flags |= IORESOURCE_MEM;
2159                 break;
2160         case PCI_EA_P_MEM_PREFETCH:
2161         case PCI_EA_P_VF_MEM_PREFETCH:
2162                 flags |= IORESOURCE_MEM | IORESOURCE_PREFETCH;
2163                 break;
2164         case PCI_EA_P_IO:
2165                 flags |= IORESOURCE_IO;
2166                 break;
2167         default:
2168                 return 0;
2169         }
2170
2171         return flags;
2172 }
2173
2174 static struct resource *pci_ea_get_resource(struct pci_dev *dev, u8 bei,
2175                                             u8 prop)
2176 {
2177         if (bei <= PCI_EA_BEI_BAR5 && prop <= PCI_EA_P_IO)
2178                 return &dev->resource[bei];
2179 #ifdef CONFIG_PCI_IOV
2180         else if (bei >= PCI_EA_BEI_VF_BAR0 && bei <= PCI_EA_BEI_VF_BAR5 &&
2181                  (prop == PCI_EA_P_VF_MEM || prop == PCI_EA_P_VF_MEM_PREFETCH))
2182                 return &dev->resource[PCI_IOV_RESOURCES +
2183                                       bei - PCI_EA_BEI_VF_BAR0];
2184 #endif
2185         else if (bei == PCI_EA_BEI_ROM)
2186                 return &dev->resource[PCI_ROM_RESOURCE];
2187         else
2188                 return NULL;
2189 }
2190
2191 /* Read an Enhanced Allocation (EA) entry */
2192 static int pci_ea_read(struct pci_dev *dev, int offset)
2193 {
2194         struct resource *res;
2195         int ent_size, ent_offset = offset;
2196         resource_size_t start, end;
2197         unsigned long flags;
2198         u32 dw0, base, max_offset;
2199         u8 prop;
2200         bool support_64 = (sizeof(resource_size_t) >= 8);
2201
2202         pci_read_config_dword(dev, ent_offset, &dw0);
2203         ent_offset += 4;
2204
2205         /* Entry size field indicates DWORDs after 1st */
2206         ent_size = ((dw0 & PCI_EA_ES) + 1) << 2;
2207
2208         if (!(dw0 & PCI_EA_ENABLE)) /* Entry not enabled */
2209                 goto out;
2210
2211         prop = PCI_EA_PP(dw0);
2212         /*
2213          * If the Property is in the reserved range, try the Secondary
2214          * Property instead.
2215          */
2216         if (prop > PCI_EA_P_BRIDGE_IO && prop < PCI_EA_P_MEM_RESERVED)
2217                 prop = PCI_EA_SP(dw0);
2218         if (prop > PCI_EA_P_BRIDGE_IO)
2219                 goto out;
2220
2221         res = pci_ea_get_resource(dev, PCI_EA_BEI(dw0), prop);
2222         if (!res) {
2223                 dev_err(&dev->dev, "Unsupported EA entry BEI: %u\n",
2224                         PCI_EA_BEI(dw0));
2225                 goto out;
2226         }
2227
2228         flags = pci_ea_flags(dev, prop);
2229         if (!flags) {
2230                 dev_err(&dev->dev, "Unsupported EA properties: %#x\n", prop);
2231                 goto out;
2232         }
2233
2234         /* Read Base */
2235         pci_read_config_dword(dev, ent_offset, &base);
2236         start = (base & PCI_EA_FIELD_MASK);
2237         ent_offset += 4;
2238
2239         /* Read MaxOffset */
2240         pci_read_config_dword(dev, ent_offset, &max_offset);
2241         ent_offset += 4;
2242
2243         /* Read Base MSBs (if 64-bit entry) */
2244         if (base & PCI_EA_IS_64) {
2245                 u32 base_upper;
2246
2247                 pci_read_config_dword(dev, ent_offset, &base_upper);
2248                 ent_offset += 4;
2249
2250                 flags |= IORESOURCE_MEM_64;
2251
2252                 /* entry starts above 32-bit boundary, can't use */
2253                 if (!support_64 && base_upper)
2254                         goto out;
2255
2256                 if (support_64)
2257                         start |= ((u64)base_upper << 32);
2258         }
2259
2260         end = start + (max_offset | 0x03);
2261
2262         /* Read MaxOffset MSBs (if 64-bit entry) */
2263         if (max_offset & PCI_EA_IS_64) {
2264                 u32 max_offset_upper;
2265
2266                 pci_read_config_dword(dev, ent_offset, &max_offset_upper);
2267                 ent_offset += 4;
2268
2269                 flags |= IORESOURCE_MEM_64;
2270
2271                 /* entry too big, can't use */
2272                 if (!support_64 && max_offset_upper)
2273                         goto out;
2274
2275                 if (support_64)
2276                         end += ((u64)max_offset_upper << 32);
2277         }
2278
2279         if (end < start) {
2280                 dev_err(&dev->dev, "EA Entry crosses address boundary\n");
2281                 goto out;
2282         }
2283
2284         if (ent_size != ent_offset - offset) {
2285                 dev_err(&dev->dev,
2286                         "EA Entry Size (%d) does not match length read (%d)\n",
2287                         ent_size, ent_offset - offset);
2288                 goto out;
2289         }
2290
2291         res->name = pci_name(dev);
2292         res->start = start;
2293         res->end = end;
2294         res->flags = flags;
2295         dev_printk(KERN_DEBUG, &dev->dev, "EA - BEI %2u, Prop 0x%02x: %pR\n",
2296                    PCI_EA_BEI(dw0), prop, res);
2297 out:
2298         return offset + ent_size;
2299 }
2300
2301 /* Enhanced Allocation Initalization */
2302 void pci_ea_init(struct pci_dev *dev)
2303 {
2304         int ea;
2305         u8 num_ent;
2306         int offset;
2307         int i;
2308
2309         /* find PCI EA capability in list */
2310         ea = pci_find_capability(dev, PCI_CAP_ID_EA);
2311         if (!ea)
2312                 return;
2313
2314         /* determine the number of entries */
2315         pci_bus_read_config_byte(dev->bus, dev->devfn, ea + PCI_EA_NUM_ENT,
2316                                         &num_ent);
2317         num_ent &= PCI_EA_NUM_ENT_MASK;
2318
2319         offset = ea + PCI_EA_FIRST_ENT;
2320
2321         /* Skip DWORD 2 for type 1 functions */
2322         if (dev->hdr_type == PCI_HEADER_TYPE_BRIDGE)
2323                 offset += 4;
2324
2325         /* parse each EA entry */
2326         for (i = 0; i < num_ent; ++i)
2327                 offset = pci_ea_read(dev, offset);
2328 }
2329
2330 static void pci_add_saved_cap(struct pci_dev *pci_dev,
2331         struct pci_cap_saved_state *new_cap)
2332 {
2333         hlist_add_head(&new_cap->next, &pci_dev->saved_cap_space);
2334 }
2335
2336 /**
2337  * _pci_add_cap_save_buffer - allocate buffer for saving given
2338  *                            capability registers
2339  * @dev: the PCI device
2340  * @cap: the capability to allocate the buffer for
2341  * @extended: Standard or Extended capability ID
2342  * @size: requested size of the buffer
2343  */
2344 static int _pci_add_cap_save_buffer(struct pci_dev *dev, u16 cap,
2345                                     bool extended, unsigned int size)
2346 {
2347         int pos;
2348         struct pci_cap_saved_state *save_state;
2349
2350         if (extended)
2351                 pos = pci_find_ext_capability(dev, cap);
2352         else
2353                 pos = pci_find_capability(dev, cap);
2354
2355         if (!pos)
2356                 return 0;
2357
2358         save_state = kzalloc(sizeof(*save_state) + size, GFP_KERNEL);
2359         if (!save_state)
2360                 return -ENOMEM;
2361
2362         save_state->cap.cap_nr = cap;
2363         save_state->cap.cap_extended = extended;
2364         save_state->cap.size = size;
2365         pci_add_saved_cap(dev, save_state);
2366
2367         return 0;
2368 }
2369
2370 int pci_add_cap_save_buffer(struct pci_dev *dev, char cap, unsigned int size)
2371 {
2372         return _pci_add_cap_save_buffer(dev, cap, false, size);
2373 }
2374
2375 int pci_add_ext_cap_save_buffer(struct pci_dev *dev, u16 cap, unsigned int size)
2376 {
2377         return _pci_add_cap_save_buffer(dev, cap, true, size);
2378 }
2379
2380 /**
2381  * pci_allocate_cap_save_buffers - allocate buffers for saving capabilities
2382  * @dev: the PCI device
2383  */
2384 void pci_allocate_cap_save_buffers(struct pci_dev *dev)
2385 {
2386         int error;
2387
2388         error = pci_add_cap_save_buffer(dev, PCI_CAP_ID_EXP,
2389                                         PCI_EXP_SAVE_REGS * sizeof(u16));
2390         if (error)
2391                 dev_err(&dev->dev,
2392                         "unable to preallocate PCI Express save buffer\n");
2393
2394         error = pci_add_cap_save_buffer(dev, PCI_CAP_ID_PCIX, sizeof(u16));
2395         if (error)
2396                 dev_err(&dev->dev,
2397                         "unable to preallocate PCI-X save buffer\n");
2398
2399         pci_allocate_vc_save_buffers(dev);
2400 }
2401
2402 void pci_free_cap_save_buffers(struct pci_dev *dev)
2403 {
2404         struct pci_cap_saved_state *tmp;
2405         struct hlist_node *n;
2406
2407         hlist_for_each_entry_safe(tmp, n, &dev->saved_cap_space, next)
2408                 kfree(tmp);
2409 }
2410
2411 /**
2412  * pci_configure_ari - enable or disable ARI forwarding
2413  * @dev: the PCI device
2414  *
2415  * If @dev and its upstream bridge both support ARI, enable ARI in the
2416  * bridge.  Otherwise, disable ARI in the bridge.
2417  */
2418 void pci_configure_ari(struct pci_dev *dev)
2419 {
2420         u32 cap;
2421         struct pci_dev *bridge;
2422
2423         if (pcie_ari_disabled || !pci_is_pcie(dev) || dev->devfn)
2424                 return;
2425
2426         bridge = dev->bus->self;
2427         if (!bridge)
2428                 return;
2429
2430         pcie_capability_read_dword(bridge, PCI_EXP_DEVCAP2, &cap);
2431         if (!(cap & PCI_EXP_DEVCAP2_ARI))
2432                 return;
2433
2434         if (pci_find_ext_capability(dev, PCI_EXT_CAP_ID_ARI)) {
2435                 pcie_capability_set_word(bridge, PCI_EXP_DEVCTL2,
2436                                          PCI_EXP_DEVCTL2_ARI);
2437                 bridge->ari_enabled = 1;
2438         } else {
2439                 pcie_capability_clear_word(bridge, PCI_EXP_DEVCTL2,
2440                                            PCI_EXP_DEVCTL2_ARI);
2441                 bridge->ari_enabled = 0;
2442         }
2443 }
2444
2445 static int pci_acs_enable;
2446
2447 /**
2448  * pci_request_acs - ask for ACS to be enabled if supported
2449  */
2450 void pci_request_acs(void)
2451 {
2452         pci_acs_enable = 1;
2453 }
2454
2455 /**
2456  * pci_std_enable_acs - enable ACS on devices using standard ACS capabilites
2457  * @dev: the PCI device
2458  */
2459 static int pci_std_enable_acs(struct pci_dev *dev)
2460 {
2461         int pos;
2462         u16 cap;
2463         u16 ctrl;
2464
2465         pos = pci_find_ext_capability(dev, PCI_EXT_CAP_ID_ACS);
2466         if (!pos)
2467                 return -ENODEV;
2468
2469         pci_read_config_word(dev, pos + PCI_ACS_CAP, &cap);
2470         pci_read_config_word(dev, pos + PCI_ACS_CTRL, &ctrl);
2471
2472         /* Source Validation */
2473         ctrl |= (cap & PCI_ACS_SV);
2474
2475         /* P2P Request Redirect */
2476         ctrl |= (cap & PCI_ACS_RR);
2477
2478         /* P2P Completion Redirect */
2479         ctrl |= (cap & PCI_ACS_CR);
2480
2481         /* Upstream Forwarding */
2482         ctrl |= (cap & PCI_ACS_UF);
2483
2484         pci_write_config_word(dev, pos + PCI_ACS_CTRL, ctrl);
2485
2486         return 0;
2487 }
2488
2489 /**
2490  * pci_enable_acs - enable ACS if hardware support it
2491  * @dev: the PCI device
2492  */
2493 void pci_enable_acs(struct pci_dev *dev)
2494 {
2495         if (!pci_acs_enable)
2496                 return;
2497
2498         if (!pci_std_enable_acs(dev))
2499                 return;
2500
2501         pci_dev_specific_enable_acs(dev);
2502 }
2503
2504 static bool pci_acs_flags_enabled(struct pci_dev *pdev, u16 acs_flags)
2505 {
2506         int pos;
2507         u16 cap, ctrl;
2508
2509         pos = pci_find_ext_capability(pdev, PCI_EXT_CAP_ID_ACS);
2510         if (!pos)
2511                 return false;
2512
2513         /*
2514          * Except for egress control, capabilities are either required
2515          * or only required if controllable.  Features missing from the
2516          * capability field can therefore be assumed as hard-wired enabled.
2517          */
2518         pci_read_config_word(pdev, pos + PCI_ACS_CAP, &cap);
2519         acs_flags &= (cap | PCI_ACS_EC);
2520
2521         pci_read_config_word(pdev, pos + PCI_ACS_CTRL, &ctrl);
2522         return (ctrl & acs_flags) == acs_flags;
2523 }
2524
2525 /**
2526  * pci_acs_enabled - test ACS against required flags for a given device
2527  * @pdev: device to test
2528  * @acs_flags: required PCI ACS flags
2529  *
2530  * Return true if the device supports the provided flags.  Automatically
2531  * filters out flags that are not implemented on multifunction devices.
2532  *
2533  * Note that this interface checks the effective ACS capabilities of the
2534  * device rather than the actual capabilities.  For instance, most single
2535  * function endpoints are not required to support ACS because they have no
2536  * opportunity for peer-to-peer access.  We therefore return 'true'
2537  * regardless of whether the device exposes an ACS capability.  This makes
2538  * it much easier for callers of this function to ignore the actual type
2539  * or topology of the device when testing ACS support.
2540  */
2541 bool pci_acs_enabled(struct pci_dev *pdev, u16 acs_flags)
2542 {
2543         int ret;
2544
2545         ret = pci_dev_specific_acs_enabled(pdev, acs_flags);
2546         if (ret >= 0)
2547                 return ret > 0;
2548
2549         /*
2550          * Conventional PCI and PCI-X devices never support ACS, either
2551          * effectively or actually.  The shared bus topology implies that
2552          * any device on the bus can receive or snoop DMA.
2553          */
2554         if (!pci_is_pcie(pdev))
2555                 return false;
2556
2557         switch (pci_pcie_type(pdev)) {
2558         /*
2559          * PCI/X-to-PCIe bridges are not specifically mentioned by the spec,
2560          * but since their primary interface is PCI/X, we conservatively
2561          * handle them as we would a non-PCIe device.
2562          */
2563         case PCI_EXP_TYPE_PCIE_BRIDGE:
2564         /*
2565          * PCIe 3.0, 6.12.1 excludes ACS on these devices.  "ACS is never
2566          * applicable... must never implement an ACS Extended Capability...".
2567          * This seems arbitrary, but we take a conservative interpretation
2568          * of this statement.
2569          */
2570         case PCI_EXP_TYPE_PCI_BRIDGE:
2571         case PCI_EXP_TYPE_RC_EC:
2572                 return false;
2573         /*
2574          * PCIe 3.0, 6.12.1.1 specifies that downstream and root ports should
2575          * implement ACS in order to indicate their peer-to-peer capabilities,
2576          * regardless of whether they are single- or multi-function devices.
2577          */
2578         case PCI_EXP_TYPE_DOWNSTREAM:
2579         case PCI_EXP_TYPE_ROOT_PORT:
2580                 return pci_acs_flags_enabled(pdev, acs_flags);
2581         /*
2582          * PCIe 3.0, 6.12.1.2 specifies ACS capabilities that should be
2583          * implemented by the remaining PCIe types to indicate peer-to-peer
2584          * capabilities, but only when they are part of a multifunction
2585          * device.  The footnote for section 6.12 indicates the specific
2586          * PCIe types included here.
2587          */
2588         case PCI_EXP_TYPE_ENDPOINT:
2589         case PCI_EXP_TYPE_UPSTREAM:
2590         case PCI_EXP_TYPE_LEG_END:
2591         case PCI_EXP_TYPE_RC_END:
2592                 if (!pdev->multifunction)
2593                         break;
2594
2595                 return pci_acs_flags_enabled(pdev, acs_flags);
2596         }
2597
2598         /*
2599          * PCIe 3.0, 6.12.1.3 specifies no ACS capabilities are applicable
2600          * to single function devices with the exception of downstream ports.
2601          */
2602         return true;
2603 }
2604
2605 /**
2606  * pci_acs_path_enable - test ACS flags from start to end in a hierarchy
2607  * @start: starting downstream device
2608  * @end: ending upstream device or NULL to search to the root bus
2609  * @acs_flags: required flags
2610  *
2611  * Walk up a device tree from start to end testing PCI ACS support.  If
2612  * any step along the way does not support the required flags, return false.
2613  */
2614 bool pci_acs_path_enabled(struct pci_dev *start,
2615                           struct pci_dev *end, u16 acs_flags)
2616 {
2617         struct pci_dev *pdev, *parent = start;
2618
2619         do {
2620                 pdev = parent;
2621
2622                 if (!pci_acs_enabled(pdev, acs_flags))
2623                         return false;
2624
2625                 if (pci_is_root_bus(pdev->bus))
2626                         return (end == NULL);
2627
2628                 parent = pdev->bus->self;
2629         } while (pdev != end);
2630
2631         return true;
2632 }
2633
2634 /**
2635  * pci_swizzle_interrupt_pin - swizzle INTx for device behind bridge
2636  * @dev: the PCI device
2637  * @pin: the INTx pin (1=INTA, 2=INTB, 3=INTC, 4=INTD)
2638  *
2639  * Perform INTx swizzling for a device behind one level of bridge.  This is
2640  * required by section 9.1 of the PCI-to-PCI bridge specification for devices
2641  * behind bridges on add-in cards.  For devices with ARI enabled, the slot
2642  * number is always 0 (see the Implementation Note in section 2.2.8.1 of
2643  * the PCI Express Base Specification, Revision 2.1)
2644  */
2645 u8 pci_swizzle_interrupt_pin(const struct pci_dev *dev, u8 pin)
2646 {
2647         int slot;
2648
2649         if (pci_ari_enabled(dev->bus))
2650                 slot = 0;
2651         else
2652                 slot = PCI_SLOT(dev->devfn);
2653
2654         return (((pin - 1) + slot) % 4) + 1;
2655 }
2656
2657 int pci_get_interrupt_pin(struct pci_dev *dev, struct pci_dev **bridge)
2658 {
2659         u8 pin;
2660
2661         pin = dev->pin;
2662         if (!pin)
2663                 return -1;
2664
2665         while (!pci_is_root_bus(dev->bus)) {
2666                 pin = pci_swizzle_interrupt_pin(dev, pin);
2667                 dev = dev->bus->self;
2668         }
2669         *bridge = dev;
2670         return pin;
2671 }
2672
2673 /**
2674  * pci_common_swizzle - swizzle INTx all the way to root bridge
2675  * @dev: the PCI device
2676  * @pinp: pointer to the INTx pin value (1=INTA, 2=INTB, 3=INTD, 4=INTD)
2677  *
2678  * Perform INTx swizzling for a device.  This traverses through all PCI-to-PCI
2679  * bridges all the way up to a PCI root bus.
2680  */
2681 u8 pci_common_swizzle(struct pci_dev *dev, u8 *pinp)
2682 {
2683         u8 pin = *pinp;
2684
2685         while (!pci_is_root_bus(dev->bus)) {
2686                 pin = pci_swizzle_interrupt_pin(dev, pin);
2687                 dev = dev->bus->self;
2688         }
2689         *pinp = pin;
2690         return PCI_SLOT(dev->devfn);
2691 }
2692 EXPORT_SYMBOL_GPL(pci_common_swizzle);
2693
2694 /**
2695  *      pci_release_region - Release a PCI bar
2696  *      @pdev: PCI device whose resources were previously reserved by pci_request_region
2697  *      @bar: BAR to release
2698  *
2699  *      Releases the PCI I/O and memory resources previously reserved by a
2700  *      successful call to pci_request_region.  Call this function only
2701  *      after all use of the PCI regions has ceased.
2702  */
2703 void pci_release_region(struct pci_dev *pdev, int bar)
2704 {
2705         struct pci_devres *dr;
2706
2707         if (pci_resource_len(pdev, bar) == 0)
2708                 return;
2709         if (pci_resource_flags(pdev, bar) & IORESOURCE_IO)
2710                 release_region(pci_resource_start(pdev, bar),
2711                                 pci_resource_len(pdev, bar));
2712         else if (pci_resource_flags(pdev, bar) & IORESOURCE_MEM)
2713                 release_mem_region(pci_resource_start(pdev, bar),
2714                                 pci_resource_len(pdev, bar));
2715
2716         dr = find_pci_dr(pdev);
2717         if (dr)
2718                 dr->region_mask &= ~(1 << bar);
2719 }
2720 EXPORT_SYMBOL(pci_release_region);
2721
2722 /**
2723  *      __pci_request_region - Reserved PCI I/O and memory resource
2724  *      @pdev: PCI device whose resources are to be reserved
2725  *      @bar: BAR to be reserved
2726  *      @res_name: Name to be associated with resource.
2727  *      @exclusive: whether the region access is exclusive or not
2728  *
2729  *      Mark the PCI region associated with PCI device @pdev BR @bar as
2730  *      being reserved by owner @res_name.  Do not access any
2731  *      address inside the PCI regions unless this call returns
2732  *      successfully.
2733  *
2734  *      If @exclusive is set, then the region is marked so that userspace
2735  *      is explicitly not allowed to map the resource via /dev/mem or
2736  *      sysfs MMIO access.
2737  *
2738  *      Returns 0 on success, or %EBUSY on error.  A warning
2739  *      message is also printed on failure.
2740  */
2741 static int __pci_request_region(struct pci_dev *pdev, int bar,
2742                                 const char *res_name, int exclusive)
2743 {
2744         struct pci_devres *dr;
2745
2746         if (pci_resource_len(pdev, bar) == 0)
2747                 return 0;
2748
2749         if (pci_resource_flags(pdev, bar) & IORESOURCE_IO) {
2750                 if (!request_region(pci_resource_start(pdev, bar),
2751                             pci_resource_len(pdev, bar), res_name))
2752                         goto err_out;
2753         } else if (pci_resource_flags(pdev, bar) & IORESOURCE_MEM) {
2754                 if (!__request_mem_region(pci_resource_start(pdev, bar),
2755                                         pci_resource_len(pdev, bar), res_name,
2756                                         exclusive))
2757                         goto err_out;
2758         }
2759
2760         dr = find_pci_dr(pdev);
2761         if (dr)
2762                 dr->region_mask |= 1 << bar;
2763
2764         return 0;
2765
2766 err_out:
2767         dev_warn(&pdev->dev, "BAR %d: can't reserve %pR\n", bar,
2768                  &pdev->resource[bar]);
2769         return -EBUSY;
2770 }
2771
2772 /**
2773  *      pci_request_region - Reserve PCI I/O and memory resource
2774  *      @pdev: PCI device whose resources are to be reserved
2775  *      @bar: BAR to be reserved
2776  *      @res_name: Name to be associated with resource
2777  *
2778  *      Mark the PCI region associated with PCI device @pdev BAR @bar as
2779  *      being reserved by owner @res_name.  Do not access any
2780  *      address inside the PCI regions unless this call returns
2781  *      successfully.
2782  *
2783  *      Returns 0 on success, or %EBUSY on error.  A warning
2784  *      message is also printed on failure.
2785  */
2786 int pci_request_region(struct pci_dev *pdev, int bar, const char *res_name)
2787 {
2788         return __pci_request_region(pdev, bar, res_name, 0);
2789 }
2790 EXPORT_SYMBOL(pci_request_region);
2791
2792 /**
2793  *      pci_request_region_exclusive - Reserved PCI I/O and memory resource
2794  *      @pdev: PCI device whose resources are to be reserved
2795  *      @bar: BAR to be reserved
2796  *      @res_name: Name to be associated with resource.
2797  *
2798  *      Mark the PCI region associated with PCI device @pdev BR @bar as
2799  *      being reserved by owner @res_name.  Do not access any
2800  *      address inside the PCI regions unless this call returns
2801  *      successfully.
2802  *
2803  *      Returns 0 on success, or %EBUSY on error.  A warning
2804  *      message is also printed on failure.
2805  *
2806  *      The key difference that _exclusive makes it that userspace is
2807  *      explicitly not allowed to map the resource via /dev/mem or
2808  *      sysfs.
2809  */
2810 int pci_request_region_exclusive(struct pci_dev *pdev, int bar,
2811                                  const char *res_name)
2812 {
2813         return __pci_request_region(pdev, bar, res_name, IORESOURCE_EXCLUSIVE);
2814 }
2815 EXPORT_SYMBOL(pci_request_region_exclusive);
2816
2817 /**
2818  * pci_release_selected_regions - Release selected PCI I/O and memory resources
2819  * @pdev: PCI device whose resources were previously reserved
2820  * @bars: Bitmask of BARs to be released
2821  *
2822  * Release selected PCI I/O and memory resources previously reserved.
2823  * Call this function only after all use of the PCI regions has ceased.
2824  */
2825 void pci_release_selected_regions(struct pci_dev *pdev, int bars)
2826 {
2827         int i;
2828
2829         for (i = 0; i < 6; i++)
2830                 if (bars & (1 << i))
2831                         pci_release_region(pdev, i);
2832 }
2833 EXPORT_SYMBOL(pci_release_selected_regions);
2834
2835 static int __pci_request_selected_regions(struct pci_dev *pdev, int bars,
2836                                           const char *res_name, int excl)
2837 {
2838         int i;
2839
2840         for (i = 0; i < 6; i++)
2841                 if (bars & (1 << i))
2842                         if (__pci_request_region(pdev, i, res_name, excl))
2843                                 goto err_out;
2844         return 0;
2845
2846 err_out:
2847         while (--i >= 0)
2848                 if (bars & (1 << i))
2849                         pci_release_region(pdev, i);
2850
2851         return -EBUSY;
2852 }
2853
2854
2855 /**
2856  * pci_request_selected_regions - Reserve selected PCI I/O and memory resources
2857  * @pdev: PCI device whose resources are to be reserved
2858  * @bars: Bitmask of BARs to be requested
2859  * @res_name: Name to be associated with resource
2860  */
2861 int pci_request_selected_regions(struct pci_dev *pdev, int bars,
2862                                  const char *res_name)
2863 {
2864         return __pci_request_selected_regions(pdev, bars, res_name, 0);
2865 }
2866 EXPORT_SYMBOL(pci_request_selected_regions);
2867
2868 int pci_request_selected_regions_exclusive(struct pci_dev *pdev, int bars,
2869                                            const char *res_name)
2870 {
2871         return __pci_request_selected_regions(pdev, bars, res_name,
2872                         IORESOURCE_EXCLUSIVE);
2873 }
2874 EXPORT_SYMBOL(pci_request_selected_regions_exclusive);
2875
2876 /**
2877  *      pci_release_regions - Release reserved PCI I/O and memory resources
2878  *      @pdev: PCI device whose resources were previously reserved by pci_request_regions
2879  *
2880  *      Releases all PCI I/O and memory resources previously reserved by a
2881  *      successful call to pci_request_regions.  Call this function only
2882  *      after all use of the PCI regions has ceased.
2883  */
2884
2885 void pci_release_regions(struct pci_dev *pdev)
2886 {
2887         pci_release_selected_regions(pdev, (1 << 6) - 1);
2888 }
2889 EXPORT_SYMBOL(pci_release_regions);
2890
2891 /**
2892  *      pci_request_regions - Reserved PCI I/O and memory resources
2893  *      @pdev: PCI device whose resources are to be reserved
2894  *      @res_name: Name to be associated with resource.
2895  *
2896  *      Mark all PCI regions associated with PCI device @pdev as
2897  *      being reserved by owner @res_name.  Do not access any
2898  *      address inside the PCI regions unless this call returns
2899  *      successfully.
2900  *
2901  *      Returns 0 on success, or %EBUSY on error.  A warning
2902  *      message is also printed on failure.
2903  */
2904 int pci_request_regions(struct pci_dev *pdev, const char *res_name)
2905 {
2906         return pci_request_selected_regions(pdev, ((1 << 6) - 1), res_name);
2907 }
2908 EXPORT_SYMBOL(pci_request_regions);
2909
2910 /**
2911  *      pci_request_regions_exclusive - Reserved PCI I/O and memory resources
2912  *      @pdev: PCI device whose resources are to be reserved
2913  *      @res_name: Name to be associated with resource.
2914  *
2915  *      Mark all PCI regions associated with PCI device @pdev as
2916  *      being reserved by owner @res_name.  Do not access any
2917  *      address inside the PCI regions unless this call returns
2918  *      successfully.
2919  *
2920  *      pci_request_regions_exclusive() will mark the region so that
2921  *      /dev/mem and the sysfs MMIO access will not be allowed.
2922  *
2923  *      Returns 0 on success, or %EBUSY on error.  A warning
2924  *      message is also printed on failure.
2925  */
2926 int pci_request_regions_exclusive(struct pci_dev *pdev, const char *res_name)
2927 {
2928         return pci_request_selected_regions_exclusive(pdev,
2929                                         ((1 << 6) - 1), res_name);
2930 }
2931 EXPORT_SYMBOL(pci_request_regions_exclusive);
2932
2933 /**
2934  *      pci_remap_iospace - Remap the memory mapped I/O space
2935  *      @res: Resource describing the I/O space
2936  *      @phys_addr: physical address of range to be mapped
2937  *
2938  *      Remap the memory mapped I/O space described by the @res
2939  *      and the CPU physical address @phys_addr into virtual address space.
2940  *      Only architectures that have memory mapped IO functions defined
2941  *      (and the PCI_IOBASE value defined) should call this function.
2942  */
2943 int __weak pci_remap_iospace(const struct resource *res, phys_addr_t phys_addr)
2944 {
2945 #if defined(PCI_IOBASE) && defined(CONFIG_MMU)
2946         unsigned long vaddr = (unsigned long)PCI_IOBASE + res->start;
2947
2948         if (!(res->flags & IORESOURCE_IO))
2949                 return -EINVAL;
2950
2951         if (res->end > IO_SPACE_LIMIT)
2952                 return -EINVAL;
2953
2954         return ioremap_page_range(vaddr, vaddr + resource_size(res), phys_addr,
2955                                   pgprot_device(PAGE_KERNEL));
2956 #else
2957         /* this architecture does not have memory mapped I/O space,
2958            so this function should never be called */
2959         WARN_ONCE(1, "This architecture does not support memory mapped I/O\n");
2960         return -ENODEV;
2961 #endif
2962 }
2963
2964 static void __pci_set_master(struct pci_dev *dev, bool enable)
2965 {
2966         u16 old_cmd, cmd;
2967
2968         pci_read_config_word(dev, PCI_COMMAND, &old_cmd);
2969         if (enable)
2970                 cmd = old_cmd | PCI_COMMAND_MASTER;
2971         else
2972                 cmd = old_cmd & ~PCI_COMMAND_MASTER;
2973         if (cmd != old_cmd) {
2974                 dev_dbg(&dev->dev, "%s bus mastering\n",
2975                         enable ? "enabling" : "disabling");
2976                 pci_write_config_word(dev, PCI_COMMAND, cmd);
2977         }
2978         dev->is_busmaster = enable;
2979 }
2980
2981 /**
2982  * pcibios_setup - process "pci=" kernel boot arguments
2983  * @str: string used to pass in "pci=" kernel boot arguments
2984  *
2985  * Process kernel boot arguments.  This is the default implementation.
2986  * Architecture specific implementations can override this as necessary.
2987  */
2988 char * __weak __init pcibios_setup(char *str)
2989 {
2990         return str;
2991 }
2992
2993 /**
2994  * pcibios_set_master - enable PCI bus-mastering for device dev
2995  * @dev: the PCI device to enable
2996  *
2997  * Enables PCI bus-mastering for the device.  This is the default
2998  * implementation.  Architecture specific implementations can override
2999  * this if necessary.
3000  */
3001 void __weak pcibios_set_master(struct pci_dev *dev)
3002 {
3003         u8 lat;
3004
3005         /* The latency timer doesn't apply to PCIe (either Type 0 or Type 1) */
3006         if (pci_is_pcie(dev))
3007                 return;
3008
3009         pci_read_config_byte(dev, PCI_LATENCY_TIMER, &lat);
3010         if (lat < 16)
3011                 lat = (64 <= pcibios_max_latency) ? 64 : pcibios_max_latency;
3012         else if (lat > pcibios_max_latency)
3013                 lat = pcibios_max_latency;
3014         else
3015                 return;
3016
3017         pci_write_config_byte(dev, PCI_LATENCY_TIMER, lat);
3018 }
3019
3020 /**
3021  * pci_set_master - enables bus-mastering for device dev
3022  * @dev: the PCI device to enable
3023  *
3024  * Enables bus-mastering on the device and calls pcibios_set_master()
3025  * to do the needed arch specific settings.
3026  */
3027 void pci_set_master(struct pci_dev *dev)
3028 {
3029         __pci_set_master(dev, true);
3030         pcibios_set_master(dev);
3031 }
3032 EXPORT_SYMBOL(pci_set_master);
3033
3034 /**
3035  * pci_clear_master - disables bus-mastering for device dev
3036  * @dev: the PCI device to disable
3037  */
3038 void pci_clear_master(struct pci_dev *dev)
3039 {
3040         __pci_set_master(dev, false);
3041 }
3042 EXPORT_SYMBOL(pci_clear_master);
3043
3044 /**
3045  * pci_set_cacheline_size - ensure the CACHE_LINE_SIZE register is programmed
3046  * @dev: the PCI device for which MWI is to be enabled
3047  *
3048  * Helper function for pci_set_mwi.
3049  * Originally copied from drivers/net/acenic.c.
3050  * Copyright 1998-2001 by Jes Sorensen, <jes@trained-monkey.org>.
3051  *
3052  * RETURNS: An appropriate -ERRNO error value on error, or zero for success.
3053  */
3054 int pci_set_cacheline_size(struct pci_dev *dev)
3055 {
3056         u8 cacheline_size;
3057
3058         if (!pci_cache_line_size)
3059                 return -EINVAL;
3060
3061         /* Validate current setting: the PCI_CACHE_LINE_SIZE must be
3062            equal to or multiple of the right value. */
3063         pci_read_config_byte(dev, PCI_CACHE_LINE_SIZE, &cacheline_size);
3064         if (cacheline_size >= pci_cache_line_size &&
3065             (cacheline_size % pci_cache_line_size) == 0)
3066                 return 0;
3067
3068         /* Write the correct value. */
3069         pci_write_config_byte(dev, PCI_CACHE_LINE_SIZE, pci_cache_line_size);
3070         /* Read it back. */
3071         pci_read_config_byte(dev, PCI_CACHE_LINE_SIZE, &cacheline_size);
3072         if (cacheline_size == pci_cache_line_size)
3073                 return 0;
3074
3075         dev_printk(KERN_DEBUG, &dev->dev, "cache line size of %d is not supported\n",
3076                    pci_cache_line_size << 2);
3077
3078         return -EINVAL;
3079 }
3080 EXPORT_SYMBOL_GPL(pci_set_cacheline_size);
3081
3082 /**
3083  * pci_set_mwi - enables memory-write-invalidate PCI transaction
3084  * @dev: the PCI device for which MWI is enabled
3085  *
3086  * Enables the Memory-Write-Invalidate transaction in %PCI_COMMAND.
3087  *
3088  * RETURNS: An appropriate -ERRNO error value on error, or zero for success.
3089  */
3090 int pci_set_mwi(struct pci_dev *dev)
3091 {
3092 #ifdef PCI_DISABLE_MWI
3093         return 0;
3094 #else
3095         int rc;
3096         u16 cmd;
3097
3098         rc = pci_set_cacheline_size(dev);
3099         if (rc)
3100                 return rc;
3101
3102         pci_read_config_word(dev, PCI_COMMAND, &cmd);
3103         if (!(cmd & PCI_COMMAND_INVALIDATE)) {
3104                 dev_dbg(&dev->dev, "enabling Mem-Wr-Inval\n");
3105                 cmd |= PCI_COMMAND_INVALIDATE;
3106                 pci_write_config_word(dev, PCI_COMMAND, cmd);
3107         }
3108         return 0;
3109 #endif
3110 }
3111 EXPORT_SYMBOL(pci_set_mwi);
3112
3113 /**
3114  * pci_try_set_mwi - enables memory-write-invalidate PCI transaction
3115  * @dev: the PCI device for which MWI is enabled
3116  *
3117  * Enables the Memory-Write-Invalidate transaction in %PCI_COMMAND.
3118  * Callers are not required to check the return value.
3119  *
3120  * RETURNS: An appropriate -ERRNO error value on error, or zero for success.
3121  */
3122 int pci_try_set_mwi(struct pci_dev *dev)
3123 {
3124 #ifdef PCI_DISABLE_MWI
3125         return 0;
3126 #else
3127         return pci_set_mwi(dev);
3128 #endif
3129 }
3130 EXPORT_SYMBOL(pci_try_set_mwi);
3131
3132 /**
3133  * pci_clear_mwi - disables Memory-Write-Invalidate for device dev
3134  * @dev: the PCI device to disable
3135  *
3136  * Disables PCI Memory-Write-Invalidate transaction on the device
3137  */
3138 void pci_clear_mwi(struct pci_dev *dev)
3139 {
3140 #ifndef PCI_DISABLE_MWI
3141         u16 cmd;
3142
3143         pci_read_config_word(dev, PCI_COMMAND, &cmd);
3144         if (cmd & PCI_COMMAND_INVALIDATE) {
3145                 cmd &= ~PCI_COMMAND_INVALIDATE;
3146                 pci_write_config_word(dev, PCI_COMMAND, cmd);
3147         }
3148 #endif
3149 }
3150 EXPORT_SYMBOL(pci_clear_mwi);
3151
3152 /**
3153  * pci_intx - enables/disables PCI INTx for device dev
3154  * @pdev: the PCI device to operate on
3155  * @enable: boolean: whether to enable or disable PCI INTx
3156  *
3157  * Enables/disables PCI INTx for device dev
3158  */
3159 void pci_intx(struct pci_dev *pdev, int enable)
3160 {
3161         u16 pci_command, new;
3162
3163         pci_read_config_word(pdev, PCI_COMMAND, &pci_command);
3164
3165         if (enable)
3166                 new = pci_command & ~PCI_COMMAND_INTX_DISABLE;
3167         else
3168                 new = pci_command | PCI_COMMAND_INTX_DISABLE;
3169
3170         if (new != pci_command) {
3171                 struct pci_devres *dr;
3172
3173                 pci_write_config_word(pdev, PCI_COMMAND, new);
3174
3175                 dr = find_pci_dr(pdev);
3176                 if (dr && !dr->restore_intx) {
3177                         dr->restore_intx = 1;
3178                         dr->orig_intx = !enable;
3179                 }
3180         }
3181 }
3182 EXPORT_SYMBOL_GPL(pci_intx);
3183
3184 /**
3185  * pci_intx_mask_supported - probe for INTx masking support
3186  * @dev: the PCI device to operate on
3187  *
3188  * Check if the device dev support INTx masking via the config space
3189  * command word.
3190  */
3191 bool pci_intx_mask_supported(struct pci_dev *dev)
3192 {
3193         bool mask_supported = false;
3194         u16 orig, new;
3195
3196         if (dev->broken_intx_masking)
3197                 return false;
3198
3199         pci_cfg_access_lock(dev);
3200
3201         pci_read_config_word(dev, PCI_COMMAND, &orig);
3202         pci_write_config_word(dev, PCI_COMMAND,
3203                               orig ^ PCI_COMMAND_INTX_DISABLE);
3204         pci_read_config_word(dev, PCI_COMMAND, &new);
3205
3206         /*
3207          * There's no way to protect against hardware bugs or detect them
3208          * reliably, but as long as we know what the value should be, let's
3209          * go ahead and check it.
3210          */
3211         if ((new ^ orig) & ~PCI_COMMAND_INTX_DISABLE) {
3212                 dev_err(&dev->dev, "Command register changed from 0x%x to 0x%x: driver or hardware bug?\n",
3213                         orig, new);
3214         } else if ((new ^ orig) & PCI_COMMAND_INTX_DISABLE) {
3215                 mask_supported = true;
3216                 pci_write_config_word(dev, PCI_COMMAND, orig);
3217         }
3218
3219         pci_cfg_access_unlock(dev);
3220         return mask_supported;
3221 }
3222 EXPORT_SYMBOL_GPL(pci_intx_mask_supported);
3223
3224 static bool pci_check_and_set_intx_mask(struct pci_dev *dev, bool mask)
3225 {
3226         struct pci_bus *bus = dev->bus;
3227         bool mask_updated = true;
3228         u32 cmd_status_dword;
3229         u16 origcmd, newcmd;
3230         unsigned long flags;
3231         bool irq_pending;
3232
3233         /*
3234          * We do a single dword read to retrieve both command and status.
3235          * Document assumptions that make this possible.
3236          */
3237         BUILD_BUG_ON(PCI_COMMAND % 4);
3238         BUILD_BUG_ON(PCI_COMMAND + 2 != PCI_STATUS);
3239
3240         raw_spin_lock_irqsave(&pci_lock, flags);
3241
3242         bus->ops->read(bus, dev->devfn, PCI_COMMAND, 4, &cmd_status_dword);
3243
3244         irq_pending = (cmd_status_dword >> 16) & PCI_STATUS_INTERRUPT;
3245
3246         /*
3247          * Check interrupt status register to see whether our device
3248          * triggered the interrupt (when masking) or the next IRQ is
3249          * already pending (when unmasking).
3250          */
3251         if (mask != irq_pending) {
3252                 mask_updated = false;
3253                 goto done;
3254         }
3255
3256         origcmd = cmd_status_dword;
3257         newcmd = origcmd & ~PCI_COMMAND_INTX_DISABLE;
3258         if (mask)
3259                 newcmd |= PCI_COMMAND_INTX_DISABLE;
3260         if (newcmd != origcmd)
3261                 bus->ops->write(bus, dev->devfn, PCI_COMMAND, 2, newcmd);
3262
3263 done:
3264         raw_spin_unlock_irqrestore(&pci_lock, flags);
3265
3266         return mask_updated;
3267 }
3268
3269 /**
3270  * pci_check_and_mask_intx - mask INTx on pending interrupt
3271  * @dev: the PCI device to operate on
3272  *
3273  * Check if the device dev has its INTx line asserted, mask it and
3274  * return true in that case. False is returned if not interrupt was
3275  * pending.
3276  */
3277 bool pci_check_and_mask_intx(struct pci_dev *dev)
3278 {
3279         return pci_check_and_set_intx_mask(dev, true);
3280 }
3281 EXPORT_SYMBOL_GPL(pci_check_and_mask_intx);
3282
3283 /**
3284  * pci_check_and_unmask_intx - unmask INTx if no interrupt is pending
3285  * @dev: the PCI device to operate on
3286  *
3287  * Check if the device dev has its INTx line asserted, unmask it if not
3288  * and return true. False is returned and the mask remains active if
3289  * there was still an interrupt pending.
3290  */
3291 bool pci_check_and_unmask_intx(struct pci_dev *dev)
3292 {
3293         return pci_check_and_set_intx_mask(dev, false);
3294 }
3295 EXPORT_SYMBOL_GPL(pci_check_and_unmask_intx);
3296
3297 int pci_set_dma_max_seg_size(struct pci_dev *dev, unsigned int size)
3298 {
3299         return dma_set_max_seg_size(&dev->dev, size);
3300 }
3301 EXPORT_SYMBOL(pci_set_dma_max_seg_size);
3302
3303 int pci_set_dma_seg_boundary(struct pci_dev *dev, unsigned long mask)
3304 {
3305         return dma_set_seg_boundary(&dev->dev, mask);
3306 }
3307 EXPORT_SYMBOL(pci_set_dma_seg_boundary);
3308
3309 /**
3310  * pci_wait_for_pending_transaction - waits for pending transaction
3311  * @dev: the PCI device to operate on
3312  *
3313  * Return 0 if transaction is pending 1 otherwise.
3314  */
3315 int pci_wait_for_pending_transaction(struct pci_dev *dev)
3316 {
3317         if (!pci_is_pcie(dev))
3318                 return 1;
3319
3320         return pci_wait_for_pending(dev, pci_pcie_cap(dev) + PCI_EXP_DEVSTA,
3321                                     PCI_EXP_DEVSTA_TRPND);
3322 }
3323 EXPORT_SYMBOL(pci_wait_for_pending_transaction);
3324
3325 static int pcie_flr(struct pci_dev *dev, int probe)
3326 {
3327         u32 cap;
3328
3329         pcie_capability_read_dword(dev, PCI_EXP_DEVCAP, &cap);
3330         if (!(cap & PCI_EXP_DEVCAP_FLR))
3331                 return -ENOTTY;
3332
3333         if (probe)
3334                 return 0;
3335
3336         if (!pci_wait_for_pending_transaction(dev))
3337                 dev_err(&dev->dev, "timed out waiting for pending transaction; performing function level reset anyway\n");
3338
3339         pcie_capability_set_word(dev, PCI_EXP_DEVCTL, PCI_EXP_DEVCTL_BCR_FLR);
3340         msleep(100);
3341         return 0;
3342 }
3343
3344 static int pci_af_flr(struct pci_dev *dev, int probe)
3345 {
3346         int pos;
3347         u8 cap;
3348
3349         pos = pci_find_capability(dev, PCI_CAP_ID_AF);
3350         if (!pos)
3351                 return -ENOTTY;
3352
3353         pci_read_config_byte(dev, pos + PCI_AF_CAP, &cap);
3354         if (!(cap & PCI_AF_CAP_TP) || !(cap & PCI_AF_CAP_FLR))
3355                 return -ENOTTY;
3356
3357         if (probe)
3358                 return 0;
3359
3360         /*
3361          * Wait for Transaction Pending bit to clear.  A word-aligned test
3362          * is used, so we use the conrol offset rather than status and shift
3363          * the test bit to match.
3364          */
3365         if (!pci_wait_for_pending(dev, pos + PCI_AF_CTRL,
3366                                  PCI_AF_STATUS_TP << 8))
3367                 dev_err(&dev->dev, "timed out waiting for pending transaction; performing AF function level reset anyway\n");
3368
3369         pci_write_config_byte(dev, pos + PCI_AF_CTRL, PCI_AF_CTRL_FLR);
3370         msleep(100);
3371         return 0;
3372 }
3373
3374 /**
3375  * pci_pm_reset - Put device into PCI_D3 and back into PCI_D0.
3376  * @dev: Device to reset.
3377  * @probe: If set, only check if the device can be reset this way.
3378  *
3379  * If @dev supports native PCI PM and its PCI_PM_CTRL_NO_SOFT_RESET flag is
3380  * unset, it will be reinitialized internally when going from PCI_D3hot to
3381  * PCI_D0.  If that's the case and the device is not in a low-power state
3382  * already, force it into PCI_D3hot and back to PCI_D0, causing it to be reset.
3383  *
3384  * NOTE: This causes the caller to sleep for twice the device power transition
3385  * cooldown period, which for the D0->D3hot and D3hot->D0 transitions is 10 ms
3386  * by default (i.e. unless the @dev's d3_delay field has a different value).
3387  * Moreover, only devices in D0 can be reset by this function.
3388  */
3389 static int pci_pm_reset(struct pci_dev *dev, int probe)
3390 {
3391         u16 csr;
3392
3393         if (!dev->pm_cap || dev->dev_flags & PCI_DEV_FLAGS_NO_PM_RESET)
3394                 return -ENOTTY;
3395
3396         pci_read_config_word(dev, dev->pm_cap + PCI_PM_CTRL, &csr);
3397         if (csr & PCI_PM_CTRL_NO_SOFT_RESET)
3398                 return -ENOTTY;
3399
3400         if (probe)
3401                 return 0;
3402
3403         if (dev->current_state != PCI_D0)
3404                 return -EINVAL;
3405
3406         csr &= ~PCI_PM_CTRL_STATE_MASK;
3407         csr |= PCI_D3hot;
3408         pci_write_config_word(dev, dev->pm_cap + PCI_PM_CTRL, csr);
3409         pci_dev_d3_sleep(dev);
3410
3411         csr &= ~PCI_PM_CTRL_STATE_MASK;
3412         csr |= PCI_D0;
3413         pci_write_config_word(dev, dev->pm_cap + PCI_PM_CTRL, csr);
3414         pci_dev_d3_sleep(dev);
3415
3416         return 0;
3417 }
3418
3419 void pci_reset_secondary_bus(struct pci_dev *dev)
3420 {
3421         u16 ctrl;
3422
3423         pci_read_config_word(dev, PCI_BRIDGE_CONTROL, &ctrl);
3424         ctrl |= PCI_BRIDGE_CTL_BUS_RESET;
3425         pci_write_config_word(dev, PCI_BRIDGE_CONTROL, ctrl);
3426         /*
3427          * PCI spec v3.0 7.6.4.2 requires minimum Trst of 1ms.  Double
3428          * this to 2ms to ensure that we meet the minimum requirement.
3429          */
3430         msleep(2);
3431
3432         ctrl &= ~PCI_BRIDGE_CTL_BUS_RESET;
3433         pci_write_config_word(dev, PCI_BRIDGE_CONTROL, ctrl);
3434
3435         /*
3436          * Trhfa for conventional PCI is 2^25 clock cycles.
3437          * Assuming a minimum 33MHz clock this results in a 1s
3438          * delay before we can consider subordinate devices to
3439          * be re-initialized.  PCIe has some ways to shorten this,
3440          * but we don't make use of them yet.
3441          */
3442         ssleep(1);
3443 }
3444
3445 void __weak pcibios_reset_secondary_bus(struct pci_dev *dev)
3446 {
3447         pci_reset_secondary_bus(dev);
3448 }
3449
3450 /**
3451  * pci_reset_bridge_secondary_bus - Reset the secondary bus on a PCI bridge.
3452  * @dev: Bridge device
3453  *
3454  * Use the bridge control register to assert reset on the secondary bus.
3455  * Devices on the secondary bus are left in power-on state.
3456  */
3457 void pci_reset_bridge_secondary_bus(struct pci_dev *dev)
3458 {
3459         pcibios_reset_secondary_bus(dev);
3460 }
3461 EXPORT_SYMBOL_GPL(pci_reset_bridge_secondary_bus);
3462
3463 static int pci_parent_bus_reset(struct pci_dev *dev, int probe)
3464 {
3465         struct pci_dev *pdev;
3466
3467         if (pci_is_root_bus(dev->bus) || dev->subordinate ||
3468             !dev->bus->self || dev->dev_flags & PCI_DEV_FLAGS_NO_BUS_RESET)
3469                 return -ENOTTY;
3470
3471         list_for_each_entry(pdev, &dev->bus->devices, bus_list)
3472                 if (pdev != dev)
3473                         return -ENOTTY;
3474
3475         if (probe)
3476                 return 0;
3477
3478         pci_reset_bridge_secondary_bus(dev->bus->self);
3479
3480         return 0;
3481 }
3482
3483 static int pci_reset_hotplug_slot(struct hotplug_slot *hotplug, int probe)
3484 {
3485         int rc = -ENOTTY;
3486
3487         if (!hotplug || !try_module_get(hotplug->ops->owner))
3488                 return rc;
3489
3490         if (hotplug->ops->reset_slot)
3491                 rc = hotplug->ops->reset_slot(hotplug, probe);
3492
3493         module_put(hotplug->ops->owner);
3494
3495         return rc;
3496 }
3497
3498 static int pci_dev_reset_slot_function(struct pci_dev *dev, int probe)
3499 {
3500         struct pci_dev *pdev;
3501
3502         if (dev->subordinate || !dev->slot ||
3503             dev->dev_flags & PCI_DEV_FLAGS_NO_BUS_RESET)
3504                 return -ENOTTY;
3505
3506         list_for_each_entry(pdev, &dev->bus->devices, bus_list)
3507                 if (pdev != dev && pdev->slot == dev->slot)
3508                         return -ENOTTY;
3509
3510         return pci_reset_hotplug_slot(dev->slot->hotplug, probe);
3511 }
3512
3513 static int __pci_dev_reset(struct pci_dev *dev, int probe)
3514 {
3515         int rc;
3516
3517         might_sleep();
3518
3519         rc = pci_dev_specific_reset(dev, probe);
3520         if (rc != -ENOTTY)
3521                 goto done;
3522
3523         rc = pcie_flr(dev, probe);
3524         if (rc != -ENOTTY)
3525                 goto done;
3526
3527         rc = pci_af_flr(dev, probe);
3528         if (rc != -ENOTTY)
3529                 goto done;
3530
3531         rc = pci_pm_reset(dev, probe);
3532         if (rc != -ENOTTY)
3533                 goto done;
3534
3535         rc = pci_dev_reset_slot_function(dev, probe);
3536         if (rc != -ENOTTY)
3537                 goto done;
3538
3539         rc = pci_parent_bus_reset(dev, probe);
3540 done:
3541         return rc;
3542 }
3543
3544 static void pci_dev_lock(struct pci_dev *dev)
3545 {
3546         pci_cfg_access_lock(dev);
3547         /* block PM suspend, driver probe, etc. */
3548         device_lock(&dev->dev);
3549 }
3550
3551 /* Return 1 on successful lock, 0 on contention */
3552 static int pci_dev_trylock(struct pci_dev *dev)
3553 {
3554         if (pci_cfg_access_trylock(dev)) {
3555                 if (device_trylock(&dev->dev))
3556                         return 1;
3557                 pci_cfg_access_unlock(dev);
3558         }
3559
3560         return 0;
3561 }
3562
3563 static void pci_dev_unlock(struct pci_dev *dev)
3564 {
3565         device_unlock(&dev->dev);
3566         pci_cfg_access_unlock(dev);
3567 }
3568
3569 /**
3570  * pci_reset_notify - notify device driver of reset
3571  * @dev: device to be notified of reset
3572  * @prepare: 'true' if device is about to be reset; 'false' if reset attempt
3573  *           completed
3574  *
3575  * Must be called prior to device access being disabled and after device
3576  * access is restored.
3577  */
3578 static void pci_reset_notify(struct pci_dev *dev, bool prepare)
3579 {
3580         const struct pci_error_handlers *err_handler =
3581                         dev->driver ? dev->driver->err_handler : NULL;
3582         if (err_handler && err_handler->reset_notify)
3583                 err_handler->reset_notify(dev, prepare);
3584 }
3585
3586 static void pci_dev_save_and_disable(struct pci_dev *dev)
3587 {
3588         pci_reset_notify(dev, true);
3589
3590         /*
3591          * Wake-up device prior to save.  PM registers default to D0 after
3592          * reset and a simple register restore doesn't reliably return
3593          * to a non-D0 state anyway.
3594          */
3595         pci_set_power_state(dev, PCI_D0);
3596
3597         pci_save_state(dev);
3598         /*
3599          * Disable the device by clearing the Command register, except for
3600          * INTx-disable which is set.  This not only disables MMIO and I/O port
3601          * BARs, but also prevents the device from being Bus Master, preventing
3602          * DMA from the device including MSI/MSI-X interrupts.  For PCI 2.3
3603          * compliant devices, INTx-disable prevents legacy interrupts.
3604          */
3605         pci_write_config_word(dev, PCI_COMMAND, PCI_COMMAND_INTX_DISABLE);
3606 }
3607
3608 static void pci_dev_restore(struct pci_dev *dev)
3609 {
3610         pci_restore_state(dev);
3611         pci_reset_notify(dev, false);
3612 }
3613
3614 static int pci_dev_reset(struct pci_dev *dev, int probe)
3615 {
3616         int rc;
3617
3618         if (!probe)
3619                 pci_dev_lock(dev);
3620
3621         rc = __pci_dev_reset(dev, probe);
3622
3623         if (!probe)
3624                 pci_dev_unlock(dev);
3625
3626         return rc;
3627 }
3628
3629 /**
3630  * __pci_reset_function - reset a PCI device function
3631  * @dev: PCI device to reset
3632  *
3633  * Some devices allow an individual function to be reset without affecting
3634  * other functions in the same device.  The PCI device must be responsive
3635  * to PCI config space in order to use this function.
3636  *
3637  * The device function is presumed to be unused when this function is called.
3638  * Resetting the device will make the contents of PCI configuration space
3639  * random, so any caller of this must be prepared to reinitialise the
3640  * device including MSI, bus mastering, BARs, decoding IO and memory spaces,
3641  * etc.
3642  *
3643  * Returns 0 if the device function was successfully reset or negative if the
3644  * device doesn't support resetting a single function.
3645  */
3646 int __pci_reset_function(struct pci_dev *dev)
3647 {
3648         return pci_dev_reset(dev, 0);
3649 }
3650 EXPORT_SYMBOL_GPL(__pci_reset_function);
3651
3652 /**
3653  * __pci_reset_function_locked - reset a PCI device function while holding
3654  * the @dev mutex lock.
3655  * @dev: PCI device to reset
3656  *
3657  * Some devices allow an individual function to be reset without affecting
3658  * other functions in the same device.  The PCI device must be responsive
3659  * to PCI config space in order to use this function.
3660  *
3661  * The device function is presumed to be unused and the caller is holding
3662  * the device mutex lock when this function is called.
3663  * Resetting the device will make the contents of PCI configuration space
3664  * random, so any caller of this must be prepared to reinitialise the
3665  * device including MSI, bus mastering, BARs, decoding IO and memory spaces,
3666  * etc.
3667  *
3668  * Returns 0 if the device function was successfully reset or negative if the
3669  * device doesn't support resetting a single function.
3670  */
3671 int __pci_reset_function_locked(struct pci_dev *dev)
3672 {
3673         return __pci_dev_reset(dev, 0);
3674 }
3675 EXPORT_SYMBOL_GPL(__pci_reset_function_locked);
3676
3677 /**
3678  * pci_probe_reset_function - check whether the device can be safely reset
3679  * @dev: PCI device to reset
3680  *
3681  * Some devices allow an individual function to be reset without affecting
3682  * other functions in the same device.  The PCI device must be responsive
3683  * to PCI config space in order to use this function.
3684  *
3685  * Returns 0 if the device function can be reset or negative if the
3686  * device doesn't support resetting a single function.
3687  */
3688 int pci_probe_reset_function(struct pci_dev *dev)
3689 {
3690         return pci_dev_reset(dev, 1);
3691 }
3692
3693 /**
3694  * pci_reset_function - quiesce and reset a PCI device function
3695  * @dev: PCI device to reset
3696  *
3697  * Some devices allow an individual function to be reset without affecting
3698  * other functions in the same device.  The PCI device must be responsive
3699  * to PCI config space in order to use this function.
3700  *
3701  * This function does not just reset the PCI portion of a device, but
3702  * clears all the state associated with the device.  This function differs
3703  * from __pci_reset_function in that it saves and restores device state
3704  * over the reset.
3705  *
3706  * Returns 0 if the device function was successfully reset or negative if the
3707  * device doesn't support resetting a single function.
3708  */
3709 int pci_reset_function(struct pci_dev *dev)
3710 {
3711         int rc;
3712
3713         rc = pci_dev_reset(dev, 1);
3714         if (rc)
3715                 return rc;
3716
3717         pci_dev_save_and_disable(dev);
3718
3719         rc = pci_dev_reset(dev, 0);
3720
3721         pci_dev_restore(dev);
3722
3723         return rc;
3724 }
3725 EXPORT_SYMBOL_GPL(pci_reset_function);
3726
3727 /**
3728  * pci_try_reset_function - quiesce and reset a PCI device function
3729  * @dev: PCI device to reset
3730  *
3731  * Same as above, except return -EAGAIN if unable to lock device.
3732  */
3733 int pci_try_reset_function(struct pci_dev *dev)
3734 {
3735         int rc;
3736
3737         rc = pci_dev_reset(dev, 1);
3738         if (rc)
3739                 return rc;
3740
3741         pci_dev_save_and_disable(dev);
3742
3743         if (pci_dev_trylock(dev)) {
3744                 rc = __pci_dev_reset(dev, 0);
3745                 pci_dev_unlock(dev);
3746         } else
3747                 rc = -EAGAIN;
3748
3749         pci_dev_restore(dev);
3750
3751         return rc;
3752 }
3753 EXPORT_SYMBOL_GPL(pci_try_reset_function);
3754
3755 /* Do any devices on or below this bus prevent a bus reset? */
3756 static bool pci_bus_resetable(struct pci_bus *bus)
3757 {
3758         struct pci_dev *dev;
3759
3760         list_for_each_entry(dev, &bus->devices, bus_list) {
3761                 if (dev->dev_flags & PCI_DEV_FLAGS_NO_BUS_RESET ||
3762                     (dev->subordinate && !pci_bus_resetable(dev->subordinate)))
3763                         return false;
3764         }
3765
3766         return true;
3767 }
3768
3769 /* Lock devices from the top of the tree down */
3770 static void pci_bus_lock(struct pci_bus *bus)
3771 {
3772         struct pci_dev *dev;
3773
3774         list_for_each_entry(dev, &bus->devices, bus_list) {
3775                 pci_dev_lock(dev);
3776                 if (dev->subordinate)
3777                         pci_bus_lock(dev->subordinate);
3778         }
3779 }
3780
3781 /* Unlock devices from the bottom of the tree up */
3782 static void pci_bus_unlock(struct pci_bus *bus)
3783 {
3784         struct pci_dev *dev;
3785
3786         list_for_each_entry(dev, &bus->devices, bus_list) {
3787                 if (dev->subordinate)
3788                         pci_bus_unlock(dev->subordinate);
3789                 pci_dev_unlock(dev);
3790         }
3791 }
3792
3793 /* Return 1 on successful lock, 0 on contention */
3794 static int pci_bus_trylock(struct pci_bus *bus)
3795 {
3796         struct pci_dev *dev;
3797
3798         list_for_each_entry(dev, &bus->devices, bus_list) {
3799                 if (!pci_dev_trylock(dev))
3800                         goto unlock;
3801                 if (dev->subordinate) {
3802                         if (!pci_bus_trylock(dev->subordinate)) {
3803                                 pci_dev_unlock(dev);
3804                                 goto unlock;
3805                         }
3806                 }
3807         }
3808         return 1;
3809
3810 unlock:
3811         list_for_each_entry_continue_reverse(dev, &bus->devices, bus_list) {
3812                 if (dev->subordinate)
3813                         pci_bus_unlock(dev->subordinate);
3814                 pci_dev_unlock(dev);
3815         }
3816         return 0;
3817 }
3818
3819 /* Do any devices on or below this slot prevent a bus reset? */
3820 static bool pci_slot_resetable(struct pci_slot *slot)
3821 {
3822         struct pci_dev *dev;
3823
3824         list_for_each_entry(dev, &slot->bus->devices, bus_list) {
3825                 if (!dev->slot || dev->slot != slot)
3826                         continue;
3827                 if (dev->dev_flags & PCI_DEV_FLAGS_NO_BUS_RESET ||
3828                     (dev->subordinate && !pci_bus_resetable(dev->subordinate)))
3829                         return false;
3830         }
3831
3832         return true;
3833 }
3834
3835 /* Lock devices from the top of the tree down */
3836 static void pci_slot_lock(struct pci_slot *slot)
3837 {
3838         struct pci_dev *dev;
3839
3840         list_for_each_entry(dev, &slot->bus->devices, bus_list) {
3841                 if (!dev->slot || dev->slot != slot)
3842                         continue;
3843                 pci_dev_lock(dev);
3844                 if (dev->subordinate)
3845                         pci_bus_lock(dev->subordinate);
3846         }
3847 }
3848
3849 /* Unlock devices from the bottom of the tree up */
3850 static void pci_slot_unlock(struct pci_slot *slot)
3851 {
3852         struct pci_dev *dev;
3853
3854         list_for_each_entry(dev, &slot->bus->devices, bus_list) {
3855                 if (!dev->slot || dev->slot != slot)
3856                         continue;
3857                 if (dev->subordinate)
3858                         pci_bus_unlock(dev->subordinate);
3859                 pci_dev_unlock(dev);
3860         }
3861 }
3862
3863 /* Return 1 on successful lock, 0 on contention */
3864 static int pci_slot_trylock(struct pci_slot *slot)
3865 {
3866         struct pci_dev *dev;
3867
3868         list_for_each_entry(dev, &slot->bus->devices, bus_list) {
3869                 if (!dev->slot || dev->slot != slot)
3870                         continue;
3871                 if (!pci_dev_trylock(dev))
3872                         goto unlock;
3873                 if (dev->subordinate) {
3874                         if (!pci_bus_trylock(dev->subordinate)) {
3875                                 pci_dev_unlock(dev);
3876                                 goto unlock;
3877                         }
3878                 }
3879         }
3880         return 1;
3881
3882 unlock:
3883         list_for_each_entry_continue_reverse(dev,
3884                                              &slot->bus->devices, bus_list) {
3885                 if (!dev->slot || dev->slot != slot)
3886                         continue;
3887                 if (dev->subordinate)
3888                         pci_bus_unlock(dev->subordinate);
3889                 pci_dev_unlock(dev);
3890         }
3891         return 0;
3892 }
3893
3894 /* Save and disable devices from the top of the tree down */
3895 static void pci_bus_save_and_disable(struct pci_bus *bus)
3896 {
3897         struct pci_dev *dev;
3898
3899         list_for_each_entry(dev, &bus->devices, bus_list) {
3900                 pci_dev_save_and_disable(dev);
3901                 if (dev->subordinate)
3902                         pci_bus_save_and_disable(dev->subordinate);
3903         }
3904 }
3905
3906 /*
3907  * Restore devices from top of the tree down - parent bridges need to be
3908  * restored before we can get to subordinate devices.
3909  */
3910 static void pci_bus_restore(struct pci_bus *bus)
3911 {
3912         struct pci_dev *dev;
3913
3914         list_for_each_entry(dev, &bus->devices, bus_list) {
3915                 pci_dev_restore(dev);
3916                 if (dev->subordinate)
3917                         pci_bus_restore(dev->subordinate);
3918         }
3919 }
3920
3921 /* Save and disable devices from the top of the tree down */
3922 static void pci_slot_save_and_disable(struct pci_slot *slot)
3923 {
3924         struct pci_dev *dev;
3925
3926         list_for_each_entry(dev, &slot->bus->devices, bus_list) {
3927                 if (!dev->slot || dev->slot != slot)
3928                         continue;
3929                 pci_dev_save_and_disable(dev);
3930                 if (dev->subordinate)
3931                         pci_bus_save_and_disable(dev->subordinate);
3932         }
3933 }
3934
3935 /*
3936  * Restore devices from top of the tree down - parent bridges need to be
3937  * restored before we can get to subordinate devices.
3938  */
3939 static void pci_slot_restore(struct pci_slot *slot)
3940 {
3941         struct pci_dev *dev;
3942
3943         list_for_each_entry(dev, &slot->bus->devices, bus_list) {
3944                 if (!dev->slot || dev->slot != slot)
3945                         continue;
3946                 pci_dev_restore(dev);
3947                 if (dev->subordinate)
3948                         pci_bus_restore(dev->subordinate);
3949         }
3950 }
3951
3952 static int pci_slot_reset(struct pci_slot *slot, int probe)
3953 {
3954         int rc;
3955
3956         if (!slot || !pci_slot_resetable(slot))
3957                 return -ENOTTY;
3958
3959         if (!probe)
3960                 pci_slot_lock(slot);
3961
3962         might_sleep();
3963
3964         rc = pci_reset_hotplug_slot(slot->hotplug, probe);
3965
3966         if (!probe)
3967                 pci_slot_unlock(slot);
3968
3969         return rc;
3970 }
3971
3972 /**
3973  * pci_probe_reset_slot - probe whether a PCI slot can be reset
3974  * @slot: PCI slot to probe
3975  *
3976  * Return 0 if slot can be reset, negative if a slot reset is not supported.
3977  */
3978 int pci_probe_reset_slot(struct pci_slot *slot)
3979 {
3980         return pci_slot_reset(slot, 1);
3981 }
3982 EXPORT_SYMBOL_GPL(pci_probe_reset_slot);
3983
3984 /**
3985  * pci_reset_slot - reset a PCI slot
3986  * @slot: PCI slot to reset
3987  *
3988  * A PCI bus may host multiple slots, each slot may support a reset mechanism
3989  * independent of other slots.  For instance, some slots may support slot power
3990  * control.  In the case of a 1:1 bus to slot architecture, this function may
3991  * wrap the bus reset to avoid spurious slot related events such as hotplug.
3992  * Generally a slot reset should be attempted before a bus reset.  All of the
3993  * function of the slot and any subordinate buses behind the slot are reset
3994  * through this function.  PCI config space of all devices in the slot and
3995  * behind the slot is saved before and restored after reset.
3996  *
3997  * Return 0 on success, non-zero on error.
3998  */
3999 int pci_reset_slot(struct pci_slot *slot)
4000 {
4001         int rc;
4002
4003         rc = pci_slot_reset(slot, 1);
4004         if (rc)
4005                 return rc;
4006
4007         pci_slot_save_and_disable(slot);
4008
4009         rc = pci_slot_reset(slot, 0);
4010
4011         pci_slot_restore(slot);
4012
4013         return rc;
4014 }
4015 EXPORT_SYMBOL_GPL(pci_reset_slot);
4016
4017 /**
4018  * pci_try_reset_slot - Try to reset a PCI slot
4019  * @slot: PCI slot to reset
4020  *
4021  * Same as above except return -EAGAIN if the slot cannot be locked
4022  */
4023 int pci_try_reset_slot(struct pci_slot *slot)
4024 {
4025         int rc;
4026
4027         rc = pci_slot_reset(slot, 1);
4028         if (rc)
4029                 return rc;
4030
4031         pci_slot_save_and_disable(slot);
4032
4033         if (pci_slot_trylock(slot)) {
4034                 might_sleep();
4035                 rc = pci_reset_hotplug_slot(slot->hotplug, 0);
4036                 pci_slot_unlock(slot);
4037         } else
4038                 rc = -EAGAIN;
4039
4040         pci_slot_restore(slot);
4041
4042         return rc;
4043 }
4044 EXPORT_SYMBOL_GPL(pci_try_reset_slot);
4045
4046 static int pci_bus_reset(struct pci_bus *bus, int probe)
4047 {
4048         if (!bus->self || !pci_bus_resetable(bus))
4049                 return -ENOTTY;
4050
4051         if (probe)
4052                 return 0;
4053
4054         pci_bus_lock(bus);
4055
4056         might_sleep();
4057
4058         pci_reset_bridge_secondary_bus(bus->self);
4059
4060         pci_bus_unlock(bus);
4061
4062         return 0;
4063 }
4064
4065 /**
4066  * pci_probe_reset_bus - probe whether a PCI bus can be reset
4067  * @bus: PCI bus to probe
4068  *
4069  * Return 0 if bus can be reset, negative if a bus reset is not supported.
4070  */
4071 int pci_probe_reset_bus(struct pci_bus *bus)
4072 {
4073         return pci_bus_reset(bus, 1);
4074 }
4075 EXPORT_SYMBOL_GPL(pci_probe_reset_bus);
4076
4077 /**
4078  * pci_reset_bus - reset a PCI bus
4079  * @bus: top level PCI bus to reset
4080  *
4081  * Do a bus reset on the given bus and any subordinate buses, saving
4082  * and restoring state of all devices.
4083  *
4084  * Return 0 on success, non-zero on error.
4085  */
4086 int pci_reset_bus(struct pci_bus *bus)
4087 {
4088         int rc;
4089
4090         rc = pci_bus_reset(bus, 1);
4091         if (rc)
4092                 return rc;
4093
4094         pci_bus_save_and_disable(bus);
4095
4096         rc = pci_bus_reset(bus, 0);
4097
4098         pci_bus_restore(bus);
4099
4100         return rc;
4101 }
4102 EXPORT_SYMBOL_GPL(pci_reset_bus);
4103
4104 /**
4105  * pci_try_reset_bus - Try to reset a PCI bus
4106  * @bus: top level PCI bus to reset
4107  *
4108  * Same as above except return -EAGAIN if the bus cannot be locked
4109  */
4110 int pci_try_reset_bus(struct pci_bus *bus)
4111 {
4112         int rc;
4113
4114         rc = pci_bus_reset(bus, 1);
4115         if (rc)
4116                 return rc;
4117
4118         pci_bus_save_and_disable(bus);
4119
4120         if (pci_bus_trylock(bus)) {
4121                 might_sleep();
4122                 pci_reset_bridge_secondary_bus(bus->self);
4123                 pci_bus_unlock(bus);
4124         } else
4125                 rc = -EAGAIN;
4126
4127         pci_bus_restore(bus);
4128
4129         return rc;
4130 }
4131 EXPORT_SYMBOL_GPL(pci_try_reset_bus);
4132
4133 /**
4134  * pcix_get_max_mmrbc - get PCI-X maximum designed memory read byte count
4135  * @dev: PCI device to query
4136  *
4137  * Returns mmrbc: maximum designed memory read count in bytes
4138  *    or appropriate error value.
4139  */
4140 int pcix_get_max_mmrbc(struct pci_dev *dev)
4141 {
4142         int cap;
4143         u32 stat;
4144
4145         cap = pci_find_capability(dev, PCI_CAP_ID_PCIX);
4146         if (!cap)
4147                 return -EINVAL;
4148
4149         if (pci_read_config_dword(dev, cap + PCI_X_STATUS, &stat))
4150                 return -EINVAL;
4151
4152         return 512 << ((stat & PCI_X_STATUS_MAX_READ) >> 21);
4153 }
4154 EXPORT_SYMBOL(pcix_get_max_mmrbc);
4155
4156 /**
4157  * pcix_get_mmrbc - get PCI-X maximum memory read byte count
4158  * @dev: PCI device to query
4159  *
4160  * Returns mmrbc: maximum memory read count in bytes
4161  *    or appropriate error value.
4162  */
4163 int pcix_get_mmrbc(struct pci_dev *dev)
4164 {
4165         int cap;
4166         u16 cmd;
4167
4168         cap = pci_find_capability(dev, PCI_CAP_ID_PCIX);
4169         if (!cap)
4170                 return -EINVAL;
4171
4172         if (pci_read_config_word(dev, cap + PCI_X_CMD, &cmd))
4173                 return -EINVAL;
4174
4175         return 512 << ((cmd & PCI_X_CMD_MAX_READ) >> 2);
4176 }
4177 EXPORT_SYMBOL(pcix_get_mmrbc);
4178
4179 /**
4180  * pcix_set_mmrbc - set PCI-X maximum memory read byte count
4181  * @dev: PCI device to query
4182  * @mmrbc: maximum memory read count in bytes
4183  *    valid values are 512, 1024, 2048, 4096
4184  *
4185  * If possible sets maximum memory read byte count, some bridges have erratas
4186  * that prevent this.
4187  */
4188 int pcix_set_mmrbc(struct pci_dev *dev, int mmrbc)
4189 {
4190         int cap;
4191         u32 stat, v, o;
4192         u16 cmd;
4193
4194         if (mmrbc < 512 || mmrbc > 4096 || !is_power_of_2(mmrbc))
4195                 return -EINVAL;
4196
4197         v = ffs(mmrbc) - 10;
4198
4199         cap = pci_find_capability(dev, PCI_CAP_ID_PCIX);
4200         if (!cap)
4201                 return -EINVAL;
4202
4203         if (pci_read_config_dword(dev, cap + PCI_X_STATUS, &stat))
4204                 return -EINVAL;
4205
4206         if (v > (stat & PCI_X_STATUS_MAX_READ) >> 21)
4207                 return -E2BIG;
4208
4209         if (pci_read_config_word(dev, cap + PCI_X_CMD, &cmd))
4210                 return -EINVAL;
4211
4212         o = (cmd & PCI_X_CMD_MAX_READ) >> 2;
4213         if (o != v) {
4214                 if (v > o && (dev->bus->bus_flags & PCI_BUS_FLAGS_NO_MMRBC))
4215                         return -EIO;
4216
4217                 cmd &= ~PCI_X_CMD_MAX_READ;
4218                 cmd |= v << 2;
4219                 if (pci_write_config_word(dev, cap + PCI_X_CMD, cmd))
4220                         return -EIO;
4221         }
4222         return 0;
4223 }
4224 EXPORT_SYMBOL(pcix_set_mmrbc);
4225
4226 /**
4227  * pcie_get_readrq - get PCI Express read request size
4228  * @dev: PCI device to query
4229  *
4230  * Returns maximum memory read request in bytes
4231  *    or appropriate error value.
4232  */
4233 int pcie_get_readrq(struct pci_dev *dev)
4234 {
4235         u16 ctl;
4236
4237         pcie_capability_read_word(dev, PCI_EXP_DEVCTL, &ctl);
4238
4239         return 128 << ((ctl & PCI_EXP_DEVCTL_READRQ) >> 12);
4240 }
4241 EXPORT_SYMBOL(pcie_get_readrq);
4242
4243 /**
4244  * pcie_set_readrq - set PCI Express maximum memory read request
4245  * @dev: PCI device to query
4246  * @rq: maximum memory read count in bytes
4247  *    valid values are 128, 256, 512, 1024, 2048, 4096
4248  *
4249  * If possible sets maximum memory read request in bytes
4250  */
4251 int pcie_set_readrq(struct pci_dev *dev, int rq)
4252 {
4253         u16 v;
4254
4255         if (rq < 128 || rq > 4096 || !is_power_of_2(rq))
4256                 return -EINVAL;
4257
4258         /*
4259          * If using the "performance" PCIe config, we clamp the
4260          * read rq size to the max packet size to prevent the
4261          * host bridge generating requests larger than we can
4262          * cope with
4263          */
4264         if (pcie_bus_config == PCIE_BUS_PERFORMANCE) {
4265                 int mps = pcie_get_mps(dev);
4266
4267                 if (mps < rq)
4268                         rq = mps;
4269         }
4270
4271         v = (ffs(rq) - 8) << 12;
4272
4273         return pcie_capability_clear_and_set_word(dev, PCI_EXP_DEVCTL,
4274                                                   PCI_EXP_DEVCTL_READRQ, v);
4275 }
4276 EXPORT_SYMBOL(pcie_set_readrq);
4277
4278 /**
4279  * pcie_get_mps - get PCI Express maximum payload size
4280  * @dev: PCI device to query
4281  *
4282  * Returns maximum payload size in bytes
4283  */
4284 int pcie_get_mps(struct pci_dev *dev)
4285 {
4286         u16 ctl;
4287
4288         pcie_capability_read_word(dev, PCI_EXP_DEVCTL, &ctl);
4289
4290         return 128 << ((ctl & PCI_EXP_DEVCTL_PAYLOAD) >> 5);
4291 }
4292 EXPORT_SYMBOL(pcie_get_mps);
4293
4294 /**
4295  * pcie_set_mps - set PCI Express maximum payload size
4296  * @dev: PCI device to query
4297  * @mps: maximum payload size in bytes
4298  *    valid values are 128, 256, 512, 1024, 2048, 4096
4299  *
4300  * If possible sets maximum payload size
4301  */
4302 int pcie_set_mps(struct pci_dev *dev, int mps)
4303 {
4304         u16 v;
4305
4306         if (mps < 128 || mps > 4096 || !is_power_of_2(mps))
4307                 return -EINVAL;
4308
4309         v = ffs(mps) - 8;
4310         if (v > dev->pcie_mpss)
4311                 return -EINVAL;
4312         v <<= 5;
4313
4314         return pcie_capability_clear_and_set_word(dev, PCI_EXP_DEVCTL,
4315                                                   PCI_EXP_DEVCTL_PAYLOAD, v);
4316 }
4317 EXPORT_SYMBOL(pcie_set_mps);
4318
4319 /**
4320  * pcie_get_minimum_link - determine minimum link settings of a PCI device
4321  * @dev: PCI device to query
4322  * @speed: storage for minimum speed
4323  * @width: storage for minimum width
4324  *
4325  * This function will walk up the PCI device chain and determine the minimum
4326  * link width and speed of the device.
4327  */
4328 int pcie_get_minimum_link(struct pci_dev *dev, enum pci_bus_speed *speed,
4329                           enum pcie_link_width *width)
4330 {
4331         int ret;
4332
4333         *speed = PCI_SPEED_UNKNOWN;
4334         *width = PCIE_LNK_WIDTH_UNKNOWN;
4335
4336         while (dev) {
4337                 u16 lnksta;
4338                 enum pci_bus_speed next_speed;
4339                 enum pcie_link_width next_width;
4340
4341                 ret = pcie_capability_read_word(dev, PCI_EXP_LNKSTA, &lnksta);
4342                 if (ret)
4343                         return ret;
4344
4345                 next_speed = pcie_link_speed[lnksta & PCI_EXP_LNKSTA_CLS];
4346                 next_width = (lnksta & PCI_EXP_LNKSTA_NLW) >>
4347                         PCI_EXP_LNKSTA_NLW_SHIFT;
4348
4349                 if (next_speed < *speed)
4350                         *speed = next_speed;
4351
4352                 if (next_width < *width)
4353                         *width = next_width;
4354
4355                 dev = dev->bus->self;
4356         }
4357
4358         return 0;
4359 }
4360 EXPORT_SYMBOL(pcie_get_minimum_link);
4361
4362 /**
4363  * pci_select_bars - Make BAR mask from the type of resource
4364  * @dev: the PCI device for which BAR mask is made
4365  * @flags: resource type mask to be selected
4366  *
4367  * This helper routine makes bar mask from the type of resource.
4368  */
4369 int pci_select_bars(struct pci_dev *dev, unsigned long flags)
4370 {
4371         int i, bars = 0;
4372         for (i = 0; i < PCI_NUM_RESOURCES; i++)
4373                 if (pci_resource_flags(dev, i) & flags)
4374                         bars |= (1 << i);
4375         return bars;
4376 }
4377 EXPORT_SYMBOL(pci_select_bars);
4378
4379 /**
4380  * pci_resource_bar - get position of the BAR associated with a resource
4381  * @dev: the PCI device
4382  * @resno: the resource number
4383  * @type: the BAR type to be filled in
4384  *
4385  * Returns BAR position in config space, or 0 if the BAR is invalid.
4386  */
4387 int pci_resource_bar(struct pci_dev *dev, int resno, enum pci_bar_type *type)
4388 {
4389         int reg;
4390
4391         if (resno < PCI_ROM_RESOURCE) {
4392                 *type = pci_bar_unknown;
4393                 return PCI_BASE_ADDRESS_0 + 4 * resno;
4394         } else if (resno == PCI_ROM_RESOURCE) {
4395                 *type = pci_bar_mem32;
4396                 return dev->rom_base_reg;
4397         } else if (resno < PCI_BRIDGE_RESOURCES) {
4398                 /* device specific resource */
4399                 *type = pci_bar_unknown;
4400                 reg = pci_iov_resource_bar(dev, resno);
4401                 if (reg)
4402                         return reg;
4403         }
4404
4405         dev_err(&dev->dev, "BAR %d: invalid resource\n", resno);
4406         return 0;
4407 }
4408
4409 /* Some architectures require additional programming to enable VGA */
4410 static arch_set_vga_state_t arch_set_vga_state;
4411
4412 void __init pci_register_set_vga_state(arch_set_vga_state_t func)
4413 {
4414         arch_set_vga_state = func;      /* NULL disables */
4415 }
4416
4417 static int pci_set_vga_state_arch(struct pci_dev *dev, bool decode,
4418                                   unsigned int command_bits, u32 flags)
4419 {
4420         if (arch_set_vga_state)
4421                 return arch_set_vga_state(dev, decode, command_bits,
4422                                                 flags);
4423         return 0;
4424 }
4425
4426 /**
4427  * pci_set_vga_state - set VGA decode state on device and parents if requested
4428  * @dev: the PCI device
4429  * @decode: true = enable decoding, false = disable decoding
4430  * @command_bits: PCI_COMMAND_IO and/or PCI_COMMAND_MEMORY
4431  * @flags: traverse ancestors and change bridges
4432  * CHANGE_BRIDGE_ONLY / CHANGE_BRIDGE
4433  */
4434 int pci_set_vga_state(struct pci_dev *dev, bool decode,
4435                       unsigned int command_bits, u32 flags)
4436 {
4437         struct pci_bus *bus;
4438         struct pci_dev *bridge;
4439         u16 cmd;
4440         int rc;
4441
4442         WARN_ON((flags & PCI_VGA_STATE_CHANGE_DECODES) && (command_bits & ~(PCI_COMMAND_IO|PCI_COMMAND_MEMORY)));
4443
4444         /* ARCH specific VGA enables */
4445         rc = pci_set_vga_state_arch(dev, decode, command_bits, flags);
4446         if (rc)
4447                 return rc;
4448
4449         if (flags & PCI_VGA_STATE_CHANGE_DECODES) {
4450                 pci_read_config_word(dev, PCI_COMMAND, &cmd);
4451                 if (decode == true)
4452                         cmd |= command_bits;
4453                 else
4454                         cmd &= ~command_bits;
4455                 pci_write_config_word(dev, PCI_COMMAND, cmd);
4456         }
4457
4458         if (!(flags & PCI_VGA_STATE_CHANGE_BRIDGE))
4459                 return 0;
4460
4461         bus = dev->bus;
4462         while (bus) {
4463                 bridge = bus->self;
4464                 if (bridge) {
4465                         pci_read_config_word(bridge, PCI_BRIDGE_CONTROL,
4466                                              &cmd);
4467                         if (decode == true)
4468                                 cmd |= PCI_BRIDGE_CTL_VGA;
4469                         else
4470                                 cmd &= ~PCI_BRIDGE_CTL_VGA;
4471                         pci_write_config_word(bridge, PCI_BRIDGE_CONTROL,
4472                                               cmd);
4473                 }
4474                 bus = bus->parent;
4475         }
4476         return 0;
4477 }
4478
4479 bool pci_device_is_present(struct pci_dev *pdev)
4480 {
4481         u32 v;
4482
4483         return pci_bus_read_dev_vendor_id(pdev->bus, pdev->devfn, &v, 0);
4484 }
4485 EXPORT_SYMBOL_GPL(pci_device_is_present);
4486
4487 void pci_ignore_hotplug(struct pci_dev *dev)
4488 {
4489         struct pci_dev *bridge = dev->bus->self;
4490
4491         dev->ignore_hotplug = 1;
4492         /* Propagate the "ignore hotplug" setting to the parent bridge. */
4493         if (bridge)
4494                 bridge->ignore_hotplug = 1;
4495 }
4496 EXPORT_SYMBOL_GPL(pci_ignore_hotplug);
4497
4498 #define RESOURCE_ALIGNMENT_PARAM_SIZE COMMAND_LINE_SIZE
4499 static char resource_alignment_param[RESOURCE_ALIGNMENT_PARAM_SIZE] = {0};
4500 static DEFINE_SPINLOCK(resource_alignment_lock);
4501
4502 /**
4503  * pci_specified_resource_alignment - get resource alignment specified by user.
4504  * @dev: the PCI device to get
4505  *
4506  * RETURNS: Resource alignment if it is specified.
4507  *          Zero if it is not specified.
4508  */
4509 static resource_size_t pci_specified_resource_alignment(struct pci_dev *dev)
4510 {
4511         int seg, bus, slot, func, align_order, count;
4512         resource_size_t align = 0;
4513         char *p;
4514
4515         spin_lock(&resource_alignment_lock);
4516         p = resource_alignment_param;
4517         while (*p) {
4518                 count = 0;
4519                 if (sscanf(p, "%d%n", &align_order, &count) == 1 &&
4520                                                         p[count] == '@') {
4521                         p += count + 1;
4522                 } else {
4523                         align_order = -1;
4524                 }
4525                 if (sscanf(p, "%x:%x:%x.%x%n",
4526                         &seg, &bus, &slot, &func, &count) != 4) {
4527                         seg = 0;
4528                         if (sscanf(p, "%x:%x.%x%n",
4529                                         &bus, &slot, &func, &count) != 3) {
4530                                 /* Invalid format */
4531                                 printk(KERN_ERR "PCI: Can't parse resource_alignment parameter: %s\n",
4532                                         p);
4533                                 break;
4534                         }
4535                 }
4536                 p += count;
4537                 if (seg == pci_domain_nr(dev->bus) &&
4538                         bus == dev->bus->number &&
4539                         slot == PCI_SLOT(dev->devfn) &&
4540                         func == PCI_FUNC(dev->devfn)) {
4541                         if (align_order == -1)
4542                                 align = PAGE_SIZE;
4543                         else
4544                                 align = 1 << align_order;
4545                         /* Found */
4546                         break;
4547                 }
4548                 if (*p != ';' && *p != ',') {
4549                         /* End of param or invalid format */
4550                         break;
4551                 }
4552                 p++;
4553         }
4554         spin_unlock(&resource_alignment_lock);
4555         return align;
4556 }
4557
4558 /*
4559  * This function disables memory decoding and releases memory resources
4560  * of the device specified by kernel's boot parameter 'pci=resource_alignment='.
4561  * It also rounds up size to specified alignment.
4562  * Later on, the kernel will assign page-aligned memory resource back
4563  * to the device.
4564  */
4565 void pci_reassigndev_resource_alignment(struct pci_dev *dev)
4566 {
4567         int i;
4568         struct resource *r;
4569         resource_size_t align, size;
4570         u16 command;
4571
4572         /* check if specified PCI is target device to reassign */
4573         align = pci_specified_resource_alignment(dev);
4574         if (!align)
4575                 return;
4576
4577         if (dev->hdr_type == PCI_HEADER_TYPE_NORMAL &&
4578             (dev->class >> 8) == PCI_CLASS_BRIDGE_HOST) {
4579                 dev_warn(&dev->dev,
4580                         "Can't reassign resources to host bridge.\n");
4581                 return;
4582         }
4583
4584         dev_info(&dev->dev,
4585                 "Disabling memory decoding and releasing memory resources.\n");
4586         pci_read_config_word(dev, PCI_COMMAND, &command);
4587         command &= ~PCI_COMMAND_MEMORY;
4588         pci_write_config_word(dev, PCI_COMMAND, command);
4589
4590         for (i = 0; i < PCI_BRIDGE_RESOURCES; i++) {
4591                 r = &dev->resource[i];
4592                 if (!(r->flags & IORESOURCE_MEM))
4593                         continue;
4594                 size = resource_size(r);
4595                 if (size < align) {
4596                         size = align;
4597                         dev_info(&dev->dev,
4598                                 "Rounding up size of resource #%d to %#llx.\n",
4599                                 i, (unsigned long long)size);
4600                 }
4601                 r->flags |= IORESOURCE_UNSET;
4602                 r->end = size - 1;
4603                 r->start = 0;
4604         }
4605         /* Need to disable bridge's resource window,
4606          * to enable the kernel to reassign new resource
4607          * window later on.
4608          */
4609         if (dev->hdr_type == PCI_HEADER_TYPE_BRIDGE &&
4610             (dev->class >> 8) == PCI_CLASS_BRIDGE_PCI) {
4611                 for (i = PCI_BRIDGE_RESOURCES; i < PCI_NUM_RESOURCES; i++) {
4612                         r = &dev->resource[i];
4613                         if (!(r->flags & IORESOURCE_MEM))
4614                                 continue;
4615                         r->flags |= IORESOURCE_UNSET;
4616                         r->end = resource_size(r) - 1;
4617                         r->start = 0;
4618                 }
4619                 pci_disable_bridge_window(dev);
4620         }
4621 }
4622
4623 static ssize_t pci_set_resource_alignment_param(const char *buf, size_t count)
4624 {
4625         if (count > RESOURCE_ALIGNMENT_PARAM_SIZE - 1)
4626                 count = RESOURCE_ALIGNMENT_PARAM_SIZE - 1;
4627         spin_lock(&resource_alignment_lock);
4628         strncpy(resource_alignment_param, buf, count);
4629         resource_alignment_param[count] = '\0';
4630         spin_unlock(&resource_alignment_lock);
4631         return count;
4632 }
4633
4634 static ssize_t pci_get_resource_alignment_param(char *buf, size_t size)
4635 {
4636         size_t count;
4637         spin_lock(&resource_alignment_lock);
4638         count = snprintf(buf, size, "%s", resource_alignment_param);
4639         spin_unlock(&resource_alignment_lock);
4640         return count;
4641 }
4642
4643 static ssize_t pci_resource_alignment_show(struct bus_type *bus, char *buf)
4644 {
4645         return pci_get_resource_alignment_param(buf, PAGE_SIZE);
4646 }
4647
4648 static ssize_t pci_resource_alignment_store(struct bus_type *bus,
4649                                         const char *buf, size_t count)
4650 {
4651         return pci_set_resource_alignment_param(buf, count);
4652 }
4653
4654 BUS_ATTR(resource_alignment, 0644, pci_resource_alignment_show,
4655                                         pci_resource_alignment_store);
4656
4657 static int __init pci_resource_alignment_sysfs_init(void)
4658 {
4659         return bus_create_file(&pci_bus_type,
4660                                         &bus_attr_resource_alignment);
4661 }
4662 late_initcall(pci_resource_alignment_sysfs_init);
4663
4664 static void pci_no_domains(void)
4665 {
4666 #ifdef CONFIG_PCI_DOMAINS
4667         pci_domains_supported = 0;
4668 #endif
4669 }
4670
4671 #ifdef CONFIG_PCI_DOMAINS
4672 static atomic_t __domain_nr = ATOMIC_INIT(-1);
4673
4674 int pci_get_new_domain_nr(void)
4675 {
4676         return atomic_inc_return(&__domain_nr);
4677 }
4678
4679 #ifdef CONFIG_PCI_DOMAINS_GENERIC
4680 void pci_bus_assign_domain_nr(struct pci_bus *bus, struct device *parent)
4681 {
4682         static int use_dt_domains = -1;
4683         int domain = of_get_pci_domain_nr(parent->of_node);
4684
4685         /*
4686          * Check DT domain and use_dt_domains values.
4687          *
4688          * If DT domain property is valid (domain >= 0) and
4689          * use_dt_domains != 0, the DT assignment is valid since this means
4690          * we have not previously allocated a domain number by using
4691          * pci_get_new_domain_nr(); we should also update use_dt_domains to
4692          * 1, to indicate that we have just assigned a domain number from
4693          * DT.
4694          *
4695          * If DT domain property value is not valid (ie domain < 0), and we
4696          * have not previously assigned a domain number from DT
4697          * (use_dt_domains != 1) we should assign a domain number by
4698          * using the:
4699          *
4700          * pci_get_new_domain_nr()
4701          *
4702          * API and update the use_dt_domains value to keep track of method we
4703          * are using to assign domain numbers (use_dt_domains = 0).
4704          *
4705          * All other combinations imply we have a platform that is trying
4706          * to mix domain numbers obtained from DT and pci_get_new_domain_nr(),
4707          * which is a recipe for domain mishandling and it is prevented by
4708          * invalidating the domain value (domain = -1) and printing a
4709          * corresponding error.
4710          */
4711         if (domain >= 0 && use_dt_domains) {
4712                 use_dt_domains = 1;
4713         } else if (domain < 0 && use_dt_domains != 1) {
4714                 use_dt_domains = 0;
4715                 domain = pci_get_new_domain_nr();
4716         } else {
4717                 dev_err(parent, "Node %s has inconsistent \"linux,pci-domain\" property in DT\n",
4718                         parent->of_node->full_name);
4719                 domain = -1;
4720         }
4721
4722         bus->domain_nr = domain;
4723 }
4724 #endif
4725 #endif
4726
4727 /**
4728  * pci_ext_cfg_avail - can we access extended PCI config space?
4729  *
4730  * Returns 1 if we can access PCI extended config space (offsets
4731  * greater than 0xff). This is the default implementation. Architecture
4732  * implementations can override this.
4733  */
4734 int __weak pci_ext_cfg_avail(void)
4735 {
4736         return 1;
4737 }
4738
4739 void __weak pci_fixup_cardbus(struct pci_bus *bus)
4740 {
4741 }
4742 EXPORT_SYMBOL(pci_fixup_cardbus);
4743
4744 static int __init pci_setup(char *str)
4745 {
4746         while (str) {
4747                 char *k = strchr(str, ',');
4748                 if (k)
4749                         *k++ = 0;
4750                 if (*str && (str = pcibios_setup(str)) && *str) {
4751                         if (!strcmp(str, "nomsi")) {
4752                                 pci_no_msi();
4753                         } else if (!strcmp(str, "noaer")) {
4754                                 pci_no_aer();
4755                         } else if (!strncmp(str, "realloc=", 8)) {
4756                                 pci_realloc_get_opt(str + 8);
4757                         } else if (!strncmp(str, "realloc", 7)) {
4758                                 pci_realloc_get_opt("on");
4759                         } else if (!strcmp(str, "nodomains")) {
4760                                 pci_no_domains();
4761                         } else if (!strncmp(str, "noari", 5)) {
4762                                 pcie_ari_disabled = true;
4763                         } else if (!strncmp(str, "cbiosize=", 9)) {
4764                                 pci_cardbus_io_size = memparse(str + 9, &str);
4765                         } else if (!strncmp(str, "cbmemsize=", 10)) {
4766                                 pci_cardbus_mem_size = memparse(str + 10, &str);
4767                         } else if (!strncmp(str, "resource_alignment=", 19)) {
4768                                 pci_set_resource_alignment_param(str + 19,
4769                                                         strlen(str + 19));
4770                         } else if (!strncmp(str, "ecrc=", 5)) {
4771                                 pcie_ecrc_get_policy(str + 5);
4772                         } else if (!strncmp(str, "hpiosize=", 9)) {
4773                                 pci_hotplug_io_size = memparse(str + 9, &str);
4774                         } else if (!strncmp(str, "hpmemsize=", 10)) {
4775                                 pci_hotplug_mem_size = memparse(str + 10, &str);
4776                         } else if (!strncmp(str, "pcie_bus_tune_off", 17)) {
4777                                 pcie_bus_config = PCIE_BUS_TUNE_OFF;
4778                         } else if (!strncmp(str, "pcie_bus_safe", 13)) {
4779                                 pcie_bus_config = PCIE_BUS_SAFE;
4780                         } else if (!strncmp(str, "pcie_bus_perf", 13)) {
4781                                 pcie_bus_config = PCIE_BUS_PERFORMANCE;
4782                         } else if (!strncmp(str, "pcie_bus_peer2peer", 18)) {
4783                                 pcie_bus_config = PCIE_BUS_PEER2PEER;
4784                         } else if (!strncmp(str, "pcie_scan_all", 13)) {
4785                                 pci_add_flags(PCI_SCAN_ALL_PCIE_DEVS);
4786                         } else {
4787                                 printk(KERN_ERR "PCI: Unknown option `%s'\n",
4788                                                 str);
4789                         }
4790                 }
4791                 str = k;
4792         }
4793         return 0;
4794 }
4795 early_param("pci", pci_setup);