Merge tag 'mlx5-fixes-2019-07-11' of git://git.kernel.org/pub/scm/linux/kernel/git...
[linux-2.6-block.git] / drivers / net / ethernet / mellanox / mlx5 / core / ipoib / ipoib.c
1 /*
2  * Copyright (c) 2017, Mellanox Technologies. All rights reserved.
3  *
4  * This software is available to you under a choice of one of two
5  * licenses.  You may choose to be licensed under the terms of the GNU
6  * General Public License (GPL) Version 2, available from the file
7  * COPYING in the main directory of this source tree, or the
8  * OpenIB.org BSD license below:
9  *
10  *     Redistribution and use in source and binary forms, with or
11  *     without modification, are permitted provided that the following
12  *     conditions are met:
13  *
14  *      - Redistributions of source code must retain the above
15  *        copyright notice, this list of conditions and the following
16  *        disclaimer.
17  *
18  *      - Redistributions in binary form must reproduce the above
19  *        copyright notice, this list of conditions and the following
20  *        disclaimer in the documentation and/or other materials
21  *        provided with the distribution.
22  *
23  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
24  * EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
25  * MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
26  * NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS
27  * BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN
28  * ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN
29  * CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
30  * SOFTWARE.
31  */
32
33 #include <rdma/ib_verbs.h>
34 #include <linux/mlx5/fs.h>
35 #include "en.h"
36 #include "ipoib.h"
37
38 #define IB_DEFAULT_Q_KEY   0xb1b
39 #define MLX5I_PARAMS_DEFAULT_LOG_RQ_SIZE 9
40
41 static int mlx5i_open(struct net_device *netdev);
42 static int mlx5i_close(struct net_device *netdev);
43 static int mlx5i_change_mtu(struct net_device *netdev, int new_mtu);
44
45 static const struct net_device_ops mlx5i_netdev_ops = {
46         .ndo_open                = mlx5i_open,
47         .ndo_stop                = mlx5i_close,
48         .ndo_get_stats64         = mlx5i_get_stats,
49         .ndo_init                = mlx5i_dev_init,
50         .ndo_uninit              = mlx5i_dev_cleanup,
51         .ndo_change_mtu          = mlx5i_change_mtu,
52         .ndo_do_ioctl            = mlx5i_ioctl,
53 };
54
55 /* IPoIB mlx5 netdev profile */
56 static void mlx5i_build_nic_params(struct mlx5_core_dev *mdev,
57                                    struct mlx5e_params *params)
58 {
59         /* Override RQ params as IPoIB supports only LINKED LIST RQ for now */
60         MLX5E_SET_PFLAG(params, MLX5E_PFLAG_RX_STRIDING_RQ, false);
61         mlx5e_set_rq_type(mdev, params);
62         mlx5e_init_rq_type_params(mdev, params);
63
64         /* RQ size in ipoib by default is 512 */
65         params->log_rq_mtu_frames = is_kdump_kernel() ?
66                 MLX5E_PARAMS_MINIMUM_LOG_RQ_SIZE :
67                 MLX5I_PARAMS_DEFAULT_LOG_RQ_SIZE;
68
69         params->lro_en = false;
70         params->hard_mtu = MLX5_IB_GRH_BYTES + MLX5_IPOIB_HARD_LEN;
71         params->tunneled_offload_en = false;
72 }
73
74 /* Called directly after IPoIB netdevice was created to initialize SW structs */
75 int mlx5i_init(struct mlx5_core_dev *mdev,
76                struct net_device *netdev,
77                const struct mlx5e_profile *profile,
78                void *ppriv)
79 {
80         struct mlx5e_priv *priv  = mlx5i_epriv(netdev);
81         int err;
82
83         err = mlx5e_netdev_init(netdev, priv, mdev, profile, ppriv);
84         if (err)
85                 return err;
86
87         mlx5e_set_netdev_mtu_boundaries(priv);
88         netdev->mtu = netdev->max_mtu;
89
90         mlx5e_build_nic_params(mdev, NULL, &priv->rss_params, &priv->channels.params,
91                                mlx5e_get_netdev_max_channels(netdev),
92                                netdev->mtu);
93         mlx5i_build_nic_params(mdev, &priv->channels.params);
94
95         mlx5e_timestamp_init(priv);
96
97         /* netdev init */
98         netdev->hw_features    |= NETIF_F_SG;
99         netdev->hw_features    |= NETIF_F_IP_CSUM;
100         netdev->hw_features    |= NETIF_F_IPV6_CSUM;
101         netdev->hw_features    |= NETIF_F_GRO;
102         netdev->hw_features    |= NETIF_F_TSO;
103         netdev->hw_features    |= NETIF_F_TSO6;
104         netdev->hw_features    |= NETIF_F_RXCSUM;
105         netdev->hw_features    |= NETIF_F_RXHASH;
106
107         netdev->netdev_ops = &mlx5i_netdev_ops;
108         netdev->ethtool_ops = &mlx5i_ethtool_ops;
109
110         return 0;
111 }
112
113 /* Called directly before IPoIB netdevice is destroyed to cleanup SW structs */
114 void mlx5i_cleanup(struct mlx5e_priv *priv)
115 {
116         mlx5e_netdev_cleanup(priv->netdev, priv);
117 }
118
119 static void mlx5i_grp_sw_update_stats(struct mlx5e_priv *priv)
120 {
121         int max_nch = mlx5e_get_netdev_max_channels(priv->netdev);
122         struct mlx5e_sw_stats s = { 0 };
123         int i, j;
124
125         for (i = 0; i < max_nch; i++) {
126                 struct mlx5e_channel_stats *channel_stats;
127                 struct mlx5e_rq_stats *rq_stats;
128
129                 channel_stats = &priv->channel_stats[i];
130                 rq_stats = &channel_stats->rq;
131
132                 s.rx_packets += rq_stats->packets;
133                 s.rx_bytes   += rq_stats->bytes;
134
135                 for (j = 0; j < priv->max_opened_tc; j++) {
136                         struct mlx5e_sq_stats *sq_stats = &channel_stats->sq[j];
137
138                         s.tx_packets           += sq_stats->packets;
139                         s.tx_bytes             += sq_stats->bytes;
140                         s.tx_queue_dropped     += sq_stats->dropped;
141                 }
142         }
143
144         memcpy(&priv->stats.sw, &s, sizeof(s));
145 }
146
147 void mlx5i_get_stats(struct net_device *dev, struct rtnl_link_stats64 *stats)
148 {
149         struct mlx5e_priv     *priv   = mlx5i_epriv(dev);
150         struct mlx5e_sw_stats *sstats = &priv->stats.sw;
151
152         mlx5i_grp_sw_update_stats(priv);
153
154         stats->rx_packets = sstats->rx_packets;
155         stats->rx_bytes   = sstats->rx_bytes;
156         stats->tx_packets = sstats->tx_packets;
157         stats->tx_bytes   = sstats->tx_bytes;
158         stats->tx_dropped = sstats->tx_queue_dropped;
159 }
160
161 int mlx5i_init_underlay_qp(struct mlx5e_priv *priv)
162 {
163         struct mlx5_core_dev *mdev = priv->mdev;
164         struct mlx5i_priv *ipriv = priv->ppriv;
165         struct mlx5_core_qp *qp = &ipriv->qp;
166         struct mlx5_qp_context *context;
167         int ret;
168
169         /* QP states */
170         context = kzalloc(sizeof(*context), GFP_KERNEL);
171         if (!context)
172                 return -ENOMEM;
173
174         context->flags = cpu_to_be32(MLX5_QP_PM_MIGRATED << 11);
175         context->pri_path.port = 1;
176         context->pri_path.pkey_index = cpu_to_be16(ipriv->pkey_index);
177         context->qkey = cpu_to_be32(IB_DEFAULT_Q_KEY);
178
179         ret = mlx5_core_qp_modify(mdev, MLX5_CMD_OP_RST2INIT_QP, 0, context, qp);
180         if (ret) {
181                 mlx5_core_err(mdev, "Failed to modify qp RST2INIT, err: %d\n", ret);
182                 goto err_qp_modify_to_err;
183         }
184         memset(context, 0, sizeof(*context));
185
186         ret = mlx5_core_qp_modify(mdev, MLX5_CMD_OP_INIT2RTR_QP, 0, context, qp);
187         if (ret) {
188                 mlx5_core_err(mdev, "Failed to modify qp INIT2RTR, err: %d\n", ret);
189                 goto err_qp_modify_to_err;
190         }
191
192         ret = mlx5_core_qp_modify(mdev, MLX5_CMD_OP_RTR2RTS_QP, 0, context, qp);
193         if (ret) {
194                 mlx5_core_err(mdev, "Failed to modify qp RTR2RTS, err: %d\n", ret);
195                 goto err_qp_modify_to_err;
196         }
197
198         kfree(context);
199         return 0;
200
201 err_qp_modify_to_err:
202         mlx5_core_qp_modify(mdev, MLX5_CMD_OP_2ERR_QP, 0, &context, qp);
203         kfree(context);
204         return ret;
205 }
206
207 void mlx5i_uninit_underlay_qp(struct mlx5e_priv *priv)
208 {
209         struct mlx5i_priv *ipriv = priv->ppriv;
210         struct mlx5_core_dev *mdev = priv->mdev;
211         struct mlx5_qp_context context;
212         int err;
213
214         err = mlx5_core_qp_modify(mdev, MLX5_CMD_OP_2RST_QP, 0, &context,
215                                   &ipriv->qp);
216         if (err)
217                 mlx5_core_err(mdev, "Failed to modify qp 2RST, err: %d\n", err);
218 }
219
220 #define MLX5_QP_ENHANCED_ULP_STATELESS_MODE 2
221
222 int mlx5i_create_underlay_qp(struct mlx5_core_dev *mdev, struct mlx5_core_qp *qp)
223 {
224         u32 *in = NULL;
225         void *addr_path;
226         int ret = 0;
227         int inlen;
228         void *qpc;
229
230         inlen = MLX5_ST_SZ_BYTES(create_qp_in);
231         in = kvzalloc(inlen, GFP_KERNEL);
232         if (!in)
233                 return -ENOMEM;
234
235         qpc = MLX5_ADDR_OF(create_qp_in, in, qpc);
236         MLX5_SET(qpc, qpc, st, MLX5_QP_ST_UD);
237         MLX5_SET(qpc, qpc, pm_state, MLX5_QP_PM_MIGRATED);
238         MLX5_SET(qpc, qpc, ulp_stateless_offload_mode,
239                  MLX5_QP_ENHANCED_ULP_STATELESS_MODE);
240
241         addr_path = MLX5_ADDR_OF(qpc, qpc, primary_address_path);
242         MLX5_SET(ads, addr_path, vhca_port_num, 1);
243         MLX5_SET(ads, addr_path, grh, 1);
244
245         ret = mlx5_core_create_qp(mdev, qp, in, inlen);
246         if (ret) {
247                 mlx5_core_err(mdev, "Failed creating IPoIB QP err : %d\n", ret);
248                 goto out;
249         }
250
251 out:
252         kvfree(in);
253         return ret;
254 }
255
256 void mlx5i_destroy_underlay_qp(struct mlx5_core_dev *mdev, struct mlx5_core_qp *qp)
257 {
258         mlx5_core_destroy_qp(mdev, qp);
259 }
260
261 int mlx5i_create_tis(struct mlx5_core_dev *mdev, u32 underlay_qpn, u32 *tisn)
262 {
263         u32 in[MLX5_ST_SZ_DW(create_tis_in)] = {};
264         void *tisc;
265
266         tisc = MLX5_ADDR_OF(create_tis_in, in, ctx);
267
268         MLX5_SET(tisc, tisc, underlay_qpn, underlay_qpn);
269
270         return mlx5e_create_tis(mdev, in, tisn);
271 }
272
273 static int mlx5i_init_tx(struct mlx5e_priv *priv)
274 {
275         struct mlx5i_priv *ipriv = priv->ppriv;
276         int err;
277
278         err = mlx5i_create_underlay_qp(priv->mdev, &ipriv->qp);
279         if (err) {
280                 mlx5_core_warn(priv->mdev, "create underlay QP failed, %d\n", err);
281                 return err;
282         }
283
284         err = mlx5i_create_tis(priv->mdev, ipriv->qp.qpn, &priv->tisn[0]);
285         if (err) {
286                 mlx5_core_warn(priv->mdev, "create tis failed, %d\n", err);
287                 goto err_destroy_underlay_qp;
288         }
289
290         return 0;
291
292 err_destroy_underlay_qp:
293         mlx5i_destroy_underlay_qp(priv->mdev, &ipriv->qp);
294         return err;
295 }
296
297 static void mlx5i_cleanup_tx(struct mlx5e_priv *priv)
298 {
299         struct mlx5i_priv *ipriv = priv->ppriv;
300
301         mlx5e_destroy_tis(priv->mdev, priv->tisn[0]);
302         mlx5i_destroy_underlay_qp(priv->mdev, &ipriv->qp);
303 }
304
305 static int mlx5i_create_flow_steering(struct mlx5e_priv *priv)
306 {
307         struct ttc_params ttc_params = {};
308         int tt, err;
309
310         priv->fs.ns = mlx5_get_flow_namespace(priv->mdev,
311                                                MLX5_FLOW_NAMESPACE_KERNEL);
312
313         if (!priv->fs.ns)
314                 return -EINVAL;
315
316         err = mlx5e_arfs_create_tables(priv);
317         if (err) {
318                 netdev_err(priv->netdev, "Failed to create arfs tables, err=%d\n",
319                            err);
320                 priv->netdev->hw_features &= ~NETIF_F_NTUPLE;
321         }
322
323         mlx5e_set_ttc_basic_params(priv, &ttc_params);
324         mlx5e_set_inner_ttc_ft_params(&ttc_params);
325         for (tt = 0; tt < MLX5E_NUM_INDIR_TIRS; tt++)
326                 ttc_params.indir_tirn[tt] = priv->inner_indir_tir[tt].tirn;
327
328         err = mlx5e_create_inner_ttc_table(priv, &ttc_params, &priv->fs.inner_ttc);
329         if (err) {
330                 netdev_err(priv->netdev, "Failed to create inner ttc table, err=%d\n",
331                            err);
332                 goto err_destroy_arfs_tables;
333         }
334
335         mlx5e_set_ttc_ft_params(&ttc_params);
336         for (tt = 0; tt < MLX5E_NUM_INDIR_TIRS; tt++)
337                 ttc_params.indir_tirn[tt] = priv->indir_tir[tt].tirn;
338
339         err = mlx5e_create_ttc_table(priv, &ttc_params, &priv->fs.ttc);
340         if (err) {
341                 netdev_err(priv->netdev, "Failed to create ttc table, err=%d\n",
342                            err);
343                 goto err_destroy_inner_ttc_table;
344         }
345
346         return 0;
347
348 err_destroy_inner_ttc_table:
349         mlx5e_destroy_inner_ttc_table(priv, &priv->fs.inner_ttc);
350 err_destroy_arfs_tables:
351         mlx5e_arfs_destroy_tables(priv);
352
353         return err;
354 }
355
356 static void mlx5i_destroy_flow_steering(struct mlx5e_priv *priv)
357 {
358         mlx5e_destroy_ttc_table(priv, &priv->fs.ttc);
359         mlx5e_destroy_inner_ttc_table(priv, &priv->fs.inner_ttc);
360         mlx5e_arfs_destroy_tables(priv);
361 }
362
363 static int mlx5i_init_rx(struct mlx5e_priv *priv)
364 {
365         struct mlx5_core_dev *mdev = priv->mdev;
366         int err;
367
368         mlx5e_create_q_counters(priv);
369
370         err = mlx5e_open_drop_rq(priv, &priv->drop_rq);
371         if (err) {
372                 mlx5_core_err(mdev, "open drop rq failed, %d\n", err);
373                 goto err_destroy_q_counters;
374         }
375
376         err = mlx5e_create_indirect_rqt(priv);
377         if (err)
378                 goto err_close_drop_rq;
379
380         err = mlx5e_create_direct_rqts(priv, priv->direct_tir);
381         if (err)
382                 goto err_destroy_indirect_rqts;
383
384         err = mlx5e_create_indirect_tirs(priv, true);
385         if (err)
386                 goto err_destroy_direct_rqts;
387
388         err = mlx5e_create_direct_tirs(priv, priv->direct_tir);
389         if (err)
390                 goto err_destroy_indirect_tirs;
391
392         err = mlx5i_create_flow_steering(priv);
393         if (err)
394                 goto err_destroy_direct_tirs;
395
396         return 0;
397
398 err_destroy_direct_tirs:
399         mlx5e_destroy_direct_tirs(priv, priv->direct_tir);
400 err_destroy_indirect_tirs:
401         mlx5e_destroy_indirect_tirs(priv, true);
402 err_destroy_direct_rqts:
403         mlx5e_destroy_direct_rqts(priv, priv->direct_tir);
404 err_destroy_indirect_rqts:
405         mlx5e_destroy_rqt(priv, &priv->indir_rqt);
406 err_close_drop_rq:
407         mlx5e_close_drop_rq(&priv->drop_rq);
408 err_destroy_q_counters:
409         mlx5e_destroy_q_counters(priv);
410         return err;
411 }
412
413 static void mlx5i_cleanup_rx(struct mlx5e_priv *priv)
414 {
415         mlx5i_destroy_flow_steering(priv);
416         mlx5e_destroy_direct_tirs(priv, priv->direct_tir);
417         mlx5e_destroy_indirect_tirs(priv, true);
418         mlx5e_destroy_direct_rqts(priv, priv->direct_tir);
419         mlx5e_destroy_rqt(priv, &priv->indir_rqt);
420         mlx5e_close_drop_rq(&priv->drop_rq);
421         mlx5e_destroy_q_counters(priv);
422 }
423
424 static const struct mlx5e_profile mlx5i_nic_profile = {
425         .init              = mlx5i_init,
426         .cleanup           = mlx5i_cleanup,
427         .init_tx           = mlx5i_init_tx,
428         .cleanup_tx        = mlx5i_cleanup_tx,
429         .init_rx           = mlx5i_init_rx,
430         .cleanup_rx        = mlx5i_cleanup_rx,
431         .enable            = NULL, /* mlx5i_enable */
432         .disable           = NULL, /* mlx5i_disable */
433         .update_rx         = mlx5e_update_nic_rx,
434         .update_stats      = NULL, /* mlx5i_update_stats */
435         .update_carrier    = NULL, /* no HW update in IB link */
436         .rx_handlers.handle_rx_cqe       = mlx5i_handle_rx_cqe,
437         .rx_handlers.handle_rx_cqe_mpwqe = NULL, /* Not supported */
438         .max_tc            = MLX5I_MAX_NUM_TC,
439 };
440
441 /* mlx5i netdev NDos */
442
443 static int mlx5i_change_mtu(struct net_device *netdev, int new_mtu)
444 {
445         struct mlx5e_priv *priv = mlx5i_epriv(netdev);
446         struct mlx5e_channels new_channels = {};
447         struct mlx5e_params *params;
448         int err = 0;
449
450         mutex_lock(&priv->state_lock);
451
452         params = &priv->channels.params;
453
454         if (!test_bit(MLX5E_STATE_OPENED, &priv->state)) {
455                 params->sw_mtu = new_mtu;
456                 netdev->mtu = params->sw_mtu;
457                 goto out;
458         }
459
460         new_channels.params = *params;
461         new_channels.params.sw_mtu = new_mtu;
462
463         err = mlx5e_safe_switch_channels(priv, &new_channels, NULL);
464         if (err)
465                 goto out;
466
467         netdev->mtu = new_channels.params.sw_mtu;
468
469 out:
470         mutex_unlock(&priv->state_lock);
471         return err;
472 }
473
474 int mlx5i_dev_init(struct net_device *dev)
475 {
476         struct mlx5e_priv    *priv   = mlx5i_epriv(dev);
477         struct mlx5i_priv    *ipriv  = priv->ppriv;
478
479         /* Set dev address using underlay QP */
480         dev->dev_addr[1] = (ipriv->qp.qpn >> 16) & 0xff;
481         dev->dev_addr[2] = (ipriv->qp.qpn >>  8) & 0xff;
482         dev->dev_addr[3] = (ipriv->qp.qpn) & 0xff;
483
484         /* Add QPN to net-device mapping to HT */
485         mlx5i_pkey_add_qpn(dev ,ipriv->qp.qpn);
486
487         return 0;
488 }
489
490 int mlx5i_ioctl(struct net_device *dev, struct ifreq *ifr, int cmd)
491 {
492         struct mlx5e_priv *priv = mlx5i_epriv(dev);
493
494         switch (cmd) {
495         case SIOCSHWTSTAMP:
496                 return mlx5e_hwstamp_set(priv, ifr);
497         case SIOCGHWTSTAMP:
498                 return mlx5e_hwstamp_get(priv, ifr);
499         default:
500                 return -EOPNOTSUPP;
501         }
502 }
503
504 void mlx5i_dev_cleanup(struct net_device *dev)
505 {
506         struct mlx5e_priv    *priv   = mlx5i_epriv(dev);
507         struct mlx5i_priv    *ipriv = priv->ppriv;
508
509         mlx5i_uninit_underlay_qp(priv);
510
511         /* Delete QPN to net-device mapping from HT */
512         mlx5i_pkey_del_qpn(dev, ipriv->qp.qpn);
513 }
514
515 static int mlx5i_open(struct net_device *netdev)
516 {
517         struct mlx5e_priv *epriv = mlx5i_epriv(netdev);
518         struct mlx5i_priv *ipriv = epriv->ppriv;
519         struct mlx5_core_dev *mdev = epriv->mdev;
520         int err;
521
522         mutex_lock(&epriv->state_lock);
523
524         set_bit(MLX5E_STATE_OPENED, &epriv->state);
525
526         err = mlx5i_init_underlay_qp(epriv);
527         if (err) {
528                 mlx5_core_warn(mdev, "prepare underlay qp state failed, %d\n", err);
529                 goto err_clear_state_opened_flag;
530         }
531
532         err = mlx5_fs_add_rx_underlay_qpn(mdev, ipriv->qp.qpn);
533         if (err) {
534                 mlx5_core_warn(mdev, "attach underlay qp to ft failed, %d\n", err);
535                 goto err_reset_qp;
536         }
537
538         err = mlx5e_open_channels(epriv, &epriv->channels);
539         if (err)
540                 goto err_remove_fs_underlay_qp;
541
542         epriv->profile->update_rx(epriv);
543         mlx5e_activate_priv_channels(epriv);
544
545         mutex_unlock(&epriv->state_lock);
546         return 0;
547
548 err_remove_fs_underlay_qp:
549         mlx5_fs_remove_rx_underlay_qpn(mdev, ipriv->qp.qpn);
550 err_reset_qp:
551         mlx5i_uninit_underlay_qp(epriv);
552 err_clear_state_opened_flag:
553         clear_bit(MLX5E_STATE_OPENED, &epriv->state);
554         mutex_unlock(&epriv->state_lock);
555         return err;
556 }
557
558 static int mlx5i_close(struct net_device *netdev)
559 {
560         struct mlx5e_priv *epriv = mlx5i_epriv(netdev);
561         struct mlx5i_priv *ipriv = epriv->ppriv;
562         struct mlx5_core_dev *mdev = epriv->mdev;
563
564         /* May already be CLOSED in case a previous configuration operation
565          * (e.g RX/TX queue size change) that involves close&open failed.
566          */
567         mutex_lock(&epriv->state_lock);
568
569         if (!test_bit(MLX5E_STATE_OPENED, &epriv->state))
570                 goto unlock;
571
572         clear_bit(MLX5E_STATE_OPENED, &epriv->state);
573
574         netif_carrier_off(epriv->netdev);
575         mlx5_fs_remove_rx_underlay_qpn(mdev, ipriv->qp.qpn);
576         mlx5e_deactivate_priv_channels(epriv);
577         mlx5e_close_channels(&epriv->channels);
578         mlx5i_uninit_underlay_qp(epriv);
579 unlock:
580         mutex_unlock(&epriv->state_lock);
581         return 0;
582 }
583
584 /* IPoIB RDMA netdev callbacks */
585 static int mlx5i_attach_mcast(struct net_device *netdev, struct ib_device *hca,
586                               union ib_gid *gid, u16 lid, int set_qkey,
587                               u32 qkey)
588 {
589         struct mlx5e_priv    *epriv = mlx5i_epriv(netdev);
590         struct mlx5_core_dev *mdev  = epriv->mdev;
591         struct mlx5i_priv    *ipriv = epriv->ppriv;
592         int err;
593
594         mlx5_core_dbg(mdev, "attaching QPN 0x%x, MGID %pI6\n", ipriv->qp.qpn, gid->raw);
595         err = mlx5_core_attach_mcg(mdev, gid, ipriv->qp.qpn);
596         if (err)
597                 mlx5_core_warn(mdev, "failed attaching QPN 0x%x, MGID %pI6\n",
598                                ipriv->qp.qpn, gid->raw);
599
600         if (set_qkey) {
601                 mlx5_core_dbg(mdev, "%s setting qkey 0x%x\n",
602                               netdev->name, qkey);
603                 ipriv->qkey = qkey;
604         }
605
606         return err;
607 }
608
609 static int mlx5i_detach_mcast(struct net_device *netdev, struct ib_device *hca,
610                               union ib_gid *gid, u16 lid)
611 {
612         struct mlx5e_priv    *epriv = mlx5i_epriv(netdev);
613         struct mlx5_core_dev *mdev  = epriv->mdev;
614         struct mlx5i_priv    *ipriv = epriv->ppriv;
615         int err;
616
617         mlx5_core_dbg(mdev, "detaching QPN 0x%x, MGID %pI6\n", ipriv->qp.qpn, gid->raw);
618
619         err = mlx5_core_detach_mcg(mdev, gid, ipriv->qp.qpn);
620         if (err)
621                 mlx5_core_dbg(mdev, "failed detaching QPN 0x%x, MGID %pI6\n",
622                               ipriv->qp.qpn, gid->raw);
623
624         return err;
625 }
626
627 static int mlx5i_xmit(struct net_device *dev, struct sk_buff *skb,
628                       struct ib_ah *address, u32 dqpn)
629 {
630         struct mlx5e_priv *epriv = mlx5i_epriv(dev);
631         struct mlx5e_txqsq *sq   = epriv->txq2sq[skb_get_queue_mapping(skb)];
632         struct mlx5_ib_ah *mah   = to_mah(address);
633         struct mlx5i_priv *ipriv = epriv->ppriv;
634
635         return mlx5i_sq_xmit(sq, skb, &mah->av, dqpn, ipriv->qkey, netdev_xmit_more());
636 }
637
638 static void mlx5i_set_pkey_index(struct net_device *netdev, int id)
639 {
640         struct mlx5i_priv *ipriv = netdev_priv(netdev);
641
642         ipriv->pkey_index = (u16)id;
643 }
644
645 static int mlx5i_check_required_hca_cap(struct mlx5_core_dev *mdev)
646 {
647         if (MLX5_CAP_GEN(mdev, port_type) != MLX5_CAP_PORT_TYPE_IB)
648                 return -EOPNOTSUPP;
649
650         if (!MLX5_CAP_GEN(mdev, ipoib_enhanced_offloads)) {
651                 mlx5_core_warn(mdev, "IPoIB enhanced offloads are not supported\n");
652                 return -EOPNOTSUPP;
653         }
654
655         return 0;
656 }
657
658 static void mlx5_rdma_netdev_free(struct net_device *netdev)
659 {
660         struct mlx5e_priv *priv = mlx5i_epriv(netdev);
661         struct mlx5i_priv *ipriv = priv->ppriv;
662         const struct mlx5e_profile *profile = priv->profile;
663
664         mlx5e_detach_netdev(priv);
665         profile->cleanup(priv);
666
667         if (!ipriv->sub_interface) {
668                 mlx5i_pkey_qpn_ht_cleanup(netdev);
669                 mlx5e_destroy_mdev_resources(priv->mdev);
670         }
671 }
672
673 static bool mlx5_is_sub_interface(struct mlx5_core_dev *mdev)
674 {
675         return mdev->mlx5e_res.pdn != 0;
676 }
677
678 static const struct mlx5e_profile *mlx5_get_profile(struct mlx5_core_dev *mdev)
679 {
680         if (mlx5_is_sub_interface(mdev))
681                 return mlx5i_pkey_get_profile();
682         return &mlx5i_nic_profile;
683 }
684
685 static int mlx5_rdma_setup_rn(struct ib_device *ibdev, u8 port_num,
686                               struct net_device *netdev, void *param)
687 {
688         struct mlx5_core_dev *mdev = (struct mlx5_core_dev *)param;
689         const struct mlx5e_profile *prof = mlx5_get_profile(mdev);
690         struct mlx5i_priv *ipriv;
691         struct mlx5e_priv *epriv;
692         struct rdma_netdev *rn;
693         int err;
694
695         ipriv = netdev_priv(netdev);
696         epriv = mlx5i_epriv(netdev);
697
698         ipriv->sub_interface = mlx5_is_sub_interface(mdev);
699         if (!ipriv->sub_interface) {
700                 err = mlx5i_pkey_qpn_ht_init(netdev);
701                 if (err) {
702                         mlx5_core_warn(mdev, "allocate qpn_to_netdev ht failed\n");
703                         return err;
704                 }
705
706                 /* This should only be called once per mdev */
707                 err = mlx5e_create_mdev_resources(mdev);
708                 if (err)
709                         goto destroy_ht;
710         }
711
712         prof->init(mdev, netdev, prof, ipriv);
713
714         err = mlx5e_attach_netdev(epriv);
715         if (err)
716                 goto detach;
717         netif_carrier_off(netdev);
718
719         /* set rdma_netdev func pointers */
720         rn = &ipriv->rn;
721         rn->hca  = ibdev;
722         rn->send = mlx5i_xmit;
723         rn->attach_mcast = mlx5i_attach_mcast;
724         rn->detach_mcast = mlx5i_detach_mcast;
725         rn->set_id = mlx5i_set_pkey_index;
726
727         netdev->priv_destructor = mlx5_rdma_netdev_free;
728         netdev->needs_free_netdev = 1;
729
730         return 0;
731
732 detach:
733         prof->cleanup(epriv);
734         if (ipriv->sub_interface)
735                 return err;
736         mlx5e_destroy_mdev_resources(mdev);
737 destroy_ht:
738         mlx5i_pkey_qpn_ht_cleanup(netdev);
739         return err;
740 }
741
742 int mlx5_rdma_rn_get_params(struct mlx5_core_dev *mdev,
743                             struct ib_device *device,
744                             struct rdma_netdev_alloc_params *params)
745 {
746         int nch;
747         int rc;
748
749         rc = mlx5i_check_required_hca_cap(mdev);
750         if (rc)
751                 return rc;
752
753         nch = mlx5e_get_max_num_channels(mdev);
754
755         *params = (struct rdma_netdev_alloc_params){
756                 .sizeof_priv = sizeof(struct mlx5i_priv) +
757                                sizeof(struct mlx5e_priv),
758                 .txqs = nch * MLX5E_MAX_NUM_TC,
759                 .rxqs = nch,
760                 .param = mdev,
761                 .initialize_rdma_netdev = mlx5_rdma_setup_rn,
762         };
763
764         return 0;
765 }
766 EXPORT_SYMBOL(mlx5_rdma_rn_get_params);