create_qp() and destroy_qp() now written (but not tested).
[people/andreif/gpxe.git] / src / drivers / net / mlx_ipoib / mt25218.c
1 /**************************************************************************
2 Etherboot -  BOOTP/TFTP Bootstrap Program
3 Skeleton NIC driver for Etherboot
4 ***************************************************************************/
5
6 /*
7  * This program is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU General Public License as
9  * published by the Free Software Foundation; either version 2, or (at
10  * your option) any later version.
11  */
12
13 #include <errno.h>
14 #include <gpxe/pci.h>
15 #include <gpxe/malloc.h>
16 #include <gpxe/iobuf.h>
17 #include <gpxe/netdevice.h>
18 #include <gpxe/infiniband.h>
19
20 /* to get some global routines like printf */
21 #include "etherboot.h"
22 /* to get the interface to the body of the program */
23 #include "nic.h"
24
25 #include "mt25218_imp.c"
26
27 #include "arbel.h"
28
29
30 static const struct ib_gid arbel_no_gid = {
31         { 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2 }
32 };
33
34
35 #define MLX_RX_MAX_FILL NUM_IPOIB_RCV_WQES
36
37 struct mlx_nic {
38         /** Queue pair handle */
39         udqp_t ipoib_qph;
40         /** Broadcast Address Vector */
41         ud_av_t bcast_av;
42         /** Send completion queue */
43         cq_t snd_cqh;
44         /** Receive completion queue */
45         cq_t rcv_cqh;
46
47         /** RX fill level */
48         unsigned int rx_fill;
49 };
50
51
52 static struct io_buffer *static_ipoib_tx_ring[NUM_IPOIB_SND_WQES];
53 static struct io_buffer *static_ipoib_rx_ring[NUM_IPOIB_RCV_WQES];
54
55 static struct arbel static_arbel;
56
57 static struct arbel_completion_queue static_arbel_ipoib_send_cq = {
58         .ci_doorbell_idx = IPOIB_SND_CQ_CI_DB_IDX,
59 };
60 static struct ib_completion_queue static_ipoib_send_cq = {
61         .cqn = 1234, /* Only used for debug messages */
62         .num_cqes = NUM_IPOIB_SND_CQES,
63         .work_queues = LIST_HEAD_INIT ( static_ipoib_send_cq.work_queues ),
64         .dev_priv = &static_arbel_ipoib_send_cq,
65 };
66
67 static struct arbel_completion_queue static_arbel_ipoib_recv_cq = {
68         .ci_doorbell_idx = IPOIB_RCV_CQ_CI_DB_IDX,
69 };
70 static struct ib_completion_queue static_ipoib_recv_cq = {
71         .cqn = 2345, /* Only used for debug messages */
72         .num_cqes = NUM_IPOIB_RCV_CQES,
73         .work_queues = LIST_HEAD_INIT ( static_ipoib_recv_cq.work_queues ),
74         .dev_priv = &static_arbel_ipoib_recv_cq,
75 };
76
77 static struct arbel_queue_pair static_arbel_ipoib_qp = {
78         .send = {
79                 .doorbell_idx = IPOIB_SND_QP_DB_IDX,
80         },
81         .recv = {
82                 .doorbell_idx = IPOIB_RCV_QP_DB_IDX,
83         },
84 };
85 static struct ib_queue_pair static_ipoib_qp = {
86         .send = {
87                 .qp = &static_ipoib_qp,
88                 .is_send = 1,
89                 .cq = &static_ipoib_send_cq,
90                 .num_wqes = NUM_IPOIB_SND_WQES,
91                 .iobufs = static_ipoib_tx_ring,
92                 .list = LIST_HEAD_INIT (static_ipoib_qp.send.list),
93                 .dev_priv = &static_arbel_ipoib_qp.send,
94         },
95         .recv = {
96                 .qp = &static_ipoib_qp,
97                 .is_send = 0,
98                 .cq = &static_ipoib_recv_cq,
99                 .num_wqes = NUM_IPOIB_RCV_WQES,
100                 .iobufs = static_ipoib_rx_ring,
101                 .list = LIST_HEAD_INIT (static_ipoib_qp.recv.list),
102                 .dev_priv = &static_arbel_ipoib_qp.recv,
103         },
104         .dev_priv = &static_arbel_ipoib_qp,
105 };
106
107
108 static struct ib_device static_ibdev = {
109         .dev_priv = &static_arbel,
110 };
111
112
113 /**
114  * Open network device
115  *
116  * @v netdev            Network device
117  * @ret rc              Return status code
118  */
119 static int mlx_open ( struct net_device *netdev ) {
120
121         ( void ) netdev;
122
123         return 0;
124 }
125
126 /**
127  * Close network device
128  *
129  * @v netdev            Network device
130  */
131 static void mlx_close ( struct net_device *netdev ) {
132
133         ( void ) netdev;
134
135 }
136
137 static int arbel_post_send ( struct ib_device *ibdev,
138                              struct ib_queue_pair *qp,
139                              struct ib_address_vector *av,
140                              struct io_buffer *iobuf );
141
142 static int mlx_transmit_direct ( struct net_device *netdev,
143                                  struct io_buffer *iobuf ) {
144         struct mlx_nic *mlx = netdev->priv;
145         int rc;
146
147         struct ud_av_st *bcast_av = mlx->bcast_av;
148         struct arbelprm_ud_address_vector *bav =
149                 ( struct arbelprm_ud_address_vector * ) &bcast_av->av;
150         struct ib_address_vector av = {
151                 .dest_qp = bcast_av->dest_qp,
152                 .qkey = bcast_av->qkey,
153                 .dlid = MLX_GET ( bav, rlid ),
154                 .rate = ( MLX_GET ( bav, max_stat_rate ) ? 1 : 4 ),
155                 .sl = MLX_GET ( bav, sl ),
156                 .gid_present = 1,
157         };
158         memcpy ( &av.gid, ( ( void * ) bav ) + 16, 16 );
159
160         rc = arbel_post_send ( &static_ibdev, &static_ipoib_qp, &av, iobuf );
161
162         return rc;
163 }
164
165 static void arbel_poll_cq ( struct ib_device *ibdev,
166                             struct ib_completion_queue *cq,
167                             ib_completer_t complete_send,
168                             ib_completer_t complete_recv );
169
170 static void temp_complete_send ( struct ib_device *ibdev __unused,
171                                  struct ib_queue_pair *qp,
172                                  struct ib_completion *completion,
173                                  struct io_buffer *iobuf ) {
174         struct net_device *netdev = qp->owner_priv;
175
176         DBG ( "Wahey! TX completion\n" );
177         netdev_tx_complete_err ( netdev, iobuf,
178                                  ( completion->syndrome ? -EIO : 0 ) );
179 }
180
181 static void temp_complete_recv ( struct ib_device *ibdev __unused,
182                                  struct ib_queue_pair *qp,
183                                  struct ib_completion *completion,
184                                  struct io_buffer *iobuf ) {
185         struct net_device *netdev = qp->owner_priv;
186         struct mlx_nic *mlx = netdev->priv;
187
188         DBG ( "Yay! RX completion on %p len %zx:\n", iobuf, completion->len );
189         if ( completion->syndrome ) {
190                 netdev_rx_err ( netdev, iobuf, -EIO );
191         } else {
192                 iob_put ( iobuf, completion->len );
193                 iob_pull ( iobuf, sizeof ( struct ib_global_route_header ) );
194                 netdev_rx ( netdev, iobuf );
195         }
196
197         mlx->rx_fill--;
198 }
199
200 static int arbel_post_recv ( struct ib_device *ibdev,
201                              struct ib_queue_pair *qp,
202                              struct io_buffer *iobuf );
203
204 static void mlx_refill_rx ( struct net_device *netdev ) {
205         struct mlx_nic *mlx = netdev->priv;
206         struct io_buffer *iobuf;
207         int rc;
208
209         while ( mlx->rx_fill < MLX_RX_MAX_FILL ) {
210                 iobuf = alloc_iob ( 2048 );
211                 if ( ! iobuf )
212                         break;
213                 DBG ( "Posting RX buffer %p:\n", iobuf );
214                 if ( ( rc = arbel_post_recv ( &static_ibdev,
215                                               &static_ipoib_qp,
216                                               iobuf ) ) != 0 ) {
217                         free_iob ( iobuf );
218                         break;
219                 }
220                 mlx->rx_fill++;
221         }
222 }
223
224 /**
225  * Poll for completed and received packets
226  *
227  * @v netdev            Network device
228  */
229 static void mlx_poll ( struct net_device *netdev ) {
230         struct mlx_nic *mlx = netdev->priv;
231         int rc;
232
233         if ( ( rc = poll_error_buf() ) != 0 ) {
234                 DBG ( "poll_error_buf() failed: %s\n", strerror ( rc ) );
235                 return;
236         }
237
238         /* Drain event queue.  We can ignore events, since we're going
239          * to just poll all completion queues anyway.
240          */
241         if ( ( rc = drain_eq() ) != 0 ) {
242                 DBG ( "drain_eq() failed: %s\n", strerror ( rc ) );
243                 return;
244         }
245
246         /* Poll completion queues */
247         arbel_poll_cq ( &static_ibdev, &static_ipoib_send_cq,
248                         temp_complete_send, temp_complete_recv );
249         arbel_poll_cq ( &static_ibdev, &static_ipoib_recv_cq,
250                         temp_complete_send, temp_complete_recv );
251
252         mlx_refill_rx ( netdev );
253 }
254
255 /**
256  * Enable or disable interrupts
257  *
258  * @v netdev            Network device
259  * @v enable            Interrupts should be enabled
260  */
261 static void mlx_irq ( struct net_device *netdev, int enable ) {
262
263         ( void ) netdev;
264         ( void ) enable;
265
266 }
267
268 static struct net_device_operations mlx_operations = {
269         .open           = mlx_open,
270         .close          = mlx_close,
271         .transmit       = mlx_transmit_direct,
272         .poll           = mlx_poll,
273         .irq            = mlx_irq,
274 };
275
276
277
278
279 /***************************************************************************
280  *
281  * Queue number allocation
282  *
283  ***************************************************************************
284  */
285
286 /**
287  * Allocate queue number
288  *
289  * @v q_inuse           Queue usage bitmask
290  * @v max_inuse         Maximum number of in-use queues
291  * @ret qn_offset       Free queue number offset, or negative error
292  */
293 static int arbel_alloc_qn_offset ( arbel_bitmask_t *q_inuse,
294                                    unsigned int max_inuse ) {
295         unsigned int qn_offset = 0;
296         arbel_bitmask_t mask = 1;
297
298         while ( qn_offset < max_inuse ) {
299                 if ( ( mask & *q_inuse ) == 0 ) {
300                         *q_inuse |= mask;
301                         return qn_offset;
302                 }
303                 qn_offset++;
304                 mask <<= 1;
305                 if ( ! mask ) {
306                         mask = 1;
307                         q_inuse++;
308                 }
309         }
310         return -ENFILE;
311 }
312
313 /**
314  * Free queue number
315  *
316  * @v q_inuse           Queue usage bitmask
317  * @v qn_offset         Queue number offset
318  */
319 static void arbel_free_qn_offset ( arbel_bitmask_t *q_inuse, int qn_offset ) {
320         arbel_bitmask_t mask;
321
322         mask = ( 1 << ( qn_offset % ( 8 * sizeof ( mask ) ) ) );
323         q_inuse += ( qn_offset / ( 8 * sizeof ( mask ) ) );
324         *q_inuse &= ~mask;
325 }
326
327 /***************************************************************************
328  *
329  * HCA commands
330  *
331  ***************************************************************************
332  */
333
334 /**
335  * Wait for Arbel command completion
336  *
337  * @v arbel             Arbel device
338  * @ret rc              Return status code
339  */
340 static int arbel_cmd_wait ( struct arbel *arbel,
341                             struct arbelprm_hca_command_register *hcr ) {
342         unsigned int wait;
343
344         for ( wait = ARBEL_HCR_MAX_WAIT_MS ; wait ; wait-- ) {
345                 hcr->u.dwords[6] =
346                         readl ( arbel->config + ARBEL_HCR_REG ( 6 ) );
347                 if ( MLX_GET ( hcr, go ) == 0 )
348                         return 0;
349                 mdelay ( 1 );
350         }
351         return -EBUSY;
352 }
353
354 /**
355  * Issue HCA command
356  *
357  * @v arbel             Arbel device
358  * @v command           Command opcode, flags and input/output lengths
359  * @v op_mod            Opcode modifier (0 if no modifier applicable)
360  * @v in                Input parameters
361  * @v in_mod            Input modifier (0 if no modifier applicable)
362  * @v out               Output parameters
363  * @ret rc              Return status code
364  */
365 static int arbel_cmd ( struct arbel *arbel, unsigned long command,
366                        unsigned int op_mod, const void *in,
367                        unsigned int in_mod, void *out ) {
368         struct arbelprm_hca_command_register hcr;
369         unsigned int opcode = ARBEL_HCR_OPCODE ( command );
370         size_t in_len = ARBEL_HCR_IN_LEN ( command );
371         size_t out_len = ARBEL_HCR_OUT_LEN ( command );
372         void *in_buffer;
373         void *out_buffer;
374         unsigned int status;
375         unsigned int i;
376         int rc;
377
378         DBGC ( arbel, "Arbel %p command %02x in %zx%s out %zx%s\n",
379                arbel, opcode, in_len,
380                ( ( command & ARBEL_HCR_IN_MBOX ) ? "(mbox)" : "" ), out_len,
381                ( ( command & ARBEL_HCR_OUT_MBOX ) ? "(mbox)" : "" ) );
382
383         /* Check that HCR is free */
384         if ( ( rc = arbel_cmd_wait ( arbel, &hcr ) ) != 0 ) {
385                 DBGC ( arbel, "Arbel %p command interface locked\n", arbel );
386                 return rc;
387         }
388
389         /* Prepare HCR */
390         memset ( &hcr, 0, sizeof ( hcr ) );
391         in_buffer = &hcr.u.dwords[0];
392         if ( in_len && ( command & ARBEL_HCR_IN_MBOX ) ) {
393                 in_buffer = arbel->mailbox_in;
394                 MLX_FILL_1 ( &hcr, 1, in_param_l, virt_to_bus ( in_buffer ) );
395         }
396         memcpy ( in_buffer, in, in_len );
397         MLX_FILL_1 ( &hcr, 2, input_modifier, in_mod );
398         out_buffer = &hcr.u.dwords[3];
399         if ( out_len && ( command & ARBEL_HCR_OUT_MBOX ) ) {
400                 out_buffer = arbel->mailbox_out;
401                 MLX_FILL_1 ( &hcr, 4, out_param_l,
402                              virt_to_bus ( out_buffer ) );
403         }
404         MLX_FILL_3 ( &hcr, 6,
405                      opcode, opcode,
406                      opcode_modifier, op_mod,
407                      go, 1 );
408
409         /* Issue command */
410         for ( i = 0 ; i < ( sizeof ( hcr ) / sizeof ( hcr.u.dwords[0] ) ) ;
411               i++ ) {
412                 writel ( hcr.u.dwords[i],
413                          arbel->config + ARBEL_HCR_REG ( i ) );
414                 barrier();
415         }
416
417         /* Wait for command completion */
418         if ( ( rc = arbel_cmd_wait ( arbel, &hcr ) ) != 0 ) {
419                 DBGC ( arbel, "Arbel %p timed out waiting for command:\n",
420                        arbel );
421                 DBGC_HD ( arbel, &hcr, sizeof ( hcr ) );
422                 return rc;
423         }
424
425         /* Check command status */
426         status = MLX_GET ( &hcr, status );
427         if ( status != 0 ) {
428                 DBGC ( arbel, "Arbel %p command failed with status %02x:\n",
429                        arbel, status );
430                 DBGC_HD ( arbel, &hcr, sizeof ( hcr ) );
431                 return -EIO;
432         }
433
434         /* Read output parameters, if any */
435         hcr.u.dwords[3] = readl ( arbel->config + ARBEL_HCR_REG ( 3 ) );
436         hcr.u.dwords[4] = readl ( arbel->config + ARBEL_HCR_REG ( 4 ) );
437         memcpy ( out, out_buffer, out_len );
438
439         return 0;
440 }
441
442 static inline int
443 arbel_cmd_query_dev_lim ( struct arbel *arbel,
444                           struct arbelprm_query_dev_lim *dev_lim ) {
445         return arbel_cmd ( arbel,
446                            ARBEL_HCR_OUT_CMD ( ARBEL_HCR_QUERY_DEV_LIM, 
447                                                1, sizeof ( *dev_lim ) ),
448                            0, NULL, 0, dev_lim );
449 }
450
451 static inline int
452 arbel_cmd_sw2hw_cq ( struct arbel *arbel, unsigned long cqn,
453                      const struct arbelprm_completion_queue_context *cqctx ) {
454         return arbel_cmd ( arbel,
455                            ARBEL_HCR_IN_CMD ( ARBEL_HCR_SW2HW_CQ,
456                                               1, sizeof ( *cqctx ) ),
457                            0, cqctx, cqn, NULL );
458 }
459
460 static inline int
461 arbel_cmd_hw2sw_cq ( struct arbel *arbel, unsigned long cqn ) {
462         return arbel_cmd ( arbel,
463                            ARBEL_HCR_VOID_CMD ( ARBEL_HCR_HW2SW_CQ ),
464                            1, NULL, cqn, NULL );
465 }
466
467 static inline int
468 arbel_cmd_rst2init_qpee ( struct arbel *arbel, unsigned long qpn,
469                           const struct arbelprm_qp_ee_state_transitions *ctx ){
470         return arbel_cmd ( arbel,
471                            ARBEL_HCR_IN_CMD ( ARBEL_HCR_RST2INIT_QPEE,
472                                               1, sizeof ( *ctx ) ),
473                            0, ctx, qpn, NULL );
474 }
475
476 static inline int
477 arbel_cmd_init2rtr_qpee ( struct arbel *arbel, unsigned long qpn,
478                           const struct arbelprm_qp_ee_state_transitions *ctx ){
479         return arbel_cmd ( arbel,
480                            ARBEL_HCR_IN_CMD ( ARBEL_HCR_INIT2RTR_QPEE,
481                                               1, sizeof ( *ctx ) ),
482                            0, ctx, qpn, NULL );
483 }
484
485 static inline int
486 arbel_cmd_rtr2rts_qpee ( struct arbel *arbel, unsigned long qpn,
487                          const struct arbelprm_qp_ee_state_transitions *ctx ) {
488         return arbel_cmd ( arbel,
489                            ARBEL_HCR_IN_CMD ( ARBEL_HCR_RTR2RTS_QPEE,
490                                               1, sizeof ( *ctx ) ),
491                            0, ctx, qpn, NULL );
492 }
493
494 static inline int
495 arbel_cmd_2rst_qpee ( struct arbel *arbel, unsigned long qpn ) {
496         return arbel_cmd ( arbel,
497                            ARBEL_HCR_VOID_CMD ( ARBEL_HCR_2RST_QPEE ),
498                            0x03, NULL, qpn, NULL );
499 }
500
501 /***************************************************************************
502  *
503  * Completion queue operations
504  *
505  ***************************************************************************
506  */
507
508 /**
509  * Create completion queue
510  *
511  * @v ibdev             Infiniband device
512  * @v cq                Completion queue
513  * @ret rc              Return status code
514  */
515 static int arbel_create_cq ( struct ib_device *ibdev,
516                              struct ib_completion_queue *cq ) {
517         struct arbel *arbel = ibdev->dev_priv;
518         struct arbel_completion_queue *arbel_cq;
519         struct arbelprm_completion_queue_context cqctx;
520         struct arbelprm_cq_ci_db_record *ci_db_rec;
521         struct arbelprm_cq_arm_db_record *arm_db_rec;
522         int cqn_offset;
523         unsigned int i;
524         int rc;
525
526         /* Find a free completion queue number */
527         cqn_offset = arbel_alloc_qn_offset ( arbel->cq_inuse, ARBEL_MAX_CQS );
528         if ( cqn_offset < 0 ) {
529                 DBGC ( arbel, "Arbel %p out of completion queues\n", arbel );
530                 rc = cqn_offset;
531                 goto err_cqn_offset;
532         }
533         cq->cqn = ( arbel->limits.reserved_cqs + cqn_offset );
534
535         /* Allocate control structures */
536         arbel_cq = zalloc ( sizeof ( *arbel_cq ) );
537         if ( ! arbel_cq ) {
538                 rc = -ENOMEM;
539                 goto err_arbel_cq;
540         }
541         arbel_cq->ci_doorbell_idx = arbel_cq_ci_doorbell_idx ( cqn_offset );
542         arbel_cq->arm_doorbell_idx = arbel_cq_arm_doorbell_idx ( cqn_offset );
543
544         /* Allocate completion queue itself */
545         arbel_cq->cqe_size = ( cq->num_cqes * sizeof ( arbel_cq->cqe[0] ) );
546         arbel_cq->cqe = malloc_dma ( arbel_cq->cqe_size,
547                                      sizeof ( arbel_cq->cqe[0] ) );
548         if ( ! arbel_cq->cqe ) {
549                 rc = -ENOMEM;
550                 goto err_cqe;
551         }
552         memset ( arbel_cq->cqe, 0, arbel_cq->cqe_size );
553         for ( i = 0 ; i < cq->num_cqes ; i++ ) {
554                 MLX_FILL_1 ( &arbel_cq->cqe[i].normal, 7, owner, 1 );
555         }
556         barrier();
557
558         /* Initialise doorbell records */
559         ci_db_rec = &arbel->db_rec[arbel_cq->ci_doorbell_idx].cq_ci;
560         MLX_FILL_1 ( ci_db_rec, 0, counter, 0 );
561         MLX_FILL_2 ( ci_db_rec, 1,
562                      res, ARBEL_UAR_RES_CQ_CI,
563                      cq_number, cq->cqn );
564         arm_db_rec = &arbel->db_rec[arbel_cq->arm_doorbell_idx].cq_arm;
565         MLX_FILL_1 ( arm_db_rec, 0, counter, 0 );
566         MLX_FILL_2 ( arm_db_rec, 1,
567                      res, ARBEL_UAR_RES_CQ_ARM,
568                      cq_number, cq->cqn );
569
570         /* Hand queue over to hardware */
571         memset ( &cqctx, 0, sizeof ( cqctx ) );
572         MLX_FILL_1 ( &cqctx, 0, st, 0xa /* "Event fired" */ );
573         MLX_FILL_1 ( &cqctx, 2, start_address_l,
574                      virt_to_bus ( arbel_cq->cqe ) );
575         MLX_FILL_2 ( &cqctx, 3,
576                      usr_page, arbel->limits.reserved_uars,
577                      log_cq_size, fls ( cq->num_cqes - 1 ) );
578         MLX_FILL_1 ( &cqctx, 5, c_eqn, arbel->eqn );
579         MLX_FILL_1 ( &cqctx, 6, pd, ARBEL_GLOBAL_PD );
580         MLX_FILL_1 ( &cqctx, 7, l_key, arbel->reserved_lkey );
581         MLX_FILL_1 ( &cqctx, 12, cqn, cq->cqn );
582         MLX_FILL_1 ( &cqctx, 13,
583                      cq_ci_db_record, arbel_cq->ci_doorbell_idx );
584         MLX_FILL_1 ( &cqctx, 14,
585                      cq_state_db_record, arbel_cq->arm_doorbell_idx );
586         if ( ( rc = arbel_cmd_sw2hw_cq ( arbel, cq->cqn, &cqctx ) ) != 0 ) {
587                 DBGC ( arbel, "Arbel %p SW2HW_CQ failed: %s\n",
588                        arbel, strerror ( rc ) );
589                 goto err_sw2hw_cq;
590         }
591
592         cq->dev_priv = arbel_cq;
593         return 0;
594
595  err_sw2hw_cq:
596         MLX_FILL_1 ( ci_db_rec, 1, res, ARBEL_UAR_RES_NONE );
597         MLX_FILL_1 ( arm_db_rec, 1, res, ARBEL_UAR_RES_NONE );
598         free_dma ( arbel_cq->cqe, arbel_cq->cqe_size );
599  err_cqe:
600         free ( arbel_cq );
601  err_arbel_cq:
602         arbel_free_qn_offset ( arbel->cq_inuse, cqn_offset );
603  err_cqn_offset:
604         return rc;
605 }
606
607 /**
608  * Destroy completion queue
609  *
610  * @v ibdev             Infiniband device
611  * @v cq                Completion queue
612  */
613 static void arbel_destroy_cq ( struct ib_device *ibdev,
614                                struct ib_completion_queue *cq ) {
615         struct arbel *arbel = ibdev->dev_priv;
616         struct arbel_completion_queue *arbel_cq = cq->dev_priv;
617         struct arbelprm_cq_ci_db_record *ci_db_rec;
618         struct arbelprm_cq_arm_db_record *arm_db_rec;
619         int cqn_offset;
620         int rc;
621
622         /* Take ownership back from hardware */
623         if ( ( rc = arbel_cmd_hw2sw_cq ( arbel, cq->cqn ) ) != 0 ) {
624                 DBGC ( arbel, "Arbel %p FATAL HW2SW_CQ failed on CQN %#lx: "
625                        "%s\n", arbel, cq->cqn, strerror ( rc ) );
626                 /* Leak memory and return; at least we avoid corruption */
627                 return;
628         }
629
630         /* Clear doorbell records */
631         ci_db_rec = &arbel->db_rec[arbel_cq->ci_doorbell_idx].cq_ci;
632         arm_db_rec = &arbel->db_rec[arbel_cq->arm_doorbell_idx].cq_arm;
633         MLX_FILL_1 ( ci_db_rec, 1, res, ARBEL_UAR_RES_NONE );
634         MLX_FILL_1 ( arm_db_rec, 1, res, ARBEL_UAR_RES_NONE );
635
636         /* Free memory */
637         free_dma ( arbel_cq->cqe, arbel_cq->cqe_size );
638         free ( arbel_cq );
639
640         /* Mark queue number as free */
641         cqn_offset = ( cq->cqn - arbel->limits.reserved_cqs );
642         arbel_free_qn_offset ( arbel->cq_inuse, cqn_offset );
643
644         cq->dev_priv = NULL;
645 }
646
647 /***************************************************************************
648  *
649  * Queue pair operations
650  *
651  ***************************************************************************
652  */
653
654 /**
655  * Create send work queue
656  *
657  * @v arbel_send_wq     Send work queue
658  * @v num_wqes          Number of work queue entries
659  * @ret rc              Return status code
660  */
661 static int arbel_create_send_wq ( struct arbel_send_work_queue *arbel_send_wq,
662                                   unsigned int num_wqes ) {
663         struct arbelprm_ud_send_wqe *wqe;
664         struct arbelprm_ud_send_wqe *next_wqe;
665         unsigned int wqe_idx_mask;
666         unsigned int i;
667
668         /* Allocate work queue */
669         arbel_send_wq->wqe_size = ( num_wqes *
670                                     sizeof ( arbel_send_wq->wqe[0] ) );
671         arbel_send_wq->wqe = malloc_dma ( arbel_send_wq->wqe_size,
672                                           sizeof ( arbel_send_wq->wqe[0] ) );
673         if ( ! arbel_send_wq->wqe )
674                 return -ENOMEM;
675         memset ( arbel_send_wq->wqe, 0, arbel_send_wq->wqe_size );
676
677         /* Link work queue entries */
678         wqe_idx_mask = ( num_wqes - 1 );
679         for ( i = 0 ; i < num_wqes ; i++ ) {
680                 wqe = &arbel_send_wq->wqe[i].ud;
681                 next_wqe = &arbel_send_wq->wqe[ ( i + 1 ) & wqe_idx_mask ].ud;
682                 MLX_FILL_1 ( &wqe->next, 0, nda_31_6,
683                              ( virt_to_bus ( next_wqe ) >> 6 ) );
684         }
685         
686         return 0;
687 }
688
689 /**
690  * Create receive work queue
691  *
692  * @v arbel_recv_wq     Receive work queue
693  * @v num_wqes          Number of work queue entries
694  * @ret rc              Return status code
695  */
696 static int arbel_create_recv_wq ( struct arbel_recv_work_queue *arbel_recv_wq,
697                                   unsigned int num_wqes ) {
698         struct arbelprm_recv_wqe *wqe;
699         struct arbelprm_recv_wqe *next_wqe;
700         unsigned int wqe_idx_mask;
701         unsigned int i;
702
703         /* Allocate work queue */
704         arbel_recv_wq->wqe_size = ( num_wqes *
705                                     sizeof ( arbel_recv_wq->wqe[0] ) );
706         arbel_recv_wq->wqe = malloc_dma ( arbel_recv_wq->wqe_size,
707                                           sizeof ( arbel_recv_wq->wqe[0] ) );
708         if ( ! arbel_recv_wq->wqe )
709                 return -ENOMEM;
710         memset ( arbel_recv_wq->wqe, 0, arbel_recv_wq->wqe_size );
711
712         /* Link work queue entries */
713         wqe_idx_mask = ( num_wqes - 1 );
714         for ( i = 0 ; i < num_wqes ; i++ ) {
715                 wqe = &arbel_recv_wq->wqe[i].recv;
716                 next_wqe = &arbel_recv_wq->wqe[( i + 1 ) & wqe_idx_mask].recv;
717                 MLX_FILL_1 ( &wqe->next, 0, nda_31_6,
718                              ( virt_to_bus ( next_wqe ) >> 6 ) );
719         }
720         
721         return 0;
722 }
723
724 /**
725  * Create queue pair
726  *
727  * @v ibdev             Infiniband device
728  * @v qp                Queue pair
729  * @ret rc              Return status code
730  */
731 static int arbel_create_qp ( struct ib_device *ibdev,
732                              struct ib_queue_pair *qp ) {
733         struct arbel *arbel = ibdev->dev_priv;
734         struct arbel_queue_pair *arbel_qp;
735         struct arbelprm_qp_ee_state_transitions qpctx;
736         struct arbelprm_qp_db_record *send_db_rec;
737         struct arbelprm_qp_db_record *recv_db_rec;
738         int qpn_offset;
739         int rc;
740
741         /* Find a free queue pair number */
742         qpn_offset = arbel_alloc_qn_offset ( arbel->qp_inuse, ARBEL_MAX_QPS );
743         if ( qpn_offset < 0 ) {
744                 DBGC ( arbel, "Arbel %p out of queue pairs\n", arbel );
745                 rc = qpn_offset;
746                 goto err_qpn_offset;
747         }
748         qp->qpn = ( ARBEL_QPN_BASE + arbel->limits.reserved_qps + qpn_offset );
749
750         /* Allocate control structures */
751         arbel_qp = zalloc ( sizeof ( *arbel_qp ) );
752         if ( ! arbel_qp ) {
753                 rc = -ENOMEM;
754                 goto err_arbel_qp;
755         }
756         arbel_qp->send.doorbell_idx = arbel_send_doorbell_idx ( qpn_offset );
757         arbel_qp->recv.doorbell_idx = arbel_recv_doorbell_idx ( qpn_offset );
758
759         /* Create send and receive work queues */
760         if ( ( rc = arbel_create_send_wq ( &arbel_qp->send,
761                                            qp->send.num_wqes ) ) != 0 )
762                 goto err_create_send_wq;
763         if ( ( rc = arbel_create_recv_wq ( &arbel_qp->recv,
764                                            qp->recv.num_wqes ) ) != 0 )
765                 goto err_create_recv_wq;
766
767         /* Initialise doorbell records */
768         send_db_rec = &arbel->db_rec[arbel_qp->send.doorbell_idx].qp;
769         MLX_FILL_1 ( send_db_rec, 0, counter, 0 );
770         MLX_FILL_2 ( send_db_rec, 1,
771                      res, ARBEL_UAR_RES_SQ,
772                      qp_number, qp->qpn );
773         recv_db_rec = &arbel->db_rec[arbel_qp->recv.doorbell_idx].qp;
774         MLX_FILL_1 ( recv_db_rec, 0, counter, 0 );
775         MLX_FILL_2 ( recv_db_rec, 1,
776                      res, ARBEL_UAR_RES_RQ,
777                      qp_number, qp->qpn );
778
779         /* Hand queue over to hardware */
780         memset ( &qpctx, 0, sizeof ( qpctx ) );
781         MLX_FILL_3 ( &qpctx, 2,
782                      qpc_eec_data.de, 1,
783                      qpc_eec_data.pm_state, 0x03 /* Always 0x03 for UD */,
784                      qpc_eec_data.st, ARBEL_ST_UD );
785         MLX_FILL_6 ( &qpctx, 4,
786                      qpc_eec_data.mtu, ARBEL_MTU_2048,
787                      qpc_eec_data.msg_max, 11 /* 2^11 = 2048 */,
788                      qpc_eec_data.log_rq_size, fls ( qp->recv.num_wqes - 1 ),
789                      qpc_eec_data.log_rq_stride,
790                      ( fls ( sizeof ( arbel_qp->send.wqe[0] ) - 1 ) - 4 ),
791                      qpc_eec_data.log_sq_size, fls ( qp->send.num_wqes - 1 ),
792                      qpc_eec_data.log_sq_stride,
793                      ( fls ( sizeof ( arbel_qp->recv.wqe[0] ) - 1 ) - 4 ) );
794         MLX_FILL_1 ( &qpctx, 5,
795                      qpc_eec_data.usr_page, arbel->limits.reserved_uars );
796         MLX_FILL_1 ( &qpctx, 10, qpc_eec_data.primary_address_path.port_number,
797                      PXE_IB_PORT );
798         MLX_FILL_1 ( &qpctx, 27, qpc_eec_data.pd, ARBEL_GLOBAL_PD );
799         MLX_FILL_1 ( &qpctx, 29, qpc_eec_data.wqe_lkey, arbel->reserved_lkey );
800         MLX_FILL_1 ( &qpctx, 30, qpc_eec_data.ssc, 1 );
801         MLX_FILL_1 ( &qpctx, 33, qpc_eec_data.cqn_snd, qp->send.cq->cqn );
802         MLX_FILL_1 ( &qpctx, 34, qpc_eec_data.snd_wqe_base_adr_l,
803                      ( virt_to_bus ( arbel_qp->send.wqe ) >> 6 ) );
804         MLX_FILL_1 ( &qpctx, 35, qpc_eec_data.snd_db_record_index,
805                      arbel_qp->send.doorbell_idx );
806         MLX_FILL_1 ( &qpctx, 38, qpc_eec_data.rsc, 1 );
807         MLX_FILL_1 ( &qpctx, 41, qpc_eec_data.cqn_rcv, qp->recv.cq->cqn );
808         MLX_FILL_1 ( &qpctx, 42, qpc_eec_data.rcv_wqe_base_adr_l,
809                      ( virt_to_bus ( arbel_qp->recv.wqe ) >> 6 ) );
810         MLX_FILL_1 ( &qpctx, 43, qpc_eec_data.rcv_db_record_index,
811                      arbel_qp->recv.doorbell_idx );
812         MLX_FILL_1 ( &qpctx, 44, qpc_eec_data.q_key, qp->qkey );
813         if ( ( rc = arbel_cmd_rst2init_qpee ( arbel, qp->qpn, &qpctx )) != 0 ){
814                 DBGC ( arbel, "Arbel %p RST2INIT_QPEE failed: %s\n",
815                        arbel, strerror ( rc ) );
816                 goto err_rst2init_qpee;
817         }
818         memset ( &qpctx, 0, sizeof ( qpctx ) );
819         MLX_FILL_2 ( &qpctx, 4,
820                      qpc_eec_data.mtu, ARBEL_MTU_2048,
821                      qpc_eec_data.msg_max, 11 /* 2^11 = 2048 */ );
822         if ( ( rc = arbel_cmd_init2rtr_qpee ( arbel, qp->qpn, &qpctx )) != 0 ){
823                 DBGC ( arbel, "Arbel %p INIT2RTR_QPEE failed: %s\n",
824                        arbel, strerror ( rc ) );
825                 goto err_init2rtr_qpee;
826         }
827         memset ( &qpctx, 0, sizeof ( qpctx ) );
828         if ( ( rc = arbel_cmd_rtr2rts_qpee ( arbel, qp->qpn, &qpctx ) ) != 0 ){
829                 DBGC ( arbel, "Arbel %p RTR2RTS_QPEE failed: %s\n",
830                        arbel, strerror ( rc ) );
831                 goto err_rtr2rts_qpee;
832         }
833
834         qp->dev_priv = arbel_qp;
835         return 0;
836
837  err_rtr2rts_qpee:
838  err_init2rtr_qpee:
839         arbel_cmd_2rst_qpee ( arbel, qp->qpn );
840  err_rst2init_qpee:
841         MLX_FILL_1 ( send_db_rec, 1, res, ARBEL_UAR_RES_NONE );
842         MLX_FILL_1 ( recv_db_rec, 1, res, ARBEL_UAR_RES_NONE );
843         free_dma ( arbel_qp->recv.wqe, arbel_qp->recv.wqe_size );
844  err_create_recv_wq:
845         free_dma ( arbel_qp->send.wqe, arbel_qp->send.wqe_size );
846  err_create_send_wq:
847         free ( arbel_qp );
848  err_arbel_qp:
849         arbel_free_qn_offset ( arbel->qp_inuse, qpn_offset );
850  err_qpn_offset:
851         return rc;
852 }
853
854 /**
855  * Destroy queue pair
856  *
857  * @v ibdev             Infiniband device
858  * @v qp                Queue pair
859  */
860 static void arbel_destroy_qp ( struct ib_device *ibdev,
861                                struct ib_queue_pair *qp ) {
862         struct arbel *arbel = ibdev->dev_priv;
863         struct arbel_queue_pair *arbel_qp = qp->dev_priv;
864         struct arbelprm_qp_db_record *send_db_rec;
865         struct arbelprm_qp_db_record *recv_db_rec;
866         int qpn_offset;
867         int rc;
868
869         /* Take ownership back from hardware */
870         if ( ( rc = arbel_cmd_2rst_qpee ( arbel, qp->qpn ) ) != 0 ) {
871                 DBGC ( arbel, "Arbel %p FATAL 2RST_QPEE failed on QPN %#lx: "
872                        "%s\n", arbel, qp->qpn, strerror ( rc ) );
873                 /* Leak memory and return; at least we avoid corruption */
874                 return;
875         }
876
877         /* Clear doorbell records */
878         send_db_rec = &arbel->db_rec[arbel_qp->send.doorbell_idx].qp;
879         recv_db_rec = &arbel->db_rec[arbel_qp->recv.doorbell_idx].qp;
880         MLX_FILL_1 ( send_db_rec, 1, res, ARBEL_UAR_RES_NONE );
881         MLX_FILL_1 ( recv_db_rec, 1, res, ARBEL_UAR_RES_NONE );
882
883         /* Free memory */
884         free_dma ( arbel_qp->send.wqe, arbel_qp->send.wqe_size );
885         free_dma ( arbel_qp->recv.wqe, arbel_qp->recv.wqe_size );
886         free ( arbel_qp );
887
888         /* Mark queue number as free */
889         qpn_offset = ( qp->qpn - ARBEL_QPN_BASE - arbel->limits.reserved_qps );
890         arbel_free_qn_offset ( arbel->qp_inuse, qpn_offset );
891
892         qp->dev_priv = NULL;
893 }
894
895 /***************************************************************************
896  *
897  * Work request operations
898  *
899  ***************************************************************************
900  */
901
902 /**
903  * Ring doorbell register in UAR
904  *
905  * @v arbel             Arbel device
906  * @v db_reg            Doorbell register structure
907  * @v offset            Address of doorbell
908  */
909 static void arbel_ring_doorbell ( struct arbel *arbel,
910                                   union arbelprm_doorbell_register *db_reg,
911                                   unsigned int offset ) {
912
913         DBG ( "arbel_ring_doorbell %08lx:%08lx to %lx\n",
914               db_reg->dword[0], db_reg->dword[1],
915               virt_to_phys ( arbel->uar + offset ) );
916
917         barrier();
918         writel ( db_reg->dword[0], ( arbel->uar + offset + 0 ) );
919         barrier();
920         writel ( db_reg->dword[1], ( arbel->uar + offset + 4 ) );
921 }
922
923 /**
924  * Post send work queue entry
925  *
926  * @v ibdev             Infiniband device
927  * @v qp                Queue pair
928  * @v av                Address vector
929  * @v iobuf             I/O buffer
930  * @ret rc              Return status code
931  */
932 static int arbel_post_send ( struct ib_device *ibdev,
933                              struct ib_queue_pair *qp,
934                              struct ib_address_vector *av,
935                              struct io_buffer *iobuf ) {
936         struct arbel *arbel = ibdev->dev_priv;
937         struct arbel_queue_pair *arbel_qp = qp->dev_priv;
938         struct ib_work_queue *wq = &qp->send;
939         struct arbel_send_work_queue *arbel_send_wq = &arbel_qp->send;
940         struct arbelprm_ud_send_wqe *prev_wqe;
941         struct arbelprm_ud_send_wqe *wqe;
942         struct arbelprm_qp_db_record *qp_db_rec;
943         union arbelprm_doorbell_register db_reg;
944         const struct ib_gid *gid;
945         unsigned int wqe_idx_mask;
946         size_t nds;
947
948         /* Allocate work queue entry */
949         wqe_idx_mask = ( wq->num_wqes - 1 );
950         if ( wq->iobufs[wq->next_idx & wqe_idx_mask] ) {
951                 DBGC ( arbel, "Arbel %p send queue full", arbel );
952                 return -ENOBUFS;
953         }
954         wq->iobufs[wq->next_idx & wqe_idx_mask] = iobuf;
955         prev_wqe = &arbel_send_wq->wqe[(wq->next_idx - 1) & wqe_idx_mask].ud;
956         wqe = &arbel_send_wq->wqe[wq->next_idx & wqe_idx_mask].ud;
957
958         /* Construct work queue entry */
959         MLX_FILL_1 ( &wqe->next, 1, always1, 1 );
960         memset ( &wqe->ctrl, 0, sizeof ( wqe->ctrl ) );
961         MLX_FILL_1 ( &wqe->ctrl, 0, always1, 1 );
962         memset ( &wqe->ud, 0, sizeof ( wqe->ud ) );
963         MLX_FILL_2 ( &wqe->ud, 0,
964                      ud_address_vector.pd, ARBEL_GLOBAL_PD,
965                      ud_address_vector.port_number, PXE_IB_PORT );
966         MLX_FILL_2 ( &wqe->ud, 1,
967                      ud_address_vector.rlid, av->dlid,
968                      ud_address_vector.g, av->gid_present );
969         MLX_FILL_2 ( &wqe->ud, 2,
970                      ud_address_vector.max_stat_rate,
971                          ( ( av->rate >= 3 ) ? 0 : 1 ),
972                      ud_address_vector.msg, 3 );
973         MLX_FILL_1 ( &wqe->ud, 3, ud_address_vector.sl, av->sl );
974         gid = ( av->gid_present ? &av->gid : &arbel_no_gid );
975         memcpy ( &wqe->ud.u.dwords[4], gid, sizeof ( *gid ) );
976         MLX_FILL_1 ( &wqe->ud, 8, destination_qp, av->dest_qp );
977         MLX_FILL_1 ( &wqe->ud, 9, q_key, av->qkey );
978         MLX_FILL_1 ( &wqe->data[0], 0, byte_count, iob_len ( iobuf ) );
979         MLX_FILL_1 ( &wqe->data[0], 3,
980                      local_address_l, virt_to_bus ( iobuf->data ) );
981
982         /* Update previous work queue entry's "next" field */
983         nds = ( ( offsetof ( typeof ( *wqe ), data ) +
984                   sizeof ( wqe->data[0] ) ) >> 4 );
985         MLX_SET ( &prev_wqe->next, nopcode, ARBEL_OPCODE_SEND );
986         MLX_FILL_3 ( &prev_wqe->next, 1,
987                      nds, nds,
988                      f, 1,
989                      always1, 1 );
990
991         /* Update doorbell record */
992         barrier();
993         qp_db_rec = &arbel->db_rec[arbel_send_wq->doorbell_idx].qp;
994         MLX_FILL_1 ( qp_db_rec, 0,
995                      counter, ( ( wq->next_idx + 1 ) & 0xffff ) );
996
997         /* Ring doorbell register */
998         MLX_FILL_4 ( &db_reg.send, 0,
999                      nopcode, ARBEL_OPCODE_SEND,
1000                      f, 1,
1001                      wqe_counter, ( wq->next_idx & 0xffff ),
1002                      wqe_cnt, 1 );
1003         MLX_FILL_2 ( &db_reg.send, 1,
1004                      nds, nds,
1005                      qpn, qp->qpn );
1006         arbel_ring_doorbell ( arbel, &db_reg, POST_SND_OFFSET );
1007
1008         /* Update work queue's index */
1009         wq->next_idx++;
1010
1011         return 0;
1012 }
1013
1014 /**
1015  * Post receive work queue entry
1016  *
1017  * @v ibdev             Infiniband device
1018  * @v qp                Queue pair
1019  * @v iobuf             I/O buffer
1020  * @ret rc              Return status code
1021  */
1022 static int arbel_post_recv ( struct ib_device *ibdev,
1023                              struct ib_queue_pair *qp,
1024                              struct io_buffer *iobuf ) {
1025         struct arbel *arbel = ibdev->dev_priv;
1026         struct arbel_queue_pair *arbel_qp = qp->dev_priv;
1027         struct ib_work_queue *wq = &qp->recv;
1028         struct arbel_recv_work_queue *arbel_recv_wq = &arbel_qp->recv;
1029         struct arbelprm_recv_wqe *wqe;
1030         union arbelprm_doorbell_record *db_rec;
1031         unsigned int wqe_idx_mask;
1032
1033         /* Allocate work queue entry */
1034         wqe_idx_mask = ( wq->num_wqes - 1 );
1035         if ( wq->iobufs[wq->next_idx & wqe_idx_mask] ) {
1036                 DBGC ( arbel, "Arbel %p receive queue full", arbel );
1037                 return -ENOBUFS;
1038         }
1039         wq->iobufs[wq->next_idx & wqe_idx_mask] = iobuf;
1040         wqe = &arbel_recv_wq->wqe[wq->next_idx & wqe_idx_mask].recv;
1041
1042         /* Construct work queue entry */
1043         MLX_FILL_1 ( &wqe->data[0], 0, byte_count, iob_tailroom ( iobuf ) );
1044         MLX_FILL_1 ( &wqe->data[0], 1, l_key, arbel->reserved_lkey );
1045         MLX_FILL_1 ( &wqe->data[0], 3,
1046                      local_address_l, virt_to_bus ( iobuf->data ) );
1047
1048         /* Update doorbell record */
1049         barrier();
1050         db_rec = &arbel->db_rec[arbel_recv_wq->doorbell_idx];
1051         MLX_FILL_1 ( &db_rec->qp, 0,
1052                      counter, ( ( wq->next_idx + 1 ) & 0xffff ) );      
1053
1054         /* Update work queue's index */
1055         wq->next_idx++;
1056
1057         return 0;       
1058 }
1059
1060 /**
1061  * Handle completion
1062  *
1063  * @v ibdev             Infiniband device
1064  * @v cq                Completion queue
1065  * @v cqe               Hardware completion queue entry
1066  * @v complete_send     Send completion handler
1067  * @v complete_recv     Receive completion handler
1068  * @ret rc              Return status code
1069  */
1070 static int arbel_complete ( struct ib_device *ibdev,
1071                             struct ib_completion_queue *cq,
1072                             union arbelprm_completion_entry *cqe,
1073                             ib_completer_t complete_send,
1074                             ib_completer_t complete_recv ) {
1075         struct arbel *arbel = ibdev->dev_priv;
1076         struct ib_completion completion;
1077         struct ib_work_queue *wq;
1078         struct ib_queue_pair *qp;
1079         struct arbel_queue_pair *arbel_qp;
1080         struct arbel_send_work_queue *arbel_send_wq;
1081         struct arbel_recv_work_queue *arbel_recv_wq;
1082         struct io_buffer *iobuf;
1083         ib_completer_t complete;
1084         unsigned int opcode;
1085         unsigned long qpn;
1086         int is_send;
1087         unsigned long wqe_adr;
1088         unsigned int wqe_idx;
1089         int rc = 0;
1090
1091         /* Parse completion */
1092         memset ( &completion, 0, sizeof ( completion ) );
1093         completion.len = MLX_GET ( &cqe->normal, byte_cnt );
1094         qpn = MLX_GET ( &cqe->normal, my_qpn );
1095         is_send = MLX_GET ( &cqe->normal, s );
1096         wqe_adr = ( MLX_GET ( &cqe->normal, wqe_adr ) << 6 );
1097         opcode = MLX_GET ( &cqe->normal, opcode );
1098         if ( opcode >= ARBEL_OPCODE_RECV_ERROR ) {
1099                 /* "s" field is not valid for error opcodes */
1100                 is_send = ( opcode == ARBEL_OPCODE_SEND_ERROR );
1101                 completion.syndrome = MLX_GET ( &cqe->error, syndrome );
1102                 DBGC ( arbel, "Arbel %p CPN %lx syndrome %x vendor %lx\n",
1103                        arbel, cq->cqn, completion.syndrome,
1104                        MLX_GET ( &cqe->error, vendor_code ) );
1105                 rc = -EIO;
1106                 /* Don't return immediately; propagate error to completer */
1107         }
1108
1109         /* Identify work queue */
1110         wq = ib_find_wq ( cq, qpn, is_send );
1111         if ( ! wq ) {
1112                 DBGC ( arbel, "Arbel %p CQN %lx unknown %s QPN %lx\n",
1113                        arbel, cq->cqn, ( is_send ? "send" : "recv" ), qpn );
1114                 return -EIO;
1115         }
1116         qp = wq->qp;
1117         arbel_qp = qp->dev_priv;
1118
1119         /* Identify work queue entry index */
1120         if ( is_send ) {
1121                 arbel_send_wq = &arbel_qp->send;
1122                 wqe_idx = ( ( wqe_adr - virt_to_bus ( arbel_send_wq->wqe ) ) /
1123                             sizeof ( arbel_send_wq->wqe[0] ) );
1124         } else {
1125                 arbel_recv_wq = &arbel_qp->recv;
1126                 wqe_idx = ( ( wqe_adr - virt_to_bus ( arbel_recv_wq->wqe ) ) /
1127                             sizeof ( arbel_recv_wq->wqe[0] ) );
1128         }
1129
1130         /* Identify I/O buffer */
1131         iobuf = wq->iobufs[wqe_idx];
1132         if ( ! iobuf ) {
1133                 DBGC ( arbel, "Arbel %p CQN %lx QPN %lx empty WQE %x\n",
1134                        arbel, cq->cqn, qpn, wqe_idx );
1135                 return -EIO;
1136         }
1137         wq->iobufs[wqe_idx] = NULL;
1138
1139         /* Pass off to caller's completion handler */
1140         complete = ( is_send ? complete_send : complete_recv );
1141         complete ( ibdev, qp, &completion, iobuf );
1142
1143         return rc;
1144 }                            
1145
1146 /**
1147  * Poll completion queue
1148  *
1149  * @v ibdev             Infiniband device
1150  * @v cq                Completion queue
1151  * @v complete_send     Send completion handler
1152  * @v complete_recv     Receive completion handler
1153  */
1154 static void arbel_poll_cq ( struct ib_device *ibdev,
1155                             struct ib_completion_queue *cq,
1156                             ib_completer_t complete_send,
1157                             ib_completer_t complete_recv ) {
1158         struct arbel *arbel = ibdev->dev_priv;
1159         struct arbel_completion_queue *arbel_cq = cq->dev_priv;
1160         struct arbelprm_cq_ci_db_record *ci_db_rec;
1161         union arbelprm_completion_entry *cqe;
1162         unsigned int cqe_idx_mask;
1163         int rc;
1164
1165         while ( 1 ) {
1166                 /* Look for completion entry */
1167                 cqe_idx_mask = ( cq->num_cqes - 1 );
1168                 cqe = &arbel_cq->cqe[cq->next_idx & cqe_idx_mask];
1169                 if ( MLX_GET ( &cqe->normal, owner ) != 0 ) {
1170                         /* Entry still owned by hardware; end of poll */
1171                         break;
1172                 }
1173
1174                 /* Handle completion */
1175                 if ( ( rc = arbel_complete ( ibdev, cq, cqe, complete_send,
1176                                              complete_recv ) ) != 0 ) {
1177                         DBGC ( arbel, "Arbel %p failed to complete: %s\n",
1178                                arbel, strerror ( rc ) );
1179                         DBGC_HD ( arbel, cqe, sizeof ( *cqe ) );
1180                 }
1181
1182                 /* Return ownership to hardware */
1183                 MLX_FILL_1 ( &cqe->normal, 7, owner, 1 );
1184                 barrier();
1185                 /* Update completion queue's index */
1186                 cq->next_idx++;
1187                 /* Update doorbell record */
1188                 ci_db_rec = &arbel->db_rec[arbel_cq->ci_doorbell_idx].cq_ci;
1189                 MLX_FILL_1 ( ci_db_rec, 0,
1190                              counter, ( cq->next_idx & 0xffffffffUL ) );
1191         }
1192 }
1193
1194 /** Arbel Infiniband operations */
1195 static struct ib_device_operations arbel_ib_operations = {
1196         .create_cq      = arbel_create_cq,
1197         .destroy_cq     = arbel_destroy_cq,
1198         .create_qp      = arbel_create_qp,
1199         .destroy_qp     = arbel_destroy_qp,
1200         .post_send      = arbel_post_send,
1201         .post_recv      = arbel_post_recv,
1202         .poll_cq        = arbel_poll_cq,
1203 };
1204
1205 /**
1206  * Remove PCI device
1207  *
1208  * @v pci               PCI device
1209  */
1210 static void arbel_remove ( struct pci_device *pci ) {
1211         struct net_device *netdev = pci_get_drvdata ( pci );
1212
1213         unregister_netdev ( netdev );
1214         ib_driver_close ( 0 );
1215         netdev_nullify ( netdev );
1216         netdev_put ( netdev );
1217 }
1218
1219 /**
1220  * Probe PCI device
1221  *
1222  * @v pci               PCI device
1223  * @v id                PCI ID
1224  * @ret rc              Return status code
1225  */
1226 static int arbel_probe ( struct pci_device *pci,
1227                          const struct pci_device_id *id __unused ) {
1228         struct net_device *netdev;
1229         struct arbelprm_query_dev_lim dev_lim;
1230         struct arbel *arbel = &static_arbel;
1231         struct mlx_nic *mlx;
1232         struct ib_mac *mac;
1233         udqp_t qph;
1234         int rc;
1235
1236         /* Allocate net device */
1237         netdev = alloc_ibdev ( sizeof ( *mlx ) );
1238         if ( ! netdev )
1239                 return -ENOMEM;
1240         netdev_init ( netdev, &mlx_operations );
1241         mlx = netdev->priv;
1242         pci_set_drvdata ( pci, netdev );
1243         netdev->dev = &pci->dev;
1244         memset ( mlx, 0, sizeof ( *mlx ) );
1245
1246         /* Fix up PCI device */
1247         adjust_pci_device ( pci );
1248
1249         /* Initialise hardware */
1250         if ( ( rc = ib_driver_init ( pci, &qph ) ) != 0 )
1251                 goto err_ipoib_init;
1252         mlx->ipoib_qph = qph;
1253         mlx->bcast_av = ib_data.bcast_av;
1254         mlx->snd_cqh = ib_data.ipoib_snd_cq;
1255         mlx->rcv_cqh = ib_data.ipoib_rcv_cq;
1256         mac = ( ( struct ib_mac * ) netdev->ll_addr );
1257         mac->qpn = htonl ( ib_get_qpn ( mlx->ipoib_qph ) );
1258         memcpy ( &mac->gid, ib_data.port_gid.raw, sizeof ( mac->gid ) );
1259
1260         /* Hack up IB structures */
1261         arbel->config = memfree_pci_dev.cr_space;
1262         arbel->mailbox_in = dev_buffers_p->inprm_buf;
1263         arbel->mailbox_out = dev_buffers_p->outprm_buf;
1264         arbel->uar = memfree_pci_dev.uar;
1265         arbel->db_rec = dev_ib_data.uar_context_base;
1266         arbel->reserved_lkey = dev_ib_data.mkey;
1267         arbel->eqn = dev_ib_data.eq.eqn;
1268         static_arbel_ipoib_qp.send.wqe =
1269                 ( ( struct udqp_st * ) qph )->snd_wq;
1270         static_arbel_ipoib_qp.recv.wqe =
1271                 ( ( struct udqp_st * ) qph )->rcv_wq;
1272         static_arbel_ipoib_send_cq.cqe =
1273                 ( ( struct cq_st * ) ib_data.ipoib_snd_cq )->cq_buf;
1274         static_arbel_ipoib_recv_cq.cqe =
1275                 ( ( struct cq_st * ) ib_data.ipoib_rcv_cq )->cq_buf;
1276         static_ipoib_qp.qpn = ib_get_qpn ( qph );
1277         static_ipoib_qp.owner_priv = netdev;
1278         list_add ( &static_ipoib_qp.send.list,
1279                    &static_ipoib_send_cq.work_queues );
1280         list_add ( &static_ipoib_qp.recv.list,
1281                    &static_ipoib_recv_cq.work_queues );
1282         static_ibdev.op = &arbel_ib_operations;
1283
1284         /* Get device limits */
1285         if ( ( rc = arbel_cmd_query_dev_lim ( arbel, &dev_lim ) ) != 0 ) {
1286                 DBGC ( arbel, "Arbel %p could not get device limits: %s\n",
1287                        arbel, strerror ( rc ) );
1288                 goto err_query_dev_lim;
1289         }
1290         arbel->limits.reserved_uars = MLX_GET ( &dev_lim, num_rsvd_uars );
1291         arbel->limits.reserved_cqs =
1292                 ( 1 << MLX_GET ( &dev_lim, log2_rsvd_cqs ) );
1293         arbel->limits.reserved_qps =
1294                 ( 1 << MLX_GET ( &dev_lim, log2_rsvd_qps ) );
1295
1296         DBG ( "MADS SND CQN = %#lx\n", dev_ib_data.mads_qp.snd_cq.cqn );
1297         struct ib_completion_queue *test_cq;
1298         test_cq = ib_create_cq ( &static_ibdev, 32 );
1299         if ( test_cq ) {
1300                 DBG ( "Woot: create_cq() passed!\n" );
1301         }
1302
1303         /* Register network device */
1304         if ( ( rc = register_netdev ( netdev ) ) != 0 )
1305                 goto err_register_netdev;
1306
1307         return 0;
1308
1309  err_query_dev_lim:
1310  err_register_netdev:
1311  err_ipoib_init:
1312         ib_driver_close ( 0 );
1313         netdev_nullify ( netdev );
1314         netdev_put ( netdev );
1315         return rc;
1316 }
1317
1318 static struct pci_device_id arbel_nics[] = {
1319         PCI_ROM ( 0x15b3, 0x6282, "MT25218", "MT25218 HCA driver" ),
1320         PCI_ROM ( 0x15b3, 0x6274, "MT25204", "MT25204 HCA driver" ),
1321 };
1322
1323 struct pci_driver arbel_driver __pci_driver = {
1324         .ids = arbel_nics,
1325         .id_count = ( sizeof ( arbel_nics ) / sizeof ( arbel_nics[0] ) ),
1326         .probe = arbel_probe,
1327         .remove = arbel_remove,
1328 };