Now transmits packets on our own allocated IPoIB queue pair. :)
[people/pcmattman/gpxe.git] / src / drivers / net / mlx_ipoib / mt25218.c
1 /**************************************************************************
2 Etherboot -  BOOTP/TFTP Bootstrap Program
3 Skeleton NIC driver for Etherboot
4 ***************************************************************************/
5
6 /*
7  * This program is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU General Public License as
9  * published by the Free Software Foundation; either version 2, or (at
10  * your option) any later version.
11  */
12
13 #include <errno.h>
14 #include <gpxe/pci.h>
15 #include <gpxe/malloc.h>
16 #include <gpxe/iobuf.h>
17 #include <gpxe/netdevice.h>
18 #include <gpxe/infiniband.h>
19
20 /* to get some global routines like printf */
21 #include "etherboot.h"
22 /* to get the interface to the body of the program */
23 #include "nic.h"
24
25 #define CREATE_OWN 1
26
27 #include "mt25218_imp.c"
28
29 #include "arbel.h"
30
31
32 static const struct ib_gid arbel_no_gid = {
33         { 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2 }
34 };
35
36
37 #define MLX_RX_MAX_FILL NUM_IPOIB_RCV_WQES
38
39 struct mlx_nic {
40 #if ! CREATE_OWN
41         /** Queue pair handle */
42         udqp_t ipoib_qph;
43         /** Send completion queue */
44         cq_t snd_cqh;
45         /** Receive completion queue */
46         cq_t rcv_cqh;
47 #endif
48         /** Broadcast Address Vector */
49         ud_av_t bcast_av;
50
51         /** RX fill level */
52         unsigned int rx_fill;
53
54 #if CREATE_OWN
55         struct ib_completion_queue *own_send_cq;
56         struct ib_completion_queue *own_recv_cq;
57         struct ib_queue_pair *own_qp;
58 #endif
59 };
60
61
62 static struct io_buffer *static_ipoib_tx_ring[NUM_IPOIB_SND_WQES];
63 static struct io_buffer *static_ipoib_rx_ring[NUM_IPOIB_RCV_WQES];
64
65 static struct arbel static_arbel;
66
67 #if ! CREATE_OWN
68
69 static struct arbel_completion_queue static_arbel_ipoib_send_cq = {
70         .ci_doorbell_idx = IPOIB_SND_CQ_CI_DB_IDX,
71 };
72 static struct ib_completion_queue static_ipoib_send_cq = {
73         .cqn = 1234, /* Only used for debug messages */
74         .num_cqes = NUM_IPOIB_SND_CQES,
75         .work_queues = LIST_HEAD_INIT ( static_ipoib_send_cq.work_queues ),
76         .dev_priv = &static_arbel_ipoib_send_cq,
77 };
78
79 static struct arbel_completion_queue static_arbel_ipoib_recv_cq = {
80         .ci_doorbell_idx = IPOIB_RCV_CQ_CI_DB_IDX,
81 };
82 static struct ib_completion_queue static_ipoib_recv_cq = {
83         .cqn = 2345, /* Only used for debug messages */
84         .num_cqes = NUM_IPOIB_RCV_CQES,
85         .work_queues = LIST_HEAD_INIT ( static_ipoib_recv_cq.work_queues ),
86         .dev_priv = &static_arbel_ipoib_recv_cq,
87 };
88
89 static struct arbel_queue_pair static_arbel_ipoib_qp = {
90         .send = {
91                 .doorbell_idx = IPOIB_SND_QP_DB_IDX,
92         },
93         .recv = {
94                 .doorbell_idx = IPOIB_RCV_QP_DB_IDX,
95         },
96 };
97 static struct ib_queue_pair static_ipoib_qp = {
98         .send = {
99                 .qp = &static_ipoib_qp,
100                 .is_send = 1,
101                 .cq = &static_ipoib_send_cq,
102                 .num_wqes = NUM_IPOIB_SND_WQES,
103                 .iobufs = static_ipoib_tx_ring,
104                 .list = LIST_HEAD_INIT (static_ipoib_qp.send.list),
105                 .dev_priv = &static_arbel_ipoib_qp.send,
106         },
107         .recv = {
108                 .qp = &static_ipoib_qp,
109                 .is_send = 0,
110                 .cq = &static_ipoib_recv_cq,
111                 .num_wqes = NUM_IPOIB_RCV_WQES,
112                 .iobufs = static_ipoib_rx_ring,
113                 .list = LIST_HEAD_INIT (static_ipoib_qp.recv.list),
114                 .dev_priv = &static_arbel_ipoib_qp.recv,
115         },
116         .dev_priv = &static_arbel_ipoib_qp,
117 };
118
119 #endif
120
121
122 static struct ib_device static_ibdev = {
123         .dev_priv = &static_arbel,
124 };
125
126
127 /**
128  * Open network device
129  *
130  * @v netdev            Network device
131  * @ret rc              Return status code
132  */
133 static int mlx_open ( struct net_device *netdev ) {
134
135         ( void ) netdev;
136
137         return 0;
138 }
139
140 /**
141  * Close network device
142  *
143  * @v netdev            Network device
144  */
145 static void mlx_close ( struct net_device *netdev ) {
146
147         ( void ) netdev;
148
149 }
150
151 static int arbel_post_send ( struct ib_device *ibdev,
152                              struct ib_queue_pair *qp,
153                              struct ib_address_vector *av,
154                              struct io_buffer *iobuf );
155
156 static int mlx_transmit_direct ( struct net_device *netdev,
157                                  struct io_buffer *iobuf ) {
158         struct mlx_nic *mlx = netdev->priv;
159         int rc;
160
161         struct ud_av_st *bcast_av = mlx->bcast_av;
162         struct arbelprm_ud_address_vector *bav =
163                 ( struct arbelprm_ud_address_vector * ) &bcast_av->av;
164         struct ib_address_vector av = {
165                 .dest_qp = bcast_av->dest_qp,
166                 .qkey = bcast_av->qkey,
167                 .dlid = MLX_GET ( bav, rlid ),
168                 .rate = ( MLX_GET ( bav, max_stat_rate ) ? 1 : 4 ),
169                 .sl = MLX_GET ( bav, sl ),
170                 .gid_present = 1,
171         };
172         memcpy ( &av.gid, ( ( void * ) bav ) + 16, 16 );
173
174         rc = arbel_post_send ( &static_ibdev,
175 #if CREATE_OWN
176                                mlx->own_qp,
177 #else
178                                &static_ipoib_qp,
179 #endif
180                                &av, iobuf );
181
182         return rc;
183 }
184
185 static void arbel_poll_cq ( struct ib_device *ibdev,
186                             struct ib_completion_queue *cq,
187                             ib_completer_t complete_send,
188                             ib_completer_t complete_recv );
189
190 static void temp_complete_send ( struct ib_device *ibdev __unused,
191                                  struct ib_queue_pair *qp,
192                                  struct ib_completion *completion,
193                                  struct io_buffer *iobuf ) {
194         struct net_device *netdev = qp->owner_priv;
195
196         DBG ( "Wahey! TX completion\n" );
197         netdev_tx_complete_err ( netdev, iobuf,
198                                  ( completion->syndrome ? -EIO : 0 ) );
199 }
200
201 static void temp_complete_recv ( struct ib_device *ibdev __unused,
202                                  struct ib_queue_pair *qp,
203                                  struct ib_completion *completion,
204                                  struct io_buffer *iobuf ) {
205         struct net_device *netdev = qp->owner_priv;
206         struct mlx_nic *mlx = netdev->priv;
207
208         DBG ( "Yay! RX completion on %p len %zx:\n", iobuf, completion->len );
209         if ( completion->syndrome ) {
210                 netdev_rx_err ( netdev, iobuf, -EIO );
211         } else {
212                 iob_put ( iobuf, completion->len );
213                 iob_pull ( iobuf, sizeof ( struct ib_global_route_header ) );
214                 netdev_rx ( netdev, iobuf );
215         }
216
217         mlx->rx_fill--;
218 }
219
220 static int arbel_post_recv ( struct ib_device *ibdev,
221                              struct ib_queue_pair *qp,
222                              struct io_buffer *iobuf );
223
224 static void mlx_refill_rx ( struct net_device *netdev ) {
225         struct mlx_nic *mlx = netdev->priv;
226         struct io_buffer *iobuf;
227         int rc;
228
229         while ( mlx->rx_fill < MLX_RX_MAX_FILL ) {
230                 iobuf = alloc_iob ( 2048 );
231                 if ( ! iobuf )
232                         break;
233                 DBG ( "Posting RX buffer %p:\n", iobuf );
234                 if ( ( rc = arbel_post_recv ( &static_ibdev,
235 #if CREATE_OWN
236                                               mlx->own_qp,
237 #else
238                                               &static_ipoib_qp,
239 #endif
240                                               iobuf ) ) != 0 ) {
241                         free_iob ( iobuf );
242                         break;
243                 }
244                 mlx->rx_fill++;
245         }
246 }
247
248 /**
249  * Poll for completed and received packets
250  *
251  * @v netdev            Network device
252  */
253 static void mlx_poll ( struct net_device *netdev ) {
254         struct mlx_nic *mlx = netdev->priv;
255         int rc;
256
257         if ( ( rc = poll_error_buf() ) != 0 ) {
258                 DBG ( "poll_error_buf() failed: %s\n", strerror ( rc ) );
259                 return;
260         }
261
262         /* Drain event queue.  We can ignore events, since we're going
263          * to just poll all completion queues anyway.
264          */
265         if ( ( rc = drain_eq() ) != 0 ) {
266                 DBG ( "drain_eq() failed: %s\n", strerror ( rc ) );
267                 return;
268         }
269
270         /* Poll completion queues */
271         arbel_poll_cq ( &static_ibdev,
272 #if CREATE_OWN
273                         mlx->own_send_cq,
274 #else
275                         &static_ipoib_send_cq,
276 #endif
277                         temp_complete_send, temp_complete_recv );
278         arbel_poll_cq ( &static_ibdev,
279 #if CREATE_OWN
280                         mlx->own_recv_cq,
281 #else
282                         &static_ipoib_recv_cq,
283 #endif
284                         temp_complete_send, temp_complete_recv );
285
286         mlx_refill_rx ( netdev );
287 }
288
289 /**
290  * Enable or disable interrupts
291  *
292  * @v netdev            Network device
293  * @v enable            Interrupts should be enabled
294  */
295 static void mlx_irq ( struct net_device *netdev, int enable ) {
296
297         ( void ) netdev;
298         ( void ) enable;
299
300 }
301
302 static struct net_device_operations mlx_operations = {
303         .open           = mlx_open,
304         .close          = mlx_close,
305         .transmit       = mlx_transmit_direct,
306         .poll           = mlx_poll,
307         .irq            = mlx_irq,
308 };
309
310
311
312
313 /***************************************************************************
314  *
315  * Queue number allocation
316  *
317  ***************************************************************************
318  */
319
320 /**
321  * Allocate queue number
322  *
323  * @v q_inuse           Queue usage bitmask
324  * @v max_inuse         Maximum number of in-use queues
325  * @ret qn_offset       Free queue number offset, or negative error
326  */
327 static int arbel_alloc_qn_offset ( arbel_bitmask_t *q_inuse,
328                                    unsigned int max_inuse ) {
329         unsigned int qn_offset = 0;
330         arbel_bitmask_t mask = 1;
331
332         while ( qn_offset < max_inuse ) {
333                 if ( ( mask & *q_inuse ) == 0 ) {
334                         *q_inuse |= mask;
335                         return qn_offset;
336                 }
337                 qn_offset++;
338                 mask <<= 1;
339                 if ( ! mask ) {
340                         mask = 1;
341                         q_inuse++;
342                 }
343         }
344         return -ENFILE;
345 }
346
347 /**
348  * Free queue number
349  *
350  * @v q_inuse           Queue usage bitmask
351  * @v qn_offset         Queue number offset
352  */
353 static void arbel_free_qn_offset ( arbel_bitmask_t *q_inuse, int qn_offset ) {
354         arbel_bitmask_t mask;
355
356         mask = ( 1 << ( qn_offset % ( 8 * sizeof ( mask ) ) ) );
357         q_inuse += ( qn_offset / ( 8 * sizeof ( mask ) ) );
358         *q_inuse &= ~mask;
359 }
360
361 /***************************************************************************
362  *
363  * HCA commands
364  *
365  ***************************************************************************
366  */
367
368 /**
369  * Wait for Arbel command completion
370  *
371  * @v arbel             Arbel device
372  * @ret rc              Return status code
373  */
374 static int arbel_cmd_wait ( struct arbel *arbel,
375                             struct arbelprm_hca_command_register *hcr ) {
376         unsigned int wait;
377
378         for ( wait = ARBEL_HCR_MAX_WAIT_MS ; wait ; wait-- ) {
379                 hcr->u.dwords[6] =
380                         readl ( arbel->config + ARBEL_HCR_REG ( 6 ) );
381                 if ( MLX_GET ( hcr, go ) == 0 )
382                         return 0;
383                 mdelay ( 1 );
384         }
385         return -EBUSY;
386 }
387
388 /**
389  * Issue HCA command
390  *
391  * @v arbel             Arbel device
392  * @v command           Command opcode, flags and input/output lengths
393  * @v op_mod            Opcode modifier (0 if no modifier applicable)
394  * @v in                Input parameters
395  * @v in_mod            Input modifier (0 if no modifier applicable)
396  * @v out               Output parameters
397  * @ret rc              Return status code
398  */
399 static int arbel_cmd ( struct arbel *arbel, unsigned long command,
400                        unsigned int op_mod, const void *in,
401                        unsigned int in_mod, void *out ) {
402         struct arbelprm_hca_command_register hcr;
403         unsigned int opcode = ARBEL_HCR_OPCODE ( command );
404         size_t in_len = ARBEL_HCR_IN_LEN ( command );
405         size_t out_len = ARBEL_HCR_OUT_LEN ( command );
406         void *in_buffer;
407         void *out_buffer;
408         unsigned int status;
409         unsigned int i;
410         int rc;
411
412         DBGC ( arbel, "Arbel %p command %02x in %zx%s out %zx%s\n",
413                arbel, opcode, in_len,
414                ( ( command & ARBEL_HCR_IN_MBOX ) ? "(mbox)" : "" ), out_len,
415                ( ( command & ARBEL_HCR_OUT_MBOX ) ? "(mbox)" : "" ) );
416
417         /* Check that HCR is free */
418         if ( ( rc = arbel_cmd_wait ( arbel, &hcr ) ) != 0 ) {
419                 DBGC ( arbel, "Arbel %p command interface locked\n", arbel );
420                 return rc;
421         }
422
423         /* Prepare HCR */
424         memset ( &hcr, 0, sizeof ( hcr ) );
425         in_buffer = &hcr.u.dwords[0];
426         if ( in_len && ( command & ARBEL_HCR_IN_MBOX ) ) {
427                 in_buffer = arbel->mailbox_in;
428                 MLX_FILL_1 ( &hcr, 1, in_param_l, virt_to_bus ( in_buffer ) );
429         }
430         memcpy ( in_buffer, in, in_len );
431         MLX_FILL_1 ( &hcr, 2, input_modifier, in_mod );
432         out_buffer = &hcr.u.dwords[3];
433         if ( out_len && ( command & ARBEL_HCR_OUT_MBOX ) ) {
434                 out_buffer = arbel->mailbox_out;
435                 MLX_FILL_1 ( &hcr, 4, out_param_l,
436                              virt_to_bus ( out_buffer ) );
437         }
438         MLX_FILL_3 ( &hcr, 6,
439                      opcode, opcode,
440                      opcode_modifier, op_mod,
441                      go, 1 );
442
443         DBG_HD ( &hcr, sizeof ( hcr ) );
444         if ( in_len ) {
445                 size_t dump_len = in_len;
446                 if ( dump_len > 256 )
447                         dump_len = 256;
448                 DBG ( "Input:\n" );
449                 DBG_HD ( in, dump_len );
450         }
451
452         /* Issue command */
453         for ( i = 0 ; i < ( sizeof ( hcr ) / sizeof ( hcr.u.dwords[0] ) ) ;
454               i++ ) {
455                 writel ( hcr.u.dwords[i],
456                          arbel->config + ARBEL_HCR_REG ( i ) );
457                 barrier();
458         }
459
460         /* Wait for command completion */
461         if ( ( rc = arbel_cmd_wait ( arbel, &hcr ) ) != 0 ) {
462                 DBGC ( arbel, "Arbel %p timed out waiting for command:\n",
463                        arbel );
464                 DBGC_HD ( arbel, &hcr, sizeof ( hcr ) );
465                 return rc;
466         }
467
468         /* Check command status */
469         status = MLX_GET ( &hcr, status );
470         if ( status != 0 ) {
471                 DBGC ( arbel, "Arbel %p command failed with status %02x:\n",
472                        arbel, status );
473                 DBGC_HD ( arbel, &hcr, sizeof ( hcr ) );
474                 return -EIO;
475         }
476
477         /* Read output parameters, if any */
478         hcr.u.dwords[3] = readl ( arbel->config + ARBEL_HCR_REG ( 3 ) );
479         hcr.u.dwords[4] = readl ( arbel->config + ARBEL_HCR_REG ( 4 ) );
480         memcpy ( out, out_buffer, out_len );
481
482         if ( out_len ) {
483                 size_t dump_len = out_len;
484                 if ( dump_len > 256 )
485                         dump_len = 256;
486                 DBG ( "Output:\n" );
487                 DBG_HD ( out, dump_len );
488         }
489
490         return 0;
491 }
492
493 static inline int
494 arbel_cmd_query_dev_lim ( struct arbel *arbel,
495                           struct arbelprm_query_dev_lim *dev_lim ) {
496         return arbel_cmd ( arbel,
497                            ARBEL_HCR_OUT_CMD ( ARBEL_HCR_QUERY_DEV_LIM, 
498                                                1, sizeof ( *dev_lim ) ),
499                            0, NULL, 0, dev_lim );
500 }
501
502 static inline int
503 arbel_cmd_sw2hw_cq ( struct arbel *arbel, unsigned long cqn,
504                      const struct arbelprm_completion_queue_context *cqctx ) {
505         return arbel_cmd ( arbel,
506                            ARBEL_HCR_IN_CMD ( ARBEL_HCR_SW2HW_CQ,
507                                               1, sizeof ( *cqctx ) ),
508                            0, cqctx, cqn, NULL );
509 }
510
511 static inline int
512 arbel_cmd_hw2sw_cq ( struct arbel *arbel, unsigned long cqn ) {
513         return arbel_cmd ( arbel,
514                            ARBEL_HCR_VOID_CMD ( ARBEL_HCR_HW2SW_CQ ),
515                            1, NULL, cqn, NULL );
516 }
517
518 static inline int
519 arbel_cmd_rst2init_qpee ( struct arbel *arbel, unsigned long qpn,
520                           const struct arbelprm_qp_ee_state_transitions *ctx ){
521         return arbel_cmd ( arbel,
522                            ARBEL_HCR_IN_CMD ( ARBEL_HCR_RST2INIT_QPEE,
523                                               1, sizeof ( *ctx ) ),
524                            0, ctx, qpn, NULL );
525 }
526
527 static inline int
528 arbel_cmd_init2rtr_qpee ( struct arbel *arbel, unsigned long qpn,
529                           const struct arbelprm_qp_ee_state_transitions *ctx ){
530         return arbel_cmd ( arbel,
531                            ARBEL_HCR_IN_CMD ( ARBEL_HCR_INIT2RTR_QPEE,
532                                               1, sizeof ( *ctx ) ),
533                            0, ctx, qpn, NULL );
534 }
535
536 static inline int
537 arbel_cmd_rtr2rts_qpee ( struct arbel *arbel, unsigned long qpn,
538                          const struct arbelprm_qp_ee_state_transitions *ctx ) {
539         return arbel_cmd ( arbel,
540                            ARBEL_HCR_IN_CMD ( ARBEL_HCR_RTR2RTS_QPEE,
541                                               1, sizeof ( *ctx ) ),
542                            0, ctx, qpn, NULL );
543 }
544
545 static inline int
546 arbel_cmd_2rst_qpee ( struct arbel *arbel, unsigned long qpn ) {
547         return arbel_cmd ( arbel,
548                            ARBEL_HCR_VOID_CMD ( ARBEL_HCR_2RST_QPEE ),
549                            0x03, NULL, qpn, NULL );
550 }
551
552 /***************************************************************************
553  *
554  * Completion queue operations
555  *
556  ***************************************************************************
557  */
558
559 /**
560  * Create completion queue
561  *
562  * @v ibdev             Infiniband device
563  * @v cq                Completion queue
564  * @ret rc              Return status code
565  */
566 static int arbel_create_cq ( struct ib_device *ibdev,
567                              struct ib_completion_queue *cq ) {
568         struct arbel *arbel = ibdev->dev_priv;
569         struct arbel_completion_queue *arbel_cq;
570         struct arbelprm_completion_queue_context cqctx;
571         struct arbelprm_cq_ci_db_record *ci_db_rec;
572         struct arbelprm_cq_arm_db_record *arm_db_rec;
573         int cqn_offset;
574         unsigned int i;
575         int rc;
576
577         /* Find a free completion queue number */
578         cqn_offset = arbel_alloc_qn_offset ( arbel->cq_inuse, ARBEL_MAX_CQS );
579         if ( cqn_offset < 0 ) {
580                 DBGC ( arbel, "Arbel %p out of completion queues\n", arbel );
581                 rc = cqn_offset;
582                 goto err_cqn_offset;
583         }
584         cq->cqn = ( arbel->limits.reserved_cqs + cqn_offset );
585
586         /* Allocate control structures */
587         arbel_cq = zalloc ( sizeof ( *arbel_cq ) );
588         if ( ! arbel_cq ) {
589                 rc = -ENOMEM;
590                 goto err_arbel_cq;
591         }
592         arbel_cq->ci_doorbell_idx = arbel_cq_ci_doorbell_idx ( cqn_offset );
593         arbel_cq->arm_doorbell_idx = arbel_cq_arm_doorbell_idx ( cqn_offset );
594
595         /* Allocate completion queue itself */
596         arbel_cq->cqe_size = ( cq->num_cqes * sizeof ( arbel_cq->cqe[0] ) );
597         arbel_cq->cqe = malloc_dma ( arbel_cq->cqe_size,
598                                      sizeof ( arbel_cq->cqe[0] ) );
599         if ( ! arbel_cq->cqe ) {
600                 rc = -ENOMEM;
601                 goto err_cqe;
602         }
603         memset ( arbel_cq->cqe, 0, arbel_cq->cqe_size );
604         for ( i = 0 ; i < cq->num_cqes ; i++ ) {
605                 MLX_FILL_1 ( &arbel_cq->cqe[i].normal, 7, owner, 1 );
606         }
607         barrier();
608
609         /* Initialise doorbell records */
610         ci_db_rec = &arbel->db_rec[arbel_cq->ci_doorbell_idx].cq_ci;
611         MLX_FILL_1 ( ci_db_rec, 0, counter, 0 );
612         MLX_FILL_2 ( ci_db_rec, 1,
613                      res, ARBEL_UAR_RES_CQ_CI,
614                      cq_number, cq->cqn );
615         arm_db_rec = &arbel->db_rec[arbel_cq->arm_doorbell_idx].cq_arm;
616         MLX_FILL_1 ( arm_db_rec, 0, counter, 0 );
617         MLX_FILL_2 ( arm_db_rec, 1,
618                      res, ARBEL_UAR_RES_CQ_ARM,
619                      cq_number, cq->cqn );
620
621         /* Hand queue over to hardware */
622         memset ( &cqctx, 0, sizeof ( cqctx ) );
623         MLX_FILL_1 ( &cqctx, 0, st, 0xa /* "Event fired" */ );
624         MLX_FILL_1 ( &cqctx, 2, start_address_l,
625                      virt_to_bus ( arbel_cq->cqe ) );
626         MLX_FILL_2 ( &cqctx, 3,
627                      usr_page, arbel->limits.reserved_uars,
628                      log_cq_size, fls ( cq->num_cqes - 1 ) );
629         MLX_FILL_1 ( &cqctx, 5, c_eqn, arbel->eqn );
630         MLX_FILL_1 ( &cqctx, 6, pd, ARBEL_GLOBAL_PD );
631         MLX_FILL_1 ( &cqctx, 7, l_key, arbel->reserved_lkey );
632         MLX_FILL_1 ( &cqctx, 12, cqn, cq->cqn );
633         MLX_FILL_1 ( &cqctx, 13,
634                      cq_ci_db_record, arbel_cq->ci_doorbell_idx );
635         MLX_FILL_1 ( &cqctx, 14,
636                      cq_state_db_record, arbel_cq->arm_doorbell_idx );
637         if ( ( rc = arbel_cmd_sw2hw_cq ( arbel, cq->cqn, &cqctx ) ) != 0 ) {
638                 DBGC ( arbel, "Arbel %p SW2HW_CQ failed: %s\n",
639                        arbel, strerror ( rc ) );
640                 goto err_sw2hw_cq;
641         }
642
643         cq->dev_priv = arbel_cq;
644         return 0;
645
646  err_sw2hw_cq:
647         MLX_FILL_1 ( ci_db_rec, 1, res, ARBEL_UAR_RES_NONE );
648         MLX_FILL_1 ( arm_db_rec, 1, res, ARBEL_UAR_RES_NONE );
649         free_dma ( arbel_cq->cqe, arbel_cq->cqe_size );
650  err_cqe:
651         free ( arbel_cq );
652  err_arbel_cq:
653         arbel_free_qn_offset ( arbel->cq_inuse, cqn_offset );
654  err_cqn_offset:
655         return rc;
656 }
657
658 /**
659  * Destroy completion queue
660  *
661  * @v ibdev             Infiniband device
662  * @v cq                Completion queue
663  */
664 static void arbel_destroy_cq ( struct ib_device *ibdev,
665                                struct ib_completion_queue *cq ) {
666         struct arbel *arbel = ibdev->dev_priv;
667         struct arbel_completion_queue *arbel_cq = cq->dev_priv;
668         struct arbelprm_cq_ci_db_record *ci_db_rec;
669         struct arbelprm_cq_arm_db_record *arm_db_rec;
670         int cqn_offset;
671         int rc;
672
673         /* Take ownership back from hardware */
674         if ( ( rc = arbel_cmd_hw2sw_cq ( arbel, cq->cqn ) ) != 0 ) {
675                 DBGC ( arbel, "Arbel %p FATAL HW2SW_CQ failed on CQN %#lx: "
676                        "%s\n", arbel, cq->cqn, strerror ( rc ) );
677                 /* Leak memory and return; at least we avoid corruption */
678                 return;
679         }
680
681         /* Clear doorbell records */
682         ci_db_rec = &arbel->db_rec[arbel_cq->ci_doorbell_idx].cq_ci;
683         arm_db_rec = &arbel->db_rec[arbel_cq->arm_doorbell_idx].cq_arm;
684         MLX_FILL_1 ( ci_db_rec, 1, res, ARBEL_UAR_RES_NONE );
685         MLX_FILL_1 ( arm_db_rec, 1, res, ARBEL_UAR_RES_NONE );
686
687         /* Free memory */
688         free_dma ( arbel_cq->cqe, arbel_cq->cqe_size );
689         free ( arbel_cq );
690
691         /* Mark queue number as free */
692         cqn_offset = ( cq->cqn - arbel->limits.reserved_cqs );
693         arbel_free_qn_offset ( arbel->cq_inuse, cqn_offset );
694
695         cq->dev_priv = NULL;
696 }
697
698 /***************************************************************************
699  *
700  * Queue pair operations
701  *
702  ***************************************************************************
703  */
704
705 /**
706  * Create send work queue
707  *
708  * @v arbel_send_wq     Send work queue
709  * @v num_wqes          Number of work queue entries
710  * @ret rc              Return status code
711  */
712 static int arbel_create_send_wq ( struct arbel_send_work_queue *arbel_send_wq,
713                                   unsigned int num_wqes ) {
714         struct arbelprm_ud_send_wqe *wqe;
715         struct arbelprm_ud_send_wqe *next_wqe;
716         unsigned int wqe_idx_mask;
717         unsigned int i;
718
719         /* Allocate work queue */
720         arbel_send_wq->wqe_size = ( num_wqes *
721                                     sizeof ( arbel_send_wq->wqe[0] ) );
722         arbel_send_wq->wqe = malloc_dma ( arbel_send_wq->wqe_size,
723                                           sizeof ( arbel_send_wq->wqe[0] ) );
724         if ( ! arbel_send_wq->wqe )
725                 return -ENOMEM;
726         memset ( arbel_send_wq->wqe, 0, arbel_send_wq->wqe_size );
727
728         /* Link work queue entries */
729         wqe_idx_mask = ( num_wqes - 1 );
730         for ( i = 0 ; i < num_wqes ; i++ ) {
731                 wqe = &arbel_send_wq->wqe[i].ud;
732                 next_wqe = &arbel_send_wq->wqe[ ( i + 1 ) & wqe_idx_mask ].ud;
733                 MLX_FILL_1 ( &wqe->next, 0, nda_31_6,
734                              ( virt_to_bus ( next_wqe ) >> 6 ) );
735         }
736         
737         return 0;
738 }
739
740 /**
741  * Create receive work queue
742  *
743  * @v arbel_recv_wq     Receive work queue
744  * @v num_wqes          Number of work queue entries
745  * @ret rc              Return status code
746  */
747 static int arbel_create_recv_wq ( struct arbel_recv_work_queue *arbel_recv_wq,
748                                   unsigned int num_wqes ) {
749         struct arbelprm_recv_wqe *wqe;
750         struct arbelprm_recv_wqe *next_wqe;
751         unsigned int wqe_idx_mask;
752         size_t nds;
753         unsigned int i;
754         unsigned int j;
755
756         /* Allocate work queue */
757         arbel_recv_wq->wqe_size = ( num_wqes *
758                                     sizeof ( arbel_recv_wq->wqe[0] ) );
759         arbel_recv_wq->wqe = malloc_dma ( arbel_recv_wq->wqe_size,
760                                           sizeof ( arbel_recv_wq->wqe[0] ) );
761         if ( ! arbel_recv_wq->wqe )
762                 return -ENOMEM;
763         memset ( arbel_recv_wq->wqe, 0, arbel_recv_wq->wqe_size );
764
765         /* Link work queue entries */
766         wqe_idx_mask = ( num_wqes - 1 );
767         nds = ( ( offsetof ( typeof ( *wqe ), data ) +
768                   sizeof ( wqe->data[0] ) ) >> 4 );
769         for ( i = 0 ; i < num_wqes ; i++ ) {
770                 wqe = &arbel_recv_wq->wqe[i].recv;
771                 next_wqe = &arbel_recv_wq->wqe[( i + 1 ) & wqe_idx_mask].recv;
772                 MLX_FILL_1 ( &wqe->next, 0, nda_31_6,
773                              ( virt_to_bus ( next_wqe ) >> 6 ) );
774                 MLX_FILL_1 ( &wqe->next, 1, nds, ( sizeof ( *wqe ) / 16 ) );
775                 for ( j = 0 ; ( ( ( void * ) &wqe->data[j] ) <
776                                 ( ( void * ) ( wqe + 1 ) ) ) ; j++ ) {
777                         MLX_FILL_1 ( &wqe->data[j], 1,
778                                      l_key, ARBEL_INVALID_LKEY );
779                 }
780         }
781         
782         return 0;
783 }
784
785 /**
786  * Create queue pair
787  *
788  * @v ibdev             Infiniband device
789  * @v qp                Queue pair
790  * @ret rc              Return status code
791  */
792 static int arbel_create_qp ( struct ib_device *ibdev,
793                              struct ib_queue_pair *qp ) {
794         struct arbel *arbel = ibdev->dev_priv;
795         struct arbel_queue_pair *arbel_qp;
796         struct arbelprm_qp_ee_state_transitions qpctx;
797         struct arbelprm_qp_db_record *send_db_rec;
798         struct arbelprm_qp_db_record *recv_db_rec;
799         int qpn_offset;
800         int rc;
801
802         /* Find a free queue pair number */
803         qpn_offset = arbel_alloc_qn_offset ( arbel->qp_inuse, ARBEL_MAX_QPS );
804         if ( qpn_offset < 0 ) {
805                 DBGC ( arbel, "Arbel %p out of queue pairs\n", arbel );
806                 rc = qpn_offset;
807                 goto err_qpn_offset;
808         }
809         qp->qpn = ( ARBEL_QPN_BASE + arbel->limits.reserved_qps + qpn_offset );
810
811         /* Allocate control structures */
812         arbel_qp = zalloc ( sizeof ( *arbel_qp ) );
813         if ( ! arbel_qp ) {
814                 rc = -ENOMEM;
815                 goto err_arbel_qp;
816         }
817         arbel_qp->send.doorbell_idx = arbel_send_doorbell_idx ( qpn_offset );
818         arbel_qp->recv.doorbell_idx = arbel_recv_doorbell_idx ( qpn_offset );
819
820         /* Create send and receive work queues */
821         if ( ( rc = arbel_create_send_wq ( &arbel_qp->send,
822                                            qp->send.num_wqes ) ) != 0 )
823                 goto err_create_send_wq;
824         if ( ( rc = arbel_create_recv_wq ( &arbel_qp->recv,
825                                            qp->recv.num_wqes ) ) != 0 )
826                 goto err_create_recv_wq;
827
828         /* Initialise doorbell records */
829         send_db_rec = &arbel->db_rec[arbel_qp->send.doorbell_idx].qp;
830         MLX_FILL_1 ( send_db_rec, 0, counter, 0 );
831         MLX_FILL_2 ( send_db_rec, 1,
832                      res, ARBEL_UAR_RES_SQ,
833                      qp_number, qp->qpn );
834         recv_db_rec = &arbel->db_rec[arbel_qp->recv.doorbell_idx].qp;
835         MLX_FILL_1 ( recv_db_rec, 0, counter, 0 );
836         MLX_FILL_2 ( recv_db_rec, 1,
837                      res, ARBEL_UAR_RES_RQ,
838                      qp_number, qp->qpn );
839
840         /* Hand queue over to hardware */
841         memset ( &qpctx, 0, sizeof ( qpctx ) );
842         MLX_FILL_3 ( &qpctx, 2,
843                      qpc_eec_data.de, 1,
844                      qpc_eec_data.pm_state, 0x03 /* Always 0x03 for UD */,
845                      qpc_eec_data.st, ARBEL_ST_UD );
846         MLX_FILL_6 ( &qpctx, 4,
847                      qpc_eec_data.mtu, ARBEL_MTU_2048,
848                      qpc_eec_data.msg_max, 11 /* 2^11 = 2048 */,
849                      qpc_eec_data.log_rq_size, fls ( qp->recv.num_wqes - 1 ),
850                      qpc_eec_data.log_rq_stride,
851                      ( fls ( sizeof ( arbel_qp->recv.wqe[0] ) - 1 ) - 4 ),
852                      qpc_eec_data.log_sq_size, fls ( qp->send.num_wqes - 1 ),
853                      qpc_eec_data.log_sq_stride,
854                      ( fls ( sizeof ( arbel_qp->send.wqe[0] ) - 1 ) - 4 ) );
855         MLX_FILL_1 ( &qpctx, 5,
856                      qpc_eec_data.usr_page, arbel->limits.reserved_uars );
857         MLX_FILL_1 ( &qpctx, 10, qpc_eec_data.primary_address_path.port_number,
858                      PXE_IB_PORT );
859         MLX_FILL_1 ( &qpctx, 27, qpc_eec_data.pd, ARBEL_GLOBAL_PD );
860         MLX_FILL_1 ( &qpctx, 29, qpc_eec_data.wqe_lkey, arbel->reserved_lkey );
861         MLX_FILL_1 ( &qpctx, 30, qpc_eec_data.ssc, 1 );
862         MLX_FILL_1 ( &qpctx, 33, qpc_eec_data.cqn_snd, qp->send.cq->cqn );
863         MLX_FILL_1 ( &qpctx, 34, qpc_eec_data.snd_wqe_base_adr_l,
864                      ( virt_to_bus ( arbel_qp->send.wqe ) >> 6 ) );
865         MLX_FILL_1 ( &qpctx, 35, qpc_eec_data.snd_db_record_index,
866                      arbel_qp->send.doorbell_idx );
867         MLX_FILL_1 ( &qpctx, 38, qpc_eec_data.rsc, 1 );
868         MLX_FILL_1 ( &qpctx, 41, qpc_eec_data.cqn_rcv, qp->recv.cq->cqn );
869         MLX_FILL_1 ( &qpctx, 42, qpc_eec_data.rcv_wqe_base_adr_l,
870                      ( virt_to_bus ( arbel_qp->recv.wqe ) >> 6 ) );
871         MLX_FILL_1 ( &qpctx, 43, qpc_eec_data.rcv_db_record_index,
872                      arbel_qp->recv.doorbell_idx );
873         MLX_FILL_1 ( &qpctx, 44, qpc_eec_data.q_key, qp->qkey );
874         if ( ( rc = arbel_cmd_rst2init_qpee ( arbel, qp->qpn, &qpctx )) != 0 ){
875                 DBGC ( arbel, "Arbel %p RST2INIT_QPEE failed: %s\n",
876                        arbel, strerror ( rc ) );
877                 goto err_rst2init_qpee;
878         }
879         memset ( &qpctx, 0, sizeof ( qpctx ) );
880         MLX_FILL_2 ( &qpctx, 4,
881                      qpc_eec_data.mtu, ARBEL_MTU_2048,
882                      qpc_eec_data.msg_max, 11 /* 2^11 = 2048 */ );
883         if ( ( rc = arbel_cmd_init2rtr_qpee ( arbel, qp->qpn, &qpctx )) != 0 ){
884                 DBGC ( arbel, "Arbel %p INIT2RTR_QPEE failed: %s\n",
885                        arbel, strerror ( rc ) );
886                 goto err_init2rtr_qpee;
887         }
888         memset ( &qpctx, 0, sizeof ( qpctx ) );
889         if ( ( rc = arbel_cmd_rtr2rts_qpee ( arbel, qp->qpn, &qpctx ) ) != 0 ){
890                 DBGC ( arbel, "Arbel %p RTR2RTS_QPEE failed: %s\n",
891                        arbel, strerror ( rc ) );
892                 goto err_rtr2rts_qpee;
893         }
894
895         qp->dev_priv = arbel_qp;
896         return 0;
897
898  err_rtr2rts_qpee:
899  err_init2rtr_qpee:
900         arbel_cmd_2rst_qpee ( arbel, qp->qpn );
901  err_rst2init_qpee:
902         MLX_FILL_1 ( send_db_rec, 1, res, ARBEL_UAR_RES_NONE );
903         MLX_FILL_1 ( recv_db_rec, 1, res, ARBEL_UAR_RES_NONE );
904         free_dma ( arbel_qp->recv.wqe, arbel_qp->recv.wqe_size );
905  err_create_recv_wq:
906         free_dma ( arbel_qp->send.wqe, arbel_qp->send.wqe_size );
907  err_create_send_wq:
908         free ( arbel_qp );
909  err_arbel_qp:
910         arbel_free_qn_offset ( arbel->qp_inuse, qpn_offset );
911  err_qpn_offset:
912         return rc;
913 }
914
915 /**
916  * Destroy queue pair
917  *
918  * @v ibdev             Infiniband device
919  * @v qp                Queue pair
920  */
921 static void arbel_destroy_qp ( struct ib_device *ibdev,
922                                struct ib_queue_pair *qp ) {
923         struct arbel *arbel = ibdev->dev_priv;
924         struct arbel_queue_pair *arbel_qp = qp->dev_priv;
925         struct arbelprm_qp_db_record *send_db_rec;
926         struct arbelprm_qp_db_record *recv_db_rec;
927         int qpn_offset;
928         int rc;
929
930         /* Take ownership back from hardware */
931         if ( ( rc = arbel_cmd_2rst_qpee ( arbel, qp->qpn ) ) != 0 ) {
932                 DBGC ( arbel, "Arbel %p FATAL 2RST_QPEE failed on QPN %#lx: "
933                        "%s\n", arbel, qp->qpn, strerror ( rc ) );
934                 /* Leak memory and return; at least we avoid corruption */
935                 return;
936         }
937
938         /* Clear doorbell records */
939         send_db_rec = &arbel->db_rec[arbel_qp->send.doorbell_idx].qp;
940         recv_db_rec = &arbel->db_rec[arbel_qp->recv.doorbell_idx].qp;
941         MLX_FILL_1 ( send_db_rec, 1, res, ARBEL_UAR_RES_NONE );
942         MLX_FILL_1 ( recv_db_rec, 1, res, ARBEL_UAR_RES_NONE );
943
944         /* Free memory */
945         free_dma ( arbel_qp->send.wqe, arbel_qp->send.wqe_size );
946         free_dma ( arbel_qp->recv.wqe, arbel_qp->recv.wqe_size );
947         free ( arbel_qp );
948
949         /* Mark queue number as free */
950         qpn_offset = ( qp->qpn - ARBEL_QPN_BASE - arbel->limits.reserved_qps );
951         arbel_free_qn_offset ( arbel->qp_inuse, qpn_offset );
952
953         qp->dev_priv = NULL;
954 }
955
956 /***************************************************************************
957  *
958  * Work request operations
959  *
960  ***************************************************************************
961  */
962
963 /**
964  * Ring doorbell register in UAR
965  *
966  * @v arbel             Arbel device
967  * @v db_reg            Doorbell register structure
968  * @v offset            Address of doorbell
969  */
970 static void arbel_ring_doorbell ( struct arbel *arbel,
971                                   union arbelprm_doorbell_register *db_reg,
972                                   unsigned int offset ) {
973
974         DBG ( "arbel_ring_doorbell %08lx:%08lx to %lx\n",
975               db_reg->dword[0], db_reg->dword[1],
976               virt_to_phys ( arbel->uar + offset ) );
977
978         barrier();
979         writel ( db_reg->dword[0], ( arbel->uar + offset + 0 ) );
980         barrier();
981         writel ( db_reg->dword[1], ( arbel->uar + offset + 4 ) );
982 }
983
984 /**
985  * Post send work queue entry
986  *
987  * @v ibdev             Infiniband device
988  * @v qp                Queue pair
989  * @v av                Address vector
990  * @v iobuf             I/O buffer
991  * @ret rc              Return status code
992  */
993 static int arbel_post_send ( struct ib_device *ibdev,
994                              struct ib_queue_pair *qp,
995                              struct ib_address_vector *av,
996                              struct io_buffer *iobuf ) {
997         struct arbel *arbel = ibdev->dev_priv;
998         struct arbel_queue_pair *arbel_qp = qp->dev_priv;
999         struct ib_work_queue *wq = &qp->send;
1000         struct arbel_send_work_queue *arbel_send_wq = &arbel_qp->send;
1001         struct arbelprm_ud_send_wqe *prev_wqe;
1002         struct arbelprm_ud_send_wqe *wqe;
1003         struct arbelprm_qp_db_record *qp_db_rec;
1004         union arbelprm_doorbell_register db_reg;
1005         const struct ib_gid *gid;
1006         unsigned int wqe_idx_mask;
1007         size_t nds;
1008
1009         /* Allocate work queue entry */
1010         wqe_idx_mask = ( wq->num_wqes - 1 );
1011         if ( wq->iobufs[wq->next_idx & wqe_idx_mask] ) {
1012                 DBGC ( arbel, "Arbel %p send queue full", arbel );
1013                 return -ENOBUFS;
1014         }
1015         wq->iobufs[wq->next_idx & wqe_idx_mask] = iobuf;
1016         prev_wqe = &arbel_send_wq->wqe[(wq->next_idx - 1) & wqe_idx_mask].ud;
1017         wqe = &arbel_send_wq->wqe[wq->next_idx & wqe_idx_mask].ud;
1018
1019         /* Construct work queue entry */
1020         MLX_FILL_1 ( &wqe->next, 1, always1, 1 );
1021         memset ( &wqe->ctrl, 0, sizeof ( wqe->ctrl ) );
1022         MLX_FILL_1 ( &wqe->ctrl, 0, always1, 1 );
1023         memset ( &wqe->ud, 0, sizeof ( wqe->ud ) );
1024         MLX_FILL_2 ( &wqe->ud, 0,
1025                      ud_address_vector.pd, ARBEL_GLOBAL_PD,
1026                      ud_address_vector.port_number, PXE_IB_PORT );
1027         MLX_FILL_2 ( &wqe->ud, 1,
1028                      ud_address_vector.rlid, av->dlid,
1029                      ud_address_vector.g, av->gid_present );
1030         MLX_FILL_2 ( &wqe->ud, 2,
1031                      ud_address_vector.max_stat_rate,
1032                          ( ( av->rate >= 3 ) ? 0 : 1 ),
1033                      ud_address_vector.msg, 3 );
1034         MLX_FILL_1 ( &wqe->ud, 3, ud_address_vector.sl, av->sl );
1035         gid = ( av->gid_present ? &av->gid : &arbel_no_gid );
1036         memcpy ( &wqe->ud.u.dwords[4], gid, sizeof ( *gid ) );
1037         MLX_FILL_1 ( &wqe->ud, 8, destination_qp, av->dest_qp );
1038         MLX_FILL_1 ( &wqe->ud, 9, q_key, av->qkey );
1039         MLX_FILL_1 ( &wqe->data[0], 0, byte_count, iob_len ( iobuf ) );
1040         MLX_FILL_1 ( &wqe->data[0], 1, l_key, arbel->reserved_lkey );
1041         MLX_FILL_1 ( &wqe->data[0], 3,
1042                      local_address_l, virt_to_bus ( iobuf->data ) );
1043
1044         /* Update previous work queue entry's "next" field */
1045         nds = ( ( offsetof ( typeof ( *wqe ), data ) +
1046                   sizeof ( wqe->data[0] ) ) >> 4 );
1047         MLX_SET ( &prev_wqe->next, nopcode, ARBEL_OPCODE_SEND );
1048         MLX_FILL_3 ( &prev_wqe->next, 1,
1049                      nds, nds,
1050                      f, 1,
1051                      always1, 1 );
1052
1053         /* Update doorbell record */
1054         barrier();
1055         qp_db_rec = &arbel->db_rec[arbel_send_wq->doorbell_idx].qp;
1056         MLX_FILL_1 ( qp_db_rec, 0,
1057                      counter, ( ( wq->next_idx + 1 ) & 0xffff ) );
1058
1059         /* Ring doorbell register */
1060         MLX_FILL_4 ( &db_reg.send, 0,
1061                      nopcode, ARBEL_OPCODE_SEND,
1062                      f, 1,
1063                      wqe_counter, ( wq->next_idx & 0xffff ),
1064                      wqe_cnt, 1 );
1065         MLX_FILL_2 ( &db_reg.send, 1,
1066                      nds, nds,
1067                      qpn, qp->qpn );
1068         arbel_ring_doorbell ( arbel, &db_reg, POST_SND_OFFSET );
1069
1070         /* Update work queue's index */
1071         wq->next_idx++;
1072
1073         return 0;
1074 }
1075
1076 /**
1077  * Post receive work queue entry
1078  *
1079  * @v ibdev             Infiniband device
1080  * @v qp                Queue pair
1081  * @v iobuf             I/O buffer
1082  * @ret rc              Return status code
1083  */
1084 static int arbel_post_recv ( struct ib_device *ibdev,
1085                              struct ib_queue_pair *qp,
1086                              struct io_buffer *iobuf ) {
1087         struct arbel *arbel = ibdev->dev_priv;
1088         struct arbel_queue_pair *arbel_qp = qp->dev_priv;
1089         struct ib_work_queue *wq = &qp->recv;
1090         struct arbel_recv_work_queue *arbel_recv_wq = &arbel_qp->recv;
1091         struct arbelprm_recv_wqe *wqe;
1092         union arbelprm_doorbell_record *db_rec;
1093         unsigned int wqe_idx_mask;
1094
1095         /* Allocate work queue entry */
1096         wqe_idx_mask = ( wq->num_wqes - 1 );
1097         if ( wq->iobufs[wq->next_idx & wqe_idx_mask] ) {
1098                 DBGC ( arbel, "Arbel %p receive queue full", arbel );
1099                 return -ENOBUFS;
1100         }
1101         wq->iobufs[wq->next_idx & wqe_idx_mask] = iobuf;
1102         wqe = &arbel_recv_wq->wqe[wq->next_idx & wqe_idx_mask].recv;
1103
1104         /* Construct work queue entry */
1105         MLX_FILL_1 ( &wqe->data[0], 0, byte_count, iob_tailroom ( iobuf ) );
1106         MLX_FILL_1 ( &wqe->data[0], 1, l_key, arbel->reserved_lkey );
1107         MLX_FILL_1 ( &wqe->data[0], 3,
1108                      local_address_l, virt_to_bus ( iobuf->data ) );
1109
1110         /* Update doorbell record */
1111         barrier();
1112         db_rec = &arbel->db_rec[arbel_recv_wq->doorbell_idx];
1113         MLX_FILL_1 ( &db_rec->qp, 0,
1114                      counter, ( ( wq->next_idx + 1 ) & 0xffff ) );      
1115
1116         /* Update work queue's index */
1117         wq->next_idx++;
1118
1119         return 0;       
1120 }
1121
1122 /**
1123  * Handle completion
1124  *
1125  * @v ibdev             Infiniband device
1126  * @v cq                Completion queue
1127  * @v cqe               Hardware completion queue entry
1128  * @v complete_send     Send completion handler
1129  * @v complete_recv     Receive completion handler
1130  * @ret rc              Return status code
1131  */
1132 static int arbel_complete ( struct ib_device *ibdev,
1133                             struct ib_completion_queue *cq,
1134                             union arbelprm_completion_entry *cqe,
1135                             ib_completer_t complete_send,
1136                             ib_completer_t complete_recv ) {
1137         struct arbel *arbel = ibdev->dev_priv;
1138         struct ib_completion completion;
1139         struct ib_work_queue *wq;
1140         struct ib_queue_pair *qp;
1141         struct arbel_queue_pair *arbel_qp;
1142         struct arbel_send_work_queue *arbel_send_wq;
1143         struct arbel_recv_work_queue *arbel_recv_wq;
1144         struct io_buffer *iobuf;
1145         ib_completer_t complete;
1146         unsigned int opcode;
1147         unsigned long qpn;
1148         int is_send;
1149         unsigned long wqe_adr;
1150         unsigned int wqe_idx;
1151         int rc = 0;
1152
1153         /* Parse completion */
1154         memset ( &completion, 0, sizeof ( completion ) );
1155         completion.len = MLX_GET ( &cqe->normal, byte_cnt );
1156         qpn = MLX_GET ( &cqe->normal, my_qpn );
1157         is_send = MLX_GET ( &cqe->normal, s );
1158         wqe_adr = ( MLX_GET ( &cqe->normal, wqe_adr ) << 6 );
1159         opcode = MLX_GET ( &cqe->normal, opcode );
1160         if ( opcode >= ARBEL_OPCODE_RECV_ERROR ) {
1161                 /* "s" field is not valid for error opcodes */
1162                 is_send = ( opcode == ARBEL_OPCODE_SEND_ERROR );
1163                 completion.syndrome = MLX_GET ( &cqe->error, syndrome );
1164                 DBGC ( arbel, "Arbel %p CPN %lx syndrome %x vendor %lx\n",
1165                        arbel, cq->cqn, completion.syndrome,
1166                        MLX_GET ( &cqe->error, vendor_code ) );
1167                 rc = -EIO;
1168                 /* Don't return immediately; propagate error to completer */
1169         }
1170
1171         /* Identify work queue */
1172         wq = ib_find_wq ( cq, qpn, is_send );
1173         if ( ! wq ) {
1174                 DBGC ( arbel, "Arbel %p CQN %lx unknown %s QPN %lx\n",
1175                        arbel, cq->cqn, ( is_send ? "send" : "recv" ), qpn );
1176                 return -EIO;
1177         }
1178         qp = wq->qp;
1179         arbel_qp = qp->dev_priv;
1180
1181         /* Identify work queue entry index */
1182         if ( is_send ) {
1183                 arbel_send_wq = &arbel_qp->send;
1184                 wqe_idx = ( ( wqe_adr - virt_to_bus ( arbel_send_wq->wqe ) ) /
1185                             sizeof ( arbel_send_wq->wqe[0] ) );
1186         } else {
1187                 arbel_recv_wq = &arbel_qp->recv;
1188                 wqe_idx = ( ( wqe_adr - virt_to_bus ( arbel_recv_wq->wqe ) ) /
1189                             sizeof ( arbel_recv_wq->wqe[0] ) );
1190         }
1191
1192         /* Identify I/O buffer */
1193         iobuf = wq->iobufs[wqe_idx];
1194         if ( ! iobuf ) {
1195                 DBGC ( arbel, "Arbel %p CQN %lx QPN %lx empty WQE %x\n",
1196                        arbel, cq->cqn, qpn, wqe_idx );
1197                 return -EIO;
1198         }
1199         wq->iobufs[wqe_idx] = NULL;
1200
1201         /* Pass off to caller's completion handler */
1202         complete = ( is_send ? complete_send : complete_recv );
1203         complete ( ibdev, qp, &completion, iobuf );
1204
1205         return rc;
1206 }                            
1207
1208 /**
1209  * Poll completion queue
1210  *
1211  * @v ibdev             Infiniband device
1212  * @v cq                Completion queue
1213  * @v complete_send     Send completion handler
1214  * @v complete_recv     Receive completion handler
1215  */
1216 static void arbel_poll_cq ( struct ib_device *ibdev,
1217                             struct ib_completion_queue *cq,
1218                             ib_completer_t complete_send,
1219                             ib_completer_t complete_recv ) {
1220         struct arbel *arbel = ibdev->dev_priv;
1221         struct arbel_completion_queue *arbel_cq = cq->dev_priv;
1222         struct arbelprm_cq_ci_db_record *ci_db_rec;
1223         union arbelprm_completion_entry *cqe;
1224         unsigned int cqe_idx_mask;
1225         int rc;
1226
1227         while ( 1 ) {
1228                 /* Look for completion entry */
1229                 cqe_idx_mask = ( cq->num_cqes - 1 );
1230                 cqe = &arbel_cq->cqe[cq->next_idx & cqe_idx_mask];
1231                 if ( MLX_GET ( &cqe->normal, owner ) != 0 ) {
1232                         /* Entry still owned by hardware; end of poll */
1233                         break;
1234                 }
1235
1236                 /* Handle completion */
1237                 if ( ( rc = arbel_complete ( ibdev, cq, cqe, complete_send,
1238                                              complete_recv ) ) != 0 ) {
1239                         DBGC ( arbel, "Arbel %p failed to complete: %s\n",
1240                                arbel, strerror ( rc ) );
1241                         DBGC_HD ( arbel, cqe, sizeof ( *cqe ) );
1242                 }
1243
1244                 /* Return ownership to hardware */
1245                 MLX_FILL_1 ( &cqe->normal, 7, owner, 1 );
1246                 barrier();
1247                 /* Update completion queue's index */
1248                 cq->next_idx++;
1249                 /* Update doorbell record */
1250                 ci_db_rec = &arbel->db_rec[arbel_cq->ci_doorbell_idx].cq_ci;
1251                 MLX_FILL_1 ( ci_db_rec, 0,
1252                              counter, ( cq->next_idx & 0xffffffffUL ) );
1253         }
1254 }
1255
1256 /** Arbel Infiniband operations */
1257 static struct ib_device_operations arbel_ib_operations = {
1258         .create_cq      = arbel_create_cq,
1259         .destroy_cq     = arbel_destroy_cq,
1260         .create_qp      = arbel_create_qp,
1261         .destroy_qp     = arbel_destroy_qp,
1262         .post_send      = arbel_post_send,
1263         .post_recv      = arbel_post_recv,
1264         .poll_cq        = arbel_poll_cq,
1265 };
1266
1267 /**
1268  * Remove PCI device
1269  *
1270  * @v pci               PCI device
1271  */
1272 static void arbel_remove ( struct pci_device *pci ) {
1273         struct net_device *netdev = pci_get_drvdata ( pci );
1274
1275         unregister_netdev ( netdev );
1276         ib_driver_close ( 0 );
1277         netdev_nullify ( netdev );
1278         netdev_put ( netdev );
1279 }
1280
1281 /**
1282  * Probe PCI device
1283  *
1284  * @v pci               PCI device
1285  * @v id                PCI ID
1286  * @ret rc              Return status code
1287  */
1288 static int arbel_probe ( struct pci_device *pci,
1289                          const struct pci_device_id *id __unused ) {
1290         struct net_device *netdev;
1291         struct arbelprm_query_dev_lim dev_lim;
1292         struct arbel *arbel = &static_arbel;
1293         struct mlx_nic *mlx;
1294         struct ib_mac *mac;
1295         udqp_t qph;
1296         int rc;
1297
1298         /* Allocate net device */
1299         netdev = alloc_ibdev ( sizeof ( *mlx ) );
1300         if ( ! netdev )
1301                 return -ENOMEM;
1302         netdev_init ( netdev, &mlx_operations );
1303         mlx = netdev->priv;
1304         pci_set_drvdata ( pci, netdev );
1305         netdev->dev = &pci->dev;
1306         memset ( mlx, 0, sizeof ( *mlx ) );
1307
1308         /* Fix up PCI device */
1309         adjust_pci_device ( pci );
1310
1311         /* Initialise hardware */
1312         if ( ( rc = ib_driver_init ( pci, &qph ) ) != 0 )
1313                 goto err_ipoib_init;
1314         mlx->bcast_av = ib_data.bcast_av;
1315 #if ! CREATE_OWN
1316         mlx->ipoib_qph = qph;
1317         mlx->snd_cqh = ib_data.ipoib_snd_cq;
1318         mlx->rcv_cqh = ib_data.ipoib_rcv_cq;
1319         mac = ( ( struct ib_mac * ) netdev->ll_addr );
1320         mac->qpn = htonl ( ib_get_qpn ( mlx->ipoib_qph ) );
1321         memcpy ( &mac->gid, ib_data.port_gid.raw, sizeof ( mac->gid ) );
1322 #endif
1323
1324         /* Hack up IB structures */
1325         arbel->config = memfree_pci_dev.cr_space;
1326         arbel->mailbox_in = dev_buffers_p->inprm_buf;
1327         arbel->mailbox_out = dev_buffers_p->outprm_buf;
1328         arbel->uar = memfree_pci_dev.uar;
1329         arbel->db_rec = dev_ib_data.uar_context_base;
1330         arbel->reserved_lkey = dev_ib_data.mkey;
1331         arbel->eqn = dev_ib_data.eq.eqn;
1332 #if ! CREATE_OWN
1333         static_arbel_ipoib_qp.send.wqe =
1334                 ( ( struct udqp_st * ) qph )->snd_wq;
1335         static_arbel_ipoib_qp.recv.wqe =
1336                 ( ( struct udqp_st * ) qph )->rcv_wq;
1337         static_arbel_ipoib_send_cq.cqe =
1338                 ( ( struct cq_st * ) ib_data.ipoib_snd_cq )->cq_buf;
1339         static_arbel_ipoib_recv_cq.cqe =
1340                 ( ( struct cq_st * ) ib_data.ipoib_rcv_cq )->cq_buf;
1341         static_ipoib_qp.qpn = ib_get_qpn ( qph );
1342         static_ipoib_qp.owner_priv = netdev;
1343         list_add ( &static_ipoib_qp.send.list,
1344                    &static_ipoib_send_cq.work_queues );
1345         list_add ( &static_ipoib_qp.recv.list,
1346                    &static_ipoib_recv_cq.work_queues );
1347 #endif
1348         static_ibdev.op = &arbel_ib_operations;
1349
1350         /* Get device limits */
1351         if ( ( rc = arbel_cmd_query_dev_lim ( arbel, &dev_lim ) ) != 0 ) {
1352                 DBGC ( arbel, "Arbel %p could not get device limits: %s\n",
1353                        arbel, strerror ( rc ) );
1354                 goto err_query_dev_lim;
1355         }
1356         arbel->limits.reserved_uars = MLX_GET ( &dev_lim, num_rsvd_uars );
1357         arbel->limits.reserved_cqs =
1358                 ( 1 << MLX_GET ( &dev_lim, log2_rsvd_cqs ) );
1359         arbel->limits.reserved_qps =
1360                 ( 1 << MLX_GET ( &dev_lim, log2_rsvd_qps ) );
1361
1362 #if CREATE_OWN
1363         struct ib_device *ibdev = &static_ibdev;
1364         mlx->own_send_cq = ib_create_cq ( ibdev, 32 );
1365         if ( ! mlx->own_send_cq ) {
1366                 DBG ( "Could not create send CQ\n" );
1367                 return -EIO;
1368         }
1369         mlx->own_recv_cq = ib_create_cq ( ibdev, 32 );
1370         if ( ! mlx->own_recv_cq ) {
1371                 DBG ( "Could not create send CQ\n" );
1372                 return -EIO;
1373         }
1374         mlx->own_qp = ib_create_qp ( ibdev, NUM_IPOIB_SND_WQES,
1375                                      mlx->own_send_cq, NUM_IPOIB_RCV_WQES,
1376                                      mlx->own_recv_cq, ipoib_qkey );
1377         if ( ! mlx->own_qp ) {
1378                 DBG ( "Could not create QP\n" );
1379                 return -EIO;
1380         }
1381         mlx->own_qp->owner_priv = netdev;
1382
1383         mac = ( ( struct ib_mac * ) netdev->ll_addr );
1384         mac->qpn = htonl ( mlx->own_qp->qpn );
1385         memcpy ( &mac->gid, ib_data.port_gid.raw, sizeof ( mac->gid ) );        
1386 #endif
1387
1388 #if 0
1389         DBG ( "MADS SND CQN = %#lx\n", dev_ib_data.mads_qp.snd_cq.cqn );
1390         struct ib_completion_queue *test_cq;
1391         test_cq = ib_create_cq ( &static_ibdev, 32 );
1392         if ( test_cq ) {
1393                 DBG ( "Woot: create_cq() passed!\n" );
1394         }
1395 #endif
1396
1397         /* Register network device */
1398         if ( ( rc = register_netdev ( netdev ) ) != 0 )
1399                 goto err_register_netdev;
1400
1401         return 0;
1402
1403  err_query_dev_lim:
1404  err_register_netdev:
1405  err_ipoib_init:
1406         ib_driver_close ( 0 );
1407         netdev_nullify ( netdev );
1408         netdev_put ( netdev );
1409         return rc;
1410 }
1411
1412 static struct pci_device_id arbel_nics[] = {
1413         PCI_ROM ( 0x15b3, 0x6282, "MT25218", "MT25218 HCA driver" ),
1414         PCI_ROM ( 0x15b3, 0x6274, "MT25204", "MT25204 HCA driver" ),
1415 };
1416
1417 struct pci_driver arbel_driver __pci_driver = {
1418         .ids = arbel_nics,
1419         .id_count = ( sizeof ( arbel_nics ) / sizeof ( arbel_nics[0] ) ),
1420         .probe = arbel_probe,
1421         .remove = arbel_remove,
1422 };