Cleaned up some debug messages.
[people/xl0/gpxe.git] / src / drivers / net / mlx_ipoib / mt25218.c
1 /**************************************************************************
2 Etherboot -  BOOTP/TFTP Bootstrap Program
3 Skeleton NIC driver for Etherboot
4 ***************************************************************************/
5
6 /*
7  * This program is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU General Public License as
9  * published by the Free Software Foundation; either version 2, or (at
10  * your option) any later version.
11  */
12
13 #include <errno.h>
14 #include <gpxe/pci.h>
15 #include <gpxe/malloc.h>
16 #include <gpxe/iobuf.h>
17 #include <gpxe/netdevice.h>
18 #include <gpxe/infiniband.h>
19 #include <gpxe/ipoib.h>
20
21 /* to get some global routines like printf */
22 #include "etherboot.h"
23 /* to get the interface to the body of the program */
24 #include "nic.h"
25
26 #define CREATE_OWN 1
27
28 #include "mt25218_imp.c"
29
30 #include "arbel.h"
31
32
33 struct ib_address_vector hack_ipoib_bcast_av;
34
35
36
37
38
39
40
41
42 /***************************************************************************
43  *
44  * Queue number allocation
45  *
46  ***************************************************************************
47  */
48
49 /**
50  * Allocate queue number
51  *
52  * @v q_inuse           Queue usage bitmask
53  * @v max_inuse         Maximum number of in-use queues
54  * @ret qn_offset       Free queue number offset, or negative error
55  */
56 static int arbel_alloc_qn_offset ( arbel_bitmask_t *q_inuse,
57                                    unsigned int max_inuse ) {
58         unsigned int qn_offset = 0;
59         arbel_bitmask_t mask = 1;
60
61         while ( qn_offset < max_inuse ) {
62                 if ( ( mask & *q_inuse ) == 0 ) {
63                         *q_inuse |= mask;
64                         return qn_offset;
65                 }
66                 qn_offset++;
67                 mask <<= 1;
68                 if ( ! mask ) {
69                         mask = 1;
70                         q_inuse++;
71                 }
72         }
73         return -ENFILE;
74 }
75
76 /**
77  * Free queue number
78  *
79  * @v q_inuse           Queue usage bitmask
80  * @v qn_offset         Queue number offset
81  */
82 static void arbel_free_qn_offset ( arbel_bitmask_t *q_inuse, int qn_offset ) {
83         arbel_bitmask_t mask;
84
85         mask = ( 1 << ( qn_offset % ( 8 * sizeof ( mask ) ) ) );
86         q_inuse += ( qn_offset / ( 8 * sizeof ( mask ) ) );
87         *q_inuse &= ~mask;
88 }
89
90 /***************************************************************************
91  *
92  * HCA commands
93  *
94  ***************************************************************************
95  */
96
97 /**
98  * Wait for Arbel command completion
99  *
100  * @v arbel             Arbel device
101  * @ret rc              Return status code
102  */
103 static int arbel_cmd_wait ( struct arbel *arbel,
104                             struct arbelprm_hca_command_register *hcr ) {
105         unsigned int wait;
106
107         for ( wait = ARBEL_HCR_MAX_WAIT_MS ; wait ; wait-- ) {
108                 hcr->u.dwords[6] =
109                         readl ( arbel->config + ARBEL_HCR_REG ( 6 ) );
110                 if ( MLX_GET ( hcr, go ) == 0 )
111                         return 0;
112                 mdelay ( 1 );
113         }
114         return -EBUSY;
115 }
116
117 /**
118  * Issue HCA command
119  *
120  * @v arbel             Arbel device
121  * @v command           Command opcode, flags and input/output lengths
122  * @v op_mod            Opcode modifier (0 if no modifier applicable)
123  * @v in                Input parameters
124  * @v in_mod            Input modifier (0 if no modifier applicable)
125  * @v out               Output parameters
126  * @ret rc              Return status code
127  */
128 static int arbel_cmd ( struct arbel *arbel, unsigned long command,
129                        unsigned int op_mod, const void *in,
130                        unsigned int in_mod, void *out ) {
131         struct arbelprm_hca_command_register hcr;
132         unsigned int opcode = ARBEL_HCR_OPCODE ( command );
133         size_t in_len = ARBEL_HCR_IN_LEN ( command );
134         size_t out_len = ARBEL_HCR_OUT_LEN ( command );
135         void *in_buffer;
136         void *out_buffer;
137         unsigned int status;
138         unsigned int i;
139         int rc;
140
141         DBGC2 ( arbel, "Arbel %p command %02x in %zx%s out %zx%s\n",
142                 arbel, opcode, in_len,
143                 ( ( command & ARBEL_HCR_IN_MBOX ) ? "(mbox)" : "" ), out_len,
144                 ( ( command & ARBEL_HCR_OUT_MBOX ) ? "(mbox)" : "" ) );
145
146         /* Check that HCR is free */
147         if ( ( rc = arbel_cmd_wait ( arbel, &hcr ) ) != 0 ) {
148                 DBGC ( arbel, "Arbel %p command interface locked\n", arbel );
149                 return rc;
150         }
151
152         /* Prepare HCR */
153         memset ( &hcr, 0, sizeof ( hcr ) );
154         in_buffer = &hcr.u.dwords[0];
155         if ( in_len && ( command & ARBEL_HCR_IN_MBOX ) ) {
156                 in_buffer = arbel->mailbox_in;
157                 MLX_FILL_1 ( &hcr, 1, in_param_l, virt_to_bus ( in_buffer ) );
158         }
159         memcpy ( in_buffer, in, in_len );
160         MLX_FILL_1 ( &hcr, 2, input_modifier, in_mod );
161         out_buffer = &hcr.u.dwords[3];
162         if ( out_len && ( command & ARBEL_HCR_OUT_MBOX ) ) {
163                 out_buffer = arbel->mailbox_out;
164                 MLX_FILL_1 ( &hcr, 4, out_param_l,
165                              virt_to_bus ( out_buffer ) );
166         }
167         MLX_FILL_3 ( &hcr, 6,
168                      opcode, opcode,
169                      opcode_modifier, op_mod,
170                      go, 1 );
171         DBGC2_HD ( arbel, &hcr, sizeof ( hcr ) );
172         if ( in_len ) {
173                 DBGC2 ( arbel, "Input:\n" );
174                 DBGC2_HD ( arbel, in, ( ( in_len < 256 ) ? in_len : 256 ) );
175         }
176
177         /* Issue command */
178         for ( i = 0 ; i < ( sizeof ( hcr ) / sizeof ( hcr.u.dwords[0] ) ) ;
179               i++ ) {
180                 writel ( hcr.u.dwords[i],
181                          arbel->config + ARBEL_HCR_REG ( i ) );
182                 barrier();
183         }
184
185         /* Wait for command completion */
186         if ( ( rc = arbel_cmd_wait ( arbel, &hcr ) ) != 0 ) {
187                 DBGC ( arbel, "Arbel %p timed out waiting for command:\n",
188                        arbel );
189                 DBGC_HD ( arbel, &hcr, sizeof ( hcr ) );
190                 return rc;
191         }
192
193         /* Check command status */
194         status = MLX_GET ( &hcr, status );
195         if ( status != 0 ) {
196                 DBGC ( arbel, "Arbel %p command failed with status %02x:\n",
197                        arbel, status );
198                 DBGC_HD ( arbel, &hcr, sizeof ( hcr ) );
199                 return -EIO;
200         }
201
202         /* Read output parameters, if any */
203         hcr.u.dwords[3] = readl ( arbel->config + ARBEL_HCR_REG ( 3 ) );
204         hcr.u.dwords[4] = readl ( arbel->config + ARBEL_HCR_REG ( 4 ) );
205         memcpy ( out, out_buffer, out_len );
206         if ( out_len ) {
207                 DBGC2 ( arbel, "Output:\n" );
208                 DBGC2_HD ( arbel, out, ( ( out_len < 256 ) ? out_len : 256 ) );
209         }
210
211         return 0;
212 }
213
214 static inline int
215 arbel_cmd_query_dev_lim ( struct arbel *arbel,
216                           struct arbelprm_query_dev_lim *dev_lim ) {
217         return arbel_cmd ( arbel,
218                            ARBEL_HCR_OUT_CMD ( ARBEL_HCR_QUERY_DEV_LIM, 
219                                                1, sizeof ( *dev_lim ) ),
220                            0, NULL, 0, dev_lim );
221 }
222
223 static inline int
224 arbel_cmd_sw2hw_cq ( struct arbel *arbel, unsigned long cqn,
225                      const struct arbelprm_completion_queue_context *cqctx ) {
226         return arbel_cmd ( arbel,
227                            ARBEL_HCR_IN_CMD ( ARBEL_HCR_SW2HW_CQ,
228                                               1, sizeof ( *cqctx ) ),
229                            0, cqctx, cqn, NULL );
230 }
231
232 static inline int
233 arbel_cmd_hw2sw_cq ( struct arbel *arbel, unsigned long cqn ) {
234         return arbel_cmd ( arbel,
235                            ARBEL_HCR_VOID_CMD ( ARBEL_HCR_HW2SW_CQ ),
236                            1, NULL, cqn, NULL );
237 }
238
239 static inline int
240 arbel_cmd_rst2init_qpee ( struct arbel *arbel, unsigned long qpn,
241                           const struct arbelprm_qp_ee_state_transitions *ctx ){
242         return arbel_cmd ( arbel,
243                            ARBEL_HCR_IN_CMD ( ARBEL_HCR_RST2INIT_QPEE,
244                                               1, sizeof ( *ctx ) ),
245                            0, ctx, qpn, NULL );
246 }
247
248 static inline int
249 arbel_cmd_init2rtr_qpee ( struct arbel *arbel, unsigned long qpn,
250                           const struct arbelprm_qp_ee_state_transitions *ctx ){
251         return arbel_cmd ( arbel,
252                            ARBEL_HCR_IN_CMD ( ARBEL_HCR_INIT2RTR_QPEE,
253                                               1, sizeof ( *ctx ) ),
254                            0, ctx, qpn, NULL );
255 }
256
257 static inline int
258 arbel_cmd_rtr2rts_qpee ( struct arbel *arbel, unsigned long qpn,
259                          const struct arbelprm_qp_ee_state_transitions *ctx ) {
260         return arbel_cmd ( arbel,
261                            ARBEL_HCR_IN_CMD ( ARBEL_HCR_RTR2RTS_QPEE,
262                                               1, sizeof ( *ctx ) ),
263                            0, ctx, qpn, NULL );
264 }
265
266 static inline int
267 arbel_cmd_2rst_qpee ( struct arbel *arbel, unsigned long qpn ) {
268         return arbel_cmd ( arbel,
269                            ARBEL_HCR_VOID_CMD ( ARBEL_HCR_2RST_QPEE ),
270                            0x03, NULL, qpn, NULL );
271 }
272
273 static inline int
274 arbel_cmd_mad_ifc ( struct arbel *arbel, union arbelprm_mad *mad ) {
275         return arbel_cmd ( arbel,
276                            ARBEL_HCR_INOUT_CMD ( ARBEL_HCR_MAD_IFC,
277                                                  1, sizeof ( *mad ),
278                                                  1, sizeof ( *mad ) ),
279                            0x03, mad, PXE_IB_PORT, mad );
280 }
281
282 static inline int
283 arbel_cmd_read_mgm ( struct arbel *arbel, unsigned int index,
284                      struct arbelprm_mgm_entry *mgm ) {
285         return arbel_cmd ( arbel,
286                            ARBEL_HCR_OUT_CMD ( ARBEL_HCR_READ_MGM,
287                                                1, sizeof ( *mgm ) ),
288                            0, NULL, index, mgm );
289 }
290
291 static inline int
292 arbel_cmd_write_mgm ( struct arbel *arbel, unsigned int index,
293                       const struct arbelprm_mgm_entry *mgm ) {
294         return arbel_cmd ( arbel,
295                            ARBEL_HCR_IN_CMD ( ARBEL_HCR_WRITE_MGM,
296                                               1, sizeof ( *mgm ) ),
297                            0, mgm, index, NULL );
298 }
299
300 static inline int
301 arbel_cmd_mgid_hash ( struct arbel *arbel, const struct ib_gid *gid,
302                       struct arbelprm_mgm_hash *hash ) {
303         return arbel_cmd ( arbel,
304                            ARBEL_HCR_INOUT_CMD ( ARBEL_HCR_MGID_HASH,
305                                                  1, sizeof ( *gid ),
306                                                  0, sizeof ( *hash ) ),
307                            0, gid, 0, hash );
308 }
309
310 /***************************************************************************
311  *
312  * Completion queue operations
313  *
314  ***************************************************************************
315  */
316
317 /**
318  * Create completion queue
319  *
320  * @v ibdev             Infiniband device
321  * @v cq                Completion queue
322  * @ret rc              Return status code
323  */
324 static int arbel_create_cq ( struct ib_device *ibdev,
325                              struct ib_completion_queue *cq ) {
326         struct arbel *arbel = ibdev->dev_priv;
327         struct arbel_completion_queue *arbel_cq;
328         struct arbelprm_completion_queue_context cqctx;
329         struct arbelprm_cq_ci_db_record *ci_db_rec;
330         struct arbelprm_cq_arm_db_record *arm_db_rec;
331         int cqn_offset;
332         unsigned int i;
333         int rc;
334
335         /* Find a free completion queue number */
336         cqn_offset = arbel_alloc_qn_offset ( arbel->cq_inuse, ARBEL_MAX_CQS );
337         if ( cqn_offset < 0 ) {
338                 DBGC ( arbel, "Arbel %p out of completion queues\n", arbel );
339                 rc = cqn_offset;
340                 goto err_cqn_offset;
341         }
342         cq->cqn = ( arbel->limits.reserved_cqs + cqn_offset );
343
344         /* Allocate control structures */
345         arbel_cq = zalloc ( sizeof ( *arbel_cq ) );
346         if ( ! arbel_cq ) {
347                 rc = -ENOMEM;
348                 goto err_arbel_cq;
349         }
350         arbel_cq->ci_doorbell_idx = arbel_cq_ci_doorbell_idx ( cqn_offset );
351         arbel_cq->arm_doorbell_idx = arbel_cq_arm_doorbell_idx ( cqn_offset );
352
353         /* Allocate completion queue itself */
354         arbel_cq->cqe_size = ( cq->num_cqes * sizeof ( arbel_cq->cqe[0] ) );
355         arbel_cq->cqe = malloc_dma ( arbel_cq->cqe_size,
356                                      sizeof ( arbel_cq->cqe[0] ) );
357         if ( ! arbel_cq->cqe ) {
358                 rc = -ENOMEM;
359                 goto err_cqe;
360         }
361         memset ( arbel_cq->cqe, 0, arbel_cq->cqe_size );
362         for ( i = 0 ; i < cq->num_cqes ; i++ ) {
363                 MLX_FILL_1 ( &arbel_cq->cqe[i].normal, 7, owner, 1 );
364         }
365         barrier();
366
367         /* Initialise doorbell records */
368         ci_db_rec = &arbel->db_rec[arbel_cq->ci_doorbell_idx].cq_ci;
369         MLX_FILL_1 ( ci_db_rec, 0, counter, 0 );
370         MLX_FILL_2 ( ci_db_rec, 1,
371                      res, ARBEL_UAR_RES_CQ_CI,
372                      cq_number, cq->cqn );
373         arm_db_rec = &arbel->db_rec[arbel_cq->arm_doorbell_idx].cq_arm;
374         MLX_FILL_1 ( arm_db_rec, 0, counter, 0 );
375         MLX_FILL_2 ( arm_db_rec, 1,
376                      res, ARBEL_UAR_RES_CQ_ARM,
377                      cq_number, cq->cqn );
378
379         /* Hand queue over to hardware */
380         memset ( &cqctx, 0, sizeof ( cqctx ) );
381         MLX_FILL_1 ( &cqctx, 0, st, 0xa /* "Event fired" */ );
382         MLX_FILL_1 ( &cqctx, 2, start_address_l,
383                      virt_to_bus ( arbel_cq->cqe ) );
384         MLX_FILL_2 ( &cqctx, 3,
385                      usr_page, arbel->limits.reserved_uars,
386                      log_cq_size, fls ( cq->num_cqes - 1 ) );
387         MLX_FILL_1 ( &cqctx, 5, c_eqn, arbel->eqn );
388         MLX_FILL_1 ( &cqctx, 6, pd, ARBEL_GLOBAL_PD );
389         MLX_FILL_1 ( &cqctx, 7, l_key, arbel->reserved_lkey );
390         MLX_FILL_1 ( &cqctx, 12, cqn, cq->cqn );
391         MLX_FILL_1 ( &cqctx, 13,
392                      cq_ci_db_record, arbel_cq->ci_doorbell_idx );
393         MLX_FILL_1 ( &cqctx, 14,
394                      cq_state_db_record, arbel_cq->arm_doorbell_idx );
395         if ( ( rc = arbel_cmd_sw2hw_cq ( arbel, cq->cqn, &cqctx ) ) != 0 ) {
396                 DBGC ( arbel, "Arbel %p SW2HW_CQ failed: %s\n",
397                        arbel, strerror ( rc ) );
398                 goto err_sw2hw_cq;
399         }
400
401         cq->dev_priv = arbel_cq;
402         return 0;
403
404  err_sw2hw_cq:
405         MLX_FILL_1 ( ci_db_rec, 1, res, ARBEL_UAR_RES_NONE );
406         MLX_FILL_1 ( arm_db_rec, 1, res, ARBEL_UAR_RES_NONE );
407         free_dma ( arbel_cq->cqe, arbel_cq->cqe_size );
408  err_cqe:
409         free ( arbel_cq );
410  err_arbel_cq:
411         arbel_free_qn_offset ( arbel->cq_inuse, cqn_offset );
412  err_cqn_offset:
413         return rc;
414 }
415
416 /**
417  * Destroy completion queue
418  *
419  * @v ibdev             Infiniband device
420  * @v cq                Completion queue
421  */
422 static void arbel_destroy_cq ( struct ib_device *ibdev,
423                                struct ib_completion_queue *cq ) {
424         struct arbel *arbel = ibdev->dev_priv;
425         struct arbel_completion_queue *arbel_cq = cq->dev_priv;
426         struct arbelprm_cq_ci_db_record *ci_db_rec;
427         struct arbelprm_cq_arm_db_record *arm_db_rec;
428         int cqn_offset;
429         int rc;
430
431         /* Take ownership back from hardware */
432         if ( ( rc = arbel_cmd_hw2sw_cq ( arbel, cq->cqn ) ) != 0 ) {
433                 DBGC ( arbel, "Arbel %p FATAL HW2SW_CQ failed on CQN %#lx: "
434                        "%s\n", arbel, cq->cqn, strerror ( rc ) );
435                 /* Leak memory and return; at least we avoid corruption */
436                 return;
437         }
438
439         /* Clear doorbell records */
440         ci_db_rec = &arbel->db_rec[arbel_cq->ci_doorbell_idx].cq_ci;
441         arm_db_rec = &arbel->db_rec[arbel_cq->arm_doorbell_idx].cq_arm;
442         MLX_FILL_1 ( ci_db_rec, 1, res, ARBEL_UAR_RES_NONE );
443         MLX_FILL_1 ( arm_db_rec, 1, res, ARBEL_UAR_RES_NONE );
444
445         /* Free memory */
446         free_dma ( arbel_cq->cqe, arbel_cq->cqe_size );
447         free ( arbel_cq );
448
449         /* Mark queue number as free */
450         cqn_offset = ( cq->cqn - arbel->limits.reserved_cqs );
451         arbel_free_qn_offset ( arbel->cq_inuse, cqn_offset );
452
453         cq->dev_priv = NULL;
454 }
455
456 /***************************************************************************
457  *
458  * Queue pair operations
459  *
460  ***************************************************************************
461  */
462
463 /**
464  * Create send work queue
465  *
466  * @v arbel_send_wq     Send work queue
467  * @v num_wqes          Number of work queue entries
468  * @ret rc              Return status code
469  */
470 static int arbel_create_send_wq ( struct arbel_send_work_queue *arbel_send_wq,
471                                   unsigned int num_wqes ) {
472         struct arbelprm_ud_send_wqe *wqe;
473         struct arbelprm_ud_send_wqe *next_wqe;
474         unsigned int wqe_idx_mask;
475         unsigned int i;
476
477         /* Allocate work queue */
478         arbel_send_wq->wqe_size = ( num_wqes *
479                                     sizeof ( arbel_send_wq->wqe[0] ) );
480         arbel_send_wq->wqe = malloc_dma ( arbel_send_wq->wqe_size,
481                                           sizeof ( arbel_send_wq->wqe[0] ) );
482         if ( ! arbel_send_wq->wqe )
483                 return -ENOMEM;
484         memset ( arbel_send_wq->wqe, 0, arbel_send_wq->wqe_size );
485
486         /* Link work queue entries */
487         wqe_idx_mask = ( num_wqes - 1 );
488         for ( i = 0 ; i < num_wqes ; i++ ) {
489                 wqe = &arbel_send_wq->wqe[i].ud;
490                 next_wqe = &arbel_send_wq->wqe[ ( i + 1 ) & wqe_idx_mask ].ud;
491                 MLX_FILL_1 ( &wqe->next, 0, nda_31_6,
492                              ( virt_to_bus ( next_wqe ) >> 6 ) );
493         }
494         
495         return 0;
496 }
497
498 /**
499  * Create receive work queue
500  *
501  * @v arbel_recv_wq     Receive work queue
502  * @v num_wqes          Number of work queue entries
503  * @ret rc              Return status code
504  */
505 static int arbel_create_recv_wq ( struct arbel_recv_work_queue *arbel_recv_wq,
506                                   unsigned int num_wqes ) {
507         struct arbelprm_recv_wqe *wqe;
508         struct arbelprm_recv_wqe *next_wqe;
509         unsigned int wqe_idx_mask;
510         size_t nds;
511         unsigned int i;
512         unsigned int j;
513
514         /* Allocate work queue */
515         arbel_recv_wq->wqe_size = ( num_wqes *
516                                     sizeof ( arbel_recv_wq->wqe[0] ) );
517         arbel_recv_wq->wqe = malloc_dma ( arbel_recv_wq->wqe_size,
518                                           sizeof ( arbel_recv_wq->wqe[0] ) );
519         if ( ! arbel_recv_wq->wqe )
520                 return -ENOMEM;
521         memset ( arbel_recv_wq->wqe, 0, arbel_recv_wq->wqe_size );
522
523         /* Link work queue entries */
524         wqe_idx_mask = ( num_wqes - 1 );
525         nds = ( ( offsetof ( typeof ( *wqe ), data ) +
526                   sizeof ( wqe->data[0] ) ) >> 4 );
527         for ( i = 0 ; i < num_wqes ; i++ ) {
528                 wqe = &arbel_recv_wq->wqe[i].recv;
529                 next_wqe = &arbel_recv_wq->wqe[( i + 1 ) & wqe_idx_mask].recv;
530                 MLX_FILL_1 ( &wqe->next, 0, nda_31_6,
531                              ( virt_to_bus ( next_wqe ) >> 6 ) );
532                 MLX_FILL_1 ( &wqe->next, 1, nds, ( sizeof ( *wqe ) / 16 ) );
533                 for ( j = 0 ; ( ( ( void * ) &wqe->data[j] ) <
534                                 ( ( void * ) ( wqe + 1 ) ) ) ; j++ ) {
535                         MLX_FILL_1 ( &wqe->data[j], 1,
536                                      l_key, ARBEL_INVALID_LKEY );
537                 }
538         }
539         
540         return 0;
541 }
542
543 /**
544  * Create queue pair
545  *
546  * @v ibdev             Infiniband device
547  * @v qp                Queue pair
548  * @ret rc              Return status code
549  */
550 static int arbel_create_qp ( struct ib_device *ibdev,
551                              struct ib_queue_pair *qp ) {
552         struct arbel *arbel = ibdev->dev_priv;
553         struct arbel_queue_pair *arbel_qp;
554         struct arbelprm_qp_ee_state_transitions qpctx;
555         struct arbelprm_qp_db_record *send_db_rec;
556         struct arbelprm_qp_db_record *recv_db_rec;
557         int qpn_offset;
558         int rc;
559
560         /* Find a free queue pair number */
561         qpn_offset = arbel_alloc_qn_offset ( arbel->qp_inuse, ARBEL_MAX_QPS );
562         if ( qpn_offset < 0 ) {
563                 DBGC ( arbel, "Arbel %p out of queue pairs\n", arbel );
564                 rc = qpn_offset;
565                 goto err_qpn_offset;
566         }
567         qp->qpn = ( ARBEL_QPN_BASE + arbel->limits.reserved_qps + qpn_offset );
568
569         /* Allocate control structures */
570         arbel_qp = zalloc ( sizeof ( *arbel_qp ) );
571         if ( ! arbel_qp ) {
572                 rc = -ENOMEM;
573                 goto err_arbel_qp;
574         }
575         arbel_qp->send.doorbell_idx = arbel_send_doorbell_idx ( qpn_offset );
576         arbel_qp->recv.doorbell_idx = arbel_recv_doorbell_idx ( qpn_offset );
577
578         /* Create send and receive work queues */
579         if ( ( rc = arbel_create_send_wq ( &arbel_qp->send,
580                                            qp->send.num_wqes ) ) != 0 )
581                 goto err_create_send_wq;
582         if ( ( rc = arbel_create_recv_wq ( &arbel_qp->recv,
583                                            qp->recv.num_wqes ) ) != 0 )
584                 goto err_create_recv_wq;
585
586         /* Initialise doorbell records */
587         send_db_rec = &arbel->db_rec[arbel_qp->send.doorbell_idx].qp;
588         MLX_FILL_1 ( send_db_rec, 0, counter, 0 );
589         MLX_FILL_2 ( send_db_rec, 1,
590                      res, ARBEL_UAR_RES_SQ,
591                      qp_number, qp->qpn );
592         recv_db_rec = &arbel->db_rec[arbel_qp->recv.doorbell_idx].qp;
593         MLX_FILL_1 ( recv_db_rec, 0, counter, 0 );
594         MLX_FILL_2 ( recv_db_rec, 1,
595                      res, ARBEL_UAR_RES_RQ,
596                      qp_number, qp->qpn );
597
598         /* Hand queue over to hardware */
599         memset ( &qpctx, 0, sizeof ( qpctx ) );
600         MLX_FILL_3 ( &qpctx, 2,
601                      qpc_eec_data.de, 1,
602                      qpc_eec_data.pm_state, 0x03 /* Always 0x03 for UD */,
603                      qpc_eec_data.st, ARBEL_ST_UD );
604         MLX_FILL_6 ( &qpctx, 4,
605                      qpc_eec_data.mtu, ARBEL_MTU_2048,
606                      qpc_eec_data.msg_max, 11 /* 2^11 = 2048 */,
607                      qpc_eec_data.log_rq_size, fls ( qp->recv.num_wqes - 1 ),
608                      qpc_eec_data.log_rq_stride,
609                      ( fls ( sizeof ( arbel_qp->recv.wqe[0] ) - 1 ) - 4 ),
610                      qpc_eec_data.log_sq_size, fls ( qp->send.num_wqes - 1 ),
611                      qpc_eec_data.log_sq_stride,
612                      ( fls ( sizeof ( arbel_qp->send.wqe[0] ) - 1 ) - 4 ) );
613         MLX_FILL_1 ( &qpctx, 5,
614                      qpc_eec_data.usr_page, arbel->limits.reserved_uars );
615         MLX_FILL_1 ( &qpctx, 10, qpc_eec_data.primary_address_path.port_number,
616                      PXE_IB_PORT );
617         MLX_FILL_1 ( &qpctx, 27, qpc_eec_data.pd, ARBEL_GLOBAL_PD );
618         MLX_FILL_1 ( &qpctx, 29, qpc_eec_data.wqe_lkey, arbel->reserved_lkey );
619         MLX_FILL_1 ( &qpctx, 30, qpc_eec_data.ssc, 1 );
620         MLX_FILL_1 ( &qpctx, 33, qpc_eec_data.cqn_snd, qp->send.cq->cqn );
621         MLX_FILL_1 ( &qpctx, 34, qpc_eec_data.snd_wqe_base_adr_l,
622                      ( virt_to_bus ( arbel_qp->send.wqe ) >> 6 ) );
623         MLX_FILL_1 ( &qpctx, 35, qpc_eec_data.snd_db_record_index,
624                      arbel_qp->send.doorbell_idx );
625         MLX_FILL_1 ( &qpctx, 38, qpc_eec_data.rsc, 1 );
626         MLX_FILL_1 ( &qpctx, 41, qpc_eec_data.cqn_rcv, qp->recv.cq->cqn );
627         MLX_FILL_1 ( &qpctx, 42, qpc_eec_data.rcv_wqe_base_adr_l,
628                      ( virt_to_bus ( arbel_qp->recv.wqe ) >> 6 ) );
629         MLX_FILL_1 ( &qpctx, 43, qpc_eec_data.rcv_db_record_index,
630                      arbel_qp->recv.doorbell_idx );
631         MLX_FILL_1 ( &qpctx, 44, qpc_eec_data.q_key, qp->qkey );
632         if ( ( rc = arbel_cmd_rst2init_qpee ( arbel, qp->qpn, &qpctx )) != 0 ){
633                 DBGC ( arbel, "Arbel %p RST2INIT_QPEE failed: %s\n",
634                        arbel, strerror ( rc ) );
635                 goto err_rst2init_qpee;
636         }
637         memset ( &qpctx, 0, sizeof ( qpctx ) );
638         MLX_FILL_2 ( &qpctx, 4,
639                      qpc_eec_data.mtu, ARBEL_MTU_2048,
640                      qpc_eec_data.msg_max, 11 /* 2^11 = 2048 */ );
641         if ( ( rc = arbel_cmd_init2rtr_qpee ( arbel, qp->qpn, &qpctx )) != 0 ){
642                 DBGC ( arbel, "Arbel %p INIT2RTR_QPEE failed: %s\n",
643                        arbel, strerror ( rc ) );
644                 goto err_init2rtr_qpee;
645         }
646         memset ( &qpctx, 0, sizeof ( qpctx ) );
647         if ( ( rc = arbel_cmd_rtr2rts_qpee ( arbel, qp->qpn, &qpctx ) ) != 0 ){
648                 DBGC ( arbel, "Arbel %p RTR2RTS_QPEE failed: %s\n",
649                        arbel, strerror ( rc ) );
650                 goto err_rtr2rts_qpee;
651         }
652
653         qp->dev_priv = arbel_qp;
654         return 0;
655
656  err_rtr2rts_qpee:
657  err_init2rtr_qpee:
658         arbel_cmd_2rst_qpee ( arbel, qp->qpn );
659  err_rst2init_qpee:
660         MLX_FILL_1 ( send_db_rec, 1, res, ARBEL_UAR_RES_NONE );
661         MLX_FILL_1 ( recv_db_rec, 1, res, ARBEL_UAR_RES_NONE );
662         free_dma ( arbel_qp->recv.wqe, arbel_qp->recv.wqe_size );
663  err_create_recv_wq:
664         free_dma ( arbel_qp->send.wqe, arbel_qp->send.wqe_size );
665  err_create_send_wq:
666         free ( arbel_qp );
667  err_arbel_qp:
668         arbel_free_qn_offset ( arbel->qp_inuse, qpn_offset );
669  err_qpn_offset:
670         return rc;
671 }
672
673 /**
674  * Destroy queue pair
675  *
676  * @v ibdev             Infiniband device
677  * @v qp                Queue pair
678  */
679 static void arbel_destroy_qp ( struct ib_device *ibdev,
680                                struct ib_queue_pair *qp ) {
681         struct arbel *arbel = ibdev->dev_priv;
682         struct arbel_queue_pair *arbel_qp = qp->dev_priv;
683         struct arbelprm_qp_db_record *send_db_rec;
684         struct arbelprm_qp_db_record *recv_db_rec;
685         int qpn_offset;
686         int rc;
687
688         /* Take ownership back from hardware */
689         if ( ( rc = arbel_cmd_2rst_qpee ( arbel, qp->qpn ) ) != 0 ) {
690                 DBGC ( arbel, "Arbel %p FATAL 2RST_QPEE failed on QPN %#lx: "
691                        "%s\n", arbel, qp->qpn, strerror ( rc ) );
692                 /* Leak memory and return; at least we avoid corruption */
693                 return;
694         }
695
696         /* Clear doorbell records */
697         send_db_rec = &arbel->db_rec[arbel_qp->send.doorbell_idx].qp;
698         recv_db_rec = &arbel->db_rec[arbel_qp->recv.doorbell_idx].qp;
699         MLX_FILL_1 ( send_db_rec, 1, res, ARBEL_UAR_RES_NONE );
700         MLX_FILL_1 ( recv_db_rec, 1, res, ARBEL_UAR_RES_NONE );
701
702         /* Free memory */
703         free_dma ( arbel_qp->send.wqe, arbel_qp->send.wqe_size );
704         free_dma ( arbel_qp->recv.wqe, arbel_qp->recv.wqe_size );
705         free ( arbel_qp );
706
707         /* Mark queue number as free */
708         qpn_offset = ( qp->qpn - ARBEL_QPN_BASE - arbel->limits.reserved_qps );
709         arbel_free_qn_offset ( arbel->qp_inuse, qpn_offset );
710
711         qp->dev_priv = NULL;
712 }
713
714 /***************************************************************************
715  *
716  * Work request operations
717  *
718  ***************************************************************************
719  */
720
721 /**
722  * Ring doorbell register in UAR
723  *
724  * @v arbel             Arbel device
725  * @v db_reg            Doorbell register structure
726  * @v offset            Address of doorbell
727  */
728 static void arbel_ring_doorbell ( struct arbel *arbel,
729                                   union arbelprm_doorbell_register *db_reg,
730                                   unsigned int offset ) {
731
732         DBGC2 ( arbel, "Arbel %p ringing doorbell %08lx:%08lx at %lx\n",
733                 arbel, db_reg->dword[0], db_reg->dword[1],
734                 virt_to_phys ( arbel->uar + offset ) );
735
736         barrier();
737         writel ( db_reg->dword[0], ( arbel->uar + offset + 0 ) );
738         barrier();
739         writel ( db_reg->dword[1], ( arbel->uar + offset + 4 ) );
740 }
741
742 /** GID used for GID-less send work queue entries */
743 static const struct ib_gid arbel_no_gid = {
744         { { 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0 } }
745 };
746
747 /**
748  * Post send work queue entry
749  *
750  * @v ibdev             Infiniband device
751  * @v qp                Queue pair
752  * @v av                Address vector
753  * @v iobuf             I/O buffer
754  * @ret rc              Return status code
755  */
756 static int arbel_post_send ( struct ib_device *ibdev,
757                              struct ib_queue_pair *qp,
758                              struct ib_address_vector *av,
759                              struct io_buffer *iobuf ) {
760         struct arbel *arbel = ibdev->dev_priv;
761         struct arbel_queue_pair *arbel_qp = qp->dev_priv;
762         struct ib_work_queue *wq = &qp->send;
763         struct arbel_send_work_queue *arbel_send_wq = &arbel_qp->send;
764         struct arbelprm_ud_send_wqe *prev_wqe;
765         struct arbelprm_ud_send_wqe *wqe;
766         struct arbelprm_qp_db_record *qp_db_rec;
767         union arbelprm_doorbell_register db_reg;
768         const struct ib_gid *gid;
769         unsigned int wqe_idx_mask;
770         size_t nds;
771
772         /* Allocate work queue entry */
773         wqe_idx_mask = ( wq->num_wqes - 1 );
774         if ( wq->iobufs[wq->next_idx & wqe_idx_mask] ) {
775                 DBGC ( arbel, "Arbel %p send queue full", arbel );
776                 return -ENOBUFS;
777         }
778         wq->iobufs[wq->next_idx & wqe_idx_mask] = iobuf;
779         prev_wqe = &arbel_send_wq->wqe[(wq->next_idx - 1) & wqe_idx_mask].ud;
780         wqe = &arbel_send_wq->wqe[wq->next_idx & wqe_idx_mask].ud;
781
782         /* Construct work queue entry */
783         MLX_FILL_1 ( &wqe->next, 1, always1, 1 );
784         memset ( &wqe->ctrl, 0, sizeof ( wqe->ctrl ) );
785         MLX_FILL_1 ( &wqe->ctrl, 0, always1, 1 );
786         memset ( &wqe->ud, 0, sizeof ( wqe->ud ) );
787         MLX_FILL_2 ( &wqe->ud, 0,
788                      ud_address_vector.pd, ARBEL_GLOBAL_PD,
789                      ud_address_vector.port_number, PXE_IB_PORT );
790         MLX_FILL_2 ( &wqe->ud, 1,
791                      ud_address_vector.rlid, av->dlid,
792                      ud_address_vector.g, av->gid_present );
793         MLX_FILL_2 ( &wqe->ud, 2,
794                      ud_address_vector.max_stat_rate,
795                          ( ( av->rate >= 3 ) ? 0 : 1 ),
796                      ud_address_vector.msg, 3 );
797         MLX_FILL_1 ( &wqe->ud, 3, ud_address_vector.sl, av->sl );
798         gid = ( av->gid_present ? &av->gid : &arbel_no_gid );
799         memcpy ( &wqe->ud.u.dwords[4], gid, sizeof ( *gid ) );
800         MLX_FILL_1 ( &wqe->ud, 8, destination_qp, av->dest_qp );
801         MLX_FILL_1 ( &wqe->ud, 9, q_key, av->qkey );
802         MLX_FILL_1 ( &wqe->data[0], 0, byte_count, iob_len ( iobuf ) );
803         MLX_FILL_1 ( &wqe->data[0], 1, l_key, arbel->reserved_lkey );
804         MLX_FILL_1 ( &wqe->data[0], 3,
805                      local_address_l, virt_to_bus ( iobuf->data ) );
806
807         /* Update previous work queue entry's "next" field */
808         nds = ( ( offsetof ( typeof ( *wqe ), data ) +
809                   sizeof ( wqe->data[0] ) ) >> 4 );
810         MLX_SET ( &prev_wqe->next, nopcode, ARBEL_OPCODE_SEND );
811         MLX_FILL_3 ( &prev_wqe->next, 1,
812                      nds, nds,
813                      f, 1,
814                      always1, 1 );
815
816         /* Update doorbell record */
817         barrier();
818         qp_db_rec = &arbel->db_rec[arbel_send_wq->doorbell_idx].qp;
819         MLX_FILL_1 ( qp_db_rec, 0,
820                      counter, ( ( wq->next_idx + 1 ) & 0xffff ) );
821
822         /* Ring doorbell register */
823         MLX_FILL_4 ( &db_reg.send, 0,
824                      nopcode, ARBEL_OPCODE_SEND,
825                      f, 1,
826                      wqe_counter, ( wq->next_idx & 0xffff ),
827                      wqe_cnt, 1 );
828         MLX_FILL_2 ( &db_reg.send, 1,
829                      nds, nds,
830                      qpn, qp->qpn );
831         arbel_ring_doorbell ( arbel, &db_reg, POST_SND_OFFSET );
832
833         /* Update work queue's index */
834         wq->next_idx++;
835
836         return 0;
837 }
838
839 /**
840  * Post receive work queue entry
841  *
842  * @v ibdev             Infiniband device
843  * @v qp                Queue pair
844  * @v iobuf             I/O buffer
845  * @ret rc              Return status code
846  */
847 static int arbel_post_recv ( struct ib_device *ibdev,
848                              struct ib_queue_pair *qp,
849                              struct io_buffer *iobuf ) {
850         struct arbel *arbel = ibdev->dev_priv;
851         struct arbel_queue_pair *arbel_qp = qp->dev_priv;
852         struct ib_work_queue *wq = &qp->recv;
853         struct arbel_recv_work_queue *arbel_recv_wq = &arbel_qp->recv;
854         struct arbelprm_recv_wqe *wqe;
855         union arbelprm_doorbell_record *db_rec;
856         unsigned int wqe_idx_mask;
857
858         /* Allocate work queue entry */
859         wqe_idx_mask = ( wq->num_wqes - 1 );
860         if ( wq->iobufs[wq->next_idx & wqe_idx_mask] ) {
861                 DBGC ( arbel, "Arbel %p receive queue full", arbel );
862                 return -ENOBUFS;
863         }
864         wq->iobufs[wq->next_idx & wqe_idx_mask] = iobuf;
865         wqe = &arbel_recv_wq->wqe[wq->next_idx & wqe_idx_mask].recv;
866
867         /* Construct work queue entry */
868         MLX_FILL_1 ( &wqe->data[0], 0, byte_count, iob_tailroom ( iobuf ) );
869         MLX_FILL_1 ( &wqe->data[0], 1, l_key, arbel->reserved_lkey );
870         MLX_FILL_1 ( &wqe->data[0], 3,
871                      local_address_l, virt_to_bus ( iobuf->data ) );
872
873         /* Update doorbell record */
874         barrier();
875         db_rec = &arbel->db_rec[arbel_recv_wq->doorbell_idx];
876         MLX_FILL_1 ( &db_rec->qp, 0,
877                      counter, ( ( wq->next_idx + 1 ) & 0xffff ) );      
878
879         /* Update work queue's index */
880         wq->next_idx++;
881
882         return 0;       
883 }
884
885 /**
886  * Handle completion
887  *
888  * @v ibdev             Infiniband device
889  * @v cq                Completion queue
890  * @v cqe               Hardware completion queue entry
891  * @v complete_send     Send completion handler
892  * @v complete_recv     Receive completion handler
893  * @ret rc              Return status code
894  */
895 static int arbel_complete ( struct ib_device *ibdev,
896                             struct ib_completion_queue *cq,
897                             union arbelprm_completion_entry *cqe,
898                             ib_completer_t complete_send,
899                             ib_completer_t complete_recv ) {
900         struct arbel *arbel = ibdev->dev_priv;
901         struct ib_completion completion;
902         struct ib_work_queue *wq;
903         struct ib_queue_pair *qp;
904         struct arbel_queue_pair *arbel_qp;
905         struct arbel_send_work_queue *arbel_send_wq;
906         struct arbel_recv_work_queue *arbel_recv_wq;
907         struct io_buffer *iobuf;
908         ib_completer_t complete;
909         unsigned int opcode;
910         unsigned long qpn;
911         int is_send;
912         unsigned long wqe_adr;
913         unsigned int wqe_idx;
914         int rc = 0;
915
916         /* Parse completion */
917         memset ( &completion, 0, sizeof ( completion ) );
918         completion.len = MLX_GET ( &cqe->normal, byte_cnt );
919         qpn = MLX_GET ( &cqe->normal, my_qpn );
920         is_send = MLX_GET ( &cqe->normal, s );
921         wqe_adr = ( MLX_GET ( &cqe->normal, wqe_adr ) << 6 );
922         opcode = MLX_GET ( &cqe->normal, opcode );
923         if ( opcode >= ARBEL_OPCODE_RECV_ERROR ) {
924                 /* "s" field is not valid for error opcodes */
925                 is_send = ( opcode == ARBEL_OPCODE_SEND_ERROR );
926                 completion.syndrome = MLX_GET ( &cqe->error, syndrome );
927                 DBGC ( arbel, "Arbel %p CPN %lx syndrome %x vendor %lx\n",
928                        arbel, cq->cqn, completion.syndrome,
929                        MLX_GET ( &cqe->error, vendor_code ) );
930                 rc = -EIO;
931                 /* Don't return immediately; propagate error to completer */
932         }
933
934         /* Identify work queue */
935         wq = ib_find_wq ( cq, qpn, is_send );
936         if ( ! wq ) {
937                 DBGC ( arbel, "Arbel %p CQN %lx unknown %s QPN %lx\n",
938                        arbel, cq->cqn, ( is_send ? "send" : "recv" ), qpn );
939                 return -EIO;
940         }
941         qp = wq->qp;
942         arbel_qp = qp->dev_priv;
943
944         /* Identify work queue entry index */
945         if ( is_send ) {
946                 arbel_send_wq = &arbel_qp->send;
947                 wqe_idx = ( ( wqe_adr - virt_to_bus ( arbel_send_wq->wqe ) ) /
948                             sizeof ( arbel_send_wq->wqe[0] ) );
949         } else {
950                 arbel_recv_wq = &arbel_qp->recv;
951                 wqe_idx = ( ( wqe_adr - virt_to_bus ( arbel_recv_wq->wqe ) ) /
952                             sizeof ( arbel_recv_wq->wqe[0] ) );
953         }
954
955         /* Identify I/O buffer */
956         iobuf = wq->iobufs[wqe_idx];
957         if ( ! iobuf ) {
958                 DBGC ( arbel, "Arbel %p CQN %lx QPN %lx empty WQE %x\n",
959                        arbel, cq->cqn, qpn, wqe_idx );
960                 return -EIO;
961         }
962         wq->iobufs[wqe_idx] = NULL;
963
964         /* Pass off to caller's completion handler */
965         complete = ( is_send ? complete_send : complete_recv );
966         complete ( ibdev, qp, &completion, iobuf );
967
968         return rc;
969 }                            
970
971 /**
972  * Drain event queue
973  *
974  * @v arbel             Arbel device
975  */
976 static void arbel_drain_eq ( struct arbel *arbel ) {
977 #warning "drain the event queue"
978 }
979
980 /**
981  * Poll completion queue
982  *
983  * @v ibdev             Infiniband device
984  * @v cq                Completion queue
985  * @v complete_send     Send completion handler
986  * @v complete_recv     Receive completion handler
987  */
988 static void arbel_poll_cq ( struct ib_device *ibdev,
989                             struct ib_completion_queue *cq,
990                             ib_completer_t complete_send,
991                             ib_completer_t complete_recv ) {
992         struct arbel *arbel = ibdev->dev_priv;
993         struct arbel_completion_queue *arbel_cq = cq->dev_priv;
994         struct arbelprm_cq_ci_db_record *ci_db_rec;
995         union arbelprm_completion_entry *cqe;
996         unsigned int cqe_idx_mask;
997         int rc;
998
999         /* Drain the event queue */
1000         arbel_drain_eq ( arbel );
1001
1002         while ( 1 ) {
1003                 /* Look for completion entry */
1004                 cqe_idx_mask = ( cq->num_cqes - 1 );
1005                 cqe = &arbel_cq->cqe[cq->next_idx & cqe_idx_mask];
1006                 if ( MLX_GET ( &cqe->normal, owner ) != 0 ) {
1007                         /* Entry still owned by hardware; end of poll */
1008                         break;
1009                 }
1010
1011                 /* Handle completion */
1012                 if ( ( rc = arbel_complete ( ibdev, cq, cqe, complete_send,
1013                                              complete_recv ) ) != 0 ) {
1014                         DBGC ( arbel, "Arbel %p failed to complete: %s\n",
1015                                arbel, strerror ( rc ) );
1016                         DBGC_HD ( arbel, cqe, sizeof ( *cqe ) );
1017                 }
1018
1019                 /* Return ownership to hardware */
1020                 MLX_FILL_1 ( &cqe->normal, 7, owner, 1 );
1021                 barrier();
1022                 /* Update completion queue's index */
1023                 cq->next_idx++;
1024                 /* Update doorbell record */
1025                 ci_db_rec = &arbel->db_rec[arbel_cq->ci_doorbell_idx].cq_ci;
1026                 MLX_FILL_1 ( ci_db_rec, 0,
1027                              counter, ( cq->next_idx & 0xffffffffUL ) );
1028         }
1029 }
1030
1031 /***************************************************************************
1032  *
1033  * Multicast group operations
1034  *
1035  ***************************************************************************
1036  */
1037
1038 /**
1039  * Attach to multicast group
1040  *
1041  * @v ibdev             Infiniband device
1042  * @v qp                Queue pair
1043  * @v gid               Multicast GID
1044  * @ret rc              Return status code
1045  */
1046 static int arbel_mcast_attach ( struct ib_device *ibdev,
1047                                 struct ib_queue_pair *qp,
1048                                 struct ib_gid *gid ) {
1049         struct arbel *arbel = ibdev->dev_priv;
1050         struct arbelprm_mgm_hash hash;
1051         struct arbelprm_mgm_entry mgm;
1052         unsigned int index;
1053         int rc;
1054
1055         /* Generate hash table index */
1056         if ( ( rc = arbel_cmd_mgid_hash ( arbel, gid, &hash ) ) != 0 ) {
1057                 DBGC ( arbel, "Arbel %p could not hash GID: %s\n",
1058                        arbel, strerror ( rc ) );
1059                 return rc;
1060         }
1061         index = MLX_GET ( &hash, hash );
1062
1063         /* Check for existing hash table entry */
1064         if ( ( rc = arbel_cmd_read_mgm ( arbel, index, &mgm ) ) != 0 ) {
1065                 DBGC ( arbel, "Arbel %p could not read MGM %#x: %s\n",
1066                        arbel, index, strerror ( rc ) );
1067                 return rc;
1068         }
1069         if ( MLX_GET ( &mgm, mgmqp_0.qi ) != 0 ) {
1070                 /* FIXME: this implementation allows only a single QP
1071                  * per multicast group, and doesn't handle hash
1072                  * collisions.  Sufficient for IPoIB but may need to
1073                  * be extended in future.
1074                  */
1075                 DBGC ( arbel, "Arbel %p MGID index %#x already in use\n",
1076                        arbel, index );
1077                 return -EBUSY;
1078         }
1079
1080         /* Update hash table entry */
1081         MLX_FILL_2 ( &mgm, 8,
1082                      mgmqp_0.qpn_i, qp->qpn,
1083                      mgmqp_0.qi, 1 );
1084         memcpy ( &mgm.u.dwords[4], gid, sizeof ( *gid ) );
1085         if ( ( rc = arbel_cmd_write_mgm ( arbel, index, &mgm ) ) != 0 ) {
1086                 DBGC ( arbel, "Arbel %p could not write MGM %#x: %s\n",
1087                        arbel, index, strerror ( rc ) );
1088                 return rc;
1089         }
1090
1091         return 0;
1092 }
1093
1094 /**
1095  * Detach from multicast group
1096  *
1097  * @v ibdev             Infiniband device
1098  * @v qp                Queue pair
1099  * @v gid               Multicast GID
1100  */
1101 static void arbel_mcast_detach ( struct ib_device *ibdev,
1102                                  struct ib_queue_pair *qp __unused,
1103                                  struct ib_gid *gid ) {
1104         struct arbel *arbel = ibdev->dev_priv;
1105         struct arbelprm_mgm_hash hash;
1106         struct arbelprm_mgm_entry mgm;
1107         unsigned int index;
1108         int rc;
1109
1110         /* Generate hash table index */
1111         if ( ( rc = arbel_cmd_mgid_hash ( arbel, gid, &hash ) ) != 0 ) {
1112                 DBGC ( arbel, "Arbel %p could not hash GID: %s\n",
1113                        arbel, strerror ( rc ) );
1114                 return;
1115         }
1116         index = MLX_GET ( &hash, hash );
1117
1118         /* Clear hash table entry */
1119         memset ( &mgm, 0, sizeof ( mgm ) );
1120         if ( ( rc = arbel_cmd_write_mgm ( arbel, index, &mgm ) ) != 0 ) {
1121                 DBGC ( arbel, "Arbel %p could not write MGM %#x: %s\n",
1122                        arbel, index, strerror ( rc ) );
1123                 return;
1124         }
1125 }
1126
1127 /** Arbel Infiniband operations */
1128 static struct ib_device_operations arbel_ib_operations = {
1129         .create_cq      = arbel_create_cq,
1130         .destroy_cq     = arbel_destroy_cq,
1131         .create_qp      = arbel_create_qp,
1132         .destroy_qp     = arbel_destroy_qp,
1133         .post_send      = arbel_post_send,
1134         .post_recv      = arbel_post_recv,
1135         .poll_cq        = arbel_poll_cq,
1136         .mcast_attach   = arbel_mcast_attach,
1137         .mcast_detach   = arbel_mcast_detach,
1138 };
1139
1140
1141 static int arbel_mad_ifc ( struct arbel *arbel,
1142                            union arbelprm_mad *mad ) {
1143         struct ib_mad_hdr *hdr = &mad->mad.mad_hdr;
1144         int rc;
1145
1146         hdr->base_version = IB_MGMT_BASE_VERSION;
1147         if ( ( rc = arbel_cmd_mad_ifc ( arbel, mad ) ) != 0 ) {
1148                 DBGC ( arbel, "Arbel %p could not issue MAD IFC: %s\n",
1149                        arbel, strerror ( rc ) );
1150                 return rc;
1151         }
1152         if ( hdr->status != 0 ) {
1153                 DBGC ( arbel, "Arbel %p MAD IFC status %04x\n",
1154                        arbel, ntohs ( hdr->status ) );
1155                 return -EIO;
1156         }
1157         return 0;
1158 }
1159
1160 static int arbel_get_port_info ( struct arbel *arbel,
1161                                  struct ib_mad_port_info *port_info ) {
1162         union arbelprm_mad mad;
1163         struct ib_mad_hdr *hdr = &mad.mad.mad_hdr;
1164         int rc;
1165
1166         memset ( &mad, 0, sizeof ( mad ) );
1167         hdr->mgmt_class = IB_MGMT_CLASS_SUBN_LID_ROUTED;
1168         hdr->class_version = 1;
1169         hdr->method = IB_MGMT_METHOD_GET;
1170         hdr->attr_id = htons ( IB_SMP_ATTR_PORT_INFO );
1171         hdr->attr_mod = htonl ( PXE_IB_PORT );
1172         if ( ( rc = arbel_mad_ifc ( arbel, &mad ) ) != 0 ) {
1173                 DBGC ( arbel, "Arbel %p could not get port info: %s\n",
1174                        arbel, strerror ( rc ) );
1175                 return rc;
1176         }
1177         memcpy ( port_info, &mad.mad.port_info, sizeof ( *port_info ) );
1178         return 0;
1179 }
1180
1181 static int arbel_get_guid_info ( struct arbel *arbel,
1182                                  struct ib_mad_guid_info *guid_info ) {
1183         union arbelprm_mad mad;
1184         struct ib_mad_hdr *hdr = &mad.mad.mad_hdr;
1185         int rc;
1186
1187         memset ( &mad, 0, sizeof ( mad ) );
1188         hdr->mgmt_class = IB_MGMT_CLASS_SUBN_LID_ROUTED;
1189         hdr->class_version = 1;
1190         hdr->method = IB_MGMT_METHOD_GET;
1191         hdr->attr_id = htons ( IB_SMP_ATTR_GUID_INFO );
1192         if ( ( rc = arbel_mad_ifc ( arbel, &mad ) ) != 0 ) {
1193                 DBGC ( arbel, "Arbel %p could not get GUID info: %s\n",
1194                        arbel, strerror ( rc ) );
1195                 return rc;
1196         }
1197         memcpy ( guid_info, &mad.mad.guid_info, sizeof ( *guid_info ) );
1198         return 0;
1199 }
1200
1201 static int arbel_get_pkey_table ( struct arbel *arbel,
1202                                   struct ib_mad_pkey_table *pkey_table ) {
1203         union arbelprm_mad mad;
1204         struct ib_mad_hdr *hdr = &mad.mad.mad_hdr;
1205         int rc;
1206
1207         memset ( &mad, 0, sizeof ( mad ) );
1208         hdr->mgmt_class = IB_MGMT_CLASS_SUBN_LID_ROUTED;
1209         hdr->class_version = 1;
1210         hdr->method = IB_MGMT_METHOD_GET;
1211         hdr->attr_id = htons ( IB_SMP_ATTR_PKEY_TABLE );
1212         if ( ( rc = arbel_mad_ifc ( arbel, &mad ) ) != 0 ) {
1213                 DBGC ( arbel, "Arbel %p could not get pkey table: %s\n",
1214                        arbel, strerror ( rc ) );
1215                 return rc;
1216         }
1217         memcpy ( pkey_table, &mad.mad.pkey_table, sizeof ( *pkey_table ) );
1218         return 0;
1219 }
1220
1221 static int arbel_get_port_gid ( struct arbel *arbel,
1222                                 struct ib_gid *port_gid ) {
1223         union {
1224                 /* This union exists just to save stack space */
1225                 struct ib_mad_port_info port_info;
1226                 struct ib_mad_guid_info guid_info;
1227         } u;
1228         int rc;
1229
1230         /* Port info gives us the first half of the port GID */
1231         if ( ( rc = arbel_get_port_info ( arbel, &u.port_info ) ) != 0 )
1232                 return rc;
1233         memcpy ( &port_gid->u.bytes[0], u.port_info.gid_prefix, 8 );
1234         
1235         /* GUID info gives us the second half of the port GID */
1236         if ( ( rc = arbel_get_guid_info ( arbel, &u.guid_info ) ) != 0 )
1237                 return rc;
1238         memcpy ( &port_gid->u.bytes[8], u.guid_info.gid_local, 8 );
1239
1240         return 0;
1241 }
1242
1243 static int arbel_get_sm_lid ( struct arbel *arbel,
1244                               unsigned long *sm_lid ) {
1245         struct ib_mad_port_info port_info;
1246         int rc;
1247
1248         if ( ( rc = arbel_get_port_info ( arbel, &port_info ) ) != 0 )
1249                 return rc;
1250         *sm_lid = ntohs ( port_info.mastersm_lid );
1251         return 0;
1252 }
1253
1254 static int arbel_get_broadcast_gid ( struct arbel *arbel,
1255                                      struct ib_gid *broadcast_gid ) {
1256         static const struct ib_gid ipv4_broadcast_gid = {
1257                 { { 0xff, 0x12, 0x40, 0x1b, 0x00, 0x00, 0x00, 0x00,
1258                     0x00, 0x00, 0x00, 0x00, 0xff, 0xff, 0xff, 0xff } }
1259         };
1260         struct ib_mad_pkey_table pkey_table;
1261         int rc;
1262
1263         /* Start with the IPv4 broadcast GID */
1264         memcpy ( broadcast_gid, &ipv4_broadcast_gid,
1265                  sizeof ( *broadcast_gid ) );
1266
1267         /* Add partition key */
1268         if ( ( rc = arbel_get_pkey_table ( arbel, &pkey_table ) ) != 0 )
1269                 return rc;
1270         memcpy ( &broadcast_gid->u.bytes[4], &pkey_table.pkey[0][0],
1271                  sizeof ( pkey_table.pkey[0][0] ) );
1272
1273         return 0;
1274 }
1275
1276 /**
1277  * Probe PCI device
1278  *
1279  * @v pci               PCI device
1280  * @v id                PCI ID
1281  * @ret rc              Return status code
1282  */
1283 static int arbel_probe ( struct pci_device *pci,
1284                          const struct pci_device_id *id __unused ) {
1285         struct ib_device *ibdev;
1286         struct arbelprm_query_dev_lim dev_lim;
1287         struct arbel *arbel;
1288         udqp_t qph;
1289         int rc;
1290
1291         /* Allocate Infiniband device */
1292         ibdev = alloc_ibdev ( sizeof ( *arbel ) );
1293         if ( ! ibdev )
1294                 return -ENOMEM;
1295         ibdev->op = &arbel_ib_operations;
1296         pci_set_drvdata ( pci, ibdev );
1297         ibdev->dev = &pci->dev;
1298         arbel = ibdev->dev_priv;
1299         memset ( arbel, 0, sizeof ( *arbel ) );
1300
1301         /* Fix up PCI device */
1302         adjust_pci_device ( pci );
1303
1304         /* Initialise hardware */
1305         if ( ( rc = ib_driver_init ( pci, &qph ) ) != 0 )
1306                 goto err_ib_driver_init;
1307
1308         /* Hack up IB structures */
1309         arbel->config = memfree_pci_dev.cr_space;
1310         arbel->mailbox_in = dev_buffers_p->inprm_buf;
1311         arbel->mailbox_out = dev_buffers_p->outprm_buf;
1312         arbel->uar = memfree_pci_dev.uar;
1313         arbel->db_rec = dev_ib_data.uar_context_base;
1314         arbel->reserved_lkey = dev_ib_data.mkey;
1315         arbel->eqn = dev_ib_data.eq.eqn;
1316
1317         /* Get device limits */
1318         if ( ( rc = arbel_cmd_query_dev_lim ( arbel, &dev_lim ) ) != 0 ) {
1319                 DBGC ( arbel, "Arbel %p could not get device limits: %s\n",
1320                        arbel, strerror ( rc ) );
1321                 goto err_query_dev_lim;
1322         }
1323         arbel->limits.reserved_uars = MLX_GET ( &dev_lim, num_rsvd_uars );
1324         arbel->limits.reserved_cqs =
1325                 ( 1 << MLX_GET ( &dev_lim, log2_rsvd_cqs ) );
1326         arbel->limits.reserved_qps =
1327                 ( 1 << MLX_GET ( &dev_lim, log2_rsvd_qps ) );
1328
1329         /* Get subnet manager LID */
1330         if ( ( rc = arbel_get_sm_lid ( arbel, &ibdev->sm_lid ) ) != 0 ) {
1331                 DBGC ( arbel, "Arbel %p could not determine subnet manager "
1332                        "LID: %s\n", arbel, strerror ( rc ) );
1333                 goto err_get_sm_lid;
1334         }
1335
1336         /* Get port GID */
1337         if ( ( rc = arbel_get_port_gid ( arbel, &ibdev->port_gid ) ) != 0 ) {
1338                 DBGC ( arbel, "Arbel %p could not determine port GID: %s\n",
1339                        arbel, strerror ( rc ) );
1340                 goto err_get_port_gid;
1341         }
1342
1343         /* Get broadcast GID */
1344         if ( ( rc = arbel_get_broadcast_gid ( arbel,
1345                                               &ibdev->broadcast_gid ) ) != 0 ){
1346                 DBGC ( arbel, "Arbel %p could not determine broadcast GID: "
1347                        "%s\n", arbel, strerror ( rc ) );
1348                 goto err_get_broadcast_gid;
1349         }
1350
1351         struct ud_av_st *bcast_av = ib_data.bcast_av;
1352         struct arbelprm_ud_address_vector *bav =
1353                 ( struct arbelprm_ud_address_vector * ) &bcast_av->av;
1354         struct ib_address_vector *av = &hack_ipoib_bcast_av;
1355         av->dest_qp = bcast_av->dest_qp;
1356         av->qkey = bcast_av->qkey;
1357         av->dlid = MLX_GET ( bav, rlid );
1358         av->rate = ( MLX_GET ( bav, max_stat_rate ) ? 1 : 4 );
1359         av->sl = MLX_GET ( bav, sl );
1360         av->gid_present = 1;
1361         memcpy ( &av->gid, ( ( void * ) bav ) + 16, 16 );
1362
1363         /* Add IPoIB device */
1364         if ( ( rc = ipoib_probe ( ibdev ) ) != 0 ) {
1365                 DBGC ( arbel, "Arbel %p could not add IPoIB device: %s\n",
1366                        arbel, strerror ( rc ) );
1367                 goto err_ipoib_probe;
1368         }
1369
1370         return 0;
1371
1372  err_ipoib_probe:
1373  err_get_broadcast_gid:
1374  err_get_port_gid:
1375  err_get_sm_lid:
1376  err_query_dev_lim:
1377         ib_driver_close ( 0 );
1378  err_ib_driver_init:
1379         free_ibdev ( ibdev );
1380         return rc;
1381 }
1382
1383 /**
1384  * Remove PCI device
1385  *
1386  * @v pci               PCI device
1387  */
1388 static void arbel_remove ( struct pci_device *pci ) {
1389         struct ib_device *ibdev = pci_get_drvdata ( pci );
1390
1391         ipoib_remove ( ibdev );
1392         ib_driver_close ( 0 );
1393 }
1394
1395 static struct pci_device_id arbel_nics[] = {
1396         PCI_ROM ( 0x15b3, 0x6282, "MT25218", "MT25218 HCA driver" ),
1397         PCI_ROM ( 0x15b3, 0x6274, "MT25204", "MT25204 HCA driver" ),
1398 };
1399
1400 struct pci_driver arbel_driver __pci_driver = {
1401         .ids = arbel_nics,
1402         .id_count = ( sizeof ( arbel_nics ) / sizeof ( arbel_nics[0] ) ),
1403         .probe = arbel_probe,
1404         .remove = arbel_remove,
1405 };