f4e228e200f9e495988a062f47498913c3dcda24
[people/peper/gpxe.git] / src / drivers / infiniband / hermon.c
1 /*
2  * Copyright (C) 2008 Michael Brown <mbrown@fensystems.co.uk>.
3  * Copyright (C) 2008 Mellanox Technologies Ltd.
4  *
5  * This program is free software; you can redistribute it and/or
6  * modify it under the terms of the GNU General Public License as
7  * published by the Free Software Foundation; either version 2 of the
8  * License, or any later version.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License for more details.
14  *
15  * You should have received a copy of the GNU General Public License
16  * along with this program; if not, write to the Free Software
17  * Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
18  */
19
20 FILE_LICENCE ( GPL2_OR_LATER );
21
22 #include <stdint.h>
23 #include <stdlib.h>
24 #include <stdio.h>
25 #include <string.h>
26 #include <strings.h>
27 #include <unistd.h>
28 #include <errno.h>
29 #include <byteswap.h>
30 #include <gpxe/io.h>
31 #include <gpxe/pci.h>
32 #include <gpxe/malloc.h>
33 #include <gpxe/umalloc.h>
34 #include <gpxe/iobuf.h>
35 #include <gpxe/netdevice.h>
36 #include <gpxe/infiniband.h>
37 #include <gpxe/ib_smc.h>
38 #include "hermon.h"
39
40 /**
41  * @file
42  *
43  * Mellanox Hermon Infiniband HCA
44  *
45  */
46
47 /***************************************************************************
48  *
49  * Queue number allocation
50  *
51  ***************************************************************************
52  */
53
54 /**
55  * Allocate offsets within usage bitmask
56  *
57  * @v bits              Usage bitmask
58  * @v bits_len          Length of usage bitmask
59  * @v num_bits          Number of contiguous bits to allocate within bitmask
60  * @ret bit             First free bit within bitmask, or negative error
61  */
62 static int hermon_bitmask_alloc ( hermon_bitmask_t *bits,
63                                   unsigned int bits_len,
64                                   unsigned int num_bits ) {
65         unsigned int bit = 0;
66         hermon_bitmask_t mask = 1;
67         unsigned int found = 0;
68
69         /* Search bits for num_bits contiguous free bits */
70         while ( bit < bits_len ) {
71                 if ( ( mask & *bits ) == 0 ) {
72                         if ( ++found == num_bits )
73                                 goto found;
74                 } else {
75                         found = 0;
76                 }
77                 bit++;
78                 mask = ( mask << 1 ) | ( mask >> ( 8 * sizeof ( mask ) - 1 ) );
79                 if ( mask == 1 )
80                         bits++;
81         }
82         return -ENFILE;
83
84  found:
85         /* Mark bits as in-use */
86         do {
87                 *bits |= mask;
88                 if ( mask == 1 )
89                         bits--;
90                 mask = ( mask >> 1 ) | ( mask << ( 8 * sizeof ( mask ) - 1 ) );
91         } while ( --found );
92
93         return ( bit - num_bits + 1 );
94 }
95
96 /**
97  * Free offsets within usage bitmask
98  *
99  * @v bits              Usage bitmask
100  * @v bit               Starting bit within bitmask
101  * @v num_bits          Number of contiguous bits to free within bitmask
102  */
103 static void hermon_bitmask_free ( hermon_bitmask_t *bits,
104                                   int bit, unsigned int num_bits ) {
105         hermon_bitmask_t mask;
106
107         for ( ; num_bits ; bit++, num_bits-- ) {
108                 mask = ( 1 << ( bit % ( 8 * sizeof ( mask ) ) ) );
109                 bits[ ( bit / ( 8 * sizeof ( mask ) ) ) ] &= ~mask;
110         }
111 }
112
113 /***************************************************************************
114  *
115  * HCA commands
116  *
117  ***************************************************************************
118  */
119
120 /**
121  * Wait for Hermon command completion
122  *
123  * @v hermon            Hermon device
124  * @v hcr               HCA command registers
125  * @ret rc              Return status code
126  */
127 static int hermon_cmd_wait ( struct hermon *hermon,
128                              struct hermonprm_hca_command_register *hcr ) {
129         unsigned int wait;
130
131         for ( wait = HERMON_HCR_MAX_WAIT_MS ; wait ; wait-- ) {
132                 hcr->u.dwords[6] =
133                         readl ( hermon->config + HERMON_HCR_REG ( 6 ) );
134                 if ( ( MLX_GET ( hcr, go ) == 0 ) &&
135                      ( MLX_GET ( hcr, t ) == hermon->toggle ) )
136                         return 0;
137                 mdelay ( 1 );
138         }
139         return -EBUSY;
140 }
141
142 /**
143  * Issue HCA command
144  *
145  * @v hermon            Hermon device
146  * @v command           Command opcode, flags and input/output lengths
147  * @v op_mod            Opcode modifier (0 if no modifier applicable)
148  * @v in                Input parameters
149  * @v in_mod            Input modifier (0 if no modifier applicable)
150  * @v out               Output parameters
151  * @ret rc              Return status code
152  */
153 static int hermon_cmd ( struct hermon *hermon, unsigned long command,
154                         unsigned int op_mod, const void *in,
155                         unsigned int in_mod, void *out ) {
156         struct hermonprm_hca_command_register hcr;
157         unsigned int opcode = HERMON_HCR_OPCODE ( command );
158         size_t in_len = HERMON_HCR_IN_LEN ( command );
159         size_t out_len = HERMON_HCR_OUT_LEN ( command );
160         void *in_buffer;
161         void *out_buffer;
162         unsigned int status;
163         unsigned int i;
164         int rc;
165
166         assert ( in_len <= HERMON_MBOX_SIZE );
167         assert ( out_len <= HERMON_MBOX_SIZE );
168
169         DBGC2 ( hermon, "Hermon %p command %02x in %zx%s out %zx%s\n",
170                 hermon, opcode, in_len,
171                 ( ( command & HERMON_HCR_IN_MBOX ) ? "(mbox)" : "" ), out_len,
172                 ( ( command & HERMON_HCR_OUT_MBOX ) ? "(mbox)" : "" ) );
173
174         /* Check that HCR is free */
175         if ( ( rc = hermon_cmd_wait ( hermon, &hcr ) ) != 0 ) {
176                 DBGC ( hermon, "Hermon %p command interface locked\n",
177                        hermon );
178                 return rc;
179         }
180
181         /* Flip HCR toggle */
182         hermon->toggle = ( 1 - hermon->toggle );
183
184         /* Prepare HCR */
185         memset ( &hcr, 0, sizeof ( hcr ) );
186         in_buffer = &hcr.u.dwords[0];
187         if ( in_len && ( command & HERMON_HCR_IN_MBOX ) ) {
188                 in_buffer = hermon->mailbox_in;
189                 MLX_FILL_1 ( &hcr, 1, in_param_l, virt_to_bus ( in_buffer ) );
190         }
191         memcpy ( in_buffer, in, in_len );
192         MLX_FILL_1 ( &hcr, 2, input_modifier, in_mod );
193         out_buffer = &hcr.u.dwords[3];
194         if ( out_len && ( command & HERMON_HCR_OUT_MBOX ) ) {
195                 out_buffer = hermon->mailbox_out;
196                 MLX_FILL_1 ( &hcr, 4, out_param_l,
197                              virt_to_bus ( out_buffer ) );
198         }
199         MLX_FILL_4 ( &hcr, 6,
200                      opcode, opcode,
201                      opcode_modifier, op_mod,
202                      go, 1,
203                      t, hermon->toggle );
204         DBGC ( hermon, "Hermon %p issuing command %04x\n",
205                hermon, opcode );
206         DBGC2_HDA ( hermon, virt_to_phys ( hermon->config + HERMON_HCR_BASE ),
207                     &hcr, sizeof ( hcr ) );
208         if ( in_len && ( command & HERMON_HCR_IN_MBOX ) ) {
209                 DBGC2 ( hermon, "Input mailbox:\n" );
210                 DBGC2_HDA ( hermon, virt_to_phys ( in_buffer ), in_buffer,
211                             ( ( in_len < 512 ) ? in_len : 512 ) );
212         }
213
214         /* Issue command */
215         for ( i = 0 ; i < ( sizeof ( hcr ) / sizeof ( hcr.u.dwords[0] ) ) ;
216               i++ ) {
217                 writel ( hcr.u.dwords[i],
218                          hermon->config + HERMON_HCR_REG ( i ) );
219                 barrier();
220         }
221
222         /* Wait for command completion */
223         if ( ( rc = hermon_cmd_wait ( hermon, &hcr ) ) != 0 ) {
224                 DBGC ( hermon, "Hermon %p timed out waiting for command:\n",
225                        hermon );
226                 DBGC_HDA ( hermon,
227                            virt_to_phys ( hermon->config + HERMON_HCR_BASE ),
228                            &hcr, sizeof ( hcr ) );
229                 return rc;
230         }
231
232         /* Check command status */
233         status = MLX_GET ( &hcr, status );
234         if ( status != 0 ) {
235                 DBGC ( hermon, "Hermon %p command failed with status %02x:\n",
236                        hermon, status );
237                 DBGC_HDA ( hermon,
238                            virt_to_phys ( hermon->config + HERMON_HCR_BASE ),
239                            &hcr, sizeof ( hcr ) );
240                 return -EIO;
241         }
242
243         /* Read output parameters, if any */
244         hcr.u.dwords[3] = readl ( hermon->config + HERMON_HCR_REG ( 3 ) );
245         hcr.u.dwords[4] = readl ( hermon->config + HERMON_HCR_REG ( 4 ) );
246         memcpy ( out, out_buffer, out_len );
247         if ( out_len ) {
248                 DBGC2 ( hermon, "Output%s:\n",
249                         ( command & HERMON_HCR_OUT_MBOX ) ? " mailbox" : "" );
250                 DBGC2_HDA ( hermon, virt_to_phys ( out_buffer ), out_buffer,
251                             ( ( out_len < 512 ) ? out_len : 512 ) );
252         }
253
254         return 0;
255 }
256
257 static inline int
258 hermon_cmd_query_dev_cap ( struct hermon *hermon,
259                            struct hermonprm_query_dev_cap *dev_cap ) {
260         return hermon_cmd ( hermon,
261                             HERMON_HCR_OUT_CMD ( HERMON_HCR_QUERY_DEV_CAP,
262                                                  1, sizeof ( *dev_cap ) ),
263                             0, NULL, 0, dev_cap );
264 }
265
266 static inline int
267 hermon_cmd_query_fw ( struct hermon *hermon, struct hermonprm_query_fw *fw ) {
268         return hermon_cmd ( hermon,
269                             HERMON_HCR_OUT_CMD ( HERMON_HCR_QUERY_FW,
270                                                  1, sizeof ( *fw ) ),
271                             0, NULL, 0, fw );
272 }
273
274 static inline int
275 hermon_cmd_init_hca ( struct hermon *hermon,
276                       const struct hermonprm_init_hca *init_hca ) {
277         return hermon_cmd ( hermon,
278                             HERMON_HCR_IN_CMD ( HERMON_HCR_INIT_HCA,
279                                                 1, sizeof ( *init_hca ) ),
280                             0, init_hca, 0, NULL );
281 }
282
283 static inline int
284 hermon_cmd_close_hca ( struct hermon *hermon ) {
285         return hermon_cmd ( hermon,
286                             HERMON_HCR_VOID_CMD ( HERMON_HCR_CLOSE_HCA ),
287                             0, NULL, 0, NULL );
288 }
289
290 static inline int
291 hermon_cmd_init_port ( struct hermon *hermon, unsigned int port,
292                        const struct hermonprm_init_port *init_port ) {
293         return hermon_cmd ( hermon,
294                             HERMON_HCR_IN_CMD ( HERMON_HCR_INIT_PORT,
295                                                 1, sizeof ( *init_port ) ),
296                             0, init_port, port, NULL );
297 }
298
299 static inline int
300 hermon_cmd_close_port ( struct hermon *hermon, unsigned int port ) {
301         return hermon_cmd ( hermon,
302                             HERMON_HCR_VOID_CMD ( HERMON_HCR_CLOSE_PORT ),
303                             0, NULL, port, NULL );
304 }
305
306 static inline int
307 hermon_cmd_sw2hw_mpt ( struct hermon *hermon, unsigned int index,
308                        const struct hermonprm_mpt *mpt ) {
309         return hermon_cmd ( hermon,
310                             HERMON_HCR_IN_CMD ( HERMON_HCR_SW2HW_MPT,
311                                                 1, sizeof ( *mpt ) ),
312                             0, mpt, index, NULL );
313 }
314
315 static inline int
316 hermon_cmd_write_mtt ( struct hermon *hermon,
317                        const struct hermonprm_write_mtt *write_mtt ) {
318         return hermon_cmd ( hermon,
319                             HERMON_HCR_IN_CMD ( HERMON_HCR_WRITE_MTT,
320                                                 1, sizeof ( *write_mtt ) ),
321                             0, write_mtt, 1, NULL );
322 }
323
324 static inline int
325 hermon_cmd_map_eq ( struct hermon *hermon, unsigned long index_map,
326                     const struct hermonprm_event_mask *mask ) {
327         return hermon_cmd ( hermon,
328                             HERMON_HCR_IN_CMD ( HERMON_HCR_MAP_EQ,
329                                                 0, sizeof ( *mask ) ),
330                             0, mask, index_map, NULL );
331 }
332
333 static inline int
334 hermon_cmd_sw2hw_eq ( struct hermon *hermon, unsigned int index,
335                       const struct hermonprm_eqc *eqctx ) {
336         return hermon_cmd ( hermon,
337                             HERMON_HCR_IN_CMD ( HERMON_HCR_SW2HW_EQ,
338                                                 1, sizeof ( *eqctx ) ),
339                             0, eqctx, index, NULL );
340 }
341
342 static inline int
343 hermon_cmd_hw2sw_eq ( struct hermon *hermon, unsigned int index,
344                       struct hermonprm_eqc *eqctx ) {
345         return hermon_cmd ( hermon,
346                             HERMON_HCR_OUT_CMD ( HERMON_HCR_HW2SW_EQ,
347                                                  1, sizeof ( *eqctx ) ),
348                             1, NULL, index, eqctx );
349 }
350
351 static inline int
352 hermon_cmd_query_eq ( struct hermon *hermon, unsigned int index,
353                       struct hermonprm_eqc *eqctx ) {
354         return hermon_cmd ( hermon,
355                             HERMON_HCR_OUT_CMD ( HERMON_HCR_QUERY_EQ,
356                                                  1, sizeof ( *eqctx ) ),
357                             0, NULL, index, eqctx );
358 }
359
360 static inline int
361 hermon_cmd_sw2hw_cq ( struct hermon *hermon, unsigned long cqn,
362                       const struct hermonprm_completion_queue_context *cqctx ){
363         return hermon_cmd ( hermon,
364                             HERMON_HCR_IN_CMD ( HERMON_HCR_SW2HW_CQ,
365                                                 1, sizeof ( *cqctx ) ),
366                             0, cqctx, cqn, NULL );
367 }
368
369 static inline int
370 hermon_cmd_hw2sw_cq ( struct hermon *hermon, unsigned long cqn,
371                       struct hermonprm_completion_queue_context *cqctx) {
372         return hermon_cmd ( hermon,
373                             HERMON_HCR_OUT_CMD ( HERMON_HCR_HW2SW_CQ,
374                                                  1, sizeof ( *cqctx ) ),
375                             0, NULL, cqn, cqctx );
376 }
377
378 static inline int
379 hermon_cmd_rst2init_qp ( struct hermon *hermon, unsigned long qpn,
380                          const struct hermonprm_qp_ee_state_transitions *ctx ){
381         return hermon_cmd ( hermon,
382                             HERMON_HCR_IN_CMD ( HERMON_HCR_RST2INIT_QP,
383                                                 1, sizeof ( *ctx ) ),
384                             0, ctx, qpn, NULL );
385 }
386
387 static inline int
388 hermon_cmd_init2rtr_qp ( struct hermon *hermon, unsigned long qpn,
389                          const struct hermonprm_qp_ee_state_transitions *ctx ){
390         return hermon_cmd ( hermon,
391                             HERMON_HCR_IN_CMD ( HERMON_HCR_INIT2RTR_QP,
392                                                 1, sizeof ( *ctx ) ),
393                             0, ctx, qpn, NULL );
394 }
395
396 static inline int
397 hermon_cmd_rtr2rts_qp ( struct hermon *hermon, unsigned long qpn,
398                         const struct hermonprm_qp_ee_state_transitions *ctx ) {
399         return hermon_cmd ( hermon,
400                             HERMON_HCR_IN_CMD ( HERMON_HCR_RTR2RTS_QP,
401                                                 1, sizeof ( *ctx ) ),
402                             0, ctx, qpn, NULL );
403 }
404
405 static inline int
406 hermon_cmd_rts2rts_qp ( struct hermon *hermon, unsigned long qpn,
407                         const struct hermonprm_qp_ee_state_transitions *ctx ) {
408         return hermon_cmd ( hermon,
409                             HERMON_HCR_IN_CMD ( HERMON_HCR_RTS2RTS_QP,
410                                                 1, sizeof ( *ctx ) ),
411                             0, ctx, qpn, NULL );
412 }
413
414 static inline int
415 hermon_cmd_2rst_qp ( struct hermon *hermon, unsigned long qpn ) {
416         return hermon_cmd ( hermon,
417                             HERMON_HCR_VOID_CMD ( HERMON_HCR_2RST_QP ),
418                             0x03, NULL, qpn, NULL );
419 }
420
421 static inline int
422 hermon_cmd_query_qp ( struct hermon *hermon, unsigned long qpn,
423                       struct hermonprm_qp_ee_state_transitions *ctx ) {
424         return hermon_cmd ( hermon,
425                             HERMON_HCR_OUT_CMD ( HERMON_HCR_QUERY_QP,
426                                                  1, sizeof ( *ctx ) ),
427                             0, NULL, qpn, ctx );
428 }
429
430 static inline int
431 hermon_cmd_conf_special_qp ( struct hermon *hermon, unsigned int internal_qps,
432                              unsigned long base_qpn ) {
433         return hermon_cmd ( hermon,
434                             HERMON_HCR_VOID_CMD ( HERMON_HCR_CONF_SPECIAL_QP ),
435                             internal_qps, NULL, base_qpn, NULL );
436 }
437
438 static inline int
439 hermon_cmd_mad_ifc ( struct hermon *hermon, unsigned int port,
440                      union hermonprm_mad *mad ) {
441         return hermon_cmd ( hermon,
442                             HERMON_HCR_INOUT_CMD ( HERMON_HCR_MAD_IFC,
443                                                    1, sizeof ( *mad ),
444                                                    1, sizeof ( *mad ) ),
445                             0x03, mad, port, mad );
446 }
447
448 static inline int
449 hermon_cmd_read_mcg ( struct hermon *hermon, unsigned int index,
450                       struct hermonprm_mcg_entry *mcg ) {
451         return hermon_cmd ( hermon,
452                             HERMON_HCR_OUT_CMD ( HERMON_HCR_READ_MCG,
453                                                  1, sizeof ( *mcg ) ),
454                             0, NULL, index, mcg );
455 }
456
457 static inline int
458 hermon_cmd_write_mcg ( struct hermon *hermon, unsigned int index,
459                        const struct hermonprm_mcg_entry *mcg ) {
460         return hermon_cmd ( hermon,
461                             HERMON_HCR_IN_CMD ( HERMON_HCR_WRITE_MCG,
462                                                 1, sizeof ( *mcg ) ),
463                             0, mcg, index, NULL );
464 }
465
466 static inline int
467 hermon_cmd_mgid_hash ( struct hermon *hermon, const struct ib_gid *gid,
468                        struct hermonprm_mgm_hash *hash ) {
469         return hermon_cmd ( hermon,
470                             HERMON_HCR_INOUT_CMD ( HERMON_HCR_MGID_HASH,
471                                                    1, sizeof ( *gid ),
472                                                    0, sizeof ( *hash ) ),
473                             0, gid, 0, hash );
474 }
475
476 static inline int
477 hermon_cmd_run_fw ( struct hermon *hermon ) {
478         return hermon_cmd ( hermon,
479                             HERMON_HCR_VOID_CMD ( HERMON_HCR_RUN_FW ),
480                             0, NULL, 0, NULL );
481 }
482
483 static inline int
484 hermon_cmd_unmap_icm ( struct hermon *hermon, unsigned int page_count,
485                        const struct hermonprm_scalar_parameter *offset ) {
486         return hermon_cmd ( hermon,
487                             HERMON_HCR_IN_CMD ( HERMON_HCR_UNMAP_ICM,
488                                                 0, sizeof ( *offset ) ),
489                             0, offset, page_count, NULL );
490 }
491
492 static inline int
493 hermon_cmd_map_icm ( struct hermon *hermon,
494                      const struct hermonprm_virtual_physical_mapping *map ) {
495         return hermon_cmd ( hermon,
496                             HERMON_HCR_IN_CMD ( HERMON_HCR_MAP_ICM,
497                                                 1, sizeof ( *map ) ),
498                             0, map, 1, NULL );
499 }
500
501 static inline int
502 hermon_cmd_unmap_icm_aux ( struct hermon *hermon ) {
503         return hermon_cmd ( hermon,
504                             HERMON_HCR_VOID_CMD ( HERMON_HCR_UNMAP_ICM_AUX ),
505                             0, NULL, 0, NULL );
506 }
507
508 static inline int
509 hermon_cmd_map_icm_aux ( struct hermon *hermon,
510                        const struct hermonprm_virtual_physical_mapping *map ) {
511         return hermon_cmd ( hermon,
512                             HERMON_HCR_IN_CMD ( HERMON_HCR_MAP_ICM_AUX,
513                                                 1, sizeof ( *map ) ),
514                             0, map, 1, NULL );
515 }
516
517 static inline int
518 hermon_cmd_set_icm_size ( struct hermon *hermon,
519                           const struct hermonprm_scalar_parameter *icm_size,
520                           struct hermonprm_scalar_parameter *icm_aux_size ) {
521         return hermon_cmd ( hermon,
522                             HERMON_HCR_INOUT_CMD ( HERMON_HCR_SET_ICM_SIZE,
523                                                    0, sizeof ( *icm_size ),
524                                                    0, sizeof (*icm_aux_size) ),
525                             0, icm_size, 0, icm_aux_size );
526 }
527
528 static inline int
529 hermon_cmd_unmap_fa ( struct hermon *hermon ) {
530         return hermon_cmd ( hermon,
531                             HERMON_HCR_VOID_CMD ( HERMON_HCR_UNMAP_FA ),
532                             0, NULL, 0, NULL );
533 }
534
535 static inline int
536 hermon_cmd_map_fa ( struct hermon *hermon,
537                     const struct hermonprm_virtual_physical_mapping *map ) {
538         return hermon_cmd ( hermon,
539                             HERMON_HCR_IN_CMD ( HERMON_HCR_MAP_FA,
540                                                 1, sizeof ( *map ) ),
541                             0, map, 1, NULL );
542 }
543
544 /***************************************************************************
545  *
546  * Memory translation table operations
547  *
548  ***************************************************************************
549  */
550
551 /**
552  * Allocate MTT entries
553  *
554  * @v hermon            Hermon device
555  * @v memory            Memory to map into MTT
556  * @v len               Length of memory to map
557  * @v mtt               MTT descriptor to fill in
558  * @ret rc              Return status code
559  */
560 static int hermon_alloc_mtt ( struct hermon *hermon,
561                               const void *memory, size_t len,
562                               struct hermon_mtt *mtt ) {
563         struct hermonprm_write_mtt write_mtt;
564         physaddr_t start;
565         unsigned int page_offset;
566         unsigned int num_pages;
567         int mtt_offset;
568         unsigned int mtt_base_addr;
569         unsigned int i;
570         int rc;
571
572         /* Find available MTT entries */
573         start = virt_to_phys ( memory );
574         page_offset = ( start & ( HERMON_PAGE_SIZE - 1 ) );
575         start -= page_offset;
576         len += page_offset;
577         num_pages = ( ( len + HERMON_PAGE_SIZE - 1 ) / HERMON_PAGE_SIZE );
578         mtt_offset = hermon_bitmask_alloc ( hermon->mtt_inuse, HERMON_MAX_MTTS,
579                                             num_pages );
580         if ( mtt_offset < 0 ) {
581                 DBGC ( hermon, "Hermon %p could not allocate %d MTT entries\n",
582                        hermon, num_pages );
583                 rc = mtt_offset;
584                 goto err_mtt_offset;
585         }
586         mtt_base_addr = ( ( hermon->cap.reserved_mtts + mtt_offset ) *
587                           hermon->cap.mtt_entry_size );
588
589         /* Fill in MTT structure */
590         mtt->mtt_offset = mtt_offset;
591         mtt->num_pages = num_pages;
592         mtt->mtt_base_addr = mtt_base_addr;
593         mtt->page_offset = page_offset;
594
595         /* Construct and issue WRITE_MTT commands */
596         for ( i = 0 ; i < num_pages ; i++ ) {
597                 memset ( &write_mtt, 0, sizeof ( write_mtt ) );
598                 MLX_FILL_1 ( &write_mtt.mtt_base_addr, 1,
599                              value, mtt_base_addr );
600                 MLX_FILL_2 ( &write_mtt.mtt, 1,
601                              p, 1,
602                              ptag_l, ( start >> 3 ) );
603                 if ( ( rc = hermon_cmd_write_mtt ( hermon,
604                                                    &write_mtt ) ) != 0 ) {
605                         DBGC ( hermon, "Hermon %p could not write MTT at %x\n",
606                                hermon, mtt_base_addr );
607                         goto err_write_mtt;
608                 }
609                 start += HERMON_PAGE_SIZE;
610                 mtt_base_addr += hermon->cap.mtt_entry_size;
611         }
612
613         return 0;
614
615  err_write_mtt:
616         hermon_bitmask_free ( hermon->mtt_inuse, mtt_offset, num_pages );
617  err_mtt_offset:
618         return rc;
619 }
620
621 /**
622  * Free MTT entries
623  *
624  * @v hermon            Hermon device
625  * @v mtt               MTT descriptor
626  */
627 static void hermon_free_mtt ( struct hermon *hermon,
628                               struct hermon_mtt *mtt ) {
629         hermon_bitmask_free ( hermon->mtt_inuse, mtt->mtt_offset,
630                               mtt->num_pages );
631 }
632
633 /***************************************************************************
634  *
635  * MAD operations
636  *
637  ***************************************************************************
638  */
639
640 /**
641  * Issue management datagram
642  *
643  * @v ibdev             Infiniband device
644  * @v mad               Management datagram
645  * @ret rc              Return status code
646  */
647 static int hermon_mad ( struct ib_device *ibdev, union ib_mad *mad ) {
648         struct hermon *hermon = ib_get_drvdata ( ibdev );
649         union hermonprm_mad mad_ifc;
650         int rc;
651
652         linker_assert ( sizeof ( *mad ) == sizeof ( mad_ifc.mad ),
653                         mad_size_mismatch );
654
655         /* Copy in request packet */
656         memcpy ( &mad_ifc.mad, mad, sizeof ( mad_ifc.mad ) );
657
658         /* Issue MAD */
659         if ( ( rc = hermon_cmd_mad_ifc ( hermon, ibdev->port,
660                                          &mad_ifc ) ) != 0 ) {
661                 DBGC ( hermon, "Hermon %p could not issue MAD IFC: %s\n",
662                        hermon, strerror ( rc ) );
663                 return rc;
664         }
665
666         /* Copy out reply packet */
667         memcpy ( mad, &mad_ifc.mad, sizeof ( *mad ) );
668
669         if ( mad->hdr.status != 0 ) {
670                 DBGC ( hermon, "Hermon %p MAD IFC status %04x\n",
671                        hermon, ntohs ( mad->hdr.status ) );
672                 return -EIO;
673         }
674         return 0;
675 }
676
677 /***************************************************************************
678  *
679  * Completion queue operations
680  *
681  ***************************************************************************
682  */
683
684 /**
685  * Create completion queue
686  *
687  * @v ibdev             Infiniband device
688  * @v cq                Completion queue
689  * @ret rc              Return status code
690  */
691 static int hermon_create_cq ( struct ib_device *ibdev,
692                               struct ib_completion_queue *cq ) {
693         struct hermon *hermon = ib_get_drvdata ( ibdev );
694         struct hermon_completion_queue *hermon_cq;
695         struct hermonprm_completion_queue_context cqctx;
696         int cqn_offset;
697         unsigned int i;
698         int rc;
699
700         /* Find a free completion queue number */
701         cqn_offset = hermon_bitmask_alloc ( hermon->cq_inuse,
702                                             HERMON_MAX_CQS, 1 );
703         if ( cqn_offset < 0 ) {
704                 DBGC ( hermon, "Hermon %p out of completion queues\n",
705                        hermon );
706                 rc = cqn_offset;
707                 goto err_cqn_offset;
708         }
709         cq->cqn = ( hermon->cap.reserved_cqs + cqn_offset );
710
711         /* Allocate control structures */
712         hermon_cq = zalloc ( sizeof ( *hermon_cq ) );
713         if ( ! hermon_cq ) {
714                 rc = -ENOMEM;
715                 goto err_hermon_cq;
716         }
717
718         /* Allocate completion queue itself */
719         hermon_cq->cqe_size = ( cq->num_cqes * sizeof ( hermon_cq->cqe[0] ) );
720         hermon_cq->cqe = malloc_dma ( hermon_cq->cqe_size,
721                                       sizeof ( hermon_cq->cqe[0] ) );
722         if ( ! hermon_cq->cqe ) {
723                 rc = -ENOMEM;
724                 goto err_cqe;
725         }
726         memset ( hermon_cq->cqe, 0, hermon_cq->cqe_size );
727         for ( i = 0 ; i < cq->num_cqes ; i++ ) {
728                 MLX_FILL_1 ( &hermon_cq->cqe[i].normal, 7, owner, 1 );
729         }
730         barrier();
731
732         /* Allocate MTT entries */
733         if ( ( rc = hermon_alloc_mtt ( hermon, hermon_cq->cqe,
734                                        hermon_cq->cqe_size,
735                                        &hermon_cq->mtt ) ) != 0 )
736                 goto err_alloc_mtt;
737
738         /* Hand queue over to hardware */
739         memset ( &cqctx, 0, sizeof ( cqctx ) );
740         MLX_FILL_1 ( &cqctx, 0, st, 0xa /* "Event fired" */ );
741         MLX_FILL_1 ( &cqctx, 2,
742                      page_offset, ( hermon_cq->mtt.page_offset >> 5 ) );
743         MLX_FILL_2 ( &cqctx, 3,
744                      usr_page, HERMON_UAR_NON_EQ_PAGE,
745                      log_cq_size, fls ( cq->num_cqes - 1 ) );
746         MLX_FILL_1 ( &cqctx, 7, mtt_base_addr_l,
747                      ( hermon_cq->mtt.mtt_base_addr >> 3 ) );
748         MLX_FILL_1 ( &cqctx, 15, db_record_addr_l,
749                      ( virt_to_phys ( &hermon_cq->doorbell ) >> 3 ) );
750         if ( ( rc = hermon_cmd_sw2hw_cq ( hermon, cq->cqn, &cqctx ) ) != 0 ) {
751                 DBGC ( hermon, "Hermon %p SW2HW_CQ failed: %s\n",
752                        hermon, strerror ( rc ) );
753                 goto err_sw2hw_cq;
754         }
755
756         DBGC ( hermon, "Hermon %p CQN %#lx ring at [%p,%p)\n",
757                hermon, cq->cqn, hermon_cq->cqe,
758                ( ( ( void * ) hermon_cq->cqe ) + hermon_cq->cqe_size ) );
759         ib_cq_set_drvdata ( cq, hermon_cq );
760         return 0;
761
762  err_sw2hw_cq:
763         hermon_free_mtt ( hermon, &hermon_cq->mtt );
764  err_alloc_mtt:
765         free_dma ( hermon_cq->cqe, hermon_cq->cqe_size );
766  err_cqe:
767         free ( hermon_cq );
768  err_hermon_cq:
769         hermon_bitmask_free ( hermon->cq_inuse, cqn_offset, 1 );
770  err_cqn_offset:
771         return rc;
772 }
773
774 /**
775  * Destroy completion queue
776  *
777  * @v ibdev             Infiniband device
778  * @v cq                Completion queue
779  */
780 static void hermon_destroy_cq ( struct ib_device *ibdev,
781                                 struct ib_completion_queue *cq ) {
782         struct hermon *hermon = ib_get_drvdata ( ibdev );
783         struct hermon_completion_queue *hermon_cq = ib_cq_get_drvdata ( cq );
784         struct hermonprm_completion_queue_context cqctx;
785         int cqn_offset;
786         int rc;
787
788         /* Take ownership back from hardware */
789         if ( ( rc = hermon_cmd_hw2sw_cq ( hermon, cq->cqn, &cqctx ) ) != 0 ) {
790                 DBGC ( hermon, "Hermon %p FATAL HW2SW_CQ failed on CQN %#lx: "
791                        "%s\n", hermon, cq->cqn, strerror ( rc ) );
792                 /* Leak memory and return; at least we avoid corruption */
793                 return;
794         }
795
796         /* Free MTT entries */
797         hermon_free_mtt ( hermon, &hermon_cq->mtt );
798
799         /* Free memory */
800         free_dma ( hermon_cq->cqe, hermon_cq->cqe_size );
801         free ( hermon_cq );
802
803         /* Mark queue number as free */
804         cqn_offset = ( cq->cqn - hermon->cap.reserved_cqs );
805         hermon_bitmask_free ( hermon->cq_inuse, cqn_offset, 1 );
806
807         ib_cq_set_drvdata ( cq, NULL );
808 }
809
810 /***************************************************************************
811  *
812  * Queue pair operations
813  *
814  ***************************************************************************
815  */
816
817 /**
818  * Assign queue pair number
819  *
820  * @v ibdev             Infiniband device
821  * @v qp                Queue pair
822  * @ret rc              Return status code
823  */
824 static int hermon_alloc_qpn ( struct ib_device *ibdev,
825                               struct ib_queue_pair *qp ) {
826         struct hermon *hermon = ib_get_drvdata ( ibdev );
827         unsigned int port_offset;
828         int qpn_offset;
829
830         /* Calculate queue pair number */
831         port_offset = ( ibdev->port - HERMON_PORT_BASE );
832
833         switch ( qp->type ) {
834         case IB_QPT_SMI:
835                 qp->qpn = ( hermon->special_qpn_base + port_offset );
836                 return 0;
837         case IB_QPT_GSI:
838                 qp->qpn = ( hermon->special_qpn_base + 2 + port_offset );
839                 return 0;
840         case IB_QPT_UD:
841         case IB_QPT_RC:
842                 /* Find a free queue pair number */
843                 qpn_offset = hermon_bitmask_alloc ( hermon->qp_inuse,
844                                                     HERMON_MAX_QPS, 1 );
845                 if ( qpn_offset < 0 ) {
846                         DBGC ( hermon, "Hermon %p out of queue pairs\n",
847                                hermon );
848                         return qpn_offset;
849                 }
850                 qp->qpn = ( hermon->qpn_base + qpn_offset );
851                 return 0;
852         default:
853                 DBGC ( hermon, "Hermon %p unsupported QP type %d\n",
854                        hermon, qp->type );
855                 return -ENOTSUP;
856         }
857 }
858
859 /**
860  * Free queue pair number
861  *
862  * @v ibdev             Infiniband device
863  * @v qp                Queue pair
864  */
865 static void hermon_free_qpn ( struct ib_device *ibdev,
866                               struct ib_queue_pair *qp ) {
867         struct hermon *hermon = ib_get_drvdata ( ibdev );
868         int qpn_offset;
869
870         qpn_offset = ( qp->qpn - hermon->qpn_base );
871         if ( qpn_offset >= 0 )
872                 hermon_bitmask_free ( hermon->qp_inuse, qpn_offset, 1 );
873 }
874
875 /**
876  * Calculate transmission rate
877  *
878  * @v av                Address vector
879  * @ret hermon_rate     Hermon rate
880  */
881 static unsigned int hermon_rate ( struct ib_address_vector *av ) {
882         return ( ( ( av->rate >= IB_RATE_2_5 ) && ( av->rate <= IB_RATE_120 ) )
883                  ? ( av->rate + 5 ) : 0 );
884 }
885
886 /**
887  * Calculate schedule queue
888  *
889  * @v ibdev             Infiniband device
890  * @v qp                Queue pair
891  * @ret sched_queue     Schedule queue
892  */
893 static unsigned int hermon_sched_queue ( struct ib_device *ibdev,
894                                          struct ib_queue_pair *qp ) {
895         return ( ( ( qp->type == IB_QPT_SMI ) ?
896                    HERMON_SCHED_QP0 : HERMON_SCHED_DEFAULT ) |
897                  ( ( ibdev->port - 1 ) << 6 ) );
898 }
899
900 /** Queue pair transport service type map */
901 static uint8_t hermon_qp_st[] = {
902         [IB_QPT_SMI] = HERMON_ST_MLX,
903         [IB_QPT_GSI] = HERMON_ST_MLX,
904         [IB_QPT_UD] = HERMON_ST_UD,
905         [IB_QPT_RC] = HERMON_ST_RC,
906 };
907
908 /**
909  * Dump queue pair context (for debugging only)
910  *
911  * @v hermon            Hermon device
912  * @v qp                Queue pair
913  * @ret rc              Return status code
914  */
915 static inline int hermon_dump_qpctx ( struct hermon *hermon,
916                                       struct ib_queue_pair *qp ) {
917         struct hermonprm_qp_ee_state_transitions qpctx;
918         int rc;
919
920         memset ( &qpctx, 0, sizeof ( qpctx ) );
921         if ( ( rc = hermon_cmd_query_qp ( hermon, qp->qpn, &qpctx ) ) != 0 ) {
922                 DBGC ( hermon, "Hermon %p QUERY_QP failed: %s\n",
923                        hermon, strerror ( rc ) );
924                 return rc;
925         }
926         DBGC ( hermon, "Hermon %p QPN %lx context:\n", hermon, qp->qpn );
927         DBGC_HDA ( hermon, 0, &qpctx.u.dwords[2],
928                    ( sizeof ( qpctx ) - 8 ) );
929
930         return 0;
931 }
932
933 /**
934  * Create queue pair
935  *
936  * @v ibdev             Infiniband device
937  * @v qp                Queue pair
938  * @ret rc              Return status code
939  */
940 static int hermon_create_qp ( struct ib_device *ibdev,
941                               struct ib_queue_pair *qp ) {
942         struct hermon *hermon = ib_get_drvdata ( ibdev );
943         struct hermon_queue_pair *hermon_qp;
944         struct hermonprm_qp_ee_state_transitions qpctx;
945         int rc;
946
947         /* Calculate queue pair number */
948         if ( ( rc = hermon_alloc_qpn ( ibdev, qp ) ) != 0 )
949                 goto err_alloc_qpn;
950
951         /* Allocate control structures */
952         hermon_qp = zalloc ( sizeof ( *hermon_qp ) );
953         if ( ! hermon_qp ) {
954                 rc = -ENOMEM;
955                 goto err_hermon_qp;
956         }
957
958         /* Calculate doorbell address */
959         hermon_qp->send.doorbell =
960                 ( hermon->uar + HERMON_UAR_NON_EQ_PAGE * HERMON_PAGE_SIZE +
961                   HERMON_DB_POST_SND_OFFSET );
962
963         /* Allocate work queue buffer */
964         hermon_qp->send.num_wqes = ( qp->send.num_wqes /* headroom */ + 1 +
965                                 ( 2048 / sizeof ( hermon_qp->send.wqe[0] ) ) );
966         hermon_qp->send.num_wqes =
967                 ( 1 << fls ( hermon_qp->send.num_wqes - 1 ) ); /* round up */
968         hermon_qp->send.wqe_size = ( hermon_qp->send.num_wqes *
969                                      sizeof ( hermon_qp->send.wqe[0] ) );
970         hermon_qp->recv.wqe_size = ( qp->recv.num_wqes *
971                                      sizeof ( hermon_qp->recv.wqe[0] ) );
972         hermon_qp->wqe_size = ( hermon_qp->send.wqe_size +
973                                 hermon_qp->recv.wqe_size );
974         hermon_qp->wqe = malloc_dma ( hermon_qp->wqe_size,
975                                       sizeof ( hermon_qp->send.wqe[0] ) );
976         if ( ! hermon_qp->wqe ) {
977                 rc = -ENOMEM;
978                 goto err_alloc_wqe;
979         }
980         hermon_qp->send.wqe = hermon_qp->wqe;
981         memset ( hermon_qp->send.wqe, 0xff, hermon_qp->send.wqe_size );
982         hermon_qp->recv.wqe = ( hermon_qp->wqe + hermon_qp->send.wqe_size );
983         memset ( hermon_qp->recv.wqe, 0, hermon_qp->recv.wqe_size );
984
985         /* Allocate MTT entries */
986         if ( ( rc = hermon_alloc_mtt ( hermon, hermon_qp->wqe,
987                                        hermon_qp->wqe_size,
988                                        &hermon_qp->mtt ) ) != 0 ) {
989                 goto err_alloc_mtt;
990         }
991
992         /* Transition queue to INIT state */
993         memset ( &qpctx, 0, sizeof ( qpctx ) );
994         MLX_FILL_2 ( &qpctx, 2,
995                      qpc_eec_data.pm_state, HERMON_PM_STATE_MIGRATED,
996                      qpc_eec_data.st, hermon_qp_st[qp->type] );
997         MLX_FILL_1 ( &qpctx, 3, qpc_eec_data.pd, HERMON_GLOBAL_PD );
998         MLX_FILL_4 ( &qpctx, 4,
999                      qpc_eec_data.log_rq_size, fls ( qp->recv.num_wqes - 1 ),
1000                      qpc_eec_data.log_rq_stride,
1001                      ( fls ( sizeof ( hermon_qp->recv.wqe[0] ) - 1 ) - 4 ),
1002                      qpc_eec_data.log_sq_size,
1003                      fls ( hermon_qp->send.num_wqes - 1 ),
1004                      qpc_eec_data.log_sq_stride,
1005                      ( fls ( sizeof ( hermon_qp->send.wqe[0] ) - 1 ) - 4 ) );
1006         MLX_FILL_1 ( &qpctx, 5,
1007                      qpc_eec_data.usr_page, HERMON_UAR_NON_EQ_PAGE );
1008         MLX_FILL_1 ( &qpctx, 33, qpc_eec_data.cqn_snd, qp->send.cq->cqn );
1009         MLX_FILL_4 ( &qpctx, 38,
1010                      qpc_eec_data.rre, 1,
1011                      qpc_eec_data.rwe, 1,
1012                      qpc_eec_data.rae, 1,
1013                      qpc_eec_data.page_offset,
1014                      ( hermon_qp->mtt.page_offset >> 6 ) );
1015         MLX_FILL_1 ( &qpctx, 41, qpc_eec_data.cqn_rcv, qp->recv.cq->cqn );
1016         MLX_FILL_1 ( &qpctx, 43, qpc_eec_data.db_record_addr_l,
1017                      ( virt_to_phys ( &hermon_qp->recv.doorbell ) >> 2 ) );
1018         MLX_FILL_1 ( &qpctx, 53, qpc_eec_data.mtt_base_addr_l,
1019                      ( hermon_qp->mtt.mtt_base_addr >> 3 ) );
1020         if ( ( rc = hermon_cmd_rst2init_qp ( hermon, qp->qpn,
1021                                              &qpctx ) ) != 0 ) {
1022                 DBGC ( hermon, "Hermon %p RST2INIT_QP failed: %s\n",
1023                        hermon, strerror ( rc ) );
1024                 goto err_rst2init_qp;
1025         }
1026
1027         DBGC ( hermon, "Hermon %p QPN %#lx send ring at [%p,%p)\n",
1028                hermon, qp->qpn, hermon_qp->send.wqe,
1029                ( ((void *)hermon_qp->send.wqe ) + hermon_qp->send.wqe_size ) );
1030         DBGC ( hermon, "Hermon %p QPN %#lx receive ring at [%p,%p)\n",
1031                hermon, qp->qpn, hermon_qp->recv.wqe,
1032                ( ((void *)hermon_qp->recv.wqe ) + hermon_qp->recv.wqe_size ) );
1033         ib_qp_set_drvdata ( qp, hermon_qp );
1034         return 0;
1035
1036         hermon_cmd_2rst_qp ( hermon, qp->qpn );
1037  err_rst2init_qp:
1038         hermon_free_mtt ( hermon, &hermon_qp->mtt );
1039  err_alloc_mtt:
1040         free_dma ( hermon_qp->wqe, hermon_qp->wqe_size );
1041  err_alloc_wqe:
1042         free ( hermon_qp );
1043  err_hermon_qp:
1044         hermon_free_qpn ( ibdev, qp );
1045  err_alloc_qpn:
1046         return rc;
1047 }
1048
1049 /**
1050  * Modify queue pair
1051  *
1052  * @v ibdev             Infiniband device
1053  * @v qp                Queue pair
1054  * @ret rc              Return status code
1055  */
1056 static int hermon_modify_qp ( struct ib_device *ibdev,
1057                               struct ib_queue_pair *qp ) {
1058         struct hermon *hermon = ib_get_drvdata ( ibdev );
1059         struct hermonprm_qp_ee_state_transitions qpctx;
1060         int rc;
1061
1062         /* Transition queue to RTR state */
1063         memset ( &qpctx, 0, sizeof ( qpctx ) );
1064         MLX_FILL_1 ( &qpctx, 0, opt_param_mask, HERMON_QP_OPT_PARAM_QKEY );
1065         MLX_FILL_2 ( &qpctx, 4,
1066                      qpc_eec_data.mtu, HERMON_MTU_2048,
1067                      qpc_eec_data.msg_max, 31 );// 11 /* 2^11 = 2048 */ );
1068         MLX_FILL_1 ( &qpctx, 7, qpc_eec_data.remote_qpn_een, qp->av.qpn );
1069         MLX_FILL_1 ( &qpctx, 9,
1070                      qpc_eec_data.primary_address_path.rlid, qp->av.lid );
1071         MLX_FILL_1 ( &qpctx, 10,
1072                      qpc_eec_data.primary_address_path.max_stat_rate,
1073                      hermon_rate ( &qp->av ) );
1074         memcpy ( &qpctx.u.dwords[12], &qp->av.gid, sizeof ( qp->av.gid ) );
1075         MLX_FILL_1 ( &qpctx, 16,
1076                      qpc_eec_data.primary_address_path.sched_queue,
1077                      hermon_sched_queue ( ibdev, qp ) );
1078         MLX_FILL_1 ( &qpctx, 39, qpc_eec_data.next_rcv_psn, qp->recv.psn );
1079         MLX_FILL_1 ( &qpctx, 44, qpc_eec_data.q_key, qp->qkey );
1080         if ( ( rc = hermon_cmd_init2rtr_qp ( hermon, qp->qpn,
1081                                              &qpctx ) ) != 0 ) {
1082                 DBGC ( hermon, "Hermon %p INIT2RTR_QP failed: %s\n",
1083                        hermon, strerror ( rc ) );
1084                 return rc;
1085         }
1086
1087         /* Transition queue to RTS state */
1088         memset ( &qpctx, 0, sizeof ( qpctx ) );
1089         MLX_FILL_1 ( &qpctx, 10,
1090                      qpc_eec_data.primary_address_path.ack_timeout, 0x13 );
1091         MLX_FILL_2 ( &qpctx, 30,
1092                      qpc_eec_data.retry_count, HERMON_RETRY_MAX,
1093                      qpc_eec_data.rnr_retry, HERMON_RETRY_MAX );
1094         MLX_FILL_1 ( &qpctx, 32, qpc_eec_data.next_send_psn, qp->send.psn );
1095         if ( ( rc = hermon_cmd_rtr2rts_qp ( hermon, qp->qpn, &qpctx ) ) != 0 ){
1096                 DBGC ( hermon, "Hermon %p RTR2RTS_QP failed: %s\n",
1097                        hermon, strerror ( rc ) );
1098                 return rc;
1099         }
1100
1101         return 0;
1102 }
1103
1104 /**
1105  * Destroy queue pair
1106  *
1107  * @v ibdev             Infiniband device
1108  * @v qp                Queue pair
1109  */
1110 static void hermon_destroy_qp ( struct ib_device *ibdev,
1111                                 struct ib_queue_pair *qp ) {
1112         struct hermon *hermon = ib_get_drvdata ( ibdev );
1113         struct hermon_queue_pair *hermon_qp = ib_qp_get_drvdata ( qp );
1114         int rc;
1115
1116         /* Take ownership back from hardware */
1117         if ( ( rc = hermon_cmd_2rst_qp ( hermon, qp->qpn ) ) != 0 ) {
1118                 DBGC ( hermon, "Hermon %p FATAL 2RST_QP failed on QPN %#lx: "
1119                        "%s\n", hermon, qp->qpn, strerror ( rc ) );
1120                 /* Leak memory and return; at least we avoid corruption */
1121                 return;
1122         }
1123
1124         /* Free MTT entries */
1125         hermon_free_mtt ( hermon, &hermon_qp->mtt );
1126
1127         /* Free memory */
1128         free_dma ( hermon_qp->wqe, hermon_qp->wqe_size );
1129         free ( hermon_qp );
1130
1131         /* Mark queue number as free */
1132         hermon_free_qpn ( ibdev, qp );
1133
1134         ib_qp_set_drvdata ( qp, NULL );
1135 }
1136
1137 /***************************************************************************
1138  *
1139  * Work request operations
1140  *
1141  ***************************************************************************
1142  */
1143
1144 /**
1145  * Construct UD send work queue entry
1146  *
1147  * @v ibdev             Infiniband device
1148  * @v qp                Queue pair
1149  * @v av                Address vector
1150  * @v iobuf             I/O buffer
1151  * @v wqe               Send work queue entry
1152  * @ret opcode          Control opcode
1153  */
1154 static unsigned int
1155 hermon_fill_ud_send_wqe ( struct ib_device *ibdev,
1156                           struct ib_queue_pair *qp __unused,
1157                           struct ib_address_vector *av,
1158                           struct io_buffer *iobuf,
1159                           union hermon_send_wqe *wqe ) {
1160         struct hermon *hermon = ib_get_drvdata ( ibdev );
1161
1162         MLX_FILL_1 ( &wqe->ud.ctrl, 1, ds,
1163                      ( ( offsetof ( typeof ( wqe->ud ), data[1] ) / 16 ) ) );
1164         MLX_FILL_1 ( &wqe->ud.ctrl, 2, c, 0x03 /* generate completion */ );
1165         MLX_FILL_2 ( &wqe->ud.ud, 0,
1166                      ud_address_vector.pd, HERMON_GLOBAL_PD,
1167                      ud_address_vector.port_number, ibdev->port );
1168         MLX_FILL_2 ( &wqe->ud.ud, 1,
1169                      ud_address_vector.rlid, av->lid,
1170                      ud_address_vector.g, av->gid_present );
1171         MLX_FILL_1 ( &wqe->ud.ud, 2,
1172                      ud_address_vector.max_stat_rate, hermon_rate ( av ) );
1173         MLX_FILL_1 ( &wqe->ud.ud, 3, ud_address_vector.sl, av->sl );
1174         memcpy ( &wqe->ud.ud.u.dwords[4], &av->gid, sizeof ( av->gid ) );
1175         MLX_FILL_1 ( &wqe->ud.ud, 8, destination_qp, av->qpn );
1176         MLX_FILL_1 ( &wqe->ud.ud, 9, q_key, av->qkey );
1177         MLX_FILL_1 ( &wqe->ud.data[0], 0, byte_count, iob_len ( iobuf ) );
1178         MLX_FILL_1 ( &wqe->ud.data[0], 1, l_key, hermon->lkey );
1179         MLX_FILL_1 ( &wqe->ud.data[0], 3,
1180                      local_address_l, virt_to_bus ( iobuf->data ) );
1181         return HERMON_OPCODE_SEND;
1182 }
1183
1184 /**
1185  * Construct MLX send work queue entry
1186  *
1187  * @v ibdev             Infiniband device
1188  * @v qp                Queue pair
1189  * @v av                Address vector
1190  * @v iobuf             I/O buffer
1191  * @v wqe               Send work queue entry
1192  * @ret opcode          Control opcode
1193  */
1194 static unsigned int
1195 hermon_fill_mlx_send_wqe ( struct ib_device *ibdev,
1196                            struct ib_queue_pair *qp,
1197                            struct ib_address_vector *av,
1198                            struct io_buffer *iobuf,
1199                            union hermon_send_wqe *wqe ) {
1200         struct hermon *hermon = ib_get_drvdata ( ibdev );
1201         struct io_buffer headers;
1202
1203         /* Construct IB headers */
1204         iob_populate ( &headers, &wqe->mlx.headers, 0,
1205                        sizeof ( wqe->mlx.headers ) );
1206         iob_reserve ( &headers, sizeof ( wqe->mlx.headers ) );
1207         ib_push ( ibdev, &headers, qp, iob_len ( iobuf ), av );
1208
1209         /* Fill work queue entry */
1210         MLX_FILL_1 ( &wqe->mlx.ctrl, 1, ds,
1211                      ( ( offsetof ( typeof ( wqe->mlx ), data[2] ) / 16 ) ) );
1212         MLX_FILL_5 ( &wqe->mlx.ctrl, 2,
1213                      c, 0x03 /* generate completion */,
1214                      icrc, 0 /* generate ICRC */,
1215                      max_statrate, hermon_rate ( av ),
1216                      slr, 0,
1217                      v15, ( ( qp->ext_qpn == IB_QPN_SMI ) ? 1 : 0 ) );
1218         MLX_FILL_1 ( &wqe->mlx.ctrl, 3, rlid, av->lid );
1219         MLX_FILL_1 ( &wqe->mlx.data[0], 0,
1220                      byte_count, iob_len ( &headers ) );
1221         MLX_FILL_1 ( &wqe->mlx.data[0], 1, l_key, hermon->lkey );
1222         MLX_FILL_1 ( &wqe->mlx.data[0], 3,
1223                      local_address_l, virt_to_bus ( headers.data ) );
1224         MLX_FILL_1 ( &wqe->mlx.data[1], 0,
1225                      byte_count, ( iob_len ( iobuf ) + 4 /* ICRC */ ) );
1226         MLX_FILL_1 ( &wqe->mlx.data[1], 1, l_key, hermon->lkey );
1227         MLX_FILL_1 ( &wqe->mlx.data[1], 3,
1228                      local_address_l, virt_to_bus ( iobuf->data ) );
1229         return HERMON_OPCODE_SEND;
1230 }
1231
1232 /**
1233  * Construct RC send work queue entry
1234  *
1235  * @v ibdev             Infiniband device
1236  * @v qp                Queue pair
1237  * @v av                Address vector
1238  * @v iobuf             I/O buffer
1239  * @v wqe               Send work queue entry
1240  * @ret opcode          Control opcode
1241  */
1242 static unsigned int
1243 hermon_fill_rc_send_wqe ( struct ib_device *ibdev,
1244                           struct ib_queue_pair *qp __unused,
1245                           struct ib_address_vector *av __unused,
1246                           struct io_buffer *iobuf,
1247                           union hermon_send_wqe *wqe ) {
1248         struct hermon *hermon = ib_get_drvdata ( ibdev );
1249
1250         MLX_FILL_1 ( &wqe->rc.ctrl, 1, ds,
1251                      ( ( offsetof ( typeof ( wqe->rc ), data[1] ) / 16 ) ) );
1252         MLX_FILL_1 ( &wqe->rc.ctrl, 2, c, 0x03 /* generate completion */ );
1253         MLX_FILL_1 ( &wqe->rc.data[0], 0, byte_count, iob_len ( iobuf ) );
1254         MLX_FILL_1 ( &wqe->rc.data[0], 1, l_key, hermon->lkey );
1255         MLX_FILL_1 ( &wqe->rc.data[0], 3,
1256                      local_address_l, virt_to_bus ( iobuf->data ) );
1257         return HERMON_OPCODE_SEND;
1258 }
1259
1260 /** Work queue entry constructors */
1261 static unsigned int
1262 ( * hermon_fill_send_wqe[] ) ( struct ib_device *ibdev,
1263                                struct ib_queue_pair *qp,
1264                                struct ib_address_vector *av,
1265                                struct io_buffer *iobuf,
1266                                union hermon_send_wqe *wqe ) = {
1267         [IB_QPT_SMI] = hermon_fill_mlx_send_wqe,
1268         [IB_QPT_GSI] = hermon_fill_mlx_send_wqe,
1269         [IB_QPT_UD] = hermon_fill_ud_send_wqe,
1270         [IB_QPT_RC] = hermon_fill_rc_send_wqe,
1271 };
1272
1273 /**
1274  * Post send work queue entry
1275  *
1276  * @v ibdev             Infiniband device
1277  * @v qp                Queue pair
1278  * @v av                Address vector
1279  * @v iobuf             I/O buffer
1280  * @ret rc              Return status code
1281  */
1282 static int hermon_post_send ( struct ib_device *ibdev,
1283                               struct ib_queue_pair *qp,
1284                               struct ib_address_vector *av,
1285                               struct io_buffer *iobuf ) {
1286         struct hermon *hermon = ib_get_drvdata ( ibdev );
1287         struct hermon_queue_pair *hermon_qp = ib_qp_get_drvdata ( qp );
1288         struct ib_work_queue *wq = &qp->send;
1289         struct hermon_send_work_queue *hermon_send_wq = &hermon_qp->send;
1290         union hermon_send_wqe *wqe;
1291         union hermonprm_doorbell_register db_reg;
1292         unsigned int wqe_idx_mask;
1293         unsigned int opcode;
1294
1295         /* Allocate work queue entry */
1296         wqe_idx_mask = ( wq->num_wqes - 1 );
1297         if ( wq->iobufs[wq->next_idx & wqe_idx_mask] ) {
1298                 DBGC ( hermon, "Hermon %p send queue full", hermon );
1299                 return -ENOBUFS;
1300         }
1301         wq->iobufs[wq->next_idx & wqe_idx_mask] = iobuf;
1302         wqe = &hermon_send_wq->wqe[ wq->next_idx &
1303                                     ( hermon_send_wq->num_wqes - 1 ) ];
1304
1305         /* Construct work queue entry */
1306         memset ( ( ( ( void * ) wqe ) + 4 /* avoid ctrl.owner */ ), 0,
1307                    ( sizeof ( *wqe ) - 4 ) );
1308         assert ( qp->type < ( sizeof ( hermon_fill_send_wqe ) /
1309                               sizeof ( hermon_fill_send_wqe[0] ) ) );
1310         assert ( hermon_fill_send_wqe[qp->type] != NULL );
1311         opcode = hermon_fill_send_wqe[qp->type] ( ibdev, qp, av, iobuf, wqe );
1312         barrier();
1313         MLX_FILL_2 ( &wqe->ctrl, 0,
1314                      opcode, opcode,
1315                      owner,
1316                      ( ( wq->next_idx & hermon_send_wq->num_wqes ) ? 1 : 0 ) );
1317         DBGCP ( hermon, "Hermon %p posting send WQE:\n", hermon );
1318         DBGCP_HD ( hermon, wqe, sizeof ( *wqe ) );
1319         barrier();
1320
1321         /* Ring doorbell register */
1322         MLX_FILL_1 ( &db_reg.send, 0, qn, qp->qpn );
1323         DBGCP ( hermon, "Ringing doorbell %08lx with %08x\n",
1324                 virt_to_phys ( hermon_send_wq->doorbell ), db_reg.dword[0] );
1325         writel ( db_reg.dword[0], ( hermon_send_wq->doorbell ) );
1326
1327         /* Update work queue's index */
1328         wq->next_idx++;
1329
1330         return 0;
1331 }
1332
1333 /**
1334  * Post receive work queue entry
1335  *
1336  * @v ibdev             Infiniband device
1337  * @v qp                Queue pair
1338  * @v iobuf             I/O buffer
1339  * @ret rc              Return status code
1340  */
1341 static int hermon_post_recv ( struct ib_device *ibdev,
1342                               struct ib_queue_pair *qp,
1343                               struct io_buffer *iobuf ) {
1344         struct hermon *hermon = ib_get_drvdata ( ibdev );
1345         struct hermon_queue_pair *hermon_qp = ib_qp_get_drvdata ( qp );
1346         struct ib_work_queue *wq = &qp->recv;
1347         struct hermon_recv_work_queue *hermon_recv_wq = &hermon_qp->recv;
1348         struct hermonprm_recv_wqe *wqe;
1349         unsigned int wqe_idx_mask;
1350
1351         /* Allocate work queue entry */
1352         wqe_idx_mask = ( wq->num_wqes - 1 );
1353         if ( wq->iobufs[wq->next_idx & wqe_idx_mask] ) {
1354                 DBGC ( hermon, "Hermon %p receive queue full", hermon );
1355                 return -ENOBUFS;
1356         }
1357         wq->iobufs[wq->next_idx & wqe_idx_mask] = iobuf;
1358         wqe = &hermon_recv_wq->wqe[wq->next_idx & wqe_idx_mask].recv;
1359
1360         /* Construct work queue entry */
1361         MLX_FILL_1 ( &wqe->data[0], 0, byte_count, iob_tailroom ( iobuf ) );
1362         MLX_FILL_1 ( &wqe->data[0], 1, l_key, hermon->lkey );
1363         MLX_FILL_1 ( &wqe->data[0], 3,
1364                      local_address_l, virt_to_bus ( iobuf->data ) );
1365
1366         /* Update work queue's index */
1367         wq->next_idx++;
1368
1369         /* Update doorbell record */
1370         barrier();
1371         MLX_FILL_1 ( &hermon_recv_wq->doorbell, 0, receive_wqe_counter,
1372                      ( wq->next_idx & 0xffff ) );
1373
1374         return 0;
1375 }
1376
1377 /**
1378  * Handle completion
1379  *
1380  * @v ibdev             Infiniband device
1381  * @v cq                Completion queue
1382  * @v cqe               Hardware completion queue entry
1383  * @ret rc              Return status code
1384  */
1385 static int hermon_complete ( struct ib_device *ibdev,
1386                              struct ib_completion_queue *cq,
1387                              union hermonprm_completion_entry *cqe ) {
1388         struct hermon *hermon = ib_get_drvdata ( ibdev );
1389         struct ib_work_queue *wq;
1390         struct ib_queue_pair *qp;
1391         struct hermon_queue_pair *hermon_qp;
1392         struct io_buffer *iobuf;
1393         struct ib_address_vector recv_av;
1394         struct ib_global_route_header *grh;
1395         struct ib_address_vector *av;
1396         unsigned int opcode;
1397         unsigned long qpn;
1398         int is_send;
1399         unsigned int wqe_idx;
1400         size_t len;
1401         int rc = 0;
1402
1403         /* Parse completion */
1404         qpn = MLX_GET ( &cqe->normal, qpn );
1405         is_send = MLX_GET ( &cqe->normal, s_r );
1406         opcode = MLX_GET ( &cqe->normal, opcode );
1407         if ( opcode >= HERMON_OPCODE_RECV_ERROR ) {
1408                 /* "s" field is not valid for error opcodes */
1409                 is_send = ( opcode == HERMON_OPCODE_SEND_ERROR );
1410                 DBGC ( hermon, "Hermon %p CQN %lx syndrome %x vendor %x\n",
1411                        hermon, cq->cqn, MLX_GET ( &cqe->error, syndrome ),
1412                        MLX_GET ( &cqe->error, vendor_error_syndrome ) );
1413                 rc = -EIO;
1414                 /* Don't return immediately; propagate error to completer */
1415         }
1416
1417         /* Identify work queue */
1418         wq = ib_find_wq ( cq, qpn, is_send );
1419         if ( ! wq ) {
1420                 DBGC ( hermon, "Hermon %p CQN %lx unknown %s QPN %lx\n",
1421                        hermon, cq->cqn, ( is_send ? "send" : "recv" ), qpn );
1422                 return -EIO;
1423         }
1424         qp = wq->qp;
1425         hermon_qp = ib_qp_get_drvdata ( qp );
1426
1427         /* Identify I/O buffer */
1428         wqe_idx = ( MLX_GET ( &cqe->normal, wqe_counter ) &
1429                     ( wq->num_wqes - 1 ) );
1430         iobuf = wq->iobufs[wqe_idx];
1431         if ( ! iobuf ) {
1432                 DBGC ( hermon, "Hermon %p CQN %lx QPN %lx empty WQE %x\n",
1433                        hermon, cq->cqn, qp->qpn, wqe_idx );
1434                 return -EIO;
1435         }
1436         wq->iobufs[wqe_idx] = NULL;
1437
1438         if ( is_send ) {
1439                 /* Hand off to completion handler */
1440                 ib_complete_send ( ibdev, qp, iobuf, rc );
1441         } else {
1442                 /* Set received length */
1443                 len = MLX_GET ( &cqe->normal, byte_cnt );
1444                 assert ( len <= iob_tailroom ( iobuf ) );
1445                 iob_put ( iobuf, len );
1446                 switch ( qp->type ) {
1447                 case IB_QPT_SMI:
1448                 case IB_QPT_GSI:
1449                 case IB_QPT_UD:
1450                         assert ( iob_len ( iobuf ) >= sizeof ( *grh ) );
1451                         grh = iobuf->data;
1452                         iob_pull ( iobuf, sizeof ( *grh ) );
1453                         /* Construct address vector */
1454                         av = &recv_av;
1455                         memset ( av, 0, sizeof ( *av ) );
1456                         av->qpn = MLX_GET ( &cqe->normal, srq_rqpn );
1457                         av->lid = MLX_GET ( &cqe->normal, slid_smac47_32 );
1458                         av->sl = MLX_GET ( &cqe->normal, sl );
1459                         av->gid_present = MLX_GET ( &cqe->normal, g );
1460                         memcpy ( &av->gid, &grh->sgid, sizeof ( av->gid ) );
1461                         break;
1462                 case IB_QPT_RC:
1463                         av = &qp->av;
1464                         break;
1465                 default:
1466                         assert ( 0 );
1467                         return -EINVAL;
1468                 }
1469                 /* Hand off to completion handler */
1470                 ib_complete_recv ( ibdev, qp, av, iobuf, rc );
1471         }
1472
1473         return rc;
1474 }
1475
1476 /**
1477  * Poll completion queue
1478  *
1479  * @v ibdev             Infiniband device
1480  * @v cq                Completion queue
1481  */
1482 static void hermon_poll_cq ( struct ib_device *ibdev,
1483                              struct ib_completion_queue *cq ) {
1484         struct hermon *hermon = ib_get_drvdata ( ibdev );
1485         struct hermon_completion_queue *hermon_cq = ib_cq_get_drvdata ( cq );
1486         union hermonprm_completion_entry *cqe;
1487         unsigned int cqe_idx_mask;
1488         int rc;
1489
1490         while ( 1 ) {
1491                 /* Look for completion entry */
1492                 cqe_idx_mask = ( cq->num_cqes - 1 );
1493                 cqe = &hermon_cq->cqe[cq->next_idx & cqe_idx_mask];
1494                 if ( MLX_GET ( &cqe->normal, owner ) ^
1495                      ( ( cq->next_idx & cq->num_cqes ) ? 1 : 0 ) ) {
1496                         /* Entry still owned by hardware; end of poll */
1497                         break;
1498                 }
1499                 DBGCP ( hermon, "Hermon %p completion:\n", hermon );
1500                 DBGCP_HD ( hermon, cqe, sizeof ( *cqe ) );
1501
1502                 /* Handle completion */
1503                 if ( ( rc = hermon_complete ( ibdev, cq, cqe ) ) != 0 ) {
1504                         DBGC ( hermon, "Hermon %p failed to complete: %s\n",
1505                                hermon, strerror ( rc ) );
1506                         DBGC_HD ( hermon, cqe, sizeof ( *cqe ) );
1507                 }
1508
1509                 /* Update completion queue's index */
1510                 cq->next_idx++;
1511
1512                 /* Update doorbell record */
1513                 MLX_FILL_1 ( &hermon_cq->doorbell, 0, update_ci,
1514                              ( cq->next_idx & 0x00ffffffUL ) );
1515         }
1516 }
1517
1518 /***************************************************************************
1519  *
1520  * Event queues
1521  *
1522  ***************************************************************************
1523  */
1524
1525 /**
1526  * Create event queue
1527  *
1528  * @v hermon            Hermon device
1529  * @ret rc              Return status code
1530  */
1531 static int hermon_create_eq ( struct hermon *hermon ) {
1532         struct hermon_event_queue *hermon_eq = &hermon->eq;
1533         struct hermonprm_eqc eqctx;
1534         struct hermonprm_event_mask mask;
1535         unsigned int i;
1536         int rc;
1537
1538         /* Select event queue number */
1539         hermon_eq->eqn = ( 4 * hermon->cap.reserved_uars );
1540         if ( hermon_eq->eqn < hermon->cap.reserved_eqs )
1541                 hermon_eq->eqn = hermon->cap.reserved_eqs;
1542
1543         /* Calculate doorbell address */
1544         hermon_eq->doorbell =
1545                 ( hermon->uar + HERMON_DB_EQ_OFFSET ( hermon_eq->eqn ) );
1546
1547         /* Allocate event queue itself */
1548         hermon_eq->eqe_size =
1549                 ( HERMON_NUM_EQES * sizeof ( hermon_eq->eqe[0] ) );
1550         hermon_eq->eqe = malloc_dma ( hermon_eq->eqe_size,
1551                                       sizeof ( hermon_eq->eqe[0] ) );
1552         if ( ! hermon_eq->eqe ) {
1553                 rc = -ENOMEM;
1554                 goto err_eqe;
1555         }
1556         memset ( hermon_eq->eqe, 0, hermon_eq->eqe_size );
1557         for ( i = 0 ; i < HERMON_NUM_EQES ; i++ ) {
1558                 MLX_FILL_1 ( &hermon_eq->eqe[i].generic, 7, owner, 1 );
1559         }
1560         barrier();
1561
1562         /* Allocate MTT entries */
1563         if ( ( rc = hermon_alloc_mtt ( hermon, hermon_eq->eqe,
1564                                        hermon_eq->eqe_size,
1565                                        &hermon_eq->mtt ) ) != 0 )
1566                 goto err_alloc_mtt;
1567
1568         /* Hand queue over to hardware */
1569         memset ( &eqctx, 0, sizeof ( eqctx ) );
1570         MLX_FILL_1 ( &eqctx, 0, st, 0xa /* "Fired" */ );
1571         MLX_FILL_1 ( &eqctx, 2,
1572                      page_offset, ( hermon_eq->mtt.page_offset >> 5 ) );
1573         MLX_FILL_1 ( &eqctx, 3, log_eq_size, fls ( HERMON_NUM_EQES - 1 ) );
1574         MLX_FILL_1 ( &eqctx, 7, mtt_base_addr_l,
1575                      ( hermon_eq->mtt.mtt_base_addr >> 3 ) );
1576         if ( ( rc = hermon_cmd_sw2hw_eq ( hermon, hermon_eq->eqn,
1577                                           &eqctx ) ) != 0 ) {
1578                 DBGC ( hermon, "Hermon %p SW2HW_EQ failed: %s\n",
1579                        hermon, strerror ( rc ) );
1580                 goto err_sw2hw_eq;
1581         }
1582
1583         /* Map events to this event queue */
1584         memset ( &mask, 0, sizeof ( mask ) );
1585         MLX_FILL_1 ( &mask, 1, port_state_change, 1 );
1586         if ( ( rc = hermon_cmd_map_eq ( hermon,
1587                                         ( HERMON_MAP_EQ | hermon_eq->eqn ),
1588                                         &mask ) ) != 0 ) {
1589                 DBGC ( hermon, "Hermon %p MAP_EQ failed: %s\n",
1590                        hermon, strerror ( rc )  );
1591                 goto err_map_eq;
1592         }
1593
1594         DBGC ( hermon, "Hermon %p EQN %#lx ring at [%p,%p])\n",
1595                hermon, hermon_eq->eqn, hermon_eq->eqe,
1596                ( ( ( void * ) hermon_eq->eqe ) + hermon_eq->eqe_size ) );
1597         return 0;
1598
1599  err_map_eq:
1600         hermon_cmd_hw2sw_eq ( hermon, hermon_eq->eqn, &eqctx );
1601  err_sw2hw_eq:
1602         hermon_free_mtt ( hermon, &hermon_eq->mtt );
1603  err_alloc_mtt:
1604         free_dma ( hermon_eq->eqe, hermon_eq->eqe_size );
1605  err_eqe:
1606         memset ( hermon_eq, 0, sizeof ( *hermon_eq ) );
1607         return rc;
1608 }
1609
1610 /**
1611  * Destroy event queue
1612  *
1613  * @v hermon            Hermon device
1614  */
1615 static void hermon_destroy_eq ( struct hermon *hermon ) {
1616         struct hermon_event_queue *hermon_eq = &hermon->eq;
1617         struct hermonprm_eqc eqctx;
1618         struct hermonprm_event_mask mask;
1619         int rc;
1620
1621         /* Unmap events from event queue */
1622         memset ( &mask, 0, sizeof ( mask ) );
1623         MLX_FILL_1 ( &mask, 1, port_state_change, 1 );
1624         if ( ( rc = hermon_cmd_map_eq ( hermon,
1625                                         ( HERMON_UNMAP_EQ | hermon_eq->eqn ),
1626                                         &mask ) ) != 0 ) {
1627                 DBGC ( hermon, "Hermon %p FATAL MAP_EQ failed to unmap: %s\n",
1628                        hermon, strerror ( rc ) );
1629                 /* Continue; HCA may die but system should survive */
1630         }
1631
1632         /* Take ownership back from hardware */
1633         if ( ( rc = hermon_cmd_hw2sw_eq ( hermon, hermon_eq->eqn,
1634                                           &eqctx ) ) != 0 ) {
1635                 DBGC ( hermon, "Hermon %p FATAL HW2SW_EQ failed: %s\n",
1636                        hermon, strerror ( rc ) );
1637                 /* Leak memory and return; at least we avoid corruption */
1638                 return;
1639         }
1640
1641         /* Free MTT entries */
1642         hermon_free_mtt ( hermon, &hermon_eq->mtt );
1643
1644         /* Free memory */
1645         free_dma ( hermon_eq->eqe, hermon_eq->eqe_size );
1646         memset ( hermon_eq, 0, sizeof ( *hermon_eq ) );
1647 }
1648
1649 /**
1650  * Handle port state event
1651  *
1652  * @v hermon            Hermon device
1653  * @v eqe               Port state change event queue entry
1654  */
1655 static void hermon_event_port_state_change ( struct hermon *hermon,
1656                                              union hermonprm_event_entry *eqe){
1657         unsigned int port;
1658         int link_up;
1659
1660         /* Get port and link status */
1661         port = ( MLX_GET ( &eqe->port_state_change, data.p ) - 1 );
1662         link_up = ( MLX_GET ( &eqe->generic, event_sub_type ) & 0x04 );
1663         DBGC ( hermon, "Hermon %p port %d link %s\n", hermon, ( port + 1 ),
1664                ( link_up ? "up" : "down" ) );
1665
1666         /* Sanity check */
1667         if ( port >= HERMON_NUM_PORTS ) {
1668                 DBGC ( hermon, "Hermon %p port %d does not exist!\n",
1669                        hermon, ( port + 1 ) );
1670                 return;
1671         }
1672
1673         /* Update MAD parameters */
1674         ib_smc_update ( hermon->ibdev[port], hermon_mad );
1675
1676         /* Notify Infiniband core of link state change */
1677         ib_link_state_changed ( hermon->ibdev[port] );
1678 }
1679
1680 /**
1681  * Poll event queue
1682  *
1683  * @v ibdev             Infiniband device
1684  */
1685 static void hermon_poll_eq ( struct ib_device *ibdev ) {
1686         struct hermon *hermon = ib_get_drvdata ( ibdev );
1687         struct hermon_event_queue *hermon_eq = &hermon->eq;
1688         union hermonprm_event_entry *eqe;
1689         union hermonprm_doorbell_register db_reg;
1690         unsigned int eqe_idx_mask;
1691         unsigned int event_type;
1692
1693         while ( 1 ) {
1694                 /* Look for event entry */
1695                 eqe_idx_mask = ( HERMON_NUM_EQES - 1 );
1696                 eqe = &hermon_eq->eqe[hermon_eq->next_idx & eqe_idx_mask];
1697                 if ( MLX_GET ( &eqe->generic, owner ) ^
1698                      ( ( hermon_eq->next_idx & HERMON_NUM_EQES ) ? 1 : 0 ) ) {
1699                         /* Entry still owned by hardware; end of poll */
1700                         break;
1701                 }
1702                 DBGCP ( hermon, "Hermon %p event:\n", hermon );
1703                 DBGCP_HD ( hermon, eqe, sizeof ( *eqe ) );
1704
1705                 /* Handle event */
1706                 event_type = MLX_GET ( &eqe->generic, event_type );
1707                 switch ( event_type ) {
1708                 case HERMON_EV_PORT_STATE_CHANGE:
1709                         hermon_event_port_state_change ( hermon, eqe );
1710                         break;
1711                 default:
1712                         DBGC ( hermon, "Hermon %p unrecognised event type "
1713                                "%#x:\n", hermon, event_type );
1714                         DBGC_HD ( hermon, eqe, sizeof ( *eqe ) );
1715                         break;
1716                 }
1717
1718                 /* Update event queue's index */
1719                 hermon_eq->next_idx++;
1720
1721                 /* Ring doorbell */
1722                 MLX_FILL_1 ( &db_reg.event, 0,
1723                              ci, ( hermon_eq->next_idx & 0x00ffffffUL ) );
1724                 DBGCP ( hermon, "Ringing doorbell %08lx with %08x\n",
1725                         virt_to_phys ( hermon_eq->doorbell ),
1726                         db_reg.dword[0] );
1727                 writel ( db_reg.dword[0], hermon_eq->doorbell );
1728         }
1729 }
1730
1731 /***************************************************************************
1732  *
1733  * Infiniband link-layer operations
1734  *
1735  ***************************************************************************
1736  */
1737
1738 /**
1739  * Initialise Infiniband link
1740  *
1741  * @v ibdev             Infiniband device
1742  * @ret rc              Return status code
1743  */
1744 static int hermon_open ( struct ib_device *ibdev ) {
1745         struct hermon *hermon = ib_get_drvdata ( ibdev );
1746         struct hermonprm_init_port init_port;
1747         int rc;
1748
1749         memset ( &init_port, 0, sizeof ( init_port ) );
1750         MLX_FILL_2 ( &init_port, 0,
1751                      port_width_cap, 3,
1752                      vl_cap, 1 );
1753         MLX_FILL_2 ( &init_port, 1,
1754                      mtu, HERMON_MTU_2048,
1755                      max_gid, 1 );
1756         MLX_FILL_1 ( &init_port, 2, max_pkey, 64 );
1757         if ( ( rc = hermon_cmd_init_port ( hermon, ibdev->port,
1758                                            &init_port ) ) != 0 ) {
1759                 DBGC ( hermon, "Hermon %p could not intialise port: %s\n",
1760                        hermon, strerror ( rc ) );
1761                 return rc;
1762         }
1763
1764         /* Update MAD parameters */
1765         ib_smc_update ( ibdev, hermon_mad );
1766
1767         return 0;
1768 }
1769
1770 /**
1771  * Close Infiniband link
1772  *
1773  * @v ibdev             Infiniband device
1774  */
1775 static void hermon_close ( struct ib_device *ibdev ) {
1776         struct hermon *hermon = ib_get_drvdata ( ibdev );
1777         int rc;
1778
1779         if ( ( rc = hermon_cmd_close_port ( hermon, ibdev->port ) ) != 0 ) {
1780                 DBGC ( hermon, "Hermon %p could not close port: %s\n",
1781                        hermon, strerror ( rc ) );
1782                 /* Nothing we can do about this */
1783         }
1784 }
1785
1786 /**
1787  * Inform embedded subnet management agent of a received MAD
1788  *
1789  * @v ibdev             Infiniband device
1790  * @v mad               MAD
1791  * @ret rc              Return status code
1792  */
1793 static int hermon_inform_sma ( struct ib_device *ibdev,
1794                                union ib_mad *mad ) {
1795         int rc;
1796
1797         /* Send the MAD to the embedded SMA */
1798         if ( ( rc = hermon_mad ( ibdev, mad ) ) != 0 )
1799                 return rc;
1800
1801         /* Update parameters held in software */
1802         ib_smc_update ( ibdev, hermon_mad );
1803
1804         return 0;
1805 }
1806
1807 /***************************************************************************
1808  *
1809  * Multicast group operations
1810  *
1811  ***************************************************************************
1812  */
1813
1814 /**
1815  * Attach to multicast group
1816  *
1817  * @v ibdev             Infiniband device
1818  * @v qp                Queue pair
1819  * @v gid               Multicast GID
1820  * @ret rc              Return status code
1821  */
1822 static int hermon_mcast_attach ( struct ib_device *ibdev,
1823                                  struct ib_queue_pair *qp,
1824                                  struct ib_gid *gid ) {
1825         struct hermon *hermon = ib_get_drvdata ( ibdev );
1826         struct hermonprm_mgm_hash hash;
1827         struct hermonprm_mcg_entry mcg;
1828         unsigned int index;
1829         int rc;
1830
1831         /* Generate hash table index */
1832         if ( ( rc = hermon_cmd_mgid_hash ( hermon, gid, &hash ) ) != 0 ) {
1833                 DBGC ( hermon, "Hermon %p could not hash GID: %s\n",
1834                        hermon, strerror ( rc ) );
1835                 return rc;
1836         }
1837         index = MLX_GET ( &hash, hash );
1838
1839         /* Check for existing hash table entry */
1840         if ( ( rc = hermon_cmd_read_mcg ( hermon, index, &mcg ) ) != 0 ) {
1841                 DBGC ( hermon, "Hermon %p could not read MCG %#x: %s\n",
1842                        hermon, index, strerror ( rc ) );
1843                 return rc;
1844         }
1845         if ( MLX_GET ( &mcg, hdr.members_count ) != 0 ) {
1846                 /* FIXME: this implementation allows only a single QP
1847                  * per multicast group, and doesn't handle hash
1848                  * collisions.  Sufficient for IPoIB but may need to
1849                  * be extended in future.
1850                  */
1851                 DBGC ( hermon, "Hermon %p MGID index %#x already in use\n",
1852                        hermon, index );
1853                 return -EBUSY;
1854         }
1855
1856         /* Update hash table entry */
1857         MLX_FILL_1 ( &mcg, 1, hdr.members_count, 1 );
1858         MLX_FILL_1 ( &mcg, 8, qp[0].qpn, qp->qpn );
1859         memcpy ( &mcg.u.dwords[4], gid, sizeof ( *gid ) );
1860         if ( ( rc = hermon_cmd_write_mcg ( hermon, index, &mcg ) ) != 0 ) {
1861                 DBGC ( hermon, "Hermon %p could not write MCG %#x: %s\n",
1862                        hermon, index, strerror ( rc ) );
1863                 return rc;
1864         }
1865
1866         return 0;
1867 }
1868
1869 /**
1870  * Detach from multicast group
1871  *
1872  * @v ibdev             Infiniband device
1873  * @v qp                Queue pair
1874  * @v gid               Multicast GID
1875  */
1876 static void hermon_mcast_detach ( struct ib_device *ibdev,
1877                                   struct ib_queue_pair *qp __unused,
1878                                   struct ib_gid *gid ) {
1879         struct hermon *hermon = ib_get_drvdata ( ibdev );
1880         struct hermonprm_mgm_hash hash;
1881         struct hermonprm_mcg_entry mcg;
1882         unsigned int index;
1883         int rc;
1884
1885         /* Generate hash table index */
1886         if ( ( rc = hermon_cmd_mgid_hash ( hermon, gid, &hash ) ) != 0 ) {
1887                 DBGC ( hermon, "Hermon %p could not hash GID: %s\n",
1888                        hermon, strerror ( rc ) );
1889                 return;
1890         }
1891         index = MLX_GET ( &hash, hash );
1892
1893         /* Clear hash table entry */
1894         memset ( &mcg, 0, sizeof ( mcg ) );
1895         if ( ( rc = hermon_cmd_write_mcg ( hermon, index, &mcg ) ) != 0 ) {
1896                 DBGC ( hermon, "Hermon %p could not write MCG %#x: %s\n",
1897                        hermon, index, strerror ( rc ) );
1898                 return;
1899         }
1900 }
1901
1902 /** Hermon Infiniband operations */
1903 static struct ib_device_operations hermon_ib_operations = {
1904         .create_cq      = hermon_create_cq,
1905         .destroy_cq     = hermon_destroy_cq,
1906         .create_qp      = hermon_create_qp,
1907         .modify_qp      = hermon_modify_qp,
1908         .destroy_qp     = hermon_destroy_qp,
1909         .post_send      = hermon_post_send,
1910         .post_recv      = hermon_post_recv,
1911         .poll_cq        = hermon_poll_cq,
1912         .poll_eq        = hermon_poll_eq,
1913         .open           = hermon_open,
1914         .close          = hermon_close,
1915         .mcast_attach   = hermon_mcast_attach,
1916         .mcast_detach   = hermon_mcast_detach,
1917         .set_port_info  = hermon_inform_sma,
1918         .set_pkey_table = hermon_inform_sma,
1919 };
1920
1921 /***************************************************************************
1922  *
1923  * Firmware control
1924  *
1925  ***************************************************************************
1926  */
1927
1928 /**
1929  * Map virtual to physical address for firmware usage
1930  *
1931  * @v hermon            Hermon device
1932  * @v map               Mapping function
1933  * @v va                Virtual address
1934  * @v pa                Physical address
1935  * @v len               Length of region
1936  * @ret rc              Return status code
1937  */
1938 static int hermon_map_vpm ( struct hermon *hermon,
1939                             int ( *map ) ( struct hermon *hermon,
1940                             const struct hermonprm_virtual_physical_mapping* ),
1941                             uint64_t va, physaddr_t pa, size_t len ) {
1942         struct hermonprm_virtual_physical_mapping mapping;
1943         int rc;
1944
1945         assert ( ( va & ( HERMON_PAGE_SIZE - 1 ) ) == 0 );
1946         assert ( ( pa & ( HERMON_PAGE_SIZE - 1 ) ) == 0 );
1947         assert ( ( len & ( HERMON_PAGE_SIZE - 1 ) ) == 0 );
1948
1949         /* These mappings tend to generate huge volumes of
1950          * uninteresting debug data, which basically makes it
1951          * impossible to use debugging otherwise.
1952          */
1953         DBG_DISABLE ( DBGLVL_LOG | DBGLVL_EXTRA );
1954
1955         while ( len ) {
1956                 memset ( &mapping, 0, sizeof ( mapping ) );
1957                 MLX_FILL_1 ( &mapping, 0, va_h, ( va >> 32 ) );
1958                 MLX_FILL_1 ( &mapping, 1, va_l, ( va >> 12 ) );
1959                 MLX_FILL_2 ( &mapping, 3,
1960                              log2size, 0,
1961                              pa_l, ( pa >> 12 ) );
1962                 if ( ( rc = map ( hermon, &mapping ) ) != 0 ) {
1963                         DBG_ENABLE ( DBGLVL_LOG | DBGLVL_EXTRA );
1964                         DBGC ( hermon, "Hermon %p could not map %llx => %lx: "
1965                                "%s\n", hermon, va, pa, strerror ( rc ) );
1966                         return rc;
1967                 }
1968                 pa += HERMON_PAGE_SIZE;
1969                 va += HERMON_PAGE_SIZE;
1970                 len -= HERMON_PAGE_SIZE;
1971         }
1972
1973         DBG_ENABLE ( DBGLVL_LOG | DBGLVL_EXTRA );
1974         return 0;
1975 }
1976
1977 /**
1978  * Start firmware running
1979  *
1980  * @v hermon            Hermon device
1981  * @ret rc              Return status code
1982  */
1983 static int hermon_start_firmware ( struct hermon *hermon ) {
1984         struct hermonprm_query_fw fw;
1985         unsigned int fw_pages;
1986         size_t fw_size;
1987         physaddr_t fw_base;
1988         int rc;
1989
1990         /* Get firmware parameters */
1991         if ( ( rc = hermon_cmd_query_fw ( hermon, &fw ) ) != 0 ) {
1992                 DBGC ( hermon, "Hermon %p could not query firmware: %s\n",
1993                        hermon, strerror ( rc ) );
1994                 goto err_query_fw;
1995         }
1996         DBGC ( hermon, "Hermon %p firmware version %d.%d.%d\n", hermon,
1997                MLX_GET ( &fw, fw_rev_major ), MLX_GET ( &fw, fw_rev_minor ),
1998                MLX_GET ( &fw, fw_rev_subminor ) );
1999         fw_pages = MLX_GET ( &fw, fw_pages );
2000         DBGC ( hermon, "Hermon %p requires %d pages (%d kB) for firmware\n",
2001                hermon, fw_pages, ( fw_pages * ( HERMON_PAGE_SIZE / 1024 ) ) );
2002
2003         /* Allocate firmware pages and map firmware area */
2004         fw_size = ( fw_pages * HERMON_PAGE_SIZE );
2005         hermon->firmware_area = umalloc ( fw_size );
2006         if ( ! hermon->firmware_area ) {
2007                 rc = -ENOMEM;
2008                 goto err_alloc_fa;
2009         }
2010         fw_base = user_to_phys ( hermon->firmware_area, 0 );
2011         DBGC ( hermon, "Hermon %p firmware area at physical [%lx,%lx)\n",
2012                hermon, fw_base, ( fw_base + fw_size ) );
2013         if ( ( rc = hermon_map_vpm ( hermon, hermon_cmd_map_fa,
2014                                      0, fw_base, fw_size ) ) != 0 ) {
2015                 DBGC ( hermon, "Hermon %p could not map firmware: %s\n",
2016                        hermon, strerror ( rc ) );
2017                 goto err_map_fa;
2018         }
2019
2020         /* Start firmware */
2021         if ( ( rc = hermon_cmd_run_fw ( hermon ) ) != 0 ) {
2022                 DBGC ( hermon, "Hermon %p could not run firmware: %s\n",
2023                        hermon, strerror ( rc ) );
2024                 goto err_run_fw;
2025         }
2026
2027         DBGC ( hermon, "Hermon %p firmware started\n", hermon );
2028         return 0;
2029
2030  err_run_fw:
2031  err_map_fa:
2032         hermon_cmd_unmap_fa ( hermon );
2033         ufree ( hermon->firmware_area );
2034         hermon->firmware_area = UNULL;
2035  err_alloc_fa:
2036  err_query_fw:
2037         return rc;
2038 }
2039
2040 /**
2041  * Stop firmware running
2042  *
2043  * @v hermon            Hermon device
2044  */
2045 static void hermon_stop_firmware ( struct hermon *hermon ) {
2046         int rc;
2047
2048         if ( ( rc = hermon_cmd_unmap_fa ( hermon ) ) != 0 ) {
2049                 DBGC ( hermon, "Hermon %p FATAL could not stop firmware: %s\n",
2050                        hermon, strerror ( rc ) );
2051                 /* Leak memory and return; at least we avoid corruption */
2052                 return;
2053         }
2054         ufree ( hermon->firmware_area );
2055         hermon->firmware_area = UNULL;
2056 }
2057
2058 /***************************************************************************
2059  *
2060  * Infinihost Context Memory management
2061  *
2062  ***************************************************************************
2063  */
2064
2065 /**
2066  * Get device limits
2067  *
2068  * @v hermon            Hermon device
2069  * @ret rc              Return status code
2070  */
2071 static int hermon_get_cap ( struct hermon *hermon ) {
2072         struct hermonprm_query_dev_cap dev_cap;
2073         int rc;
2074
2075         if ( ( rc = hermon_cmd_query_dev_cap ( hermon, &dev_cap ) ) != 0 ) {
2076                 DBGC ( hermon, "Hermon %p could not get device limits: %s\n",
2077                        hermon, strerror ( rc ) );
2078                 return rc;
2079         }
2080
2081         hermon->cap.cmpt_entry_size = MLX_GET ( &dev_cap, c_mpt_entry_sz );
2082         hermon->cap.reserved_qps =
2083                 ( 1 << MLX_GET ( &dev_cap, log2_rsvd_qps ) );
2084         hermon->cap.qpc_entry_size = MLX_GET ( &dev_cap, qpc_entry_sz );
2085         hermon->cap.altc_entry_size = MLX_GET ( &dev_cap, altc_entry_sz );
2086         hermon->cap.auxc_entry_size = MLX_GET ( &dev_cap, aux_entry_sz );
2087         hermon->cap.reserved_srqs =
2088                 ( 1 << MLX_GET ( &dev_cap, log2_rsvd_srqs ) );
2089         hermon->cap.srqc_entry_size = MLX_GET ( &dev_cap, srq_entry_sz );
2090         hermon->cap.reserved_cqs =
2091                 ( 1 << MLX_GET ( &dev_cap, log2_rsvd_cqs ) );
2092         hermon->cap.cqc_entry_size = MLX_GET ( &dev_cap, cqc_entry_sz );
2093         hermon->cap.reserved_eqs = MLX_GET ( &dev_cap, num_rsvd_eqs );
2094         hermon->cap.eqc_entry_size = MLX_GET ( &dev_cap, eqc_entry_sz );
2095         hermon->cap.reserved_mtts =
2096                 ( 1 << MLX_GET ( &dev_cap, log2_rsvd_mtts ) );
2097         hermon->cap.mtt_entry_size = MLX_GET ( &dev_cap, mtt_entry_sz );
2098         hermon->cap.reserved_mrws =
2099                 ( 1 << MLX_GET ( &dev_cap, log2_rsvd_mrws ) );
2100         hermon->cap.dmpt_entry_size = MLX_GET ( &dev_cap, d_mpt_entry_sz );
2101         hermon->cap.reserved_uars = MLX_GET ( &dev_cap, num_rsvd_uars );
2102
2103         return 0;
2104 }
2105
2106 /**
2107  * Get ICM usage
2108  *
2109  * @v log_num_entries   Log2 of the number of entries
2110  * @v entry_size        Entry size
2111  * @ret usage           Usage size in ICM
2112  */
2113 static size_t icm_usage ( unsigned int log_num_entries, size_t entry_size ) {
2114         size_t usage;
2115
2116         usage = ( ( 1 << log_num_entries ) * entry_size );
2117         usage = ( ( usage + HERMON_PAGE_SIZE - 1 ) &
2118                   ~( HERMON_PAGE_SIZE - 1 ) );
2119         return usage;
2120 }
2121
2122 /**
2123  * Allocate ICM
2124  *
2125  * @v hermon            Hermon device
2126  * @v init_hca          INIT_HCA structure to fill in
2127  * @ret rc              Return status code
2128  */
2129 static int hermon_alloc_icm ( struct hermon *hermon,
2130                               struct hermonprm_init_hca *init_hca ) {
2131         struct hermonprm_scalar_parameter icm_size;
2132         struct hermonprm_scalar_parameter icm_aux_size;
2133         uint64_t icm_offset = 0;
2134         unsigned int log_num_qps, log_num_srqs, log_num_cqs, log_num_eqs;
2135         unsigned int log_num_mtts, log_num_mpts;
2136         size_t cmpt_max_len;
2137         size_t qp_cmpt_len, srq_cmpt_len, cq_cmpt_len, eq_cmpt_len;
2138         size_t icm_len, icm_aux_len;
2139         physaddr_t icm_phys;
2140         int i;
2141         int rc;
2142
2143         /*
2144          * Start by carving up the ICM virtual address space
2145          *
2146          */
2147
2148         /* Calculate number of each object type within ICM */
2149         log_num_qps = fls ( hermon->cap.reserved_qps +
2150                             HERMON_RSVD_SPECIAL_QPS + HERMON_MAX_QPS - 1 );
2151         log_num_srqs = fls ( hermon->cap.reserved_srqs - 1 );
2152         log_num_cqs = fls ( hermon->cap.reserved_cqs + HERMON_MAX_CQS - 1 );
2153         log_num_eqs = fls ( hermon->cap.reserved_eqs + HERMON_MAX_EQS - 1 );
2154         log_num_mtts = fls ( hermon->cap.reserved_mtts + HERMON_MAX_MTTS - 1 );
2155
2156         /* ICM starts with the cMPT tables, which are sparse */
2157         cmpt_max_len = ( HERMON_CMPT_MAX_ENTRIES *
2158                          ( ( uint64_t ) hermon->cap.cmpt_entry_size ) );
2159         qp_cmpt_len = icm_usage ( log_num_qps, hermon->cap.cmpt_entry_size );
2160         hermon->icm_map[HERMON_ICM_QP_CMPT].offset = icm_offset;
2161         hermon->icm_map[HERMON_ICM_QP_CMPT].len = qp_cmpt_len;
2162         icm_offset += cmpt_max_len;
2163         srq_cmpt_len = icm_usage ( log_num_srqs, hermon->cap.cmpt_entry_size );
2164         hermon->icm_map[HERMON_ICM_SRQ_CMPT].offset = icm_offset;
2165         hermon->icm_map[HERMON_ICM_SRQ_CMPT].len = srq_cmpt_len;
2166         icm_offset += cmpt_max_len;
2167         cq_cmpt_len = icm_usage ( log_num_cqs, hermon->cap.cmpt_entry_size );
2168         hermon->icm_map[HERMON_ICM_CQ_CMPT].offset = icm_offset;
2169         hermon->icm_map[HERMON_ICM_CQ_CMPT].len = cq_cmpt_len;
2170         icm_offset += cmpt_max_len;
2171         eq_cmpt_len = icm_usage ( log_num_eqs, hermon->cap.cmpt_entry_size );
2172         hermon->icm_map[HERMON_ICM_EQ_CMPT].offset = icm_offset;
2173         hermon->icm_map[HERMON_ICM_EQ_CMPT].len = eq_cmpt_len;
2174         icm_offset += cmpt_max_len;
2175
2176         hermon->icm_map[HERMON_ICM_OTHER].offset = icm_offset;
2177
2178         /* Queue pair contexts */
2179         MLX_FILL_1 ( init_hca, 12,
2180                      qpc_eec_cqc_eqc_rdb_parameters.qpc_base_addr_h,
2181                      ( icm_offset >> 32 ) );
2182         MLX_FILL_2 ( init_hca, 13,
2183                      qpc_eec_cqc_eqc_rdb_parameters.qpc_base_addr_l,
2184                      ( icm_offset >> 5 ),
2185                      qpc_eec_cqc_eqc_rdb_parameters.log_num_of_qp,
2186                      log_num_qps );
2187         DBGC ( hermon, "Hermon %p ICM QPC base = %llx\n", hermon, icm_offset );
2188         icm_offset += icm_usage ( log_num_qps, hermon->cap.qpc_entry_size );
2189
2190         /* Extended alternate path contexts */
2191         MLX_FILL_1 ( init_hca, 24,
2192                      qpc_eec_cqc_eqc_rdb_parameters.altc_base_addr_h,
2193                      ( icm_offset >> 32 ) );
2194         MLX_FILL_1 ( init_hca, 25,
2195                      qpc_eec_cqc_eqc_rdb_parameters.altc_base_addr_l,
2196                      icm_offset );
2197         DBGC ( hermon, "Hermon %p ICM ALTC base = %llx\n", hermon, icm_offset);
2198         icm_offset += icm_usage ( log_num_qps,
2199                                   hermon->cap.altc_entry_size );
2200
2201         /* Extended auxiliary contexts */
2202         MLX_FILL_1 ( init_hca, 28,
2203                      qpc_eec_cqc_eqc_rdb_parameters.auxc_base_addr_h,
2204                      ( icm_offset >> 32 ) );
2205         MLX_FILL_1 ( init_hca, 29,
2206                      qpc_eec_cqc_eqc_rdb_parameters.auxc_base_addr_l,
2207                      icm_offset );
2208         DBGC ( hermon, "Hermon %p ICM AUXC base = %llx\n", hermon, icm_offset);
2209         icm_offset += icm_usage ( log_num_qps,
2210                                   hermon->cap.auxc_entry_size );
2211
2212         /* Shared receive queue contexts */
2213         MLX_FILL_1 ( init_hca, 18,
2214                      qpc_eec_cqc_eqc_rdb_parameters.srqc_base_addr_h,
2215                      ( icm_offset >> 32 ) );
2216         MLX_FILL_2 ( init_hca, 19,
2217                      qpc_eec_cqc_eqc_rdb_parameters.srqc_base_addr_l,
2218                      ( icm_offset >> 5 ),
2219                      qpc_eec_cqc_eqc_rdb_parameters.log_num_of_srq,
2220                      log_num_srqs );
2221         DBGC ( hermon, "Hermon %p ICM SRQC base = %llx\n", hermon, icm_offset);
2222         icm_offset += icm_usage ( log_num_srqs,
2223                                   hermon->cap.srqc_entry_size );
2224
2225         /* Completion queue contexts */
2226         MLX_FILL_1 ( init_hca, 20,
2227                      qpc_eec_cqc_eqc_rdb_parameters.cqc_base_addr_h,
2228                      ( icm_offset >> 32 ) );
2229         MLX_FILL_2 ( init_hca, 21,
2230                      qpc_eec_cqc_eqc_rdb_parameters.cqc_base_addr_l,
2231                      ( icm_offset >> 5 ),
2232                      qpc_eec_cqc_eqc_rdb_parameters.log_num_of_cq,
2233                      log_num_cqs );
2234         DBGC ( hermon, "Hermon %p ICM CQC base = %llx\n", hermon, icm_offset );
2235         icm_offset += icm_usage ( log_num_cqs, hermon->cap.cqc_entry_size );
2236
2237         /* Event queue contexts */
2238         MLX_FILL_1 ( init_hca, 32,
2239                      qpc_eec_cqc_eqc_rdb_parameters.eqc_base_addr_h,
2240                      ( icm_offset >> 32 ) );
2241         MLX_FILL_2 ( init_hca, 33,
2242                      qpc_eec_cqc_eqc_rdb_parameters.eqc_base_addr_l,
2243                      ( icm_offset >> 5 ),
2244                      qpc_eec_cqc_eqc_rdb_parameters.log_num_of_eq,
2245                      log_num_eqs );
2246         DBGC ( hermon, "Hermon %p ICM EQC base = %llx\n", hermon, icm_offset );
2247         icm_offset += icm_usage ( log_num_eqs, hermon->cap.eqc_entry_size );
2248
2249         /* Memory translation table */
2250         MLX_FILL_1 ( init_hca, 64,
2251                      tpt_parameters.mtt_base_addr_h, ( icm_offset >> 32 ) );
2252         MLX_FILL_1 ( init_hca, 65,
2253                      tpt_parameters.mtt_base_addr_l, icm_offset );
2254         DBGC ( hermon, "Hermon %p ICM MTT base = %llx\n", hermon, icm_offset );
2255         icm_offset += icm_usage ( log_num_mtts,
2256                                   hermon->cap.mtt_entry_size );
2257
2258         /* Memory protection table */
2259         log_num_mpts = fls ( hermon->cap.reserved_mrws + 1 - 1 );
2260         MLX_FILL_1 ( init_hca, 60,
2261                      tpt_parameters.dmpt_base_adr_h, ( icm_offset >> 32 ) );
2262         MLX_FILL_1 ( init_hca, 61,
2263                      tpt_parameters.dmpt_base_adr_l, icm_offset );
2264         MLX_FILL_1 ( init_hca, 62,
2265                      tpt_parameters.log_dmpt_sz, log_num_mpts );
2266         DBGC ( hermon, "Hermon %p ICM DMPT base = %llx\n", hermon, icm_offset);
2267         icm_offset += icm_usage ( log_num_mpts,
2268                                   hermon->cap.dmpt_entry_size );
2269
2270         /* Multicast table */
2271         MLX_FILL_1 ( init_hca, 48,
2272                      multicast_parameters.mc_base_addr_h,
2273                      ( icm_offset >> 32 ) );
2274         MLX_FILL_1 ( init_hca, 49,
2275                      multicast_parameters.mc_base_addr_l, icm_offset );
2276         MLX_FILL_1 ( init_hca, 52,
2277                      multicast_parameters.log_mc_table_entry_sz,
2278                      fls ( sizeof ( struct hermonprm_mcg_entry ) - 1 ) );
2279         MLX_FILL_1 ( init_hca, 53,
2280                      multicast_parameters.log_mc_table_hash_sz, 3 );
2281         MLX_FILL_1 ( init_hca, 54,
2282                      multicast_parameters.log_mc_table_sz, 3 );
2283         DBGC ( hermon, "Hermon %p ICM MC base = %llx\n", hermon, icm_offset );
2284         icm_offset += ( ( 8 * sizeof ( struct hermonprm_mcg_entry ) +
2285                           HERMON_PAGE_SIZE - 1 ) & ~( HERMON_PAGE_SIZE - 1 ) );
2286
2287         hermon->icm_map[HERMON_ICM_OTHER].len =
2288                 ( icm_offset - hermon->icm_map[HERMON_ICM_OTHER].offset );
2289
2290         /*
2291          * Allocate and map physical memory for (portions of) ICM
2292          *
2293          * Map is:
2294          *   ICM AUX area (aligned to its own size)
2295          *   cMPT areas
2296          *   Other areas
2297          */
2298
2299         /* Calculate physical memory required for ICM */
2300         icm_len = 0;
2301         for ( i = 0 ; i < HERMON_ICM_NUM_REGIONS ; i++ ) {
2302                 icm_len += hermon->icm_map[i].len;
2303         }
2304
2305         /* Get ICM auxiliary area size */
2306         memset ( &icm_size, 0, sizeof ( icm_size ) );
2307         MLX_FILL_1 ( &icm_size, 0, value_hi, ( icm_offset >> 32 ) );
2308         MLX_FILL_1 ( &icm_size, 1, value, icm_offset );
2309         if ( ( rc = hermon_cmd_set_icm_size ( hermon, &icm_size,
2310                                               &icm_aux_size ) ) != 0 ) {
2311                 DBGC ( hermon, "Hermon %p could not set ICM size: %s\n",
2312                        hermon, strerror ( rc ) );
2313                 goto err_set_icm_size;
2314         }
2315         icm_aux_len = ( MLX_GET ( &icm_aux_size, value ) * HERMON_PAGE_SIZE );
2316
2317         /* Allocate ICM data and auxiliary area */
2318         DBGC ( hermon, "Hermon %p requires %zd kB ICM and %zd kB AUX ICM\n",
2319                hermon, ( icm_len / 1024 ), ( icm_aux_len / 1024 ) );
2320         hermon->icm = umalloc ( icm_aux_len + icm_len );
2321         if ( ! hermon->icm ) {
2322                 rc = -ENOMEM;
2323                 goto err_alloc;
2324         }
2325         icm_phys = user_to_phys ( hermon->icm, 0 );
2326
2327         /* Map ICM auxiliary area */
2328         DBGC ( hermon, "Hermon %p mapping ICM AUX => %08lx\n",
2329                hermon, icm_phys );
2330         if ( ( rc = hermon_map_vpm ( hermon, hermon_cmd_map_icm_aux,
2331                                      0, icm_phys, icm_aux_len ) ) != 0 ) {
2332                 DBGC ( hermon, "Hermon %p could not map AUX ICM: %s\n",
2333                        hermon, strerror ( rc ) );               
2334                 goto err_map_icm_aux;
2335         }
2336         icm_phys += icm_aux_len;
2337
2338         /* MAP ICM area */
2339         for ( i = 0 ; i < HERMON_ICM_NUM_REGIONS ; i++ ) {
2340                 DBGC ( hermon, "Hermon %p mapping ICM %llx+%zx => %08lx\n",
2341                        hermon, hermon->icm_map[i].offset,
2342                        hermon->icm_map[i].len, icm_phys );
2343                 if ( ( rc = hermon_map_vpm ( hermon, hermon_cmd_map_icm,
2344                                              hermon->icm_map[i].offset,
2345                                              icm_phys,
2346                                              hermon->icm_map[i].len ) ) != 0 ){
2347                         DBGC ( hermon, "Hermon %p could not map ICM: %s\n",
2348                                hermon, strerror ( rc ) );
2349                         goto err_map_icm;
2350                 }
2351                 icm_phys += hermon->icm_map[i].len;
2352         }
2353
2354         return 0;
2355
2356  err_map_icm:
2357         assert ( i == 0 ); /* We don't handle partial failure at present */
2358  err_map_icm_aux:
2359         hermon_cmd_unmap_icm_aux ( hermon );
2360         ufree ( hermon->icm );
2361         hermon->icm = UNULL;
2362  err_alloc:
2363  err_set_icm_size:
2364         return rc;
2365 }
2366
2367 /**
2368  * Free ICM
2369  *
2370  * @v hermon            Hermon device
2371  */
2372 static void hermon_free_icm ( struct hermon *hermon ) {
2373         struct hermonprm_scalar_parameter unmap_icm;
2374         int i;
2375
2376         for ( i = ( HERMON_ICM_NUM_REGIONS - 1 ) ; i >= 0 ; i-- ) {
2377                 memset ( &unmap_icm, 0, sizeof ( unmap_icm ) );
2378                 MLX_FILL_1 ( &unmap_icm, 0, value_hi,
2379                              ( hermon->icm_map[i].offset >> 32 ) );
2380                 MLX_FILL_1 ( &unmap_icm, 1, value,
2381                              hermon->icm_map[i].offset );
2382                 hermon_cmd_unmap_icm ( hermon,
2383                                        ( 1 << fls ( ( hermon->icm_map[i].len /
2384                                                       HERMON_PAGE_SIZE ) - 1)),
2385                                        &unmap_icm );
2386         }
2387         hermon_cmd_unmap_icm_aux ( hermon );
2388         ufree ( hermon->icm );
2389         hermon->icm = UNULL;
2390 }
2391
2392 /***************************************************************************
2393  *
2394  * PCI interface
2395  *
2396  ***************************************************************************
2397  */
2398
2399 /**
2400  * Set up memory protection table
2401  *
2402  * @v hermon            Hermon device
2403  * @ret rc              Return status code
2404  */
2405 static int hermon_setup_mpt ( struct hermon *hermon ) {
2406         struct hermonprm_mpt mpt;
2407         uint32_t key;
2408         int rc;
2409
2410         /* Derive key */
2411         key = ( hermon->cap.reserved_mrws | HERMON_MKEY_PREFIX );
2412         hermon->lkey = ( ( key << 8 ) | ( key >> 24 ) );
2413
2414         /* Initialise memory protection table */
2415         memset ( &mpt, 0, sizeof ( mpt ) );
2416         MLX_FILL_7 ( &mpt, 0,
2417                      atomic, 1,
2418                      rw, 1,
2419                      rr, 1,
2420                      lw, 1,
2421                      lr, 1,
2422                      pa, 1,
2423                      r_w, 1 );
2424         MLX_FILL_1 ( &mpt, 2, mem_key, key );
2425         MLX_FILL_1 ( &mpt, 3,
2426                      pd, HERMON_GLOBAL_PD );
2427         MLX_FILL_1 ( &mpt, 10, len64, 1 );
2428         if ( ( rc = hermon_cmd_sw2hw_mpt ( hermon,
2429                                            hermon->cap.reserved_mrws,
2430                                            &mpt ) ) != 0 ) {
2431                 DBGC ( hermon, "Hermon %p could not set up MPT: %s\n",
2432                        hermon, strerror ( rc ) );
2433                 return rc;
2434         }
2435
2436         return 0;
2437 }
2438
2439 /**
2440  * Configure special queue pairs
2441  *
2442  * @v hermon            Hermon device
2443  * @ret rc              Return status code
2444  */
2445 static int hermon_configure_special_qps ( struct hermon *hermon ) {
2446         int rc;
2447
2448         /* Special QP block must be aligned on its own size */
2449         hermon->special_qpn_base = ( ( HERMON_QPN_BASE +
2450                                        hermon->cap.reserved_qps +
2451                                        HERMON_NUM_SPECIAL_QPS - 1 )
2452                                      & ~( HERMON_NUM_SPECIAL_QPS - 1 ) );
2453         hermon->qpn_base = ( hermon->special_qpn_base +
2454                              HERMON_NUM_SPECIAL_QPS );
2455         DBGC ( hermon, "Hermon %p special QPs at [%lx,%lx]\n", hermon,
2456                hermon->special_qpn_base, ( hermon->qpn_base - 1 ) );
2457
2458         /* Issue command to configure special QPs */
2459         if ( ( rc = hermon_cmd_conf_special_qp ( hermon, 0x00,
2460                                           hermon->special_qpn_base ) ) != 0 ) {
2461                 DBGC ( hermon, "Hermon %p could not configure special QPs: "
2462                        "%s\n", hermon, strerror ( rc ) );
2463                 return rc;
2464         }
2465
2466         return 0;
2467 }
2468
2469 /**
2470  * Probe PCI device
2471  *
2472  * @v pci               PCI device
2473  * @v id                PCI ID
2474  * @ret rc              Return status code
2475  */
2476 static int hermon_probe ( struct pci_device *pci,
2477                           const struct pci_device_id *id __unused ) {
2478         struct hermon *hermon;
2479         struct ib_device *ibdev;
2480         struct hermonprm_init_hca init_hca;
2481         int i;
2482         int rc;
2483
2484         /* Allocate Hermon device */
2485         hermon = zalloc ( sizeof ( *hermon ) );
2486         if ( ! hermon ) {
2487                 rc = -ENOMEM;
2488                 goto err_alloc_hermon;
2489         }
2490         pci_set_drvdata ( pci, hermon );
2491
2492         /* Allocate Infiniband devices */
2493         for ( i = 0 ; i < HERMON_NUM_PORTS ; i++ ) {
2494                 ibdev = alloc_ibdev ( 0 );
2495                 if ( ! ibdev ) {
2496                         rc = -ENOMEM;
2497                         goto err_alloc_ibdev;
2498                 }
2499                 hermon->ibdev[i] = ibdev;
2500                 ibdev->op = &hermon_ib_operations;
2501                 ibdev->dev = &pci->dev;
2502                 ibdev->port = ( HERMON_PORT_BASE + i );
2503                 ib_set_drvdata ( ibdev, hermon );
2504         }
2505
2506         /* Fix up PCI device */
2507         adjust_pci_device ( pci );
2508
2509         /* Get PCI BARs */
2510         hermon->config = ioremap ( pci_bar_start ( pci, HERMON_PCI_CONFIG_BAR),
2511                                    HERMON_PCI_CONFIG_BAR_SIZE );
2512         hermon->uar = ioremap ( pci_bar_start ( pci, HERMON_PCI_UAR_BAR ),
2513                                 HERMON_UAR_NON_EQ_PAGE * HERMON_PAGE_SIZE );
2514
2515         /* Allocate space for mailboxes */
2516         hermon->mailbox_in = malloc_dma ( HERMON_MBOX_SIZE,
2517                                           HERMON_MBOX_ALIGN );
2518         if ( ! hermon->mailbox_in ) {
2519                 rc = -ENOMEM;
2520                 goto err_mailbox_in;
2521         }
2522         hermon->mailbox_out = malloc_dma ( HERMON_MBOX_SIZE,
2523                                            HERMON_MBOX_ALIGN );
2524         if ( ! hermon->mailbox_out ) {
2525                 rc = -ENOMEM;
2526                 goto err_mailbox_out;
2527         }
2528
2529         /* Start firmware */
2530         if ( ( rc = hermon_start_firmware ( hermon ) ) != 0 )
2531                 goto err_start_firmware;
2532
2533         /* Get device limits */
2534         if ( ( rc = hermon_get_cap ( hermon ) ) != 0 )
2535                 goto err_get_cap;
2536
2537         /* Allocate ICM */
2538         memset ( &init_hca, 0, sizeof ( init_hca ) );
2539         if ( ( rc = hermon_alloc_icm ( hermon, &init_hca ) ) != 0 )
2540                 goto err_alloc_icm;
2541
2542         /* Initialise HCA */
2543         MLX_FILL_1 ( &init_hca, 0, version, 0x02 /* "Must be 0x02" */ );
2544         MLX_FILL_1 ( &init_hca, 5, udp, 1 );
2545         MLX_FILL_1 ( &init_hca, 74, uar_parameters.log_max_uars, 8 );
2546         if ( ( rc = hermon_cmd_init_hca ( hermon, &init_hca ) ) != 0 ) {
2547                 DBGC ( hermon, "Hermon %p could not initialise HCA: %s\n",
2548                        hermon, strerror ( rc ) );
2549                 goto err_init_hca;
2550         }
2551
2552         /* Set up memory protection */
2553         if ( ( rc = hermon_setup_mpt ( hermon ) ) != 0 )
2554                 goto err_setup_mpt;
2555         for ( i = 0 ; i < HERMON_NUM_PORTS ; i++ )
2556                 hermon->ibdev[i]->rdma_key = hermon->lkey;
2557
2558         /* Set up event queue */
2559         if ( ( rc = hermon_create_eq ( hermon ) ) != 0 )
2560                 goto err_create_eq;
2561
2562         /* Configure special QPs */
2563         if ( ( rc = hermon_configure_special_qps ( hermon ) ) != 0 )
2564                 goto err_conf_special_qps;
2565
2566         /* Update MAD parameters */
2567         for ( i = 0 ; i < HERMON_NUM_PORTS ; i++ )
2568                 ib_smc_update ( hermon->ibdev[i], hermon_mad );
2569
2570         /* Register Infiniband devices */
2571         for ( i = 0 ; i < HERMON_NUM_PORTS ; i++ ) {
2572                 if ( ( rc = register_ibdev ( hermon->ibdev[i] ) ) != 0 ) {
2573                         DBGC ( hermon, "Hermon %p could not register IB "
2574                                "device: %s\n", hermon, strerror ( rc ) );
2575                         goto err_register_ibdev;
2576                 }
2577         }
2578
2579         return 0;
2580
2581         i = HERMON_NUM_PORTS;
2582  err_register_ibdev:
2583         for ( i-- ; i >= 0 ; i-- )
2584                 unregister_ibdev ( hermon->ibdev[i] );
2585  err_conf_special_qps:
2586         hermon_destroy_eq ( hermon );
2587  err_create_eq:
2588  err_setup_mpt:
2589         hermon_cmd_close_hca ( hermon );
2590  err_init_hca:
2591         hermon_free_icm ( hermon );
2592  err_alloc_icm:
2593  err_get_cap:
2594         hermon_stop_firmware ( hermon );
2595  err_start_firmware:
2596         free_dma ( hermon->mailbox_out, HERMON_MBOX_SIZE );
2597  err_mailbox_out:
2598         free_dma ( hermon->mailbox_in, HERMON_MBOX_SIZE );
2599  err_mailbox_in:
2600         i = HERMON_NUM_PORTS;
2601  err_alloc_ibdev:
2602         for ( i-- ; i >= 0 ; i-- )
2603                 ibdev_put ( hermon->ibdev[i] );
2604         free ( hermon );
2605  err_alloc_hermon:
2606         return rc;
2607 }
2608
2609 /**
2610  * Remove PCI device
2611  *
2612  * @v pci               PCI device
2613  */
2614 static void hermon_remove ( struct pci_device *pci ) {
2615         struct hermon *hermon = pci_get_drvdata ( pci );
2616         int i;
2617
2618         for ( i = ( HERMON_NUM_PORTS - 1 ) ; i >= 0 ; i-- )
2619                 unregister_ibdev ( hermon->ibdev[i] );
2620         hermon_destroy_eq ( hermon );
2621         hermon_cmd_close_hca ( hermon );
2622         hermon_free_icm ( hermon );
2623         hermon_stop_firmware ( hermon );
2624         hermon_stop_firmware ( hermon );
2625         free_dma ( hermon->mailbox_out, HERMON_MBOX_SIZE );
2626         free_dma ( hermon->mailbox_in, HERMON_MBOX_SIZE );
2627         for ( i = ( HERMON_NUM_PORTS - 1 ) ; i >= 0 ; i-- )
2628                 ibdev_put ( hermon->ibdev[i] );
2629         free ( hermon );
2630 }
2631
2632 static struct pci_device_id hermon_nics[] = {
2633         PCI_ROM ( 0x15b3, 0x6340, "mt25408", "MT25408 HCA driver", 0 ),
2634         PCI_ROM ( 0x15b3, 0x634a, "mt25418", "MT25418 HCA driver", 0 ),
2635         PCI_ROM ( 0x15b3, 0x6732, "mt26418", "MT26418 HCA driver", 0 ),
2636         PCI_ROM ( 0x15b3, 0x673c, "mt26428", "MT26428 HCA driver", 0 ),
2637 };
2638
2639 struct pci_driver hermon_driver __pci_driver = {
2640         .ids = hermon_nics,
2641         .id_count = ( sizeof ( hermon_nics ) / sizeof ( hermon_nics[0] ) ),
2642         .probe = hermon_probe,
2643         .remove = hermon_remove,
2644 };