llvm · JerryShih · May 6, 2024 · banach-space · Jul 5, 2024 · ftynse
@@ -1336,7 +1336,7 @@ structured_op: !LinalgStructuredOpConfig
     name: C
     kind: output_tensor
     type_var: U
-    shape_map: affine_map<()[s0, s1, s2] -> (s2, s1)>
+    shape_map: affine_map<()[s0, s1, s2] -> (s1, s2)>
 shape_map: affine_map<()[s0, s1, s2] -> (s0, s2)> 
 shape_map: affine_map<()[s0, s1, s2] -> (s0, s2)> 
 // CHECK-LABEL: func @matmul_transpose_a 
 //       CHECK:   linalg.matmul_transpose_a 
 //  CHECK-SAME:     ins(%{{.+}}, %{{.+}} : memref<5x3xf32>, memref<5x7xf32>) 
 //  CHECK-SAME:     outs(%{{.+}} : memref<3x7xf32>) 
 func.func @matmul_transpose_a(%arg0: memref<5x3xf32>, %arg1: memref<5x7xf32>, %arg2: memref<3x7xf32>) { 
   linalg.matmul_transpose_a ins(%arg0, %arg1 : memref<5x3xf32>, memref<5x7xf32>) outs(%arg2: memref<3x7xf32>) 
   return 
 } 
 // Generating the getIndexingMaps() method. 
 indexing_maps: !LinalgIndexingMapsConfig 
   static_indexing_maps: 
   - affine_map<(d0, d1, d2)[s0, s1, s2] -> (d0, d2)> 
   - affine_map<(d0, d1, d2)[s0, s1, s2] -> (d2, d1)> 
   - affine_map<(d0, d1, d2)[s0, s1, s2] -> (d0, d1)> 
 args: 
 - !LinalgOperandDefConfig 
   name: A 
   kind: input_tensor 
   type_var: T1 
   shape_map: affine_map<()[s0, s1, s2] -> (s0, s1)> 
 - !LinalgOperandDefConfig 
   name: B 
   kind: input_tensor 
   type_var: T2 
   shape_map: affine_map<()[s0, s1, s2] -> (s1, s2)> 
 - !LinalgOperandDefConfig 
   name: C 
   kind: output_tensor 
   type_var: U 
   shape_map: affine_map<()[s0, s1, s2] -> (s0, s2)> 
 - !LinalgOperandDefConfig 
   name: cast 
   kind: type_fn_attr 
   default_fn: cast_signed 
 shape_map: affine_map<()[s0, s1, s2] -> (s0, s2)> 
 shape_map: affine_map<()[s0, s1, s2] -> (s0, s2)> 
 // CHECK-LABEL: func @matmul_transpose_a 
 //       CHECK:   linalg.matmul_transpose_a 
 //  CHECK-SAME:     ins(%{{.+}}, %{{.+}} : memref<5x3xf32>, memref<5x7xf32>) 
 //  CHECK-SAME:     outs(%{{.+}} : memref<3x7xf32>) 
 func.func @matmul_transpose_a(%arg0: memref<5x3xf32>, %arg1: memref<5x7xf32>, %arg2: memref<3x7xf32>) { 
   linalg.matmul_transpose_a ins(%arg0, %arg1 : memref<5x3xf32>, memref<5x7xf32>) outs(%arg2: memref<3x7xf32>) 
   return 
 } 
 // Generating the getIndexingMaps() method. 
 indexing_maps: !LinalgIndexingMapsConfig 
   static_indexing_maps: 
   - affine_map<(d0, d1, d2)[s0, s1, s2] -> (d0, d2)> 
   - affine_map<(d0, d1, d2)[s0, s1, s2] -> (d2, d1)> 
   - affine_map<(d0, d1, d2)[s0, s1, s2] -> (d0, d1)> 
 args: 
 - !LinalgOperandDefConfig 
   name: A 
   kind: input_tensor 
   type_var: T1 
   shape_map: affine_map<()[s0, s1, s2] -> (s0, s1)> 
 - !LinalgOperandDefConfig 
   name: B 
   kind: input_tensor 
   type_var: T2 
   shape_map: affine_map<()[s0, s1, s2] -> (s1, s2)> 
 - !LinalgOperandDefConfig 
   name: C 
   kind: output_tensor 
   type_var: U 
   shape_map: affine_map<()[s0, s1, s2] -> (s0, s2)> 
 - !LinalgOperandDefConfig 
   name: cast 
   kind: type_fn_attr 
   default_fn: cast_signed 
   - !LinalgOperandDefConfig
     name: cast
     kind: type_fn_attr

@@ -429,8 +429,8 @@ def quantized_matmul(
 
 @linalg_structured_op
 def matmul_transpose_a(
-    A=TensorDef(T1, S.K, S.N),
-    B=TensorDef(T2, S.K, S.M),
+    A=TensorDef(T1, S.K, S.M),
+    B=TensorDef(T2, S.K, S.N),
     C=TensorDef(U, S.M, S.N, output=True),
     cast=TypeFnAttrDef(default=TypeFn.cast_signed),
 ):