@@ -70,15 +70,15 @@ var default_GPU_schedules = {
70
70
} ,
71
71
{
72
72
command : "split" ,
73
- parameters : [ "fpos" , "block" , "fpos1" , 2048 ]
73
+ parameters : [ "fpos" , "block" , "fpos1" , 3584 ]
74
74
} ,
75
75
{
76
76
command : "split" ,
77
- parameters : [ "fpos1" , "warp" , "fpos2" , 256 ]
77
+ parameters : [ "fpos1" , "warp" , "fpos2" , 224 ]
78
78
} ,
79
79
{
80
80
command : "split" ,
81
- parameters : [ "fpos2" , "thread" , "thr_nz" , 8 ]
81
+ parameters : [ "fpos2" , "thread" , "thr_nz" , 7 ]
82
82
} ,
83
83
{
84
84
command : "reorder" ,
@@ -90,7 +90,7 @@ var default_GPU_schedules = {
90
90
} ,
91
91
{
92
92
command : "unroll" ,
93
- parameters : [ "thr_nz_pre" , 8 ]
93
+ parameters : [ "thr_nz_pre" , 7 ]
94
94
} ,
95
95
{
96
96
command : "parallelize" ,
@@ -121,15 +121,15 @@ var default_GPU_schedules = {
121
121
} ,
122
122
{
123
123
command : "split" ,
124
- parameters : [ "fpos" , "block" , "fpos1" , 2048 ]
124
+ parameters : [ "fpos" , "block" , "fpos1" , 256 ]
125
125
} ,
126
126
{
127
127
command : "split" ,
128
- parameters : [ "fpos1" , "warp" , "fpos2" , 256 ]
128
+ parameters : [ "fpos1" , "warp" , "fpos2" , 16 ]
129
129
} ,
130
130
{
131
131
command : "split" ,
132
- parameters : [ "fpos2" , "thread" , "thr_nz" , 8 ]
132
+ parameters : [ "fpos2" , "thread" , "thr_nz" , 1 ]
133
133
} ,
134
134
{
135
135
command : "reorder" ,
@@ -141,7 +141,7 @@ var default_GPU_schedules = {
141
141
} ,
142
142
{
143
143
command : "unroll" ,
144
- parameters : [ "thr_nz_pre" , 8 ]
144
+ parameters : [ "thr_nz_pre" , 1 ]
145
145
} ,
146
146
{
147
147
command : "parallelize" ,
@@ -175,11 +175,11 @@ var default_GPU_schedules = {
175
175
} ,
176
176
{
177
177
command : "split" ,
178
- parameters : [ "fpos" , "block" , "fpos1" , 128 ]
178
+ parameters : [ "fpos" , "block" , "fpos1" , 64 ]
179
179
} ,
180
180
{
181
181
command : "split" ,
182
- parameters : [ "fpos1" , "warp" , "nnz" , 16 ]
182
+ parameters : [ "fpos1" , "warp" , "nnz" , 4 ]
183
183
} ,
184
184
{
185
185
command : "split" ,
0 commit comments