Home My Page Projects Code Snippets Project Openings diderot
Summary Activity Tracker Tasks SCM

SCM Repository

[diderot] Annotation of /branches/pure-cfg/src/compiler/cl-target/cl-target.sml
ViewVC logotype

Annotation of /branches/pure-cfg/src/compiler/cl-target/cl-target.sml

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1278 - (view) (download)

1 : lamonts 1244 (* c-target.sml
2 :     *
3 :     * COPYRIGHT (c) 2011 The Diderot Project (http://diderot-language.cs.uchicago.edu)
4 :     * All rights reserved.
5 :     *)
6 :    
7 :     structure CLTarget : TARGET =
8 :     struct
9 :    
10 :     structure IL = TreeIL
11 :     structure V = IL.Var
12 :     structure Ty = IL.Ty
13 :     structure CL = CLang
14 :     structure RN = RuntimeNames
15 : jhr 1273 structure ToCL = TreeToCL
16 : lamonts 1244
17 : jhr 1273 type var = ToCL.var
18 : lamonts 1244 type exp = CL.exp
19 :     type stm = CL.stm
20 :    
21 :     datatype strand = Strand of {
22 : jhr 1261 name : string,
23 :     tyName : string,
24 :     state : var list ref,
25 :     output : (Ty.ty * CL.var) option ref, (* the strand's output variable (only one for now) *)
26 : lamonts 1271 code : CL.decl list ref,
27 : jhr 1273 init_code: CL.decl ref
28 : lamonts 1244 }
29 :    
30 :     datatype program = Prog of {
31 : jhr 1278 name : string, (* stem of source file *)
32 : jhr 1261 double : bool, (* true for double-precision support *)
33 :     parallel : bool, (* true for multithreaded (or multi-GPU) target *)
34 :     debug : bool, (* true for debug support in executable *)
35 :     globals : CL.decl list ref,
36 :     topDecls : CL.decl list ref,
37 :     strands : strand AtomTable.hash_table,
38 :     initially : CL.stm list ref,
39 : jhr 1273 numDims: int ref,
40 :     imgGlobals: (string * int) list ref,
41 :     prFn: CL.decl ref
42 :     }
43 : lamonts 1244
44 :     datatype env = ENV of {
45 : jhr 1261 info : env_info,
46 :     vMap : var V.Map.map,
47 :     scope : scope
48 : lamonts 1244 }
49 :    
50 :     and env_info = INFO of {
51 : jhr 1261 prog : program
52 : lamonts 1244 }
53 :    
54 :     and scope
55 :     = NoScope
56 :     | GlobalScope
57 :     | InitiallyScope
58 : jhr 1261 | StrandScope of TreeIL.var list (* strand initialization *)
59 :     | MethodScope of TreeIL.var list (* method body; vars are state variables *)
60 : lamonts 1244
61 : jhr 1273 (* the supprted widths of vectors of reals on the target. *)
62 :     (* FIXME: for OpenCL 1.1, 3 is also valid *)
63 :     fun vectorWidths () = [2, 4, 8, 16]
64 : lamonts 1244
65 :     (* tests for whether various expression forms can appear inline *)
66 : jhr 1261 fun inlineCons n = (n < 2) (* vectors are inline, but not matrices *)
67 :     val inlineMatrixExp = false (* can matrix-valued expressions appear inline? *)
68 : lamonts 1244
69 :     (* TreeIL to target translations *)
70 :     structure Tr =
71 :     struct
72 : jhr 1261 fun fragment (ENV{info, vMap, scope}, blk) = let
73 : jhr 1273 val (vMap, stms) = ToCL.trFragment (vMap, blk)
74 : jhr 1261 in
75 :     (ENV{info=info, vMap=vMap, scope=scope}, stms)
76 :     end
77 :     fun saveState cxt stateVars (env, args, stm) = (
78 :     ListPair.foldrEq
79 : jhr 1273 (fn (x, e, stms) => ToCL.trAssign(env, x, e)@stms)
80 : jhr 1261 [stm]
81 :     (stateVars, args)
82 :     ) handle ListPair.UnequalLengths => (
83 :     print(concat["saveState ", cxt, ": length mismatch; ", Int.toString(List.length args), " args\n"]);
84 :     raise Fail(concat["saveState ", cxt, ": length mismatch"]))
85 :     fun block (ENV{vMap, scope, ...}, blk) = (case scope
86 : jhr 1273 of StrandScope stateVars => ToCL.trBlock (vMap, saveState "StrandScope" stateVars, blk)
87 :     | MethodScope stateVars => ToCL.trBlock (vMap, saveState "MethodScope" stateVars, blk)
88 :     | _ => ToCL.trBlock (vMap, fn (_, _, stm) => [stm], blk)
89 : jhr 1261 (* end case *))
90 : jhr 1273 fun exp (ENV{vMap, ...}, e) = ToCL.trExp(vMap, e)
91 : lamonts 1244 end
92 :    
93 :     (* variables *)
94 :     structure Var =
95 :     struct
96 : jhr 1273 fun name (ToCL.V(_, name)) = name
97 : jhr 1278 fun global (Prog{globals, imgGlobals, ...}, name, ty) = let
98 : jhr 1273 val ty' = ToCL.trType ty
99 : jhr 1261 fun isImgGlobal (imgGlobals, Ty.ImageTy(ImageInfo.ImgInfo{dim, ...}), name) = imgGlobals := (name,dim):: !imgGlobals
100 :     | isImgGlobal (imgGlobals, _, _) = ()
101 :     in
102 :     globals := CL.D_Var([], ty', name, NONE) :: !globals;
103 :     isImgGlobal(imgGlobals,ty,name);
104 : jhr 1273 ToCL.V(ty', name)
105 : jhr 1261 end
106 : jhr 1273 fun param x = ToCL.V(ToCL.trType(V.ty x), V.name x)
107 : jhr 1261 fun state (Strand{state, ...}, x) = let
108 : jhr 1273 val ty' = ToCL.trType(V.ty x)
109 :     val x' = ToCL.V(ty', V.name x)
110 : jhr 1261 in
111 :     state := x' :: !state;
112 :     x'
113 :     end
114 : lamonts 1244 end
115 :    
116 :     (* environments *)
117 :     structure Env =
118 :     struct
119 :     (* create a new environment *)
120 : jhr 1261 fun new prog = ENV{
121 :     info=INFO{prog = prog},
122 :     vMap = V.Map.empty,
123 :     scope = NoScope
124 :     }
125 : lamonts 1244 (* define the current translation context *)
126 : jhr 1261 fun setScope scope (ENV{info, vMap, ...}) = ENV{info=info, vMap=vMap, scope=scope}
127 :     val scopeGlobal = setScope GlobalScope
128 :     val scopeInitially = setScope InitiallyScope
129 :     fun scopeStrand (env, svars) = setScope (StrandScope svars) env
130 :     fun scopeMethod (env, svars) = setScope (MethodScope svars) env
131 : lamonts 1244 (* bind a TreeIL varaiable to a target variable *)
132 : jhr 1261 fun bind (ENV{info, vMap, scope}, x, x') = ENV{
133 :     info = info,
134 :     vMap = V.Map.insert(vMap, x, x'),
135 :     scope = scope
136 :     }
137 : lamonts 1244 end
138 :    
139 :     (* programs *)
140 :     structure Program =
141 :     struct
142 : jhr 1278 fun new {name, double, parallel, debug} = (
143 : jhr 1261 RN.initTargetSpec double;
144 :     Prog{
145 : jhr 1278 name = name,
146 : jhr 1261 double = double, parallel = parallel, debug = debug,
147 : lamonts 1271 globals = ref [],
148 : jhr 1261 topDecls = ref [],
149 :     strands = AtomTable.mkTable (16, Fail "strand table"),
150 :     initially = ref([CL.S_Comment["missing initially"]]),
151 : lamonts 1264 numDims = ref(0),
152 :     imgGlobals = ref[],
153 :     prFn = ref(CL.D_Comment(["No Print Function"]))
154 : jhr 1261 })
155 : lamonts 1244 (* register the global initialization part of a program *)
156 : lamonts 1264 fun globalIndirects (globals,stms) = let
157 : jhr 1278 fun getGlobals(CL.D_Var(_,_,globalVar,_)::rest) = CL.mkAssign(CL.mkIndirect(CL.mkVar RN.globalsVarName,globalVar),CL.mkVar globalVar)::getGlobals(rest)
158 : jhr 1273 | getGlobals([]) = []
159 :     | getGlobals(_::rest) = getGlobals(rest)
160 :     in
161 :     stms @ getGlobals(globals)
162 :     end
163 : jhr 1261
164 :     (* register the code that is used to register command-line options for input variables *)
165 :     fun inputs (Prog{topDecls, ...}, stm) = let
166 :     val inputsFn = CL.D_Func(
167 :     [], CL.voidTy, RN.registerOpts,
168 :     [CL.PARAM([], CL.T_Ptr(CL.T_Named RN.optionsTy), "opts")],
169 :     stm)
170 :     in
171 :     topDecls := inputsFn :: !topDecls
172 :     end
173 :    
174 : jhr 1278 fun init (Prog{globals, topDecls,...}, CL.S_Block(init)) = let
175 : jhr 1261 val params = [
176 : jhr 1273 CL.PARAM([], CL.T_Ptr(CL.T_Named RN.globalsTy), RN.globalsVarName)
177 :     ]
178 : jhr 1261 val body = CL.S_Block(globalIndirects(!globals,init))
179 :     val initFn = CL.D_Func([], CL.voidTy, RN.initGlobals, params, body)
180 :     in
181 :     topDecls := initFn :: !topDecls
182 :     end
183 :     | init (Prog{globals,topDecls,...}, init) = let
184 :     val params = [
185 : jhr 1273 CL.PARAM([], CL.T_Ptr(CL.T_Named RN.globalsTy), RN.globalsVarName)
186 :     ]
187 : jhr 1261 val initFn = CL.D_Func([], CL.voidTy, RN.initGlobals, params, init)
188 :     in
189 :     topDecls := initFn :: !topDecls
190 :     end
191 :    
192 : lamonts 1244 (* create and register the initially function for a program *)
193 : jhr 1261 fun initially {
194 : jhr 1278 prog = Prog{strands, initially, numDims,...},
195 : jhr 1261 isArray : bool,
196 :     iterPrefix : stm list,
197 :     iters : (var * exp * exp) list,
198 :     createPrefix : stm list,
199 :     strand : Atom.atom,
200 :     args : exp list
201 :     } = let
202 :     val name = Atom.toString strand
203 :     val nDims = List.length iters
204 :     fun mapi f xs = let
205 :     fun mapf (_, []) = []
206 :     | mapf (i, x::xs) = f(i, x) :: mapf(i+1, xs)
207 :     in
208 :     mapf (0, xs)
209 :     end
210 :     val baseInit = mapi (fn (i, (_, e, _)) => (i, CL.I_Exp e)) iters
211 :     val sizeInit = mapi
212 : jhr 1273 (fn (i, (ToCL.V(ty, _), lo, hi)) =>
213 : jhr 1278 (i, CL.I_Exp(CL.mkBinOp(CL.mkBinOp(hi, CL.#-, lo), CL.#+, CL.mkInt(1, ty))))
214 : jhr 1261 ) iters
215 :     val numStrandsVar = "numStrandsVar"
216 :     val allocCode = iterPrefix @ [
217 :     CL.mkComment["allocate initial block of strands"],
218 :     CL.mkDecl(CL.T_Array(CL.int32, SOME nDims), "base", SOME(CL.I_Array baseInit)),
219 :     CL.mkDecl(CL.T_Array(CL.uint32, SOME nDims), "size", SOME(CL.I_Array sizeInit)),
220 : jhr 1278 CL.mkDecl(CL.int32,"numDims",SOME(CL.I_Exp(CL.mkInt(IntInf.fromInt nDims, CL.int32))))
221 : jhr 1273 ]
222 : jhr 1278 val numStrandsLoopBody = CL.mkExpStm(CL.mkAssignOp(CL.mkVar numStrandsVar, CL.*=,CL.mkSubscript(CL.mkVar "size",CL.mkVar "i")))
223 :     val numStrandsLoop = CL.mkFor([(CL.intTy, "i", CL.mkInt(0,CL.intTy))],
224 :     CL.mkBinOp(CL.mkVar "i", CL.#<, CL.mkVar "numDims"),
225 :     [CL.mkPostOp(CL.mkVar "i", CL.^++)], numStrandsLoopBody)
226 : jhr 1273 in
227 :     numDims := nDims;
228 :     initially := allocCode @ [numStrandsLoop]
229 :     end
230 : lamonts 1256
231 :    
232 : lamonts 1244 (***** OUTPUT *****)
233 : jhr 1278 fun genStrandInit(Strand{name,tyName,state,output,code,...},nDims) = let
234 :     val params = [
235 :     CL.PARAM([], CL.T_Ptr(CL.uint32), "sizes" ),
236 :     CL.PARAM([], CL.intTy, "width"),
237 :     CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "strands")
238 :     ]
239 :     val body = let
240 :     fun loopParams 3 = ["x", "y", "k"]
241 :     | loopParams 2 = ["x", "y"]
242 :     | loopParams 1 = ["x"]
243 :     | loopParams _ = raise Fail "genStrandInit: missing size dim"
244 :     fun mkLoopNest ([], _, nDims) = if nDims = 1
245 :     then CL.mkBlock [
246 :     CL.mkCall(RN.strandInit name, [
247 :     CL.mkUnOp(CL.%&,CL.mkSubscript(CL.mkVar "strands",CL.mkStr "x")),
248 :     CL.mkVar "x"])
249 :     ]
250 : lamonts 1271 else let
251 : jhr 1278 val index = CL.mkBinOp(CL.mkBinOp(CL.mkVar "x",CL.#*,CL.mkVar "width"),CL.#+,CL.mkVar "y")
252 : lamonts 1271 in
253 : jhr 1278 CL.mkBlock([CL.mkCall(RN.strandInit name, [CL.mkUnOp(CL.%&,CL.mkSubscript(CL.mkVar "strands",index)),
254 :     CL.mkVar "x", CL.mkVar"y"])])
255 : lamonts 1271 end
256 :    
257 :     | mkLoopNest (param::rest,count,nDims) = let
258 :     val body = mkLoopNest (rest, count + 1,nDims)
259 :     in
260 :     CL.mkFor(
261 : jhr 1278 [(CL.intTy, param, CL.mkInt(0,CL.intTy))],
262 :     CL.mkBinOp(CL.mkVar param, CL.#<, CL.mkSubscript(CL.mkVar "sizes",CL.mkInt(count,CL.intTy))),
263 :     [CL.mkPostOp(CL.mkVar param, CL.^++)],
264 : lamonts 1271 body)
265 :     end
266 :     in
267 :     [mkLoopNest ((loopParams nDims),0,nDims)]
268 :     end
269 :     in
270 :     CL.D_Func(["static"], CL.voidTy, RN.strandInitSetup, params,CL.mkBlock(body))
271 :     end
272 :     fun genStrandPrint (Strand{name, tyName, state, output, code,...},nDims) = let
273 : lamonts 1264 (* the print function *)
274 :     val prFnName = concat[name, "_print"]
275 :    
276 :     val prFn = let
277 :     val params = [
278 :     CL.PARAM([], CL.T_Ptr(CL.T_Named "FILE"), "outS"),
279 : lamonts 1271 CL.PARAM([], CL.T_Ptr(CL.uint32), "sizes" ),
280 : lamonts 1264 CL.PARAM([], CL.intTy, "width"),
281 :     CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "self")
282 :     ]
283 :    
284 :     val SOME(ty, x) = !output
285 :     val outState = if nDims = 1 then
286 : jhr 1278 CL.mkSelect(CL.mkSubscript(CL.mkVar "self",CL.mkVar "x"), x)
287 : lamonts 1264 else if nDims = 2 then
288 :     CL.mkSelect(CL.mkSubscript(CL.mkVar "self",
289 : jhr 1278 CL.mkBinOp(CL.mkBinOp(CL.mkVar "x",CL.#*,CL.mkVar "width"),CL.#+,CL.mkVar "y")), x)
290 : lamonts 1264
291 :     else CL.mkSelect(CL.mkVar "self",x)
292 :    
293 :     val prArgs = (case ty
294 : jhr 1278 of Ty.IVecTy 1 => [CL.mkStr(!RN.gIntFormat ^ "\n"), outState]
295 : lamonts 1264 | Ty.IVecTy d => let
296 : jhr 1278 val fmt = CL.mkStr(
297 : lamonts 1264 String.concatWith " " (List.tabulate(d, fn _ => !RN.gIntFormat))
298 :     ^ "\n")
299 : jhr 1273 val args = List.tabulate (d, fn i => ToCL.vecIndex(outState, i))
300 : lamonts 1264 in
301 :     fmt :: args
302 :     end
303 : jhr 1278 | Ty.TensorTy[] => [CL.mkStr "%f\n", outState]
304 : lamonts 1264 | Ty.TensorTy[d] => let
305 : jhr 1278 val fmt = CL.mkStr(
306 : lamonts 1264 String.concatWith " " (List.tabulate(d, fn _ => "%f"))
307 :     ^ "\n")
308 : jhr 1273 val args = List.tabulate (d, fn i => ToCL.vecIndex(outState, i))
309 : lamonts 1264 in
310 :     fmt :: args
311 :     end
312 :     | _ => raise Fail("genStrand: unsupported output type " ^ Ty.toString ty)
313 :     (* end case *))
314 :    
315 :     val body = let
316 :    
317 :     fun loopParams (3) =
318 :     "x"::"y"::"k"::[]
319 :     | loopParams (2) =
320 :     "x"::"y"::[]
321 :     | loopParams (1) =
322 :     "x"::[]
323 :     | loopParams (_) =
324 :     raise Fail("genStrandPrint: unsupported output type " ^ Ty.toString ty)
325 :    
326 :     fun mkLoopNest ([],_) =
327 :     CL.mkCall("fprintf", CL.mkVar "outS" :: prArgs)
328 :     | mkLoopNest (param::rest,count) = let
329 :     val body = mkLoopNest (rest, count + 1)
330 :     in
331 :     CL.mkFor(
332 : jhr 1278 [(CL.intTy, param, CL.mkInt(0,CL.intTy))],
333 :     CL.mkBinOp(CL.mkVar param, CL.#<, CL.mkSubscript(CL.mkVar "sizes",CL.mkInt(count,CL.intTy))),
334 :     [CL.mkPostOp(CL.mkVar param, CL.^++)],
335 : lamonts 1264 body)
336 :     end
337 :     in
338 :     [mkLoopNest ((loopParams nDims),0)]
339 :     end
340 :    
341 :     in
342 :     CL.D_Func(["static"], CL.voidTy, prFnName, params,CL.mkBlock(body))
343 :     end
344 :     in
345 :     prFn
346 :     end
347 : jhr 1261 fun genStrandTyDef (Strand{tyName, state,...}) =
348 :     (* the type declaration for the strand's state struct *)
349 :     CL.D_StructDef(
350 : jhr 1273 List.rev (List.map (fn ToCL.V(ty, x) => (ty, x)) (!state)),
351 : jhr 1261 tyName)
352 :    
353 :    
354 : lamonts 1264 (* generates the load kernel function *)
355 : jhr 1261 (* FIXME: this code might be part of the runtime system *)
356 : lamonts 1264 fun genKernelLoader() =
357 :     CL.D_Verbatim ( ["/* Loads the Kernel from a file */",
358 :     "char * loadKernel (const char * filename) {",
359 :     "struct stat statbuf;",
360 :     "FILE *fh;",
361 :     "char *source;",
362 :     "fh = fopen(filename, \"r\");",
363 :     "if (fh == 0)",
364 :     " return 0;",
365 :     "stat(filename, &statbuf);",
366 :     "source = (char *) malloc(statbuf.st_size + 1);",
367 :     "fread(source, statbuf.st_size, 1, fh);",
368 :     "fread(source, statbuf.st_size, 1, fh);",
369 :     "return source;",
370 :     "}"])
371 :     (* generates the opencl buffers for the image data *)
372 :     fun getGlobalDataBuffers(globals,count,contextVar,errVar) = let
373 :     val globalBufferDecl = CL.mkDecl(CL.clMemoryTy,concat[RN.globalsVarName,"_cl"],NONE)
374 : jhr 1278 val globalBuffer = CL.mkAssign(CL.mkVar(concat[RN.globalsVarName,"_cl"]), CL.mkApply("clCreateBuffer",
375 :     [CL.mkVar contextVar,
376 :     CL.mkVar "CL_MEM_COPY_HOST_PTR",
377 :     CL.mkApply("sizeof",[CL.mkVar RN.globalsTy]),
378 :     CL.mkVar RN.globalsVarName,
379 :     CL.mkUnOp(CL.%&,CL.mkVar errVar)]))
380 : jhr 1261
381 : lamonts 1264 fun genDataBuffers([],_,_,_) = []
382 :     | genDataBuffers((var,nDims)::globals,count,contextVar,errVar) = let
383 :     (* FIXME: use CL constructors to build expressions (not strings) *)
384 :     val size = if nDims = 1 then
385 : jhr 1278 CL.mkBinOp(CL.mkApply("sizeof",[CL.mkVar "float"]), CL.#*,
386 :     CL.mkIndirect(CL.mkVar var, "size[0]"))
387 : lamonts 1264 else if nDims = 2 then
388 : jhr 1278 CL.mkBinOp(CL.mkApply("sizeof",[CL.mkVar "float"]), CL.#*,
389 :     CL.mkIndirect(CL.mkVar var, concat["size[0]", " * ", var, "->size[1]"]))
390 : lamonts 1264 else
391 : jhr 1278 CL.mkBinOp(CL.mkApply("sizeof",[CL.mkVar "float"]), CL.#*,
392 :     CL.mkIndirect(CL.mkVar var,concat["size[0]", " * ", var, "->size[1] * ", var, "->size[2]"]))
393 : lamonts 1264
394 :     in
395 :     CL.mkDecl(CL.clMemoryTy,RN.addBufferSuffix var ,NONE)::
396 :     CL.mkDecl(CL.clMemoryTy,RN.addBufferSuffixData var ,NONE)::
397 : jhr 1278 CL.mkAssign(CL.mkVar(RN.addBufferSuffix var), CL.mkApply("clCreateBuffer",
398 :     [CL.mkVar contextVar,
399 :     CL.mkVar "CL_MEM_COPY_HOST_PTR",
400 :     CL.mkApply("sizeof",[CL.mkVar (RN.imageTy nDims)]),
401 :     CL.mkVar var,
402 :     CL.mkUnOp(CL.%&,CL.mkVar errVar)])) ::
403 :     CL.mkAssign(CL.mkVar(RN.addBufferSuffixData var), CL.mkApply("clCreateBuffer",
404 :     [CL.mkVar contextVar,
405 :     CL.mkVar "CL_MEM_COPY_HOST_PTR",
406 : lamonts 1264 size,
407 : jhr 1278 CL.mkIndirect(CL.mkVar var,"data"),
408 :     CL.mkUnOp(CL.%&,CL.mkVar errVar)])):: genDataBuffers(globals,count + 2,contextVar,errVar)
409 : lamonts 1264 end
410 :     in
411 :     [globalBufferDecl] @ [globalBuffer] @ genDataBuffers(globals,count + 2,contextVar,errVar)
412 :     end
413 :    
414 : jhr 1261
415 : lamonts 1264 (* generates the kernel arguments for the image data *)
416 :     fun genGlobalArguments(globals,count,kernelVar,errVar) = let
417 : jhr 1278 val globalArgument = CL.mkExpStm(CL.mkAssignOp(CL.mkVar errVar,CL.|=,CL.mkApply("clSetKernelArg",
418 :     [CL.mkVar kernelVar,
419 :     CL.mkInt(count,CL.intTy),
420 :     CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),
421 :     CL.mkUnOp(CL.%&,CL.mkVar(concat[RN.globalsVarName,"_cl"]))])))
422 : lamonts 1264
423 :     fun genDataArguments([],_,_,_) = []
424 :     | genDataArguments((var,nDims)::globals,count,kernelVar,errVar) =
425 :    
426 : jhr 1278 CL.mkExpStm(CL.mkAssignOp(CL.mkVar errVar,CL.|=, CL.mkApply("clSetKernelArg",
427 :     [CL.mkVar kernelVar,
428 :     CL.mkInt(count,CL.intTy),
429 :     CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),
430 :     CL.mkUnOp(CL.%&,CL.mkVar(RN.addBufferSuffix var))])))::
431 : lamonts 1264
432 : jhr 1278 CL.mkExpStm(CL.mkAssignOp(CL.mkVar errVar,CL.|=,CL.mkApply("clSetKernelArg",
433 :     [CL.mkVar kernelVar,
434 :     CL.mkInt((count + 1),CL.intTy),
435 :     CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),
436 :     CL.mkUnOp(CL.%&,CL.mkVar(RN.addBufferSuffixData var))]))):: genDataArguments (globals, count + 2,kernelVar,errVar)
437 : lamonts 1264
438 :     in
439 :    
440 :     [globalArgument] @ genDataArguments(globals,count + 1,kernelVar,errVar)
441 :    
442 :     end
443 :    
444 :     (* generates the main function of host code *)
445 :     fun genHostMain() = let
446 : jhr 1278 val setupCall = [CL.mkCall(RN.setupFName,[CL.mkVar RN.globalsVarName])]
447 : jhr 1273 val globalsDecl = CL.mkDecl(
448 :     CL.T_Ptr(CL.T_Named RN.globalsTy),
449 :     RN.globalsVarName,
450 : jhr 1278 SOME(CL.I_Exp(CL.mkApply("malloc", [CL.mkApply("sizeof",[CL.mkVar RN.globalsTy])]))))
451 :     val initGlobalsCall = CL.mkCall(RN.initGlobals,[CL.mkVar RN.globalsVarName])
452 :     val returnStm = [CL.mkReturn(SOME(CL.mkInt(0,CL.intTy)))]
453 : jhr 1273 val params = [
454 :     CL.PARAM([],CL.intTy, "argc"),
455 :     CL.PARAM([],CL.charArrayPtr,"argv")
456 :     ]
457 :     val body = CL.mkBlock([globalsDecl] @ [initGlobalsCall] @ setupCall @ returnStm)
458 :     in
459 :     CL.D_Func([],CL.intTy,"main",params,body)
460 :     end
461 : lamonts 1264
462 : jhr 1273 (* generates the host-side setup function *)
463 :     fun genHostSetupFunc (strand as Strand{name,tyName,...}, filename, nDims, initially, imgGlobals) = let
464 :     (* Delcare opencl setup objects *)
465 :     val programVar= "program"
466 :     val kernelVar = "kernel"
467 :     val cmdVar = "queue"
468 :     val inStateVar = "selfin"
469 :     val outStateVar = "selfout"
470 :     val stateSizeVar= "state_mem_size"
471 :     val clInstateVar = "clSelfIn"
472 :     val clOutStateVar = "clSelfOut"
473 :     val clGlobals = "clGlobals"
474 :     val sourcesVar = "sources"
475 :     val contextVar = "context"
476 :     val errVar = "err"
477 :     val imgDataSizeVar = "image_dataSize"
478 :     val globalVar = "global_work_size"
479 :     val localVar = "local_work_size"
480 :     val clFNVar = "filename"
481 :     val numStrandsVar = "numStrandsVar"
482 :     val headerFNVar = "header"
483 :     val deviceVar = "device"
484 :     val platformsVar = "platforms"
485 :     val numPlatformsVar = "num_platforms"
486 :     val numDevicesVar = "num_devices"
487 : jhr 1278 val assertStm = CL.mkCall("assert",[CL.mkBinOp(CL.mkVar errVar, CL.#==, CL.mkVar "CL_SUCCESS")])
488 : jhr 1273 val params = [
489 :     CL.PARAM([],CL.T_Named("cl_device_id"), deviceVar)
490 :     ]
491 :     val declarations = [
492 :     CL.mkDecl(CL.clProgramTy, programVar, NONE),
493 :     CL.mkDecl(CL.clKernelTy, kernelVar, NONE),
494 :     CL.mkDecl(CL.clCmdQueueTy, cmdVar, NONE),
495 :     CL.mkDecl(CL.clContextTy, contextVar, NONE),
496 :     CL.mkDecl(CL.intTy, errVar, NONE),
497 : jhr 1278 CL.mkDecl(CL.intTy, numStrandsVar, SOME(CL.I_Exp(CL.mkInt(1,CL.intTy)))),
498 : jhr 1273 CL.mkDecl(CL.intTy, stateSizeVar, NONE),
499 :     CL.mkDecl(CL.intTy, "width", NONE),
500 :     CL.mkDecl(CL.intTy, imgDataSizeVar, NONE),
501 :     (*CL.mkDecl(CL.clDeviceIdTy, deviceVar, NONE), *)
502 :     CL.mkDecl(CL.T_Ptr(CL.T_Named tyName), inStateVar,NONE),
503 :     CL.mkDecl(CL.clMemoryTy,clInstateVar,NONE),
504 :     CL.mkDecl(CL.clMemoryTy,clOutStateVar,NONE),
505 :     CL.mkDecl(CL.T_Ptr(CL.T_Named tyName), outStateVar,NONE),
506 : jhr 1278 CL.mkDecl(CL.charPtr, clFNVar,SOME(CL.I_Exp(CL.mkStr filename))),
507 : jhr 1273 (* FIXME: use Paths.diderotInclude *)
508 : jhr 1278 CL.mkDecl(CL.charPtr, headerFNVar,SOME(CL.I_Exp(CL.mkStr "../src/include/Diderot/cl-types.h"))),
509 : jhr 1273 CL.mkDecl(CL.T_Array(CL.charPtr,SOME(2)),sourcesVar,NONE),
510 :     CL.mkDecl(CL.T_Array(CL.T_Named "size_t",SOME(nDims)),globalVar,NONE),
511 :     CL.mkDecl(CL.T_Array(CL.T_Named "size_t",SOME(nDims)),localVar,NONE),
512 : jhr 1278 CL.mkDecl(CL.intTy,numDevicesVar,SOME(CL.I_Exp(CL.mkInt(~1,CL.intTy)))),
513 : jhr 1273 CL.mkDecl(CL.T_Array(CL.T_Named "cl_platform_id", SOME(1)), platformsVar, NONE),
514 : jhr 1278 CL.mkDecl(CL.intTy,"num_platforms",SOME(CL.I_Exp(CL.mkInt(~1,CL.intTy))))
515 : jhr 1273 ]
516 :     (* Setup Global Variables *)
517 :     val globalsDecl = CL.mkDecl(
518 :     CL.T_Ptr(CL.T_Named RN.globalsTy),
519 :     RN.globalsVarName,
520 : jhr 1278 SOME(CL.I_Exp(CL.mkApply("malloc", [CL.mkApply("sizeof",[CL.mkVar RN.globalsTy])]))))
521 :     val initGlobalsCall = CL.mkCall(RN.initGlobals,[CL.mkVar RN.globalsVarName])
522 : lamonts 1271
523 :     (* Retrieve the platforms
524 : jhr 1278 val platformStm = [CL.mkAssign(CL.mkVar errVar, CL.mkApply("clGetPlatformIDs",
525 :     [CL.mkInt(10,CL.intTy),
526 :     CL.mkVar platformsVar,
527 :     CL.mkUnOp(CL.%&,CL.mkVar numPlatformsVar)])),
528 : lamonts 1264 assertStm]
529 :    
530 : jhr 1278 val devicesStm = [CL.mkAssign(CL.mkVar errVar, CL.mkApply("clGetDeviceIDs",
531 :     [CL.mkSubscript(CL.mkVar platformsVar,CL.mkInt(0,CL.intTy)),
532 :     CL.mkVar "CL_DEVICE_TYPE_GPU",
533 :     CL.mkInt(1,CL.intTy),
534 :     CL.mkUnOp(CL.%&,CL.mkVar deviceVar),
535 :     CL.mkUnOp(CL.%&,CL.mkVar numDevicesVar)])),
536 : lamonts 1271 assertStm] *)
537 : lamonts 1264
538 :     (* Create Context *)
539 : jhr 1278 val contextStm = [CL.mkAssign(CL.mkVar contextVar, CL.mkApply("clCreateContext",
540 :     [CL.mkInt(0,CL.intTy),
541 :     CL.mkInt(1,CL.intTy),
542 :     CL.mkUnOp(CL.%&,CL.mkVar deviceVar),
543 :     CL.mkVar "NULL",
544 :     CL.mkVar "NULL",
545 :     CL.mkUnOp(CL.%&,CL.mkVar errVar)])),
546 : lamonts 1264 assertStm]
547 :    
548 :     (* Create Command Queue *)
549 : jhr 1278 val commandStm = [CL.mkAssign(CL.mkVar cmdVar, CL.mkApply("clCreateCommandQueue",
550 :     [CL.mkVar contextVar,
551 :     CL.mkVar deviceVar,
552 :     CL.mkInt(0,CL.intTy),
553 :     CL.mkUnOp(CL.%&,CL.mkVar errVar)])),
554 : lamonts 1264 assertStm]
555 :    
556 :    
557 :     (*Create Program/Build/Kernel with Source statement *)
558 : jhr 1278 val createProgStm = CL.mkAssign(CL.mkVar programVar, CL.mkApply("clCreateProgramWithSource",
559 :     [CL.mkVar contextVar,
560 :     CL.mkInt(2,CL.intTy),
561 :     CL.mkCast(CL.T_Ptr(CL.T_Named("const char *")),CL.mkUnOp(CL.%&,CL.mkVar sourcesVar)),
562 :     CL.mkVar "NULL",
563 :     CL.mkUnOp(CL.%&,CL.mkVar errVar)]))
564 : lamonts 1264
565 :     (* FIXME: Remove after testing purposes, Build Log for OpenCL*)
566 : jhr 1278 val buildLog = [CL.mkAssign(CL.mkVar errVar, CL.mkApply("clBuildProgram",
567 :     [CL.mkVar programVar,
568 :     CL.mkInt(0,CL.intTy),
569 :     CL.mkVar "NULL",
570 :     CL.mkVar "NULL",
571 :     CL.mkVar "NULL",
572 :     CL.mkVar "NULL"])),
573 : lamonts 1271 CL.mkDecl(CL.charPtr, "build", NONE),
574 :     CL.mkDecl(CL.T_Named("size_t"),"ret_val_size",NONE),
575 : jhr 1278 CL.mkAssign(CL.mkVar errVar, CL.mkApply("clGetProgramBuildInfo",
576 :     [CL.mkVar programVar,
577 :     CL.mkVar deviceVar,
578 :     CL.mkVar "CL_PROGRAM_BUILD_LOG",
579 :     CL.mkInt(0,CL.intTy),
580 :     CL.mkVar "NULL",
581 :     CL.mkUnOp(CL.%&,CL.mkVar "ret_val_size")])),
582 :     CL.mkAssign(CL.mkVar "build", CL.mkApply("malloc", [CL.mkVar "ret_val_size"])),
583 :     CL.mkAssign(CL.mkVar errVar, CL.mkApply("clGetProgramBuildInfo",
584 :     [CL.mkVar programVar,
585 :     CL.mkVar deviceVar,
586 :     CL.mkVar "CL_PROGRAM_BUILD_LOG",
587 :     CL.mkVar "ret_val_size",
588 :     CL.mkVar "build",
589 :     CL.mkVar "NULL"])),
590 :     CL.mkAssign(CL.mkSubscript(CL.mkVar "build",CL.mkVar "ret_val_size"),CL.mkVar ("'\\" ^ "0'")),
591 :     CL.mkCall("printf",[CL.mkStr ( "Build Log:" ^ "\n" ^ "%s" ^ "\n"), CL.mkVar "build"])]
592 : lamonts 1264
593 :    
594 :    
595 :    
596 : jhr 1278 val createKernel = CL.mkAssign(CL.mkVar kernelVar, CL.mkApply("clCreateKernel",
597 :     [CL.mkVar programVar,
598 :     CL.mkStr RN.kernelFuncName,
599 :     CL.mkUnOp(CL.%&,CL.mkVar errVar)]))
600 : lamonts 1264
601 :    
602 :     val create_build_stms = [createProgStm,assertStm] @ buildLog @ [assertStm,createKernel,assertStm]
603 :    
604 :    
605 :    
606 :     (* Create Memory Buffers for Strand States and Globals *)
607 : jhr 1278 val strandSize = CL.mkAssign(CL.mkVar stateSizeVar,CL.mkBinOp(CL.mkApply("sizeof",
608 :     [CL.mkVar tyName]), CL.#*,CL.mkVar numStrandsVar))
609 : lamonts 1271
610 : jhr 1278 val clStrandObjects = [CL.mkAssign(CL.mkVar clInstateVar, CL.mkApply("clCreateBuffer",
611 :     [CL.mkVar contextVar,
612 :     CL.mkVar "CL_MEM_READ_WRITE | CL_MEM_COPY_HOST_PTR",
613 :     CL.mkVar stateSizeVar,
614 :     CL.mkVar "NULL",
615 :     CL.mkUnOp(CL.%&,CL.mkVar errVar)])),
616 :     CL.mkAssign(CL.mkVar clOutStateVar, CL.mkApply("clCreateBuffer",
617 :     [CL.mkVar contextVar,
618 :     CL.mkVar "CL_MEM_READ_WRITE",
619 :     CL.mkVar stateSizeVar,
620 :     CL.mkVar "NULL",
621 :     CL.mkUnOp(CL.%&,CL.mkVar errVar)]))]
622 : lamonts 1271
623 :    
624 :     (* Setup up selfOut variable *)
625 : jhr 1278 val strandsArrays = [CL.mkAssign(CL.mkVar outStateVar, CL.mkApply("malloc", [CL.mkBinOp(CL.mkVar numStrandsVar,
626 :     CL.#*, CL.mkApply("sizeof",[CL.mkVar tyName]))])),
627 :     CL.mkAssign(CL.mkVar inStateVar, CL.mkApply("malloc", [CL.mkBinOp(CL.mkVar numStrandsVar,
628 :     CL.#*, CL.mkApply("sizeof",[CL.mkVar tyName]))]))]
629 : lamonts 1271
630 :    
631 :     (* Initialize Width Parameter *)
632 :     val widthDel = if nDims = 2 then
633 : jhr 1278 CL.mkAssign(CL.mkVar "width",CL.mkSubscript(CL.mkVar globalVar, CL.mkInt(1, CL.intTy)))
634 : lamonts 1271 else
635 : jhr 1278 CL.mkAssign(CL.mkVar "width",CL.mkInt(0,CL.intTy))
636 : lamonts 1271
637 :    
638 : jhr 1278 val strands_init = CL.mkCall(RN.strandInitSetup, [
639 :     CL.mkVar "size", CL.mkVar "width", CL.mkVar inStateVar
640 :     ])
641 : lamonts 1271
642 : lamonts 1264 val clGlobalBuffers = getGlobalDataBuffers(!imgGlobals,3,contextVar,errVar)
643 :    
644 :    
645 :     (* Load the Kernel and Header Files *)
646 : jhr 1278 val sourceStms = [CL.mkAssign(CL.mkSubscript(CL.mkVar sourcesVar,CL.mkInt(1,CL.intTy)),
647 :     CL.mkApply(RN.clLoaderFN, [CL.mkVar clFNVar])),
648 :     CL.mkAssign(CL.mkSubscript(CL.mkVar sourcesVar,CL.mkInt(0,CL.intTy)),
649 :     CL.mkApply(RN.clLoaderFN, [CL.mkVar headerFNVar]))]
650 : lamonts 1271
651 : jhr 1278 (* val sourceStms = [CL.mkAssign(CL.mkSubscript(CL.mkVar sourcesVar,CL.mkInt(1,CL.intTy)),
652 :     CL.mkApply(RN.clLoaderFN, [CL.mkVar clFNVar]))] *)
653 : lamonts 1271
654 : lamonts 1264
655 : jhr 1261 (* Created Enqueue Statements *)
656 :     (* FIXME: simplify this code by function abstraction *)
657 : lamonts 1264 val enqueueStm = if nDims = 1
658 : jhr 1278 then [CL.mkAssign(CL.mkVar errVar,
659 : lamonts 1264 CL.mkApply("clEnqueueNDRangeKernel",
660 : jhr 1278 [CL.mkVar cmdVar,
661 :     CL.mkVar kernelVar,
662 :     CL.mkInt(1,CL.intTy),
663 :     CL.mkVar "NULL",
664 :     CL.mkVar globalVar,
665 :     CL.mkVar localVar,
666 :     CL.mkInt(0,CL.intTy),
667 :     CL.mkVar "NULL",
668 :     CL.mkVar "NULL"])),CL.mkCall("clFinish",[CL.mkVar cmdVar])]
669 : lamonts 1264 else if nDims = 2 then
670 : jhr 1278 [CL.mkAssign(CL.mkVar errVar,
671 : lamonts 1264 CL.mkApply("clEnqueueNDRangeKernel",
672 : jhr 1278 [CL.mkVar cmdVar,
673 :     CL.mkVar kernelVar,
674 :     CL.mkInt(2,CL.intTy),
675 :     CL.mkVar "NULL",
676 :     CL.mkVar globalVar,
677 :     CL.mkVar localVar,
678 :     CL.mkInt(0,CL.intTy),
679 :     CL.mkVar "NULL",
680 :     CL.mkVar "NULL"])),CL.mkCall("clFinish",[CL.mkVar cmdVar])]
681 : lamonts 1264 else
682 : jhr 1278 [CL.mkAssign(CL.mkVar errVar,
683 : lamonts 1264 CL.mkApply("clEnqueueNDRangeKernel",
684 : jhr 1278 [CL.mkVar cmdVar,
685 :     CL.mkVar kernelVar,
686 :     CL.mkInt(3,CL.intTy),
687 :     CL.mkVar "NULL",
688 :     CL.mkVar globalVar,
689 :     CL.mkVar localVar,
690 :     CL.mkInt(0,CL.intTy),
691 :     CL.mkVar "NULL",
692 :     CL.mkVar "NULL"])),CL.mkCall("clFinish",[CL.mkVar cmdVar])]
693 : lamonts 1264
694 : lamonts 1271
695 : lamonts 1264
696 :     (* Setup Global and Local variables *)
697 :    
698 :     val globalAndlocalStms = if nDims = 1 then
699 : jhr 1278 [CL.mkAssign(CL.mkSubscript(CL.mkVar globalVar, CL.mkInt(0,CL.intTy)),
700 :     CL.mkSubscript(CL.mkVar "size", CL.mkInt(0,CL.intTy))),
701 :     CL.mkAssign(CL.mkSubscript(CL.mkVar localVar, CL.mkInt(0,CL.intTy)),
702 :     CL.mkVar "16")]
703 : lamonts 1264
704 :    
705 :     else if nDims = 2 then
706 : jhr 1278 [CL.mkAssign(CL.mkSubscript(CL.mkVar globalVar, CL.mkInt(0,CL.intTy)),
707 :     CL.mkSubscript(CL.mkVar "size", CL.mkInt(0,CL.intTy))),
708 :     CL.mkAssign(CL.mkSubscript(CL.mkVar globalVar, CL.mkInt(1,CL.intTy)),
709 :     CL.mkSubscript(CL.mkVar "size", CL.mkInt(1,CL.intTy))),
710 :     CL.mkAssign(CL.mkSubscript(CL.mkVar localVar, CL.mkInt(0,CL.intTy)),
711 :     CL.mkVar "16"),
712 :     CL.mkAssign(CL.mkSubscript(CL.mkVar localVar, CL.mkInt(1,CL.intTy)),
713 :     CL.mkVar "16")]
714 : lamonts 1264
715 :     else
716 : jhr 1278 [CL.mkAssign(CL.mkSubscript(CL.mkVar globalVar, CL.mkInt(0,CL.intTy)),
717 :     CL.mkSubscript(CL.mkVar "size", CL.mkInt(0,CL.intTy))),
718 :     CL.mkAssign(CL.mkSubscript(CL.mkVar globalVar, CL.mkInt(1,CL.intTy)),
719 :     CL.mkSubscript(CL.mkVar "size", CL.mkInt(1,CL.intTy))),
720 :     CL.mkAssign(CL.mkSubscript(CL.mkVar globalVar, CL.mkInt(2,CL.intTy)),
721 :     CL.mkSubscript(CL.mkVar "size", CL.mkInt(2,CL.intTy))),
722 :     CL.mkAssign(CL.mkSubscript(CL.mkVar localVar, CL.mkInt(0,CL.intTy)),
723 :     CL.mkVar "16"),
724 :     CL.mkAssign(CL.mkSubscript(CL.mkVar localVar, CL.mkInt(1,CL.intTy)),
725 :     CL.mkVar "16"),
726 :     CL.mkAssign(CL.mkSubscript(CL.mkVar localVar, CL.mkInt(2,CL.intTy)),
727 :     CL.mkVar "16")]
728 : lamonts 1264
729 : lamonts 1244
730 : lamonts 1264
731 :     (* Setup Kernel arguments *)
732 : jhr 1278 val kernelArguments = [CL.mkAssign(CL.mkVar errVar,CL.mkApply("clSetKernelArg",
733 :     [CL.mkVar kernelVar,
734 :     CL.mkInt(0,CL.intTy),
735 :     CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),
736 :     CL.mkUnOp(CL.%&,CL.mkVar clInstateVar)])),
737 :     CL.mkExpStm(CL.mkAssignOp(CL.mkVar errVar, CL.|=,CL.mkApply("clSetKernelArg",
738 :     [CL.mkVar kernelVar,
739 :     CL.mkInt(1,CL.intTy),
740 :     CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),
741 :     CL.mkUnOp(CL.%&,CL.mkVar clOutStateVar)]))),
742 :     CL.mkExpStm(CL.mkAssignOp(CL.mkVar errVar, CL.|=,CL.mkApply("clSetKernelArg",
743 :     [CL.mkVar kernelVar,
744 :     CL.mkInt(2,CL.intTy),
745 :     CL.mkApply("sizeof",[CL.mkVar "int"]),
746 :     CL.mkUnOp(CL.%&,CL.mkVar "width")])))]
747 : lamonts 1264
748 :     val clGlobalArguments = genGlobalArguments(!imgGlobals,3,kernelVar,errVar) @ [assertStm]
749 :    
750 :     (* Retrieve output *)
751 : jhr 1278 val outputStm = CL.mkAssign(CL.mkVar errVar,
752 : lamonts 1264 CL.mkApply("clEnqueueReadBuffer",
753 : jhr 1278 [CL.mkVar cmdVar,
754 :     CL.mkVar clOutStateVar,
755 :     CL.mkVar "CL_TRUE",
756 :     CL.mkInt(0,CL.intTy),
757 :     CL.mkVar stateSizeVar,
758 :     CL.mkVar outStateVar,
759 :     CL.mkInt(0,CL.intTy),
760 :     CL.mkVar "NULL",
761 :     CL.mkVar "NULL"]))
762 : lamonts 1264
763 :     (* Free all the objects *)
764 : jhr 1278 val freeStms = [CL.mkCall("clReleaseKernel",[CL.mkVar kernelVar]),
765 :     CL.mkCall("clReleaseProgram",[CL.mkVar programVar ]),
766 :     CL.mkCall("clReleaseCommandQueue",[CL.mkVar cmdVar]),
767 :     CL.mkCall("clReleaseContext",[CL.mkVar contextVar]),
768 :     CL.mkCall("clReleaseMemObject",[CL.mkVar clInstateVar]),
769 :     CL.mkCall("clReleaseMemObject",[CL.mkVar clOutStateVar])]
770 : lamonts 1264
771 :    
772 :     (*Setup Strand Print Function *)
773 :     val outputData = [CL.mkDecl(CL.T_Ptr(CL.T_Named("FILE")), "outS", SOME(CL.I_Exp(CL.mkApply("fopen",
774 : jhr 1278 [CL.mkStr "mip.txt",
775 :     CL.mkStr "w"])))),
776 : lamonts 1264 CL.mkCall(concat[name, "_print"],
777 : jhr 1278 [CL.mkVar "outS",
778 :     CL.mkVar "size",
779 :     CL.mkVar "width",
780 :     CL.mkVar outStateVar])]
781 : lamonts 1271
782 : lamonts 1264
783 :    
784 :     (* Body put all the statments together *)
785 : jhr 1273 val body = declarations @ [globalsDecl,initGlobalsCall] (*@ platformStm @ devicesStm *) @ contextStm @ commandStm @ !initially @ [strandSize] @
786 : lamonts 1271 strandsArrays @ globalAndlocalStms @ [widthDel,strands_init] @ clStrandObjects @ clGlobalBuffers @ sourceStms @ create_build_stms (*@
787 :     kernelArguments @ clGlobalArguments @ enqueueStm @ [outputStm] @ freeStms @ outputData *)
788 : lamonts 1264
789 :     in
790 :    
791 :     CL.D_Func([],CL.voidTy,RN.setupFName,params,CL.mkBlock(body))
792 :    
793 :     end
794 :     (* generate the data and global parameters *)
795 :     fun genKeneralGlobalParams ((name,tyname)::rest) =
796 : lamonts 1271 CL.PARAM([], CL.T_Ptr(CL.T_Named RN.globalsTy), concat[RN.globalsVarName]) ::
797 :     CL.PARAM([], CL.T_Ptr(CL.T_Named (RN.imageTy tyname)),RN.addBufferSuffix name) ::
798 :     CL.PARAM([], CL.T_Ptr(CL.voidTy),RN.addBufferSuffixData name) ::
799 : lamonts 1264 genKeneralGlobalParams(rest)
800 :    
801 :     | genKeneralGlobalParams ([]) = []
802 :    
803 :     (*generate code for intilizing kernel global data *)
804 :     fun initKernelGlobals (globals,imgGlobals) = let
805 :     fun initGlobalStruct (CL.D_Var(_, _ , name, _)::rest) =
806 : jhr 1278 CL.mkAssign(CL.mkVar name, CL.mkIndirect(CL.mkVar RN.globalsVarName, name)) ::
807 : lamonts 1264 initGlobalStruct(rest)
808 :     | initGlobalStruct ( _::rest) = initGlobalStruct(rest)
809 :     | initGlobalStruct([]) = []
810 :    
811 :     fun initGlobalImages((name,tyname)::rest) =
812 : jhr 1278 CL.mkAssign(CL.mkVar name, CL.mkVar (RN.addBufferSuffix name)) ::
813 :     CL.mkAssign(CL.mkIndirect(CL.mkVar name,"data"),CL.mkVar (RN.addBufferSuffixData name)) ::
814 : lamonts 1264 initGlobalImages(rest)
815 :     | initGlobalImages([]) = []
816 :     in
817 :     initGlobalStruct(globals) @ initGlobalImages(imgGlobals)
818 :     end
819 :    
820 :     (* generate the main kernel function for the .cl file *)
821 : lamonts 1271 fun genKernelFun(Strand{name, tyName, state, output, code,...},nDims,globals,imgGlobals) = let
822 : lamonts 1264 val fName = RN.kernelFuncName;
823 :     val inState = "strand_in"
824 :     val outState = "strand_out"
825 :     val params = [
826 :     CL.PARAM(["__global"], CL.T_Ptr(CL.T_Named tyName), "selfIn"),
827 :     CL.PARAM(["__global"], CL.T_Ptr(CL.T_Named tyName), "selfOut"),
828 :     CL.PARAM(["__global"], CL.intTy, "width")
829 :     ] @ genKeneralGlobalParams(!imgGlobals)
830 :     val thread_ids = if nDims = 1
831 : jhr 1278 then [CL.mkDecl(CL.intTy, "x", SOME(CL.I_Exp(CL.mkInt(0, CL.intTy)))),
832 :     CL.mkAssign(CL.mkVar "x",CL.mkApply(RN.getGlobalThreadId,[CL.mkInt(0,CL.intTy)]))]
833 : lamonts 1264 else
834 : jhr 1278 [CL.mkDecl(CL.intTy, "x", SOME(CL.I_Exp(CL.mkInt(0, CL.intTy)))),
835 :     CL.mkDecl(CL.intTy, "y", SOME(CL.I_Exp(CL.mkInt(0, CL.intTy)))),
836 :     CL.mkAssign(CL.mkVar "x", CL.mkApply(RN.getGlobalThreadId,[CL.mkInt(0,CL.intTy)])),
837 :     CL.mkAssign(CL.mkVar "y",CL.mkApply(RN.getGlobalThreadId,[CL.mkInt(1,CL.intTy)]))]
838 : lamonts 1264
839 :     val strandDecl = [CL.mkDecl(CL.T_Named tyName, inState, NONE),
840 :     CL.mkDecl(CL.T_Named tyName, outState,NONE)]
841 :     val strandObjects = if nDims = 1
842 : jhr 1278 then [CL.mkAssign(CL.mkSubscript(CL.mkVar "selfIn",CL.mkStr "x"),
843 :     CL.mkVar inState),
844 :     CL.mkAssign(CL.mkSubscript(CL.mkVar "selfOut",CL.mkStr "x"),
845 :     CL.mkVar outState)]
846 : lamonts 1264 else let
847 : jhr 1278 val index = CL.mkBinOp(CL.mkBinOp(CL.mkVar "x",CL.#*,CL.mkVar "width"),CL.#+,CL.mkVar "y")
848 : lamonts 1264 in
849 : jhr 1278 [CL.mkAssign(CL.mkSubscript(CL.mkVar "selfIn",index),
850 :     CL.mkVar inState),
851 :     CL.mkAssign(CL.mkSubscript(CL.mkVar "selfOut",index),
852 :     CL.mkVar outState)]
853 : lamonts 1264 end
854 :    
855 :    
856 : jhr 1278 val status = CL.mkDecl(CL.intTy, "status", SOME(CL.I_Exp(CL.mkInt(0, CL.intTy))))
857 : lamonts 1271 val local_vars = thread_ids @ initKernelGlobals(!globals,!imgGlobals) @ strandDecl @ strandObjects @ [status]
858 : jhr 1278 val while_exp = CL.mkBinOp(CL.mkBinOp(CL.mkVar "status",CL.#!=, CL.mkVar RN.kStabilize),CL.#||,CL.mkBinOp(CL.mkVar "status", CL.#!=, CL.mkVar RN.kDie))
859 :     val while_body = [CL.mkAssign(CL.mkVar "status", CL.mkApply(RN.strandUpdate name,[ CL.mkUnOp(CL.%&,CL.mkVar inState), CL.mkUnOp(CL.%&,CL.mkVar outState)])),
860 :     CL.mkCall(RN.strandStabilize name,[ CL.mkUnOp(CL.%&,CL.mkVar inState), CL.mkUnOp(CL.%&,CL.mkVar outState)])]
861 : lamonts 1264
862 :     val whileBlock = [CL.mkWhile(while_exp,CL.mkBlock while_body)]
863 :    
864 :     val body = CL.mkBlock(local_vars @ whileBlock)
865 :     in
866 :     CL.D_Func(["__kernel"], CL.voidTy, fName, params, body)
867 :     end
868 :     (* generate a global structure from the globals *)
869 :     fun genGlobalStruct(globals) = let
870 :     fun getGlobals(CL.D_Var(_,ty,globalVar,_)::rest) = (ty,globalVar)::getGlobals(rest)
871 :     | getGlobals([]) = []
872 :     | getGlobals(_::rest) = getGlobals(rest)
873 :     in
874 :     CL.D_StructDef(getGlobals(globals),RN.globalsTy)
875 :     end
876 :    
877 : lamonts 1244 (* generate the table of strand descriptors *)
878 : jhr 1261 fun genStrandTable (ppStrm, strands) = let
879 :     val nStrands = length strands
880 : jhr 1278 fun genInit (Strand{name, ...}) = CL.I_Exp(CL.mkUnOp(CL.%&, CL.mkVar(RN.strandDesc name)))
881 : jhr 1261 fun genInits (_, []) = []
882 :     | genInits (i, s::ss) = (i, genInit s) :: genInits(i+1, ss)
883 :     fun ppDecl dcl = PrintAsC.output(ppStrm, dcl)
884 :     in
885 :     ppDecl (CL.D_Var([], CL.int32, RN.numStrands,
886 : jhr 1278 SOME(CL.I_Exp(CL.mkInt(IntInf.fromInt nStrands, CL.int32)))));
887 : jhr 1261 ppDecl (CL.D_Var([],
888 :     CL.T_Array(CL.T_Ptr(CL.T_Named RN.strandDescTy), SOME nStrands),
889 :     RN.strands,
890 :     SOME(CL.I_Array(genInits (0, strands)))))
891 :     end
892 : lamonts 1244
893 : lamonts 1264
894 :     fun genSrc (baseName, Prog{double,globals, topDecls, strands, initially,imgGlobals,numDims,...}) = let
895 :     val clFileName = OS.Path.joinBaseExt{base=baseName, ext=SOME "cl"}
896 :     val cFileName = OS.Path.joinBaseExt{base=baseName, ext=SOME "c"}
897 :     val clOutS = TextIO.openOut clFileName
898 :     val cOutS = TextIO.openOut cFileName
899 : jhr 1273 (* FIXME: need to use PrintAsC and PrintAsCL *)
900 : lamonts 1264 val clppStrm = PrintAsC.new clOutS
901 :     val cppStrm = PrintAsC.new cOutS
902 :     fun cppDecl dcl = PrintAsC.output(cppStrm, dcl)
903 :     fun clppDecl dcl = PrintAsC.output(clppStrm, dcl)
904 :     val strands = AtomTable.listItems strands
905 : jhr 1273 val [strand as Strand{name, tyName, code,init_code, ...}] = strands
906 : lamonts 1264 in
907 : jhr 1273 (* Generate the OpenCl file *)
908 :     clppDecl (CL.D_Verbatim([
909 :     if double
910 :     then "#define DIDEROT_DOUBLE_PRECISION"
911 :     else "#define DIDEROT_SINGLE_PRECISION",
912 :     "#define DIDEROT_TARGET_CL",
913 :     "#include \"Diderot/cl-types.h\""
914 :     ]));
915 :     List.app clppDecl (List.rev (!globals));
916 :     clppDecl (genGlobalStruct (!globals));
917 :     clppDecl (genStrandTyDef strand);
918 :     List.app clppDecl (!code);
919 :     clppDecl (genKernelFun (strand,!numDims,globals,imgGlobals));
920 :     (* Generate the Host file .c *)
921 :     cppDecl (CL.D_Verbatim([
922 :     if double
923 :     then "#define DIDEROT_DOUBLE_PRECISION"
924 :     else "#define DIDEROT_SINGLE_PRECISION",
925 :     "#define DIDEROT_TARGET_CL",
926 :     "#include \"Diderot/diderot.h\""
927 :     ]));
928 :     List.app cppDecl (List.rev (!globals));
929 :     cppDecl (genGlobalStruct (!globals));
930 :     cppDecl (genStrandTyDef strand);
931 :     cppDecl (!init_code);
932 :     cppDecl (genStrandInit(strand,!numDims));
933 :     cppDecl (genStrandPrint(strand,!numDims));
934 :     (* cppDecl (genKernelLoader());*)
935 :     List.app cppDecl (List.rev (!topDecls));
936 :     cppDecl (genHostSetupFunc (strand, clFileName, !numDims, initially, imgGlobals));
937 : lamonts 1264 PrintAsC.close cppStrm;
938 :     PrintAsC.close clppStrm;
939 :     TextIO.closeOut cOutS;
940 :     TextIO.closeOut clOutS
941 :     end
942 :    
943 : lamonts 1244 (* output the code to a file. The string is the basename of the file, the extension
944 :     * is provided by the target.
945 :     *)
946 : lamonts 1264 fun generate (basename, prog as Prog{double, parallel, debug, ...}) = let
947 :     fun condCons (true, x, xs) = x::xs
948 :     | condCons (false, _, xs) = xs
949 :     (* generate the C compiler flags *)
950 :     val cflags = ["-I" ^ Paths.diderotInclude, "-I" ^ Paths.teemInclude]
951 :     val cflags = condCons (parallel, #pthread Paths.cflags, cflags)
952 :     val cflags = if debug
953 :     then #debug Paths.cflags :: cflags
954 :     else #ndebug Paths.cflags :: cflags
955 :     val cflags = #base Paths.cflags :: cflags
956 :     (* generate the loader flags *)
957 :     val extraLibs = condCons (parallel, #pthread Paths.extraLibs, [])
958 :     val extraLibs = Paths.teemLinkFlags @ #base Paths.extraLibs :: extraLibs
959 : lamonts 1271 val extraLibs = #cl Paths.extraLibs :: extraLibs
960 : lamonts 1264 val rtLib = TargetUtil.runtimeName {
961 :     target = TargetUtil.TARGET_CL,
962 :     parallel = parallel, double = double, debug = debug
963 :     }
964 :     val ldOpts = rtLib :: extraLibs
965 :     in
966 : lamonts 1271 genSrc (basename, prog);
967 :     RunCC.compile (basename, cflags);
968 :     RunCC.link (basename, ldOpts)
969 : jhr 1273 end
970 : lamonts 1244
971 : jhr 1273 end
972 : lamonts 1264
973 : lamonts 1244 (* strands *)
974 :     structure Strand =
975 :     struct
976 : jhr 1261 fun define (Prog{strands, ...}, strandId) = let
977 :     val name = Atom.toString strandId
978 :     val strand = Strand{
979 :     name = name,
980 :     tyName = RN.strandTy name,
981 :     state = ref [],
982 :     output = ref NONE,
983 : lamonts 1271 code = ref [],
984 : jhr 1273 init_code = ref (CL.D_Comment(["no init code"]))
985 : jhr 1261 }
986 :     in
987 :     AtomTable.insert strands (strandId, strand);
988 :     strand
989 :     end
990 : lamonts 1244
991 :     (* return the strand with the given name *)
992 : jhr 1261 fun lookup (Prog{strands, ...}, strandId) = AtomTable.lookup strands strandId
993 : lamonts 1244
994 :     (* register the strand-state initialization code. The variables are the strand
995 :     * parameters.
996 :     *)
997 : lamonts 1271 fun init (Strand{name, tyName, code,init_code, ...}, params, init) = let
998 : jhr 1261 val fName = RN.strandInit name
999 :     val params =
1000 :     CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfOut") ::
1001 : jhr 1273 List.map (fn (ToCL.V(ty, x)) => CL.PARAM([], ty, x)) params
1002 : jhr 1261 val initFn = CL.D_Func([], CL.voidTy, fName, params, init)
1003 :     in
1004 : jhr 1273 init_code := initFn
1005 : jhr 1261 end
1006 : lamonts 1244
1007 :     (* register a strand method *)
1008 : lamonts 1271 fun method (Strand{name, tyName, code,...}, methName, body) = let
1009 : jhr 1261 val fName = concat[name, "_", methName]
1010 :     val params = [
1011 :     CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfIn"),
1012 :     CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfOut")
1013 :     ]
1014 :     val methFn = CL.D_Func([], CL.int32, fName, params, body)
1015 :     in
1016 : jhr 1273 code := methFn :: !code
1017 : jhr 1261 end
1018 :    
1019 : jhr 1273 fun output (Strand{output, ...}, ty, ToCL.V(_, x)) = output := SOME(ty, x)
1020 : lamonts 1244
1021 :     end
1022 :    
1023 :     end
1024 :    
1025 :     structure CLBackEnd = CodeGenFn(CLTarget)

root@smlnj-gforge.cs.uchicago.edu
ViewVC Help
Powered by ViewVC 1.0.0