Home My Page Projects Code Snippets Project Openings diderot
Summary Activity Tracker Tasks SCM

SCM Repository

[diderot] Annotation of /branches/pure-cfg/src/compiler/cl-target/cl-target.sml
ViewVC logotype

Annotation of /branches/pure-cfg/src/compiler/cl-target/cl-target.sml

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1273 - (view) (download)

1 : lamonts 1244 (* c-target.sml
2 :     *
3 :     * COPYRIGHT (c) 2011 The Diderot Project (http://diderot-language.cs.uchicago.edu)
4 :     * All rights reserved.
5 :     *)
6 :    
7 :     structure CLTarget : TARGET =
8 :     struct
9 :    
10 :     structure IL = TreeIL
11 :     structure V = IL.Var
12 :     structure Ty = IL.Ty
13 :     structure CL = CLang
14 :     structure RN = RuntimeNames
15 : jhr 1273 structure ToCL = TreeToCL
16 : lamonts 1244
17 : jhr 1273 type var = ToCL.var
18 : lamonts 1244 type exp = CL.exp
19 :     type stm = CL.stm
20 :    
21 :     datatype strand = Strand of {
22 : jhr 1261 name : string,
23 :     tyName : string,
24 :     state : var list ref,
25 :     output : (Ty.ty * CL.var) option ref, (* the strand's output variable (only one for now) *)
26 : lamonts 1271 code : CL.decl list ref,
27 : jhr 1273 init_code: CL.decl ref
28 : lamonts 1244 }
29 :    
30 :     datatype program = Prog of {
31 : jhr 1261 double : bool, (* true for double-precision support *)
32 :     parallel : bool, (* true for multithreaded (or multi-GPU) target *)
33 :     debug : bool, (* true for debug support in executable *)
34 :     globals : CL.decl list ref,
35 :     topDecls : CL.decl list ref,
36 :     strands : strand AtomTable.hash_table,
37 :     initially : CL.stm list ref,
38 : jhr 1273 numDims: int ref,
39 :     imgGlobals: (string * int) list ref,
40 :     prFn: CL.decl ref
41 :     }
42 : lamonts 1244
43 :     datatype env = ENV of {
44 : jhr 1261 info : env_info,
45 :     vMap : var V.Map.map,
46 :     scope : scope
47 : lamonts 1244 }
48 :    
49 :     and env_info = INFO of {
50 : jhr 1261 prog : program
51 : lamonts 1244 }
52 :    
53 :     and scope
54 :     = NoScope
55 :     | GlobalScope
56 :     | InitiallyScope
57 : jhr 1261 | StrandScope of TreeIL.var list (* strand initialization *)
58 :     | MethodScope of TreeIL.var list (* method body; vars are state variables *)
59 : lamonts 1244
60 : jhr 1273 (* the supprted widths of vectors of reals on the target. *)
61 :     (* FIXME: for OpenCL 1.1, 3 is also valid *)
62 :     fun vectorWidths () = [2, 4, 8, 16]
63 : lamonts 1244
64 :     (* tests for whether various expression forms can appear inline *)
65 : jhr 1261 fun inlineCons n = (n < 2) (* vectors are inline, but not matrices *)
66 :     val inlineMatrixExp = false (* can matrix-valued expressions appear inline? *)
67 : lamonts 1244
68 :     (* TreeIL to target translations *)
69 :     structure Tr =
70 :     struct
71 : jhr 1261 fun fragment (ENV{info, vMap, scope}, blk) = let
72 : jhr 1273 val (vMap, stms) = ToCL.trFragment (vMap, blk)
73 : jhr 1261 in
74 :     (ENV{info=info, vMap=vMap, scope=scope}, stms)
75 :     end
76 :     fun saveState cxt stateVars (env, args, stm) = (
77 :     ListPair.foldrEq
78 : jhr 1273 (fn (x, e, stms) => ToCL.trAssign(env, x, e)@stms)
79 : jhr 1261 [stm]
80 :     (stateVars, args)
81 :     ) handle ListPair.UnequalLengths => (
82 :     print(concat["saveState ", cxt, ": length mismatch; ", Int.toString(List.length args), " args\n"]);
83 :     raise Fail(concat["saveState ", cxt, ": length mismatch"]))
84 :     fun block (ENV{vMap, scope, ...}, blk) = (case scope
85 : jhr 1273 of StrandScope stateVars => ToCL.trBlock (vMap, saveState "StrandScope" stateVars, blk)
86 :     | MethodScope stateVars => ToCL.trBlock (vMap, saveState "MethodScope" stateVars, blk)
87 :     | _ => ToCL.trBlock (vMap, fn (_, _, stm) => [stm], blk)
88 : jhr 1261 (* end case *))
89 : jhr 1273 fun exp (ENV{vMap, ...}, e) = ToCL.trExp(vMap, e)
90 : lamonts 1244 end
91 :    
92 :     (* variables *)
93 :     structure Var =
94 :     struct
95 : jhr 1273 fun name (ToCL.V(_, name)) = name
96 :     fun global (Prog{globals,imgGlobals, ...}, name, ty) = let
97 :     val ty' = ToCL.trType ty
98 : jhr 1261 fun isImgGlobal (imgGlobals, Ty.ImageTy(ImageInfo.ImgInfo{dim, ...}), name) = imgGlobals := (name,dim):: !imgGlobals
99 :     | isImgGlobal (imgGlobals, _, _) = ()
100 :     in
101 :     globals := CL.D_Var([], ty', name, NONE) :: !globals;
102 :     isImgGlobal(imgGlobals,ty,name);
103 : jhr 1273 ToCL.V(ty', name)
104 : jhr 1261 end
105 : jhr 1273 fun param x = ToCL.V(ToCL.trType(V.ty x), V.name x)
106 : jhr 1261 fun state (Strand{state, ...}, x) = let
107 : jhr 1273 val ty' = ToCL.trType(V.ty x)
108 :     val x' = ToCL.V(ty', V.name x)
109 : jhr 1261 in
110 :     state := x' :: !state;
111 :     x'
112 :     end
113 : lamonts 1244 end
114 :    
115 :     (* environments *)
116 :     structure Env =
117 :     struct
118 :     (* create a new environment *)
119 : jhr 1261 fun new prog = ENV{
120 :     info=INFO{prog = prog},
121 :     vMap = V.Map.empty,
122 :     scope = NoScope
123 :     }
124 : lamonts 1244 (* define the current translation context *)
125 : jhr 1261 fun setScope scope (ENV{info, vMap, ...}) = ENV{info=info, vMap=vMap, scope=scope}
126 :     val scopeGlobal = setScope GlobalScope
127 :     val scopeInitially = setScope InitiallyScope
128 :     fun scopeStrand (env, svars) = setScope (StrandScope svars) env
129 :     fun scopeMethod (env, svars) = setScope (MethodScope svars) env
130 : lamonts 1244 (* bind a TreeIL varaiable to a target variable *)
131 : jhr 1261 fun bind (ENV{info, vMap, scope}, x, x') = ENV{
132 :     info = info,
133 :     vMap = V.Map.insert(vMap, x, x'),
134 :     scope = scope
135 :     }
136 : lamonts 1244 end
137 :    
138 :     (* programs *)
139 :     structure Program =
140 :     struct
141 : jhr 1261 fun new {double, parallel, debug} = (
142 :     RN.initTargetSpec double;
143 :     Prog{
144 :     double = double, parallel = parallel, debug = debug,
145 : lamonts 1271 globals = ref [],
146 : jhr 1261 topDecls = ref [],
147 :     strands = AtomTable.mkTable (16, Fail "strand table"),
148 :     initially = ref([CL.S_Comment["missing initially"]]),
149 : lamonts 1264 numDims = ref(0),
150 :     imgGlobals = ref[],
151 :     prFn = ref(CL.D_Comment(["No Print Function"]))
152 : jhr 1261 })
153 : lamonts 1244 (* register the global initialization part of a program *)
154 : lamonts 1264 fun globalIndirects (globals,stms) = let
155 : jhr 1273 fun getGlobals(CL.D_Var(_,_,globalVar,_)::rest) = CL.mkAssign(CL.mkIndirect(CL.E_Var RN.globalsVarName,globalVar),CL.E_Var globalVar)::getGlobals(rest)
156 :     | getGlobals([]) = []
157 :     | getGlobals(_::rest) = getGlobals(rest)
158 :     in
159 :     stms @ getGlobals(globals)
160 :     end
161 : jhr 1261
162 :     (* register the code that is used to register command-line options for input variables *)
163 :     fun inputs (Prog{topDecls, ...}, stm) = let
164 :     val inputsFn = CL.D_Func(
165 :     [], CL.voidTy, RN.registerOpts,
166 :     [CL.PARAM([], CL.T_Ptr(CL.T_Named RN.optionsTy), "opts")],
167 :     stm)
168 :     in
169 :     topDecls := inputsFn :: !topDecls
170 :     end
171 :    
172 :     fun init (Prog{globals,topDecls,...}, CL.S_Block(init)) = let
173 :     val params = [
174 : jhr 1273 CL.PARAM([], CL.T_Ptr(CL.T_Named RN.globalsTy), RN.globalsVarName)
175 :     ]
176 : jhr 1261 val body = CL.S_Block(globalIndirects(!globals,init))
177 :     val initFn = CL.D_Func([], CL.voidTy, RN.initGlobals, params, body)
178 :     in
179 :     topDecls := initFn :: !topDecls
180 :     end
181 :     | init (Prog{globals,topDecls,...}, init) = let
182 :     val params = [
183 : jhr 1273 CL.PARAM([], CL.T_Ptr(CL.T_Named RN.globalsTy), RN.globalsVarName)
184 :     ]
185 : jhr 1261 val initFn = CL.D_Func([], CL.voidTy, RN.initGlobals, params, init)
186 :     in
187 :     topDecls := initFn :: !topDecls
188 :     end
189 :    
190 : lamonts 1244 (* create and register the initially function for a program *)
191 : jhr 1261 fun initially {
192 : lamonts 1264 prog = Prog{strands, initially,numDims,...},
193 : jhr 1261 isArray : bool,
194 :     iterPrefix : stm list,
195 :     iters : (var * exp * exp) list,
196 :     createPrefix : stm list,
197 :     strand : Atom.atom,
198 :     args : exp list
199 :     } = let
200 :     val name = Atom.toString strand
201 :     val nDims = List.length iters
202 :     fun mapi f xs = let
203 :     fun mapf (_, []) = []
204 :     | mapf (i, x::xs) = f(i, x) :: mapf(i+1, xs)
205 :     in
206 :     mapf (0, xs)
207 :     end
208 :     val baseInit = mapi (fn (i, (_, e, _)) => (i, CL.I_Exp e)) iters
209 :     val sizeInit = mapi
210 : jhr 1273 (fn (i, (ToCL.V(ty, _), lo, hi)) =>
211 : jhr 1261 (i, CL.I_Exp(CL.mkBinOp(CL.mkBinOp(hi, CL.#-, lo), CL.#+, CL.E_Int(1, ty))))
212 :     ) iters
213 :     val numStrandsVar = "numStrandsVar"
214 :     val allocCode = iterPrefix @ [
215 :     CL.mkComment["allocate initial block of strands"],
216 :     CL.mkDecl(CL.T_Array(CL.int32, SOME nDims), "base", SOME(CL.I_Array baseInit)),
217 :     CL.mkDecl(CL.T_Array(CL.uint32, SOME nDims), "size", SOME(CL.I_Array sizeInit)),
218 :     CL.mkDecl(CL.int32,"numDims",SOME(CL.I_Exp(CL.E_Int(IntInf.fromInt nDims, CL.int32))))
219 : jhr 1273 ]
220 :     val numStrandsLoopBody = CL.mkExpStm(CL.mkAssignOp(CL.E_Var numStrandsVar, CL.*=,CL.mkSubscript(CL.E_Var "size",CL.E_Var "i")))
221 :     val numStrandsLoop = CL.mkFor([(CL.intTy, "i", CL.E_Int(0,CL.intTy))],
222 :     CL.mkBinOp(CL.E_Var "i", CL.#<, CL.E_Var "numDims"),
223 :     [CL.mkPostOp(CL.E_Var "i", CL.^++)], numStrandsLoopBody)
224 :     in
225 :     numDims := nDims;
226 :     initially := allocCode @ [numStrandsLoop]
227 :     end
228 : lamonts 1256
229 :    
230 : lamonts 1244 (***** OUTPUT *****)
231 : lamonts 1271 fun genStrandInit(Strand{name,tyName,state,output,code,...},nDims) = let
232 :     val params = [
233 :     CL.PARAM([], CL.T_Ptr(CL.uint32), "sizes" ),
234 :     CL.PARAM([], CL.intTy, "width"),
235 :     CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "strands")
236 :     ]
237 :    
238 :     val body = let
239 :     fun loopParams (3) =
240 :     "x"::"y"::"k"::[]
241 :     | loopParams (2) =
242 :     "x"::"y"::[]
243 :     | loopParams (1) =
244 :     "x"::[]
245 :     | loopParams (_) =
246 :     raise Fail("genStrandInit: missing size dim")
247 :     fun mkLoopNest ([],_,nDims) = if nDims = 1 then
248 :    
249 :     CL.mkBlock ([CL.mkCall(RN.strandInit name, [CL.E_UnOp(CL.%&,CL.mkSubscript(CL.E_Var "strands",CL.E_Str "x")),
250 :     CL.E_Var "x"])])
251 :     else let
252 :     val index = CL.mkBinOp(CL.mkBinOp(CL.E_Var "x",CL.#*,CL.E_Var "width"),CL.#+,CL.E_Var "y")
253 :     in
254 :     CL.mkBlock([CL.mkCall(RN.strandInit name, [CL.E_UnOp(CL.%&,CL.mkSubscript(CL.E_Var "strands",index)),
255 :     CL.E_Var "x", CL.E_Var"y"])])
256 :     end
257 :    
258 :     | mkLoopNest (param::rest,count,nDims) = let
259 :     val body = mkLoopNest (rest, count + 1,nDims)
260 :     in
261 :     CL.mkFor(
262 :     [(CL.intTy, param, CL.E_Int(0,CL.intTy))],
263 :     CL.mkBinOp(CL.E_Var param, CL.#<, CL.mkSubscript(CL.E_Var "sizes",CL.E_Int(count,CL.intTy))),
264 :     [CL.mkPostOp(CL.E_Var param, CL.^++)],
265 :     body)
266 :     end
267 :     in
268 :     [mkLoopNest ((loopParams nDims),0,nDims)]
269 :     end
270 :     in
271 :     CL.D_Func(["static"], CL.voidTy, RN.strandInitSetup, params,CL.mkBlock(body))
272 :     end
273 :     fun genStrandPrint (Strand{name, tyName, state, output, code,...},nDims) = let
274 : lamonts 1264 (* the print function *)
275 :     val prFnName = concat[name, "_print"]
276 :    
277 :     val prFn = let
278 :     val params = [
279 :     CL.PARAM([], CL.T_Ptr(CL.T_Named "FILE"), "outS"),
280 : lamonts 1271 CL.PARAM([], CL.T_Ptr(CL.uint32), "sizes" ),
281 : lamonts 1264 CL.PARAM([], CL.intTy, "width"),
282 :     CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "self")
283 :     ]
284 :    
285 :     val SOME(ty, x) = !output
286 :     val outState = if nDims = 1 then
287 :     CL.mkSelect(CL.mkSubscript(CL.mkVar "self",CL.E_Var "x"), x)
288 :     else if nDims = 2 then
289 :     CL.mkSelect(CL.mkSubscript(CL.mkVar "self",
290 :     CL.mkBinOp(CL.mkBinOp(CL.E_Var "x",CL.#*,CL.E_Var "width"),CL.#+,CL.E_Var "y")), x)
291 :    
292 :     else CL.mkSelect(CL.mkVar "self",x)
293 :    
294 :     val prArgs = (case ty
295 :     of Ty.IVecTy 1 => [CL.E_Str(!RN.gIntFormat ^ "\n"), outState]
296 :     | Ty.IVecTy d => let
297 :     val fmt = CL.E_Str(
298 :     String.concatWith " " (List.tabulate(d, fn _ => !RN.gIntFormat))
299 :     ^ "\n")
300 : jhr 1273 val args = List.tabulate (d, fn i => ToCL.vecIndex(outState, i))
301 : lamonts 1264 in
302 :     fmt :: args
303 :     end
304 :     | Ty.TensorTy[] => [CL.E_Str "%f\n", outState]
305 :     | Ty.TensorTy[d] => let
306 :     val fmt = CL.E_Str(
307 :     String.concatWith " " (List.tabulate(d, fn _ => "%f"))
308 :     ^ "\n")
309 : jhr 1273 val args = List.tabulate (d, fn i => ToCL.vecIndex(outState, i))
310 : lamonts 1264 in
311 :     fmt :: args
312 :     end
313 :     | _ => raise Fail("genStrand: unsupported output type " ^ Ty.toString ty)
314 :     (* end case *))
315 :    
316 :     val body = let
317 :    
318 :     fun loopParams (3) =
319 :     "x"::"y"::"k"::[]
320 :     | loopParams (2) =
321 :     "x"::"y"::[]
322 :     | loopParams (1) =
323 :     "x"::[]
324 :     | loopParams (_) =
325 :     raise Fail("genStrandPrint: unsupported output type " ^ Ty.toString ty)
326 :    
327 :     fun mkLoopNest ([],_) =
328 :     CL.mkCall("fprintf", CL.mkVar "outS" :: prArgs)
329 :     | mkLoopNest (param::rest,count) = let
330 :     val body = mkLoopNest (rest, count + 1)
331 :     in
332 :     CL.mkFor(
333 :     [(CL.intTy, param, CL.E_Int(0,CL.intTy))],
334 : lamonts 1271 CL.mkBinOp(CL.E_Var param, CL.#<, CL.mkSubscript(CL.E_Var "sizes",CL.E_Int(count,CL.intTy))),
335 : lamonts 1264 [CL.mkPostOp(CL.E_Var param, CL.^++)],
336 :     body)
337 :     end
338 :     in
339 :     [mkLoopNest ((loopParams nDims),0)]
340 :     end
341 :    
342 :     in
343 :     CL.D_Func(["static"], CL.voidTy, prFnName, params,CL.mkBlock(body))
344 :     end
345 :     in
346 :     prFn
347 :     end
348 : jhr 1261 fun genStrandTyDef (Strand{tyName, state,...}) =
349 :     (* the type declaration for the strand's state struct *)
350 :     CL.D_StructDef(
351 : jhr 1273 List.rev (List.map (fn ToCL.V(ty, x) => (ty, x)) (!state)),
352 : jhr 1261 tyName)
353 :    
354 :    
355 : lamonts 1264 (* generates the load kernel function *)
356 : jhr 1261 (* FIXME: this code might be part of the runtime system *)
357 : lamonts 1264 fun genKernelLoader() =
358 :     CL.D_Verbatim ( ["/* Loads the Kernel from a file */",
359 :     "char * loadKernel (const char * filename) {",
360 :     "struct stat statbuf;",
361 :     "FILE *fh;",
362 :     "char *source;",
363 :     "fh = fopen(filename, \"r\");",
364 :     "if (fh == 0)",
365 :     " return 0;",
366 :     "stat(filename, &statbuf);",
367 :     "source = (char *) malloc(statbuf.st_size + 1);",
368 :     "fread(source, statbuf.st_size, 1, fh);",
369 :     "fread(source, statbuf.st_size, 1, fh);",
370 :     "return source;",
371 :     "}"])
372 :     (* generates the opencl buffers for the image data *)
373 :     fun getGlobalDataBuffers(globals,count,contextVar,errVar) = let
374 :     val globalBufferDecl = CL.mkDecl(CL.clMemoryTy,concat[RN.globalsVarName,"_cl"],NONE)
375 :     val globalBuffer = CL.mkAssign(CL.E_Var(concat[RN.globalsVarName,"_cl"]), CL.mkApply("clCreateBuffer",
376 :     [CL.E_Var contextVar,
377 : lamonts 1271 CL.E_Var "CL_MEM_COPY_HOST_PTR",
378 : lamonts 1264 CL.mkApply("sizeof",[CL.E_Var RN.globalsTy]),
379 :     CL.E_Var RN.globalsVarName,
380 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)]))
381 : jhr 1261
382 : lamonts 1264 fun genDataBuffers([],_,_,_) = []
383 :     | genDataBuffers((var,nDims)::globals,count,contextVar,errVar) = let
384 :     (* FIXME: use CL constructors to build expressions (not strings) *)
385 :     val size = if nDims = 1 then
386 :     CL.mkBinOp(CL.mkApply("sizeof",[CL.E_Var "float"]), CL.#*,
387 :     CL.mkIndirect(CL.E_Var var, "size[0]"))
388 :     else if nDims = 2 then
389 :     CL.mkBinOp(CL.mkApply("sizeof",[CL.E_Var "float"]), CL.#*,
390 :     CL.mkIndirect(CL.E_Var var, concat["size[0]", " * ", var, "->size[1]"]))
391 :     else
392 :     CL.mkBinOp(CL.mkApply("sizeof",[CL.E_Var "float"]), CL.#*,
393 :     CL.mkIndirect(CL.E_Var var,concat["size[0]", " * ", var, "->size[1] * ", var, "->size[2]"]))
394 :    
395 :     in
396 :     CL.mkDecl(CL.clMemoryTy,RN.addBufferSuffix var ,NONE)::
397 :     CL.mkDecl(CL.clMemoryTy,RN.addBufferSuffixData var ,NONE)::
398 :     CL.mkAssign(CL.E_Var(RN.addBufferSuffix var), CL.mkApply("clCreateBuffer",
399 :     [CL.E_Var contextVar,
400 : lamonts 1271 CL.E_Var "CL_MEM_COPY_HOST_PTR",
401 : lamonts 1264 CL.mkApply("sizeof",[CL.E_Var (RN.imageTy nDims)]),
402 :     CL.E_Var var,
403 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)])) ::
404 :     CL.mkAssign(CL.E_Var(RN.addBufferSuffixData var), CL.mkApply("clCreateBuffer",
405 :     [CL.E_Var contextVar,
406 : lamonts 1271 CL.E_Var "CL_MEM_COPY_HOST_PTR",
407 : lamonts 1264 size,
408 :     CL.mkIndirect(CL.E_Var var,"data"),
409 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)])):: genDataBuffers(globals,count + 2,contextVar,errVar)
410 :     end
411 :     in
412 :     [globalBufferDecl] @ [globalBuffer] @ genDataBuffers(globals,count + 2,contextVar,errVar)
413 :     end
414 :    
415 : jhr 1261
416 : lamonts 1264 (* generates the kernel arguments for the image data *)
417 :     fun genGlobalArguments(globals,count,kernelVar,errVar) = let
418 :     val globalArgument = CL.mkExpStm(CL.mkAssignOp(CL.E_Var errVar,CL.|=,CL.mkApply("clSetKernelArg",
419 :     [CL.E_Var kernelVar,
420 :     CL.E_Int(count,CL.intTy),
421 :     CL.mkApply("sizeof",[CL.E_Var "cl_mem"]),
422 :     CL.E_UnOp(CL.%&,CL.E_Var(concat[RN.globalsVarName,"_cl"]))])))
423 :    
424 :     fun genDataArguments([],_,_,_) = []
425 :     | genDataArguments((var,nDims)::globals,count,kernelVar,errVar) =
426 :    
427 :     CL.mkExpStm(CL.mkAssignOp(CL.E_Var errVar,CL.|=, CL.mkApply("clSetKernelArg",
428 :     [CL.E_Var kernelVar,
429 :     CL.E_Int(count,CL.intTy),
430 :     CL.mkApply("sizeof",[CL.E_Var "cl_mem"]),
431 :     CL.E_UnOp(CL.%&,CL.E_Var(RN.addBufferSuffix var))])))::
432 :    
433 :     CL.mkExpStm(CL.mkAssignOp(CL.E_Var errVar,CL.|=,CL.mkApply("clSetKernelArg",
434 :     [CL.E_Var kernelVar,
435 :     CL.E_Int((count + 1),CL.intTy),
436 :     CL.mkApply("sizeof",[CL.E_Var "cl_mem"]),
437 :     CL.E_UnOp(CL.%&,CL.E_Var(RN.addBufferSuffixData var))]))):: genDataArguments (globals, count + 2,kernelVar,errVar)
438 :    
439 :     in
440 :    
441 :     [globalArgument] @ genDataArguments(globals,count + 1,kernelVar,errVar)
442 :    
443 :     end
444 :    
445 :     (* generates the main function of host code *)
446 :     fun genHostMain() = let
447 : jhr 1273 val setupCall = [CL.mkCall(RN.setupFName,[CL.E_Var RN.globalsVarName])]
448 :     val globalsDecl = CL.mkDecl(
449 :     CL.T_Ptr(CL.T_Named RN.globalsTy),
450 :     RN.globalsVarName,
451 :     SOME(CL.I_Exp(CL.mkApply("malloc", [CL.mkApply("sizeof",[CL.E_Var RN.globalsTy])]))))
452 :     val initGlobalsCall = CL.mkCall(RN.initGlobals,[CL.E_Var RN.globalsVarName])
453 :     val returnStm = [CL.mkReturn(SOME(CL.E_Int(0,CL.intTy)))]
454 :     val params = [
455 :     CL.PARAM([],CL.intTy, "argc"),
456 :     CL.PARAM([],CL.charArrayPtr,"argv")
457 :     ]
458 :     val body = CL.mkBlock([globalsDecl] @ [initGlobalsCall] @ setupCall @ returnStm)
459 :     in
460 :     CL.D_Func([],CL.intTy,"main",params,body)
461 :     end
462 : lamonts 1264
463 : jhr 1273 (* generates the host-side setup function *)
464 :     fun genHostSetupFunc (strand as Strand{name,tyName,...}, filename, nDims, initially, imgGlobals) = let
465 :     (* Delcare opencl setup objects *)
466 :     val programVar= "program"
467 :     val kernelVar = "kernel"
468 :     val cmdVar = "queue"
469 :     val inStateVar = "selfin"
470 :     val outStateVar = "selfout"
471 :     val stateSizeVar= "state_mem_size"
472 :     val clInstateVar = "clSelfIn"
473 :     val clOutStateVar = "clSelfOut"
474 :     val clGlobals = "clGlobals"
475 :     val sourcesVar = "sources"
476 :     val contextVar = "context"
477 :     val errVar = "err"
478 :     val imgDataSizeVar = "image_dataSize"
479 :     val globalVar = "global_work_size"
480 :     val localVar = "local_work_size"
481 :     val clFNVar = "filename"
482 :     val numStrandsVar = "numStrandsVar"
483 :     val headerFNVar = "header"
484 :     val deviceVar = "device"
485 :     val platformsVar = "platforms"
486 :     val numPlatformsVar = "num_platforms"
487 :     val numDevicesVar = "num_devices"
488 :     val assertStm = CL.mkCall("assert",[CL.mkBinOp(CL.E_Var errVar, CL.#==, CL.E_Var "CL_SUCCESS")])
489 :     val params = [
490 :     CL.PARAM([],CL.T_Named("cl_device_id"), deviceVar)
491 :     ]
492 :     val declarations = [
493 :     CL.mkDecl(CL.clProgramTy, programVar, NONE),
494 :     CL.mkDecl(CL.clKernelTy, kernelVar, NONE),
495 :     CL.mkDecl(CL.clCmdQueueTy, cmdVar, NONE),
496 :     CL.mkDecl(CL.clContextTy, contextVar, NONE),
497 :     CL.mkDecl(CL.intTy, errVar, NONE),
498 :     CL.mkDecl(CL.intTy, numStrandsVar, SOME(CL.I_Exp(CL.E_Int(1,CL.intTy)))),
499 :     CL.mkDecl(CL.intTy, stateSizeVar, NONE),
500 :     CL.mkDecl(CL.intTy, "width", NONE),
501 :     CL.mkDecl(CL.intTy, imgDataSizeVar, NONE),
502 :     (*CL.mkDecl(CL.clDeviceIdTy, deviceVar, NONE), *)
503 :     CL.mkDecl(CL.T_Ptr(CL.T_Named tyName), inStateVar,NONE),
504 :     CL.mkDecl(CL.clMemoryTy,clInstateVar,NONE),
505 :     CL.mkDecl(CL.clMemoryTy,clOutStateVar,NONE),
506 :     CL.mkDecl(CL.T_Ptr(CL.T_Named tyName), outStateVar,NONE),
507 :     CL.mkDecl(CL.charPtr, clFNVar,SOME(CL.I_Exp(CL.E_Str filename))),
508 :     (* FIXME: use Paths.diderotInclude *)
509 :     CL.mkDecl(CL.charPtr, headerFNVar,SOME(CL.I_Exp(CL.E_Str "../src/include/Diderot/cl-types.h"))),
510 :     CL.mkDecl(CL.T_Array(CL.charPtr,SOME(2)),sourcesVar,NONE),
511 :     CL.mkDecl(CL.T_Array(CL.T_Named "size_t",SOME(nDims)),globalVar,NONE),
512 :     CL.mkDecl(CL.T_Array(CL.T_Named "size_t",SOME(nDims)),localVar,NONE),
513 :     CL.mkDecl(CL.intTy,numDevicesVar,SOME(CL.I_Exp(CL.E_Int(~1,CL.intTy)))),
514 :     CL.mkDecl(CL.T_Array(CL.T_Named "cl_platform_id", SOME(1)), platformsVar, NONE),
515 :     CL.mkDecl(CL.intTy,"num_platforms",SOME(CL.I_Exp(CL.E_Int(~1,CL.intTy))))
516 :     ]
517 :     (* Setup Global Variables *)
518 :     val globalsDecl = CL.mkDecl(
519 :     CL.T_Ptr(CL.T_Named RN.globalsTy),
520 :     RN.globalsVarName,
521 :     SOME(CL.I_Exp(CL.mkApply("malloc", [CL.mkApply("sizeof",[CL.E_Var RN.globalsTy])]))))
522 :     val initGlobalsCall = CL.mkCall(RN.initGlobals,[CL.E_Var RN.globalsVarName])
523 : lamonts 1271
524 :     (* Retrieve the platforms
525 : lamonts 1264 val platformStm = [CL.mkAssign(CL.E_Var errVar, CL.mkApply("clGetPlatformIDs",
526 :     [CL.E_Int(10,CL.intTy),
527 :     CL.E_Var platformsVar,
528 :     CL.E_UnOp(CL.%&,CL.E_Var numPlatformsVar)])),
529 :     assertStm]
530 :    
531 :     val devicesStm = [CL.mkAssign(CL.E_Var errVar, CL.mkApply("clGetDeviceIDs",
532 :     [CL.mkSubscript(CL.E_Var platformsVar,CL.E_Int(0,CL.intTy)),
533 :     CL.E_Var "CL_DEVICE_TYPE_GPU",
534 :     CL.E_Int(1,CL.intTy),
535 :     CL.E_UnOp(CL.%&,CL.E_Var deviceVar),
536 :     CL.E_UnOp(CL.%&,CL.E_Var numDevicesVar)])),
537 : lamonts 1271 assertStm] *)
538 : lamonts 1264
539 :     (* Create Context *)
540 :     val contextStm = [CL.mkAssign(CL.E_Var contextVar, CL.mkApply("clCreateContext",
541 :     [CL.E_Int(0,CL.intTy),
542 :     CL.E_Int(1,CL.intTy),
543 :     CL.E_UnOp(CL.%&,CL.E_Var deviceVar),
544 :     CL.E_Var "NULL",
545 :     CL.E_Var "NULL",
546 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)])),
547 :     assertStm]
548 :    
549 :     (* Create Command Queue *)
550 :     val commandStm = [CL.mkAssign(CL.E_Var cmdVar, CL.mkApply("clCreateCommandQueue",
551 :     [CL.E_Var contextVar,
552 :     CL.E_Var deviceVar,
553 :     CL.E_Int(0,CL.intTy),
554 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)])),
555 :     assertStm]
556 :    
557 :    
558 :     (*Create Program/Build/Kernel with Source statement *)
559 :     val createProgStm = CL.mkAssign(CL.E_Var programVar, CL.mkApply("clCreateProgramWithSource",
560 :     [CL.E_Var contextVar,
561 :     CL.E_Int(2,CL.intTy),
562 :     CL.E_Cast(CL.T_Ptr(CL.T_Named("const char *")),CL.E_UnOp(CL.%&,CL.E_Var sourcesVar)),
563 :     CL.E_Var "NULL",
564 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)]))
565 :    
566 :     (* FIXME: Remove after testing purposes, Build Log for OpenCL*)
567 :     val buildLog = [CL.mkAssign(CL.E_Var errVar, CL.mkApply("clBuildProgram",
568 :     [CL.E_Var programVar,
569 :     CL.E_Int(0,CL.intTy),
570 :     CL.E_Var "NULL",
571 :     CL.E_Var "NULL",
572 :     CL.E_Var "NULL",
573 :     CL.E_Var "NULL"])),
574 : lamonts 1271 CL.mkDecl(CL.charPtr, "build", NONE),
575 :     CL.mkDecl(CL.T_Named("size_t"),"ret_val_size",NONE),
576 : lamonts 1264 CL.mkAssign(CL.E_Var errVar, CL.mkApply("clGetProgramBuildInfo",
577 :     [CL.E_Var programVar,
578 :     CL.E_Var deviceVar,
579 :     CL.E_Var "CL_PROGRAM_BUILD_LOG",
580 : lamonts 1271 CL.E_Int(0,CL.intTy),
581 :     CL.E_Var "NULL",
582 :     CL.E_UnOp(CL.%&,CL.E_Var "ret_val_size")])),
583 :     CL.mkAssign(CL.E_Var "build", CL.mkApply("malloc", [CL.E_Var "ret_val_size"])),
584 :     CL.mkAssign(CL.E_Var errVar, CL.mkApply("clGetProgramBuildInfo",
585 :     [CL.E_Var programVar,
586 :     CL.E_Var deviceVar,
587 :     CL.E_Var "CL_PROGRAM_BUILD_LOG",
588 :     CL.E_Var "ret_val_size",
589 : lamonts 1264 CL.E_Var "build",
590 : lamonts 1271 CL.E_Var "NULL"])),
591 :     CL.mkAssign(CL.mkSubscript(CL.E_Var "build",CL.E_Var "ret_val_size"),CL.E_Var ("'\\" ^ "0'")),
592 : lamonts 1264 CL.mkCall("printf",[CL.E_Str ( "Build Log:" ^ "\n" ^ "%s" ^ "\n"), CL.E_Var "build"])]
593 :    
594 :    
595 :    
596 :    
597 :     val createKernel = CL.mkAssign(CL.E_Var kernelVar, CL.mkApply("clCreateKernel",
598 :     [CL.E_Var programVar,
599 :     CL.E_Str RN.kernelFuncName,
600 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)]))
601 :    
602 :    
603 :     val create_build_stms = [createProgStm,assertStm] @ buildLog @ [assertStm,createKernel,assertStm]
604 :    
605 :    
606 :    
607 :     (* Create Memory Buffers for Strand States and Globals *)
608 :     val strandSize = CL.mkAssign(CL.E_Var stateSizeVar,CL.mkBinOp(CL.mkApply("sizeof",
609 :     [CL.E_Var tyName]), CL.#*,CL.E_Var numStrandsVar))
610 : lamonts 1271
611 : lamonts 1264 val clStrandObjects = [CL.mkAssign(CL.E_Var clInstateVar, CL.mkApply("clCreateBuffer",
612 :     [CL.E_Var contextVar,
613 : lamonts 1271 CL.E_Var "CL_MEM_READ_WRITE | CL_MEM_COPY_HOST_PTR",
614 : lamonts 1264 CL.E_Var stateSizeVar,
615 :     CL.E_Var "NULL",
616 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)])),
617 :     CL.mkAssign(CL.E_Var clOutStateVar, CL.mkApply("clCreateBuffer",
618 :     [CL.E_Var contextVar,
619 :     CL.E_Var "CL_MEM_READ_WRITE",
620 :     CL.E_Var stateSizeVar,
621 :     CL.E_Var "NULL",
622 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)]))]
623 : lamonts 1271
624 :    
625 :     (* Setup up selfOut variable *)
626 :     val strandsArrays = [CL.mkAssign(CL.E_Var outStateVar, CL.mkApply("malloc", [CL.mkBinOp(CL.E_Var numStrandsVar,
627 :     CL.#*, CL.mkApply("sizeof",[CL.E_Var tyName]))])),
628 :     CL.mkAssign(CL.E_Var inStateVar, CL.mkApply("malloc", [CL.mkBinOp(CL.E_Var numStrandsVar,
629 :     CL.#*, CL.mkApply("sizeof",[CL.E_Var tyName]))]))]
630 :    
631 :    
632 :     (* Initialize Width Parameter *)
633 :     val widthDel = if nDims = 2 then
634 :     CL.mkAssign(CL.E_Var "width",CL.mkSubscript(CL.E_Var globalVar, CL.E_Int(1, CL.intTy)))
635 :     else
636 :     CL.mkAssign(CL.E_Var "width",CL.E_Int(0,CL.intTy))
637 :    
638 :    
639 :     val strands_init = CL.mkCall(RN.strandInitSetup,
640 :     [CL.E_Var "size",
641 :     CL.E_Var "width",
642 :     CL.E_Var inStateVar])
643 :    
644 : lamonts 1264 val clGlobalBuffers = getGlobalDataBuffers(!imgGlobals,3,contextVar,errVar)
645 :    
646 :    
647 :     (* Load the Kernel and Header Files *)
648 : lamonts 1271 val sourceStms = [CL.mkAssign(CL.mkSubscript(CL.E_Var sourcesVar,CL.E_Int(1,CL.intTy)),
649 :     CL.mkApply(RN.clLoaderFN, [CL.E_Var clFNVar])),
650 :     CL.mkAssign(CL.mkSubscript(CL.E_Var sourcesVar,CL.E_Int(0,CL.intTy)),
651 :     CL.mkApply(RN.clLoaderFN, [CL.E_Var headerFNVar]))]
652 :    
653 :     (* val sourceStms = [CL.mkAssign(CL.mkSubscript(CL.E_Var sourcesVar,CL.E_Int(1,CL.intTy)),
654 :     CL.mkApply(RN.clLoaderFN, [CL.E_Var clFNVar]))] *)
655 :    
656 : lamonts 1264
657 : jhr 1261 (* Created Enqueue Statements *)
658 :     (* FIXME: simplify this code by function abstraction *)
659 : lamonts 1264 val enqueueStm = if nDims = 1
660 :     then [CL.mkAssign(CL.E_Var errVar,
661 :     CL.mkApply("clEnqueueNDRangeKernel",
662 :     [CL.E_Var cmdVar,
663 :     CL.E_Var kernelVar,
664 :     CL.E_Int(1,CL.intTy),
665 :     CL.E_Var "NULL",
666 :     CL.E_Var globalVar,
667 :     CL.E_Var localVar,
668 :     CL.E_Int(0,CL.intTy),
669 :     CL.E_Var "NULL",
670 :     CL.E_Var "NULL"])),CL.mkCall("clFinish",[CL.E_Var cmdVar])]
671 :     else if nDims = 2 then
672 :     [CL.mkAssign(CL.E_Var errVar,
673 :     CL.mkApply("clEnqueueNDRangeKernel",
674 :     [CL.E_Var cmdVar,
675 :     CL.E_Var kernelVar,
676 :     CL.E_Int(2,CL.intTy),
677 :     CL.E_Var "NULL",
678 :     CL.E_Var globalVar,
679 :     CL.E_Var localVar,
680 :     CL.E_Int(0,CL.intTy),
681 :     CL.E_Var "NULL",
682 :     CL.E_Var "NULL"])),CL.mkCall("clFinish",[CL.E_Var cmdVar])]
683 :     else
684 :     [CL.mkAssign(CL.E_Var errVar,
685 :     CL.mkApply("clEnqueueNDRangeKernel",
686 :     [CL.E_Var cmdVar,
687 :     CL.E_Var kernelVar,
688 :     CL.E_Int(3,CL.intTy),
689 :     CL.E_Var "NULL",
690 :     CL.E_Var globalVar,
691 :     CL.E_Var localVar,
692 :     CL.E_Int(0,CL.intTy),
693 :     CL.E_Var "NULL",
694 :     CL.E_Var "NULL"])),CL.mkCall("clFinish",[CL.E_Var cmdVar])]
695 :    
696 : lamonts 1271
697 : lamonts 1264
698 :     (* Setup Global and Local variables *)
699 :    
700 :     val globalAndlocalStms = if nDims = 1 then
701 :     [CL.mkAssign(CL.mkSubscript(CL.E_Var globalVar, CL.E_Int(0,CL.intTy)),
702 :     CL.mkSubscript(CL.E_Var "size", CL.E_Int(0,CL.intTy))),
703 :     CL.mkAssign(CL.mkSubscript(CL.E_Var localVar, CL.E_Int(0,CL.intTy)),
704 :     CL.E_Var "16")]
705 :    
706 :    
707 :     else if nDims = 2 then
708 :     [CL.mkAssign(CL.mkSubscript(CL.E_Var globalVar, CL.E_Int(0,CL.intTy)),
709 :     CL.mkSubscript(CL.E_Var "size", CL.E_Int(0,CL.intTy))),
710 :     CL.mkAssign(CL.mkSubscript(CL.E_Var globalVar, CL.E_Int(1,CL.intTy)),
711 :     CL.mkSubscript(CL.E_Var "size", CL.E_Int(1,CL.intTy))),
712 :     CL.mkAssign(CL.mkSubscript(CL.E_Var localVar, CL.E_Int(0,CL.intTy)),
713 :     CL.E_Var "16"),
714 :     CL.mkAssign(CL.mkSubscript(CL.E_Var localVar, CL.E_Int(1,CL.intTy)),
715 :     CL.E_Var "16")]
716 :    
717 :     else
718 :     [CL.mkAssign(CL.mkSubscript(CL.E_Var globalVar, CL.E_Int(0,CL.intTy)),
719 :     CL.mkSubscript(CL.E_Var "size", CL.E_Int(0,CL.intTy))),
720 :     CL.mkAssign(CL.mkSubscript(CL.E_Var globalVar, CL.E_Int(1,CL.intTy)),
721 :     CL.mkSubscript(CL.E_Var "size", CL.E_Int(1,CL.intTy))),
722 :     CL.mkAssign(CL.mkSubscript(CL.E_Var globalVar, CL.E_Int(2,CL.intTy)),
723 :     CL.mkSubscript(CL.E_Var "size", CL.E_Int(2,CL.intTy))),
724 :     CL.mkAssign(CL.mkSubscript(CL.E_Var localVar, CL.E_Int(0,CL.intTy)),
725 :     CL.E_Var "16"),
726 :     CL.mkAssign(CL.mkSubscript(CL.E_Var localVar, CL.E_Int(1,CL.intTy)),
727 :     CL.E_Var "16"),
728 :     CL.mkAssign(CL.mkSubscript(CL.E_Var localVar, CL.E_Int(2,CL.intTy)),
729 :     CL.E_Var "16")]
730 :    
731 : lamonts 1244
732 : lamonts 1264
733 :     (* Setup Kernel arguments *)
734 :     val kernelArguments = [CL.mkAssign(CL.E_Var errVar,CL.mkApply("clSetKernelArg",
735 :     [CL.E_Var kernelVar,
736 :     CL.E_Int(0,CL.intTy),
737 :     CL.mkApply("sizeof",[CL.E_Var "cl_mem"]),
738 :     CL.E_UnOp(CL.%&,CL.E_Var clInstateVar)])),
739 :     CL.mkExpStm(CL.mkAssignOp(CL.E_Var errVar, CL.|=,CL.mkApply("clSetKernelArg",
740 :     [CL.E_Var kernelVar,
741 :     CL.E_Int(1,CL.intTy),
742 :     CL.mkApply("sizeof",[CL.E_Var "cl_mem"]),
743 :     CL.E_UnOp(CL.%&,CL.E_Var clOutStateVar)]))),
744 :     CL.mkExpStm(CL.mkAssignOp(CL.E_Var errVar, CL.|=,CL.mkApply("clSetKernelArg",
745 :     [CL.E_Var kernelVar,
746 :     CL.E_Int(2,CL.intTy),
747 :     CL.mkApply("sizeof",[CL.E_Var "int"]),
748 :     CL.E_UnOp(CL.%&,CL.E_Var "width")])))]
749 :    
750 :     val clGlobalArguments = genGlobalArguments(!imgGlobals,3,kernelVar,errVar) @ [assertStm]
751 :    
752 :     (* Retrieve output *)
753 :     val outputStm = CL.mkAssign(CL.E_Var errVar,
754 :     CL.mkApply("clEnqueueReadBuffer",
755 :     [CL.E_Var cmdVar,
756 :     CL.E_Var clOutStateVar,
757 :     CL.E_Var "CL_TRUE",
758 :     CL.E_Int(0,CL.intTy),
759 :     CL.E_Var stateSizeVar,
760 :     CL.E_Var outStateVar,
761 :     CL.E_Int(0,CL.intTy),
762 :     CL.E_Var "NULL",
763 :     CL.E_Var "NULL"]))
764 :    
765 :     (* Free all the objects *)
766 :     val freeStms = [CL.mkCall("clReleaseKernel",[CL.E_Var kernelVar]),
767 :     CL.mkCall("clReleaseProgram",[CL.E_Var programVar ]),
768 :     CL.mkCall("clReleaseCommandQueue",[CL.E_Var cmdVar]),
769 :     CL.mkCall("clReleaseContext",[CL.E_Var contextVar]),
770 :     CL.mkCall("clReleaseMemObject",[CL.E_Var clInstateVar]),
771 :     CL.mkCall("clReleaseMemObject",[CL.E_Var clOutStateVar])]
772 :    
773 :    
774 :     (*Setup Strand Print Function *)
775 :     val outputData = [CL.mkDecl(CL.T_Ptr(CL.T_Named("FILE")), "outS", SOME(CL.I_Exp(CL.mkApply("fopen",
776 :     [CL.E_Str "mip.txt",
777 :     CL.E_Str "w"])))),
778 :     CL.mkCall(concat[name, "_print"],
779 :     [CL.E_Var "outS",
780 :     CL.E_Var "size",
781 :     CL.E_Var "width",
782 :     CL.E_Var outStateVar])]
783 : lamonts 1271
784 : lamonts 1264
785 :    
786 :     (* Body put all the statments together *)
787 : jhr 1273 val body = declarations @ [globalsDecl,initGlobalsCall] (*@ platformStm @ devicesStm *) @ contextStm @ commandStm @ !initially @ [strandSize] @
788 : lamonts 1271 strandsArrays @ globalAndlocalStms @ [widthDel,strands_init] @ clStrandObjects @ clGlobalBuffers @ sourceStms @ create_build_stms (*@
789 :     kernelArguments @ clGlobalArguments @ enqueueStm @ [outputStm] @ freeStms @ outputData *)
790 : lamonts 1264
791 :     in
792 :    
793 :     CL.D_Func([],CL.voidTy,RN.setupFName,params,CL.mkBlock(body))
794 :    
795 :     end
796 :     (* generate the data and global parameters *)
797 :     fun genKeneralGlobalParams ((name,tyname)::rest) =
798 : lamonts 1271 CL.PARAM([], CL.T_Ptr(CL.T_Named RN.globalsTy), concat[RN.globalsVarName]) ::
799 :     CL.PARAM([], CL.T_Ptr(CL.T_Named (RN.imageTy tyname)),RN.addBufferSuffix name) ::
800 :     CL.PARAM([], CL.T_Ptr(CL.voidTy),RN.addBufferSuffixData name) ::
801 : lamonts 1264 genKeneralGlobalParams(rest)
802 :    
803 :     | genKeneralGlobalParams ([]) = []
804 :    
805 :     (*generate code for intilizing kernel global data *)
806 :     fun initKernelGlobals (globals,imgGlobals) = let
807 :     fun initGlobalStruct (CL.D_Var(_, _ , name, _)::rest) =
808 :     CL.mkAssign(CL.E_Var name, CL.mkIndirect(CL.E_Var RN.globalsVarName, name)) ::
809 :     initGlobalStruct(rest)
810 :     | initGlobalStruct ( _::rest) = initGlobalStruct(rest)
811 :     | initGlobalStruct([]) = []
812 :    
813 :     fun initGlobalImages((name,tyname)::rest) =
814 :     CL.mkAssign(CL.E_Var name, CL.E_Var (RN.addBufferSuffix name)) ::
815 :     CL.mkAssign(CL.mkIndirect(CL.E_Var name,"data"),CL.E_Var (RN.addBufferSuffixData name)) ::
816 :     initGlobalImages(rest)
817 :     | initGlobalImages([]) = []
818 :     in
819 :     initGlobalStruct(globals) @ initGlobalImages(imgGlobals)
820 :     end
821 :    
822 :     (* generate the main kernel function for the .cl file *)
823 : lamonts 1271 fun genKernelFun(Strand{name, tyName, state, output, code,...},nDims,globals,imgGlobals) = let
824 : lamonts 1264 val fName = RN.kernelFuncName;
825 :     val inState = "strand_in"
826 :     val outState = "strand_out"
827 :     val params = [
828 :     CL.PARAM(["__global"], CL.T_Ptr(CL.T_Named tyName), "selfIn"),
829 :     CL.PARAM(["__global"], CL.T_Ptr(CL.T_Named tyName), "selfOut"),
830 :     CL.PARAM(["__global"], CL.intTy, "width")
831 :     ] @ genKeneralGlobalParams(!imgGlobals)
832 :     val thread_ids = if nDims = 1
833 :     then [CL.mkDecl(CL.intTy, "x", SOME(CL.I_Exp(CL.E_Int(0, CL.intTy)))),
834 :     CL.mkAssign(CL.E_Var "x",CL.mkApply(RN.getGlobalThreadId,[CL.E_Int(0,CL.intTy)]))]
835 :     else
836 :     [CL.mkDecl(CL.intTy, "x", SOME(CL.I_Exp(CL.E_Int(0, CL.intTy)))),
837 :     CL.mkDecl(CL.intTy, "y", SOME(CL.I_Exp(CL.E_Int(0, CL.intTy)))),
838 :     CL.mkAssign(CL.E_Var "x", CL.mkApply(RN.getGlobalThreadId,[CL.E_Int(0,CL.intTy)])),
839 :     CL.mkAssign(CL.E_Var "y",CL.mkApply(RN.getGlobalThreadId,[CL.E_Int(1,CL.intTy)]))]
840 :    
841 :     val strandDecl = [CL.mkDecl(CL.T_Named tyName, inState, NONE),
842 :     CL.mkDecl(CL.T_Named tyName, outState,NONE)]
843 :     val strandObjects = if nDims = 1
844 :     then [CL.mkAssign(CL.mkSubscript(CL.E_Var "selfIn",CL.E_Str "x"),
845 :     CL.E_Var inState),
846 :     CL.mkAssign(CL.mkSubscript(CL.E_Var "selfOut",CL.E_Str "x"),
847 :     CL.E_Var outState)]
848 :     else let
849 :     val index = CL.mkBinOp(CL.mkBinOp(CL.E_Var "x",CL.#*,CL.E_Var "width"),CL.#+,CL.E_Var "y")
850 :     in
851 :     [CL.mkAssign(CL.mkSubscript(CL.E_Var "selfIn",index),
852 :     CL.E_Var inState),
853 :     CL.mkAssign(CL.mkSubscript(CL.E_Var "selfOut",index),
854 :     CL.E_Var outState)]
855 :     end
856 :    
857 :    
858 :     val status = CL.mkDecl(CL.intTy, "status", SOME(CL.I_Exp(CL.E_Int(0, CL.intTy))))
859 : lamonts 1271 val local_vars = thread_ids @ initKernelGlobals(!globals,!imgGlobals) @ strandDecl @ strandObjects @ [status]
860 : lamonts 1264 val while_exp = CL.mkBinOp(CL.mkBinOp(CL.E_Var "status",CL.#!=, CL.E_Var RN.kStabilize),CL.#||,CL.mkBinOp(CL.E_Var "status", CL.#!=, CL.E_Var RN.kDie))
861 :     val while_body = [CL.mkAssign(CL.E_Var "status", CL.mkApply(RN.strandUpdate name,[ CL.E_UnOp(CL.%&,CL.E_Var inState), CL.E_UnOp(CL.%&,CL.E_Var outState)])),
862 :     CL.mkCall(RN.strandStabilize name,[ CL.E_UnOp(CL.%&,CL.E_Var inState), CL.E_UnOp(CL.%&,CL.E_Var outState)])]
863 :    
864 :     val whileBlock = [CL.mkWhile(while_exp,CL.mkBlock while_body)]
865 :    
866 :     val body = CL.mkBlock(local_vars @ whileBlock)
867 :     in
868 :     CL.D_Func(["__kernel"], CL.voidTy, fName, params, body)
869 :     end
870 :     (* generate a global structure from the globals *)
871 :     fun genGlobalStruct(globals) = let
872 :     fun getGlobals(CL.D_Var(_,ty,globalVar,_)::rest) = (ty,globalVar)::getGlobals(rest)
873 :     | getGlobals([]) = []
874 :     | getGlobals(_::rest) = getGlobals(rest)
875 :     in
876 :     CL.D_StructDef(getGlobals(globals),RN.globalsTy)
877 :     end
878 :    
879 : lamonts 1244 (* generate the table of strand descriptors *)
880 : jhr 1261 fun genStrandTable (ppStrm, strands) = let
881 :     val nStrands = length strands
882 :     fun genInit (Strand{name, ...}) = CL.I_Exp(CL.mkUnOp(CL.%&, CL.E_Var(RN.strandDesc name)))
883 :     fun genInits (_, []) = []
884 :     | genInits (i, s::ss) = (i, genInit s) :: genInits(i+1, ss)
885 :     fun ppDecl dcl = PrintAsC.output(ppStrm, dcl)
886 :     in
887 :     ppDecl (CL.D_Var([], CL.int32, RN.numStrands,
888 :     SOME(CL.I_Exp(CL.E_Int(IntInf.fromInt nStrands, CL.int32)))));
889 :     ppDecl (CL.D_Var([],
890 :     CL.T_Array(CL.T_Ptr(CL.T_Named RN.strandDescTy), SOME nStrands),
891 :     RN.strands,
892 :     SOME(CL.I_Array(genInits (0, strands)))))
893 :     end
894 : lamonts 1244
895 : lamonts 1264
896 :     fun genSrc (baseName, Prog{double,globals, topDecls, strands, initially,imgGlobals,numDims,...}) = let
897 :     val clFileName = OS.Path.joinBaseExt{base=baseName, ext=SOME "cl"}
898 :     val cFileName = OS.Path.joinBaseExt{base=baseName, ext=SOME "c"}
899 :     val clOutS = TextIO.openOut clFileName
900 :     val cOutS = TextIO.openOut cFileName
901 : jhr 1273 (* FIXME: need to use PrintAsC and PrintAsCL *)
902 : lamonts 1264 val clppStrm = PrintAsC.new clOutS
903 :     val cppStrm = PrintAsC.new cOutS
904 :     fun cppDecl dcl = PrintAsC.output(cppStrm, dcl)
905 :     fun clppDecl dcl = PrintAsC.output(clppStrm, dcl)
906 :     val strands = AtomTable.listItems strands
907 : jhr 1273 val [strand as Strand{name, tyName, code,init_code, ...}] = strands
908 : lamonts 1264 in
909 : jhr 1273 (* Generate the OpenCl file *)
910 :     clppDecl (CL.D_Verbatim([
911 :     if double
912 :     then "#define DIDEROT_DOUBLE_PRECISION"
913 :     else "#define DIDEROT_SINGLE_PRECISION",
914 :     "#define DIDEROT_TARGET_CL",
915 :     "#include \"Diderot/cl-types.h\""
916 :     ]));
917 :     List.app clppDecl (List.rev (!globals));
918 :     clppDecl (genGlobalStruct (!globals));
919 :     clppDecl (genStrandTyDef strand);
920 :     List.app clppDecl (!code);
921 :     clppDecl (genKernelFun (strand,!numDims,globals,imgGlobals));
922 :     (* Generate the Host file .c *)
923 :     cppDecl (CL.D_Verbatim([
924 :     if double
925 :     then "#define DIDEROT_DOUBLE_PRECISION"
926 :     else "#define DIDEROT_SINGLE_PRECISION",
927 :     "#define DIDEROT_TARGET_CL",
928 :     "#include \"Diderot/diderot.h\""
929 :     ]));
930 :     List.app cppDecl (List.rev (!globals));
931 :     cppDecl (genGlobalStruct (!globals));
932 :     cppDecl (genStrandTyDef strand);
933 :     cppDecl (!init_code);
934 :     cppDecl (genStrandInit(strand,!numDims));
935 :     cppDecl (genStrandPrint(strand,!numDims));
936 :     (* cppDecl (genKernelLoader());*)
937 :     List.app cppDecl (List.rev (!topDecls));
938 :     cppDecl (genHostSetupFunc (strand, clFileName, !numDims, initially, imgGlobals));
939 : lamonts 1264 PrintAsC.close cppStrm;
940 :     PrintAsC.close clppStrm;
941 :     TextIO.closeOut cOutS;
942 :     TextIO.closeOut clOutS
943 :     end
944 :    
945 : lamonts 1244 (* output the code to a file. The string is the basename of the file, the extension
946 :     * is provided by the target.
947 :     *)
948 : lamonts 1264 fun generate (basename, prog as Prog{double, parallel, debug, ...}) = let
949 :     fun condCons (true, x, xs) = x::xs
950 :     | condCons (false, _, xs) = xs
951 :     (* generate the C compiler flags *)
952 :     val cflags = ["-I" ^ Paths.diderotInclude, "-I" ^ Paths.teemInclude]
953 :     val cflags = condCons (parallel, #pthread Paths.cflags, cflags)
954 :     val cflags = if debug
955 :     then #debug Paths.cflags :: cflags
956 :     else #ndebug Paths.cflags :: cflags
957 :     val cflags = #base Paths.cflags :: cflags
958 :     (* generate the loader flags *)
959 :     val extraLibs = condCons (parallel, #pthread Paths.extraLibs, [])
960 :     val extraLibs = Paths.teemLinkFlags @ #base Paths.extraLibs :: extraLibs
961 : lamonts 1271 val extraLibs = #cl Paths.extraLibs :: extraLibs
962 : lamonts 1264 val rtLib = TargetUtil.runtimeName {
963 :     target = TargetUtil.TARGET_CL,
964 :     parallel = parallel, double = double, debug = debug
965 :     }
966 :     val ldOpts = rtLib :: extraLibs
967 :     in
968 : lamonts 1271 genSrc (basename, prog);
969 :     RunCC.compile (basename, cflags);
970 :     RunCC.link (basename, ldOpts)
971 : jhr 1273 end
972 : lamonts 1244
973 : jhr 1273 end
974 : lamonts 1264
975 : lamonts 1244 (* strands *)
976 :     structure Strand =
977 :     struct
978 : jhr 1261 fun define (Prog{strands, ...}, strandId) = let
979 :     val name = Atom.toString strandId
980 :     val strand = Strand{
981 :     name = name,
982 :     tyName = RN.strandTy name,
983 :     state = ref [],
984 :     output = ref NONE,
985 : lamonts 1271 code = ref [],
986 : jhr 1273 init_code = ref (CL.D_Comment(["no init code"]))
987 : jhr 1261 }
988 :     in
989 :     AtomTable.insert strands (strandId, strand);
990 :     strand
991 :     end
992 : lamonts 1244
993 :     (* return the strand with the given name *)
994 : jhr 1261 fun lookup (Prog{strands, ...}, strandId) = AtomTable.lookup strands strandId
995 : lamonts 1244
996 :     (* register the strand-state initialization code. The variables are the strand
997 :     * parameters.
998 :     *)
999 : lamonts 1271 fun init (Strand{name, tyName, code,init_code, ...}, params, init) = let
1000 : jhr 1261 val fName = RN.strandInit name
1001 :     val params =
1002 :     CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfOut") ::
1003 : jhr 1273 List.map (fn (ToCL.V(ty, x)) => CL.PARAM([], ty, x)) params
1004 : jhr 1261 val initFn = CL.D_Func([], CL.voidTy, fName, params, init)
1005 :     in
1006 : jhr 1273 init_code := initFn
1007 : jhr 1261 end
1008 : lamonts 1244
1009 :     (* register a strand method *)
1010 : lamonts 1271 fun method (Strand{name, tyName, code,...}, methName, body) = let
1011 : jhr 1261 val fName = concat[name, "_", methName]
1012 :     val params = [
1013 :     CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfIn"),
1014 :     CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfOut")
1015 :     ]
1016 :     val methFn = CL.D_Func([], CL.int32, fName, params, body)
1017 :     in
1018 : jhr 1273 code := methFn :: !code
1019 : jhr 1261 end
1020 :    
1021 : jhr 1273 fun output (Strand{output, ...}, ty, ToCL.V(_, x)) = output := SOME(ty, x)
1022 : lamonts 1244
1023 :     end
1024 :    
1025 :     end
1026 :    
1027 :     structure CLBackEnd = CodeGenFn(CLTarget)

root@smlnj-gforge.cs.uchicago.edu
ViewVC Help
Powered by ViewVC 1.0.0