Home My Page Projects Code Snippets Project Openings diderot
Summary Activity Tracker Tasks SCM

SCM Repository

[diderot] Annotation of /branches/pure-cfg/src/compiler/cl-target/cl-target.sml
ViewVC logotype

Annotation of /branches/pure-cfg/src/compiler/cl-target/cl-target.sml

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1264 - (view) (download)

1 : lamonts 1244 (* c-target.sml
2 :     *
3 :     * COPYRIGHT (c) 2011 The Diderot Project (http://diderot-language.cs.uchicago.edu)
4 :     * All rights reserved.
5 :     *)
6 :    
7 :     structure CLTarget : TARGET =
8 :     struct
9 :    
10 :     structure IL = TreeIL
11 :     structure V = IL.Var
12 :     structure Ty = IL.Ty
13 :     structure CL = CLang
14 :     structure RN = RuntimeNames
15 :     structure ToC = TreeToCL
16 :    
17 :     type var = ToC.var
18 :     type exp = CL.exp
19 :     type stm = CL.stm
20 :    
21 :     datatype strand = Strand of {
22 : jhr 1261 name : string,
23 :     tyName : string,
24 :     state : var list ref,
25 :     output : (Ty.ty * CL.var) option ref, (* the strand's output variable (only one for now) *)
26 :     code : CL.decl list ref
27 : lamonts 1244 }
28 :    
29 :     datatype program = Prog of {
30 : jhr 1261 double : bool, (* true for double-precision support *)
31 :     parallel : bool, (* true for multithreaded (or multi-GPU) target *)
32 :     debug : bool, (* true for debug support in executable *)
33 :     globals : CL.decl list ref,
34 :     topDecls : CL.decl list ref,
35 :     strands : strand AtomTable.hash_table,
36 :     initially : CL.stm list ref,
37 : lamonts 1264 numDims: int ref,
38 :     imgGlobals: (string * int) list ref,
39 :     prFn: CL.decl ref
40 : lamonts 1244 }
41 :    
42 :     datatype env = ENV of {
43 : jhr 1261 info : env_info,
44 :     vMap : var V.Map.map,
45 :     scope : scope
46 : lamonts 1244 }
47 :    
48 :     and env_info = INFO of {
49 : jhr 1261 prog : program
50 : lamonts 1244 }
51 :    
52 :     and scope
53 :     = NoScope
54 :     | GlobalScope
55 :     | InitiallyScope
56 : jhr 1261 | StrandScope of TreeIL.var list (* strand initialization *)
57 :     | MethodScope of TreeIL.var list (* method body; vars are state variables *)
58 : lamonts 1244
59 :     (* the supprted widths of vectors of reals on the target. For the GNU vector extensions,
60 :     * the supported sizes are powers of two, but float2 is broken.
61 :     * NOTE: we should also consider the AVX vector hardware, which has 256-bit registers.
62 :     *)
63 :     fun vectorWidths () = if !RuntimeNames.doublePrecision
64 : jhr 1261 then [2, 4, 8]
65 :     else [4, 8]
66 : lamonts 1244
67 :     (* tests for whether various expression forms can appear inline *)
68 : jhr 1261 fun inlineCons n = (n < 2) (* vectors are inline, but not matrices *)
69 :     val inlineMatrixExp = false (* can matrix-valued expressions appear inline? *)
70 : lamonts 1244
71 :     (* TreeIL to target translations *)
72 :     structure Tr =
73 :     struct
74 : jhr 1261 fun fragment (ENV{info, vMap, scope}, blk) = let
75 :     val (vMap, stms) = ToC.trFragment (vMap, blk)
76 :     in
77 :     (ENV{info=info, vMap=vMap, scope=scope}, stms)
78 :     end
79 :     fun saveState cxt stateVars (env, args, stm) = (
80 :     ListPair.foldrEq
81 :     (fn (x, e, stms) => ToC.trAssign(env, x, e)@stms)
82 :     [stm]
83 :     (stateVars, args)
84 :     ) handle ListPair.UnequalLengths => (
85 :     print(concat["saveState ", cxt, ": length mismatch; ", Int.toString(List.length args), " args\n"]);
86 :     raise Fail(concat["saveState ", cxt, ": length mismatch"]))
87 :     fun block (ENV{vMap, scope, ...}, blk) = (case scope
88 :     of StrandScope stateVars => ToC.trBlock (vMap, saveState "StrandScope" stateVars, blk)
89 :     | MethodScope stateVars => ToC.trBlock (vMap, saveState "MethodScope" stateVars, blk)
90 :     | _ => ToC.trBlock (vMap, fn (_, _, stm) => [stm], blk)
91 :     (* end case *))
92 :     fun exp (ENV{vMap, ...}, e) = ToC.trExp(vMap, e)
93 : lamonts 1244 end
94 :    
95 :     (* variables *)
96 :     structure Var =
97 :     struct
98 : jhr 1261 fun name (ToC.V(_, name)) = name
99 :     fun global (Prog{globals,imgGlobals, ...}, name, ty) = let
100 :     val ty' = ToC.trType ty
101 :     fun isImgGlobal (imgGlobals, Ty.ImageTy(ImageInfo.ImgInfo{dim, ...}), name) = imgGlobals := (name,dim):: !imgGlobals
102 :     | isImgGlobal (imgGlobals, _, _) = ()
103 :     in
104 :     globals := CL.D_Var([], ty', name, NONE) :: !globals;
105 :     isImgGlobal(imgGlobals,ty,name);
106 :     ToC.V(ty', name)
107 :     end
108 :     fun param x = ToC.V(ToC.trType(V.ty x), V.name x)
109 :     fun state (Strand{state, ...}, x) = let
110 :     val ty' = ToC.trType(V.ty x)
111 :     val x' = ToC.V(ty', V.name x)
112 :     in
113 :     state := x' :: !state;
114 :     x'
115 :     end
116 : lamonts 1244 end
117 :    
118 :     (* environments *)
119 :     structure Env =
120 :     struct
121 :     (* create a new environment *)
122 : jhr 1261 fun new prog = ENV{
123 :     info=INFO{prog = prog},
124 :     vMap = V.Map.empty,
125 :     scope = NoScope
126 :     }
127 : lamonts 1244 (* define the current translation context *)
128 : jhr 1261 fun setScope scope (ENV{info, vMap, ...}) = ENV{info=info, vMap=vMap, scope=scope}
129 :     val scopeGlobal = setScope GlobalScope
130 :     val scopeInitially = setScope InitiallyScope
131 :     fun scopeStrand (env, svars) = setScope (StrandScope svars) env
132 :     fun scopeMethod (env, svars) = setScope (MethodScope svars) env
133 : lamonts 1244 (* bind a TreeIL varaiable to a target variable *)
134 : jhr 1261 fun bind (ENV{info, vMap, scope}, x, x') = ENV{
135 :     info = info,
136 :     vMap = V.Map.insert(vMap, x, x'),
137 :     scope = scope
138 :     }
139 : lamonts 1244 end
140 :    
141 :     (* programs *)
142 :     structure Program =
143 :     struct
144 : jhr 1261 fun new {double, parallel, debug} = (
145 :     RN.initTargetSpec double;
146 :     Prog{
147 :     double = double, parallel = parallel, debug = debug,
148 :     globals = ref [
149 :     CL.D_Verbatim[
150 :     if double
151 :     then "#define DIDEROT_DOUBLE_PRECISION"
152 :     else "#define DIDEROT_SINGLE_PRECISION",
153 :     "#include \"Diderot/opencl_types.h\""
154 :     ]],
155 :     topDecls = ref [],
156 :     strands = AtomTable.mkTable (16, Fail "strand table"),
157 :     initially = ref([CL.S_Comment["missing initially"]]),
158 : lamonts 1264 numDims = ref(0),
159 :     imgGlobals = ref[],
160 :     prFn = ref(CL.D_Comment(["No Print Function"]))
161 : jhr 1261 })
162 : lamonts 1244 (* register the global initialization part of a program *)
163 : lamonts 1264 fun globalIndirects (globals,stms) = let
164 :     fun getGlobals(CL.D_Var(_,_,globalVar,_)::rest) = CL.mkAssign(CL.mkIndirect(CL.E_Var RN.globalsVarName,globalVar),CL.E_Var globalVar)::getGlobals(rest)
165 :     | getGlobals([]) = []
166 :     | getGlobals(_::rest) = getGlobals(rest)
167 :     in
168 :     stms @ getGlobals(globals)
169 :     end
170 : jhr 1261
171 :     (* register the code that is used to register command-line options for input variables *)
172 :     fun inputs (Prog{topDecls, ...}, stm) = let
173 :     val inputsFn = CL.D_Func(
174 :     [], CL.voidTy, RN.registerOpts,
175 :     [CL.PARAM([], CL.T_Ptr(CL.T_Named RN.optionsTy), "opts")],
176 :     stm)
177 :     in
178 :     topDecls := inputsFn :: !topDecls
179 :     end
180 :    
181 :     fun init (Prog{globals,topDecls,...}, CL.S_Block(init)) = let
182 :     val params = [
183 :     CL.PARAM([], CL.T_Ptr(CL.T_Named RN.globalsTy), RN.globalsVarName)
184 :     ]
185 :     val body = CL.S_Block(globalIndirects(!globals,init))
186 :     val initFn = CL.D_Func([], CL.voidTy, RN.initGlobals, params, body)
187 :     in
188 :     topDecls := initFn :: !topDecls
189 :     end
190 :     | init (Prog{globals,topDecls,...}, init) = let
191 :     val params = [
192 :     CL.PARAM([], CL.T_Ptr(CL.T_Named RN.globalsTy), RN.globalsVarName)
193 :     ]
194 :     val initFn = CL.D_Func([], CL.voidTy, RN.initGlobals, params, init)
195 :     in
196 :     topDecls := initFn :: !topDecls
197 :     end
198 :    
199 : lamonts 1244 (* create and register the initially function for a program *)
200 : jhr 1261 fun initially {
201 : lamonts 1264 prog = Prog{strands, initially,numDims,...},
202 : jhr 1261 isArray : bool,
203 :     iterPrefix : stm list,
204 :     iters : (var * exp * exp) list,
205 :     createPrefix : stm list,
206 :     strand : Atom.atom,
207 :     args : exp list
208 :     } = let
209 :     val name = Atom.toString strand
210 :     val nDims = List.length iters
211 :     fun mapi f xs = let
212 :     fun mapf (_, []) = []
213 :     | mapf (i, x::xs) = f(i, x) :: mapf(i+1, xs)
214 :     in
215 :     mapf (0, xs)
216 :     end
217 :     val baseInit = mapi (fn (i, (_, e, _)) => (i, CL.I_Exp e)) iters
218 :     val sizeInit = mapi
219 :     (fn (i, (ToC.V(ty, _), lo, hi)) =>
220 :     (i, CL.I_Exp(CL.mkBinOp(CL.mkBinOp(hi, CL.#-, lo), CL.#+, CL.E_Int(1, ty))))
221 :     ) iters
222 :     val numStrandsVar = "numStrandsVar"
223 :     val allocCode = iterPrefix @ [
224 :     CL.mkComment["allocate initial block of strands"],
225 :     CL.mkDecl(CL.T_Array(CL.int32, SOME nDims), "base", SOME(CL.I_Array baseInit)),
226 :     CL.mkDecl(CL.T_Array(CL.uint32, SOME nDims), "size", SOME(CL.I_Array sizeInit)),
227 :     CL.mkDecl(CL.int32,"numDims",SOME(CL.I_Exp(CL.E_Int(IntInf.fromInt nDims, CL.int32))))
228 :     ]
229 :    
230 : lamonts 1264 val numStrandsLoopBody = CL.mkExpStm(CL.mkAssignOp(CL.E_Var numStrandsVar, CL.*=,CL.mkSubscript(CL.E_Var "size",CL.E_Var "i")))
231 :    
232 :    
233 :     val numStrandsLoop = CL.mkFor([(CL.intTy, "i", CL.E_Int(0,CL.intTy))],
234 :     CL.mkBinOp(CL.E_Var "i", CL.#<, CL.E_Var "numDims"),
235 :     [CL.mkPostOp(CL.E_Var "i", CL.^++)], numStrandsLoopBody)
236 :     in
237 :     numDims := nDims;
238 :     initially := allocCode @ [numStrandsLoop]
239 :    
240 :     end
241 : lamonts 1256
242 :    
243 : lamonts 1244 (***** OUTPUT *****)
244 : lamonts 1264 fun genStrandPrint (Strand{name, tyName, state, output, code},nDims) = let
245 :     (* the print function *)
246 :     val prFnName = concat[name, "_print"]
247 :    
248 :     val prFn = let
249 :     val params = [
250 :     CL.PARAM([], CL.T_Ptr(CL.T_Named "FILE"), "outS"),
251 :     CL.PARAM([], CL.T_Ptr(CL.intTy), "sizes" ),
252 :     CL.PARAM([], CL.intTy, "width"),
253 :     CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "self")
254 :     ]
255 :    
256 :     val SOME(ty, x) = !output
257 :     val outState = if nDims = 1 then
258 :     CL.mkSelect(CL.mkSubscript(CL.mkVar "self",CL.E_Var "x"), x)
259 :     else if nDims = 2 then
260 :     CL.mkSelect(CL.mkSubscript(CL.mkVar "self",
261 :     CL.mkBinOp(CL.mkBinOp(CL.E_Var "x",CL.#*,CL.E_Var "width"),CL.#+,CL.E_Var "y")), x)
262 :    
263 :     else CL.mkSelect(CL.mkVar "self",x)
264 :    
265 :     val prArgs = (case ty
266 :     of Ty.IVecTy 1 => [CL.E_Str(!RN.gIntFormat ^ "\n"), outState]
267 :     | Ty.IVecTy d => let
268 :     val fmt = CL.E_Str(
269 :     String.concatWith " " (List.tabulate(d, fn _ => !RN.gIntFormat))
270 :     ^ "\n")
271 :     val args = List.tabulate (d, fn i => ToC.ivecIndex(outState, d, i))
272 :     in
273 :     fmt :: args
274 :     end
275 :     | Ty.TensorTy[] => [CL.E_Str "%f\n", outState]
276 :     | Ty.TensorTy[d] => let
277 :     val fmt = CL.E_Str(
278 :     String.concatWith " " (List.tabulate(d, fn _ => "%f"))
279 :     ^ "\n")
280 :     val args = List.tabulate (d, fn i => ToC.vecIndex(outState, d, i))
281 :     in
282 :     fmt :: args
283 :     end
284 :     | _ => raise Fail("genStrand: unsupported output type " ^ Ty.toString ty)
285 :     (* end case *))
286 :    
287 :     val body = let
288 :    
289 :     fun loopParams (3) =
290 :     "x"::"y"::"k"::[]
291 :     | loopParams (2) =
292 :     "x"::"y"::[]
293 :     | loopParams (1) =
294 :     "x"::[]
295 :     | loopParams (_) =
296 :     raise Fail("genStrandPrint: unsupported output type " ^ Ty.toString ty)
297 :    
298 :     fun mkLoopNest ([],_) =
299 :     CL.mkCall("fprintf", CL.mkVar "outS" :: prArgs)
300 :     | mkLoopNest (param::rest,count) = let
301 :     val body = mkLoopNest (rest, count + 1)
302 :     in
303 :     CL.mkFor(
304 :     [(CL.intTy, param, CL.E_Int(0,CL.intTy))],
305 :     CL.mkBinOp(CL.E_Var param, CL.#<=, CL.mkSubscript(CL.E_Var "sizes",CL.E_Int(count,CL.intTy))),
306 :     [CL.mkPostOp(CL.E_Var param, CL.^++)],
307 :     body)
308 :     end
309 :     in
310 :     [mkLoopNest ((loopParams nDims),0)]
311 :     end
312 :    
313 :     in
314 :     CL.D_Func(["static"], CL.voidTy, prFnName, params,CL.mkBlock(body))
315 :     end
316 :     in
317 :     prFn
318 :     end
319 : jhr 1261 fun genStrandTyDef (Strand{tyName, state,...}) =
320 :     (* the type declaration for the strand's state struct *)
321 :     CL.D_StructDef(
322 :     List.rev (List.map (fn ToC.V(ty, x) => (ty, x)) (!state)),
323 :     tyName)
324 :    
325 :    
326 : lamonts 1264 (* generates the load kernel function *)
327 : jhr 1261 (* FIXME: this code might be part of the runtime system *)
328 : lamonts 1264 fun genKernelLoader() =
329 :     CL.D_Verbatim ( ["/* Loads the Kernel from a file */",
330 :     "char * loadKernel (const char * filename) {",
331 :     "struct stat statbuf;",
332 :     "FILE *fh;",
333 :     "char *source;",
334 :     "fh = fopen(filename, \"r\");",
335 :     "if (fh == 0)",
336 :     " return 0;",
337 :     "stat(filename, &statbuf);",
338 :     "source = (char *) malloc(statbuf.st_size + 1);",
339 :     "fread(source, statbuf.st_size, 1, fh);",
340 :     "fread(source, statbuf.st_size, 1, fh);",
341 :     "return source;",
342 :     "}"])
343 :     (* generates the opencl buffers for the image data *)
344 :     fun getGlobalDataBuffers(globals,count,contextVar,errVar) = let
345 :     val globalBufferDecl = CL.mkDecl(CL.clMemoryTy,concat[RN.globalsVarName,"_cl"],NONE)
346 :     val globalBuffer = CL.mkAssign(CL.E_Var(concat[RN.globalsVarName,"_cl"]), CL.mkApply("clCreateBuffer",
347 :     [CL.E_Var contextVar,
348 :     CL.E_Var "CL_MEM_READ_WRITE | CL_MEM_ALLOC_HOST_PTR | CL_MEM_COPY_HOST_PTR",
349 :     CL.mkApply("sizeof",[CL.E_Var RN.globalsTy]),
350 :     CL.E_Var RN.globalsVarName,
351 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)]))
352 : jhr 1261
353 : lamonts 1264 fun genDataBuffers([],_,_,_) = []
354 :     | genDataBuffers((var,nDims)::globals,count,contextVar,errVar) = let
355 :     (* FIXME: use CL constructors to build expressions (not strings) *)
356 :     val size = if nDims = 1 then
357 :     CL.mkBinOp(CL.mkApply("sizeof",[CL.E_Var "float"]), CL.#*,
358 :     CL.mkIndirect(CL.E_Var var, "size[0]"))
359 :     else if nDims = 2 then
360 :     CL.mkBinOp(CL.mkApply("sizeof",[CL.E_Var "float"]), CL.#*,
361 :     CL.mkIndirect(CL.E_Var var, concat["size[0]", " * ", var, "->size[1]"]))
362 :     else
363 :     CL.mkBinOp(CL.mkApply("sizeof",[CL.E_Var "float"]), CL.#*,
364 :     CL.mkIndirect(CL.E_Var var,concat["size[0]", " * ", var, "->size[1] * ", var, "->size[2]"]))
365 :    
366 :     in
367 :     CL.mkDecl(CL.clMemoryTy,RN.addBufferSuffix var ,NONE)::
368 :     CL.mkDecl(CL.clMemoryTy,RN.addBufferSuffixData var ,NONE)::
369 :     CL.mkAssign(CL.E_Var(RN.addBufferSuffix var), CL.mkApply("clCreateBuffer",
370 :     [CL.E_Var contextVar,
371 :     CL.E_Var "CL_MEM_READ_WRITE | CL_MEM_ALLOC_HOST_PTR | CL_MEM_COPY_HOST_PTR",
372 :     CL.mkApply("sizeof",[CL.E_Var (RN.imageTy nDims)]),
373 :     CL.E_Var var,
374 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)])) ::
375 :     CL.mkAssign(CL.E_Var(RN.addBufferSuffixData var), CL.mkApply("clCreateBuffer",
376 :     [CL.E_Var contextVar,
377 :     CL.E_Var "CL_MEM_READ_WRITE | CL_MEM_ALLOC_HOST_PTR | CL_MEM_COPY_HOST_PTR",
378 :     size,
379 :     CL.mkIndirect(CL.E_Var var,"data"),
380 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)])):: genDataBuffers(globals,count + 2,contextVar,errVar)
381 :     end
382 :     in
383 :     [globalBufferDecl] @ [globalBuffer] @ genDataBuffers(globals,count + 2,contextVar,errVar)
384 :     end
385 :    
386 : jhr 1261
387 : lamonts 1264 (* generates the kernel arguments for the image data *)
388 :     fun genGlobalArguments(globals,count,kernelVar,errVar) = let
389 :     val globalArgument = CL.mkExpStm(CL.mkAssignOp(CL.E_Var errVar,CL.|=,CL.mkApply("clSetKernelArg",
390 :     [CL.E_Var kernelVar,
391 :     CL.E_Int(count,CL.intTy),
392 :     CL.mkApply("sizeof",[CL.E_Var "cl_mem"]),
393 :     CL.E_UnOp(CL.%&,CL.E_Var(concat[RN.globalsVarName,"_cl"]))])))
394 :    
395 :     fun genDataArguments([],_,_,_) = []
396 :     | genDataArguments((var,nDims)::globals,count,kernelVar,errVar) =
397 :    
398 :     CL.mkExpStm(CL.mkAssignOp(CL.E_Var errVar,CL.|=, CL.mkApply("clSetKernelArg",
399 :     [CL.E_Var kernelVar,
400 :     CL.E_Int(count,CL.intTy),
401 :     CL.mkApply("sizeof",[CL.E_Var "cl_mem"]),
402 :     CL.E_UnOp(CL.%&,CL.E_Var(RN.addBufferSuffix var))])))::
403 :    
404 :     CL.mkExpStm(CL.mkAssignOp(CL.E_Var errVar,CL.|=,CL.mkApply("clSetKernelArg",
405 :     [CL.E_Var kernelVar,
406 :     CL.E_Int((count + 1),CL.intTy),
407 :     CL.mkApply("sizeof",[CL.E_Var "cl_mem"]),
408 :     CL.E_UnOp(CL.%&,CL.E_Var(RN.addBufferSuffixData var))]))):: genDataArguments (globals, count + 2,kernelVar,errVar)
409 :    
410 :     in
411 :    
412 :     [globalArgument] @ genDataArguments(globals,count + 1,kernelVar,errVar)
413 :    
414 :     end
415 :    
416 :     (* generates the main function of host code *)
417 :     fun genHostMain() = let
418 :     val setupCall = [CL.mkCall(RN.setupFName,[CL.E_Var RN.globalsVarName])]
419 :     val globalsDecl = CL.mkDecl(CL.T_Ptr(CL.T_Named RN.globalsTy), RN.globalsVarName,SOME(CL.I_Exp(CL.mkApply("malloc",
420 :     [CL.mkApply("sizeof",[CL.E_Var RN.globalsTy])]))))
421 :     val initGlobalsCall = CL.mkCall(RN.initGlobals,[CL.E_Var RN.globalsVarName])
422 :     val returnStm = [CL.mkReturn(SOME(CL.E_Int(0,CL.intTy)))]
423 :     val params = [
424 :     CL.PARAM([],CL.intTy, "argc"),
425 :     CL.PARAM([],CL.charArrayPtr,"argv")
426 :     ]
427 :     val body = CL.mkBlock([globalsDecl] @ [initGlobalsCall] @ setupCall @ returnStm)
428 :     in
429 :     CL.D_Func([],CL.intTy,"main",params,body)
430 :     end
431 :    
432 : jhr 1261 (* generates the host-side setup function *)
433 : lamonts 1264 fun genHostSetupFunc(strand as Strand{name,tyName,...}, filename, nDims, initially, imgGlobals) = let
434 :     (*Delcare opencl setup objects *)
435 :     val programVar= "program"
436 :     val kernelVar = "kernel"
437 :     val cmdVar = "queue"
438 :     val inStateVar = "selfin"
439 :     val outStateVar = "selfout"
440 :     val stateSizeVar= "state_mem_size"
441 :     val clInstateVar = "clSelfIn"
442 :     val clOutStateVar = "clSelfOut"
443 :     val clGlobals = "clGlobals"
444 :     val sourcesVar = "sources"
445 :     val contextVar = "context"
446 :     val errVar = "err"
447 :     val imgDataSizeVar = "image_dataSize"
448 :     val globalVar = "global_work_size"
449 :     val localVar = "local_work_size"
450 :     val clFNVar = "filename"
451 :     val numStrandsVar = "numStrandsVar"
452 :     val headerFNVar = "header"
453 :     val deviceVar = "device"
454 :     val platformsVar = "platforms"
455 :     val numPlatformsVar = "num_platforms"
456 :     val numDevicesVar = "num_devices"
457 :     val assertStm = CL.mkCall("assert",[CL.mkBinOp(CL.E_Var errVar, CL.#==, CL.E_Var "CL_SUCCESS")])
458 :     val params = [
459 :     CL.PARAM([],CL.T_Ptr(CL.T_Named RN.globalsTy), RN.globalsVarName)
460 :     ]
461 :     val delcarations = [CL.mkDecl(CL.clProgramTy, programVar, NONE),
462 :     CL.mkDecl(CL.clKernelTy, kernelVar, NONE),
463 :     CL.mkDecl(CL.clCmdQueueTy, cmdVar, NONE),
464 :     CL.mkDecl(CL.clContextTy, contextVar, NONE),
465 :     CL.mkDecl(CL.intTy, errVar, NONE),
466 :     CL.mkDecl(CL.intTy, numStrandsVar, NONE),
467 :     CL.mkDecl(CL.intTy, stateSizeVar, NONE),
468 :     CL.mkDecl(CL.intTy, "width", NONE),
469 :     CL.mkDecl(CL.intTy, imgDataSizeVar, NONE),
470 :     CL.mkDecl(CL.clDeviceIdTy, deviceVar, NONE),
471 :     CL.mkDecl(CL.T_Ptr(CL.T_Named tyName), inStateVar,NONE),
472 :     CL.mkDecl(CL.clMemoryTy,clInstateVar,NONE),
473 :     CL.mkDecl(CL.clMemoryTy,clOutStateVar,NONE),
474 :     CL.mkDecl(CL.T_Ptr(CL.T_Named tyName), outStateVar,NONE),
475 :     CL.mkDecl(CL.charPtr, clFNVar,SOME(CL.I_Exp(CL.E_Str filename))),
476 :     CL.mkDecl(CL.charPtr, headerFNVar,SOME(CL.I_Exp(CL.E_Str "Diderot/opencl_types.h"))),
477 :     CL.mkDecl(CL.T_Array(CL.charPtr,SOME(2)),sourcesVar,NONE),
478 :     CL.mkDecl(CL.T_Array(CL.T_Named "size_t",SOME(nDims)),globalVar,NONE),
479 :     CL.mkDecl(CL.T_Array(CL.T_Named "size_t",SOME(nDims)),localVar,NONE),
480 :     CL.mkDecl(CL.intTy,numDevicesVar,SOME(CL.I_Exp(CL.E_Int(~1,CL.intTy)))),
481 :     CL.mkDecl(CL.T_Array(CL.T_Named "cl_platform_id", SOME(1)), platformsVar, NONE),
482 :     CL.mkDecl(CL.intTy,"num_platforms",SOME(CL.I_Exp(CL.E_Int(~1,CL.intTy))))]
483 :    
484 :     (* Retrieve the platforms *)
485 :     val platformStm = [CL.mkAssign(CL.E_Var errVar, CL.mkApply("clGetPlatformIDs",
486 :     [CL.E_Int(10,CL.intTy),
487 :     CL.E_Var platformsVar,
488 :     CL.E_UnOp(CL.%&,CL.E_Var numPlatformsVar)])),
489 :     assertStm]
490 :    
491 :     val devicesStm = [CL.mkAssign(CL.E_Var errVar, CL.mkApply("clGetDeviceIDs",
492 :     [CL.mkSubscript(CL.E_Var platformsVar,CL.E_Int(0,CL.intTy)),
493 :     CL.E_Var "CL_DEVICE_TYPE_GPU",
494 :     CL.E_Int(1,CL.intTy),
495 :     CL.E_UnOp(CL.%&,CL.E_Var deviceVar),
496 :     CL.E_UnOp(CL.%&,CL.E_Var numDevicesVar)])),
497 :     assertStm]
498 :    
499 :     (* Create Context *)
500 :     val contextStm = [CL.mkAssign(CL.E_Var contextVar, CL.mkApply("clCreateContext",
501 :     [CL.E_Int(0,CL.intTy),
502 :     CL.E_Int(1,CL.intTy),
503 :     CL.E_UnOp(CL.%&,CL.E_Var deviceVar),
504 :     CL.E_Var "NULL",
505 :     CL.E_Var "NULL",
506 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)])),
507 :     assertStm]
508 :    
509 :     (* Create Command Queue *)
510 :     val commandStm = [CL.mkAssign(CL.E_Var cmdVar, CL.mkApply("clCreateCommandQueue",
511 :     [CL.E_Var contextVar,
512 :     CL.E_Var deviceVar,
513 :     CL.E_Int(0,CL.intTy),
514 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)])),
515 :     assertStm]
516 :    
517 :    
518 :     (*Create Program/Build/Kernel with Source statement *)
519 :     val createProgStm = CL.mkAssign(CL.E_Var programVar, CL.mkApply("clCreateProgramWithSource",
520 :     [CL.E_Var contextVar,
521 :     CL.E_Int(2,CL.intTy),
522 :     CL.E_Cast(CL.T_Ptr(CL.T_Named("const char *")),CL.E_UnOp(CL.%&,CL.E_Var sourcesVar)),
523 :     CL.E_Var "NULL",
524 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)]))
525 :    
526 :     (* FIXME: Remove after testing purposes, Build Log for OpenCL*)
527 :     val buildLog = [CL.mkAssign(CL.E_Var errVar, CL.mkApply("clBuildProgram",
528 :     [CL.E_Var programVar,
529 :     CL.E_Int(0,CL.intTy),
530 :     CL.E_Var "NULL",
531 :     CL.E_Var "NULL",
532 :     CL.E_Var "NULL",
533 :     CL.E_Var "NULL"])),
534 :     CL.mkDecl(CL.T_Array(CL.charTy,SOME(2048)), "build", NONE),
535 :     CL.mkAssign(CL.E_Var errVar, CL.mkApply("clGetProgramBuildInfo",
536 :     [CL.E_Var programVar,
537 :     CL.E_Var deviceVar,
538 :     CL.E_Var "CL_PROGRAM_BUILD_LOG",
539 :     CL.E_Int (2048,CL.intTy),
540 :     CL.E_Var "build",
541 :     CL.E_Var "NULL"])),
542 :     CL.mkCall("printf",[CL.E_Str ( "Build Log:" ^ "\n" ^ "%s" ^ "\n"), CL.E_Var "build"])]
543 :    
544 :    
545 :    
546 :    
547 :     val createKernel = CL.mkAssign(CL.E_Var kernelVar, CL.mkApply("clCreateKernel",
548 :     [CL.E_Var programVar,
549 :     CL.E_Str RN.kernelFuncName,
550 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)]))
551 :    
552 :    
553 :     val create_build_stms = [createProgStm,assertStm] @ buildLog @ [assertStm,createKernel,assertStm]
554 :    
555 :    
556 :    
557 :     (* Create Memory Buffers for Strand States and Globals *)
558 :     val strandSize = CL.mkAssign(CL.E_Var stateSizeVar,CL.mkBinOp(CL.mkApply("sizeof",
559 :     [CL.E_Var tyName]), CL.#*,CL.E_Var numStrandsVar))
560 :     val strandObjects = [CL.mkAssign(CL.E_Var inStateVar, CL.mkApply("malloc",
561 :     [CL.E_Var stateSizeVar])),
562 :     CL.mkAssign(CL.E_Var outStateVar, CL.mkApply("malloc",
563 :     [CL.E_Var stateSizeVar]))]
564 :    
565 :     val clStrandObjects = [CL.mkAssign(CL.E_Var clInstateVar, CL.mkApply("clCreateBuffer",
566 :     [CL.E_Var contextVar,
567 :     CL.E_Var "CL_MEM_READ_WRITE",
568 :     CL.E_Var stateSizeVar,
569 :     CL.E_Var "NULL",
570 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)])),
571 :     CL.mkAssign(CL.E_Var clOutStateVar, CL.mkApply("clCreateBuffer",
572 :     [CL.E_Var contextVar,
573 :     CL.E_Var "CL_MEM_READ_WRITE",
574 :     CL.E_Var stateSizeVar,
575 :     CL.E_Var "NULL",
576 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)]))]
577 :    
578 :     val clGlobalBuffers = getGlobalDataBuffers(!imgGlobals,3,contextVar,errVar)
579 :    
580 :    
581 :     (* Load the Kernel and Header Files *)
582 :     val sourceStms = [CL.mkAssign(CL.mkSubscript(CL.E_Var sourcesVar,CL.E_Int(0,CL.intTy)),
583 :     CL.mkApply(RN.clLoaderFN, [CL.E_Var clFNVar])),
584 :     CL.mkAssign(CL.mkSubscript(CL.E_Var sourcesVar,CL.E_Int(1,CL.intTy)),
585 :     CL.mkApply(RN.clLoaderFN, [CL.E_Var headerFNVar]))]
586 :    
587 : jhr 1261 (* Created Enqueue Statements *)
588 :     (* FIXME: simplify this code by function abstraction *)
589 : lamonts 1264 val enqueueStm = if nDims = 1
590 :     then [CL.mkAssign(CL.E_Var errVar,
591 :     CL.mkApply("clEnqueueNDRangeKernel",
592 :     [CL.E_Var cmdVar,
593 :     CL.E_Var kernelVar,
594 :     CL.E_Int(1,CL.intTy),
595 :     CL.E_Var "NULL",
596 :     CL.E_Var globalVar,
597 :     CL.E_Var localVar,
598 :     CL.E_Int(0,CL.intTy),
599 :     CL.E_Var "NULL",
600 :     CL.E_Var "NULL"])),CL.mkCall("clFinish",[CL.E_Var cmdVar])]
601 :     else if nDims = 2 then
602 :     [CL.mkAssign(CL.E_Var errVar,
603 :     CL.mkApply("clEnqueueNDRangeKernel",
604 :     [CL.E_Var cmdVar,
605 :     CL.E_Var kernelVar,
606 :     CL.E_Int(2,CL.intTy),
607 :     CL.E_Var "NULL",
608 :     CL.E_Var globalVar,
609 :     CL.E_Var localVar,
610 :     CL.E_Int(0,CL.intTy),
611 :     CL.E_Var "NULL",
612 :     CL.E_Var "NULL"])),CL.mkCall("clFinish",[CL.E_Var cmdVar])]
613 :     else
614 :     [CL.mkAssign(CL.E_Var errVar,
615 :     CL.mkApply("clEnqueueNDRangeKernel",
616 :     [CL.E_Var cmdVar,
617 :     CL.E_Var kernelVar,
618 :     CL.E_Int(3,CL.intTy),
619 :     CL.E_Var "NULL",
620 :     CL.E_Var globalVar,
621 :     CL.E_Var localVar,
622 :     CL.E_Int(0,CL.intTy),
623 :     CL.E_Var "NULL",
624 :     CL.E_Var "NULL"])),CL.mkCall("clFinish",[CL.E_Var cmdVar])]
625 :    
626 :     (* Setup up selfOut variable *)
627 :     val selfOutStm = CL.mkAssign(CL.E_Var outStateVar, CL.mkApply("malloc", [CL.mkBinOp(CL.E_Var numStrandsVar,
628 :     CL.#*, CL.mkApply("sizeof",[CL.E_Var tyName]))]))
629 :    
630 :     (* Initialize Width Parameter *)
631 :     val widthDel = if nDims = 2 then
632 :     CL.mkAssign(CL.E_Var "width",CL.mkSubscript(CL.E_Var globalVar, CL.E_Int(1, CL.intTy)))
633 :     else
634 :     CL.mkAssign(CL.E_Var "width",CL.E_Int(0,CL.intTy))
635 :    
636 :     (* Setup Global and Local variables *)
637 :    
638 :     val globalAndlocalStms = if nDims = 1 then
639 :     [CL.mkAssign(CL.mkSubscript(CL.E_Var globalVar, CL.E_Int(0,CL.intTy)),
640 :     CL.mkSubscript(CL.E_Var "size", CL.E_Int(0,CL.intTy))),
641 :     CL.mkAssign(CL.mkSubscript(CL.E_Var localVar, CL.E_Int(0,CL.intTy)),
642 :     CL.E_Var "16")]
643 :    
644 :    
645 :     else if nDims = 2 then
646 :     [CL.mkAssign(CL.mkSubscript(CL.E_Var globalVar, CL.E_Int(0,CL.intTy)),
647 :     CL.mkSubscript(CL.E_Var "size", CL.E_Int(0,CL.intTy))),
648 :     CL.mkAssign(CL.mkSubscript(CL.E_Var globalVar, CL.E_Int(1,CL.intTy)),
649 :     CL.mkSubscript(CL.E_Var "size", CL.E_Int(1,CL.intTy))),
650 :     CL.mkAssign(CL.mkSubscript(CL.E_Var localVar, CL.E_Int(0,CL.intTy)),
651 :     CL.E_Var "16"),
652 :     CL.mkAssign(CL.mkSubscript(CL.E_Var localVar, CL.E_Int(1,CL.intTy)),
653 :     CL.E_Var "16")]
654 :    
655 :     else
656 :     [CL.mkAssign(CL.mkSubscript(CL.E_Var globalVar, CL.E_Int(0,CL.intTy)),
657 :     CL.mkSubscript(CL.E_Var "size", CL.E_Int(0,CL.intTy))),
658 :     CL.mkAssign(CL.mkSubscript(CL.E_Var globalVar, CL.E_Int(1,CL.intTy)),
659 :     CL.mkSubscript(CL.E_Var "size", CL.E_Int(1,CL.intTy))),
660 :     CL.mkAssign(CL.mkSubscript(CL.E_Var globalVar, CL.E_Int(2,CL.intTy)),
661 :     CL.mkSubscript(CL.E_Var "size", CL.E_Int(2,CL.intTy))),
662 :     CL.mkAssign(CL.mkSubscript(CL.E_Var localVar, CL.E_Int(0,CL.intTy)),
663 :     CL.E_Var "16"),
664 :     CL.mkAssign(CL.mkSubscript(CL.E_Var localVar, CL.E_Int(1,CL.intTy)),
665 :     CL.E_Var "16"),
666 :     CL.mkAssign(CL.mkSubscript(CL.E_Var localVar, CL.E_Int(2,CL.intTy)),
667 :     CL.E_Var "16")]
668 :    
669 : lamonts 1244
670 : lamonts 1264
671 :     (* Setup Kernel arguments *)
672 :     val kernelArguments = [CL.mkAssign(CL.E_Var errVar,CL.mkApply("clSetKernelArg",
673 :     [CL.E_Var kernelVar,
674 :     CL.E_Int(0,CL.intTy),
675 :     CL.mkApply("sizeof",[CL.E_Var "cl_mem"]),
676 :     CL.E_UnOp(CL.%&,CL.E_Var clInstateVar)])),
677 :     CL.mkExpStm(CL.mkAssignOp(CL.E_Var errVar, CL.|=,CL.mkApply("clSetKernelArg",
678 :     [CL.E_Var kernelVar,
679 :     CL.E_Int(1,CL.intTy),
680 :     CL.mkApply("sizeof",[CL.E_Var "cl_mem"]),
681 :     CL.E_UnOp(CL.%&,CL.E_Var clOutStateVar)]))),
682 :     CL.mkExpStm(CL.mkAssignOp(CL.E_Var errVar, CL.|=,CL.mkApply("clSetKernelArg",
683 :     [CL.E_Var kernelVar,
684 :     CL.E_Int(2,CL.intTy),
685 :     CL.mkApply("sizeof",[CL.E_Var "int"]),
686 :     CL.E_UnOp(CL.%&,CL.E_Var "width")])))]
687 :    
688 :     val clGlobalArguments = genGlobalArguments(!imgGlobals,3,kernelVar,errVar) @ [assertStm]
689 :    
690 :     (* Retrieve output *)
691 :     val outputStm = CL.mkAssign(CL.E_Var errVar,
692 :     CL.mkApply("clEnqueueReadBuffer",
693 :     [CL.E_Var cmdVar,
694 :     CL.E_Var clOutStateVar,
695 :     CL.E_Var "CL_TRUE",
696 :     CL.E_Int(0,CL.intTy),
697 :     CL.E_Var stateSizeVar,
698 :     CL.E_Var outStateVar,
699 :     CL.E_Int(0,CL.intTy),
700 :     CL.E_Var "NULL",
701 :     CL.E_Var "NULL"]))
702 :    
703 :     (* Free all the objects *)
704 :     val freeStms = [CL.mkCall("clReleaseKernel",[CL.E_Var kernelVar]),
705 :     CL.mkCall("clReleaseProgram",[CL.E_Var programVar ]),
706 :     CL.mkCall("clReleaseCommandQueue",[CL.E_Var cmdVar]),
707 :     CL.mkCall("clReleaseContext",[CL.E_Var contextVar]),
708 :     CL.mkCall("clReleaseMemObject",[CL.E_Var clInstateVar]),
709 :     CL.mkCall("clReleaseMemObject",[CL.E_Var clOutStateVar])]
710 :    
711 :    
712 :     (*Setup Strand Print Function *)
713 :     val outputData = [CL.mkDecl(CL.T_Ptr(CL.T_Named("FILE")), "outS", SOME(CL.I_Exp(CL.mkApply("fopen",
714 :     [CL.E_Str "mip.txt",
715 :     CL.E_Str "w"])))),
716 :     CL.mkCall(concat[name, "_print"],
717 :     [CL.E_Var "outS",
718 :     CL.E_Var "size",
719 :     CL.E_Var "width",
720 :     CL.E_Var outStateVar])]
721 :    
722 :    
723 :     (* Body put all the statments together *)
724 :     val body = delcarations @ platformStm @ devicesStm @ contextStm @ commandStm @ !initially @ [strandSize] @
725 :     clStrandObjects @ clGlobalBuffers @ sourceStms @ [selfOutStm] @ create_build_stms @ globalAndlocalStms @ [widthDel] @
726 :     kernelArguments @ clGlobalArguments @ enqueueStm @ [outputStm] @ freeStms @ outputData
727 :    
728 :     in
729 :    
730 :     CL.D_Func([],CL.voidTy,RN.setupFName,params,CL.mkBlock(body))
731 :    
732 :     end
733 :     (* generate the data and global parameters *)
734 :     fun genKeneralGlobalParams ((name,tyname)::rest) =
735 :     CL.PARAM(["__global"], CL.T_Ptr(CL.T_Named RN.globalsTy), concat[RN.globalsVarName]) ::
736 :     CL.PARAM(["__global"], CL.T_Ptr(CL.T_Named (RN.imageTy tyname)),RN.addBufferSuffix name) ::
737 :     CL.PARAM(["__global"], CL.T_Ptr(CL.voidTy),RN.addBufferSuffixData name) ::
738 :     genKeneralGlobalParams(rest)
739 :    
740 :     | genKeneralGlobalParams ([]) = []
741 :    
742 :     (*generate code for intilizing kernel global data *)
743 :     fun initKernelGlobals (globals,imgGlobals) = let
744 :     fun initGlobalStruct (CL.D_Var(_, _ , name, _)::rest) =
745 :     CL.mkAssign(CL.E_Var name, CL.mkIndirect(CL.E_Var RN.globalsVarName, name)) ::
746 :     initGlobalStruct(rest)
747 :     | initGlobalStruct ( _::rest) = initGlobalStruct(rest)
748 :     | initGlobalStruct([]) = []
749 :    
750 :     fun initGlobalImages((name,tyname)::rest) =
751 :     CL.mkAssign(CL.E_Var name, CL.E_Var (RN.addBufferSuffix name)) ::
752 :     CL.mkAssign(CL.mkIndirect(CL.E_Var name,"data"),CL.E_Var (RN.addBufferSuffixData name)) ::
753 :     initGlobalImages(rest)
754 :     | initGlobalImages([]) = []
755 :     in
756 :     initGlobalStruct(globals) @ initGlobalImages(imgGlobals)
757 :     end
758 :    
759 :     (* generate the main kernel function for the .cl file *)
760 :     fun genKernelFun(Strand{name, tyName, state, output, code},nDims,globals,imgGlobals) = let
761 :     val fName = RN.kernelFuncName;
762 :     val inState = "strand_in"
763 :     val outState = "strand_out"
764 :     val params = [
765 :     CL.PARAM(["__global"], CL.T_Ptr(CL.T_Named tyName), "selfIn"),
766 :     CL.PARAM(["__global"], CL.T_Ptr(CL.T_Named tyName), "selfOut"),
767 :     CL.PARAM(["__global"], CL.intTy, "width")
768 :     ] @ genKeneralGlobalParams(!imgGlobals)
769 :     val thread_ids = if nDims = 1
770 :     then [CL.mkDecl(CL.intTy, "x", SOME(CL.I_Exp(CL.E_Int(0, CL.intTy)))),
771 :     CL.mkAssign(CL.E_Var "x",CL.mkApply(RN.getGlobalThreadId,[CL.E_Int(0,CL.intTy)]))]
772 :     else
773 :     [CL.mkDecl(CL.intTy, "x", SOME(CL.I_Exp(CL.E_Int(0, CL.intTy)))),
774 :     CL.mkDecl(CL.intTy, "y", SOME(CL.I_Exp(CL.E_Int(0, CL.intTy)))),
775 :     CL.mkAssign(CL.E_Var "x", CL.mkApply(RN.getGlobalThreadId,[CL.E_Int(0,CL.intTy)])),
776 :     CL.mkAssign(CL.E_Var "y",CL.mkApply(RN.getGlobalThreadId,[CL.E_Int(1,CL.intTy)]))]
777 :    
778 :     val strandDecl = [CL.mkDecl(CL.T_Named tyName, inState, NONE),
779 :     CL.mkDecl(CL.T_Named tyName, outState,NONE)]
780 :     val strandObjects = if nDims = 1
781 :     then [CL.mkAssign(CL.mkSubscript(CL.E_Var "selfIn",CL.E_Str "x"),
782 :     CL.E_Var inState),
783 :     CL.mkAssign(CL.mkSubscript(CL.E_Var "selfOut",CL.E_Str "x"),
784 :     CL.E_Var outState)]
785 :     else let
786 :     val index = CL.mkBinOp(CL.mkBinOp(CL.E_Var "x",CL.#*,CL.E_Var "width"),CL.#+,CL.E_Var "y")
787 :     in
788 :     [CL.mkAssign(CL.mkSubscript(CL.E_Var "selfIn",index),
789 :     CL.E_Var inState),
790 :     CL.mkAssign(CL.mkSubscript(CL.E_Var "selfOut",index),
791 :     CL.E_Var outState)]
792 :     end
793 :    
794 :    
795 :     val status = CL.mkDecl(CL.intTy, "status", SOME(CL.I_Exp(CL.E_Int(0, CL.intTy))))
796 :     val strand_init_function = CL.mkCall(RN.strandInit name, [CL.E_UnOp(CL.%&,CL.E_Var inState),CL.E_Var "x", CL.E_Var "y"])
797 :     val local_vars = thread_ids @ initKernelGlobals(!globals,!imgGlobals) @ strandDecl @ strandObjects @ [status,strand_init_function]
798 :     val while_exp = CL.mkBinOp(CL.mkBinOp(CL.E_Var "status",CL.#!=, CL.E_Var RN.kStabilize),CL.#||,CL.mkBinOp(CL.E_Var "status", CL.#!=, CL.E_Var RN.kDie))
799 :     val while_body = [CL.mkAssign(CL.E_Var "status", CL.mkApply(RN.strandUpdate name,[ CL.E_UnOp(CL.%&,CL.E_Var inState), CL.E_UnOp(CL.%&,CL.E_Var outState)])),
800 :     CL.mkCall(RN.strandStabilize name,[ CL.E_UnOp(CL.%&,CL.E_Var inState), CL.E_UnOp(CL.%&,CL.E_Var outState)])]
801 :    
802 :     val whileBlock = [CL.mkWhile(while_exp,CL.mkBlock while_body)]
803 :    
804 :     val body = CL.mkBlock(local_vars @ whileBlock)
805 :     in
806 :     CL.D_Func(["__kernel"], CL.voidTy, fName, params, body)
807 :     end
808 :     (* generate a global structure from the globals *)
809 :     fun genGlobalStruct(globals) = let
810 :     fun getGlobals(CL.D_Var(_,ty,globalVar,_)::rest) = (ty,globalVar)::getGlobals(rest)
811 :     | getGlobals([]) = []
812 :     | getGlobals(_::rest) = getGlobals(rest)
813 :     in
814 :     CL.D_StructDef(getGlobals(globals),RN.globalsTy)
815 :     end
816 :    
817 : lamonts 1244 (* generate the table of strand descriptors *)
818 : jhr 1261 fun genStrandTable (ppStrm, strands) = let
819 :     val nStrands = length strands
820 :     fun genInit (Strand{name, ...}) = CL.I_Exp(CL.mkUnOp(CL.%&, CL.E_Var(RN.strandDesc name)))
821 :     fun genInits (_, []) = []
822 :     | genInits (i, s::ss) = (i, genInit s) :: genInits(i+1, ss)
823 :     fun ppDecl dcl = PrintAsC.output(ppStrm, dcl)
824 :     in
825 :     ppDecl (CL.D_Var([], CL.int32, RN.numStrands,
826 :     SOME(CL.I_Exp(CL.E_Int(IntInf.fromInt nStrands, CL.int32)))));
827 :     ppDecl (CL.D_Var([],
828 :     CL.T_Array(CL.T_Ptr(CL.T_Named RN.strandDescTy), SOME nStrands),
829 :     RN.strands,
830 :     SOME(CL.I_Array(genInits (0, strands)))))
831 :     end
832 : lamonts 1244
833 : lamonts 1264
834 :     fun genSrc (baseName, Prog{double,globals, topDecls, strands, initially,imgGlobals,numDims,...}) = let
835 :     val clFileName = OS.Path.joinBaseExt{base=baseName, ext=SOME "cl"}
836 :     val cFileName = OS.Path.joinBaseExt{base=baseName, ext=SOME "c"}
837 :     val clOutS = TextIO.openOut clFileName
838 :     val cOutS = TextIO.openOut cFileName
839 :     val clppStrm = PrintAsC.new clOutS
840 :     val cppStrm = PrintAsC.new cOutS
841 :     fun cppDecl dcl = PrintAsC.output(cppStrm, dcl)
842 :     fun clppDecl dcl = PrintAsC.output(clppStrm, dcl)
843 :     val strands = AtomTable.listItems strands
844 :     val single_strand as Strand{name, tyName, code, ...}= hd(strands)
845 :     in
846 :    
847 :     (* Generate the OpenCl file *)
848 :     List.app clppDecl (List.rev (!globals));
849 :     clppDecl (genGlobalStruct (!globals));
850 :     clppDecl (genStrandTyDef single_strand);
851 :     List.app clppDecl (!code);
852 :     clppDecl (genKernelFun (single_strand,!numDims,globals,imgGlobals));
853 :    
854 :    
855 :     (* Generate the Host file .c *)
856 :     cppDecl (CL.D_Verbatim([
857 :     if double
858 :     then "#define DIDEROT_DOUBLE_PRECISION"
859 :     else "#define DIDEROT_SINGLE_PRECISION",
860 :     "#include \"Diderot/diderot.h\"",
861 :     "#include <OpenCL/OpenCL.h>",
862 :     "#include <sys/sysctl.h>",
863 :     "#include <sys/stat.h>",
864 :     "#include <assert.h>"
865 :     ]));
866 :    
867 :     (* cppDecl (CL.D_Verbatim([ "#include <OpenCL/OpenCL.h>",
868 :     "#include Diderot/diderot.h"])); *)
869 :     List.app cppDecl (List.rev (!globals));
870 :     cppDecl (genGlobalStruct (!globals));
871 :     cppDecl (genStrandTyDef single_strand);
872 :     cppDecl (genStrandPrint(single_strand,!numDims));
873 :     cppDecl (genKernelLoader());
874 :     List.app cppDecl (List.rev (!topDecls));
875 :     cppDecl (genHostSetupFunc (single_strand,clFileName,!numDims,initially,imgGlobals));
876 :     cppDecl (genHostMain());
877 :    
878 :    
879 : lamonts 1244
880 : lamonts 1264 (*List.app (fn strand => List.app ppDecl (genStrand strand)) strands;
881 :     genStrandTable (ppStrm, strands);
882 :     ppDecl (!initially);*)
883 :    
884 :     PrintAsC.close cppStrm;
885 :     PrintAsC.close clppStrm;
886 :     TextIO.closeOut cOutS;
887 :     TextIO.closeOut clOutS
888 :     end
889 :    
890 : lamonts 1244 (* output the code to a file. The string is the basename of the file, the extension
891 :     * is provided by the target.
892 :     *)
893 : lamonts 1264 fun generate (basename, prog as Prog{double, parallel, debug, ...}) = let
894 :     fun condCons (true, x, xs) = x::xs
895 :     | condCons (false, _, xs) = xs
896 :     (* generate the C compiler flags *)
897 :     val cflags = ["-I" ^ Paths.diderotInclude, "-I" ^ Paths.teemInclude]
898 :     val cflags = condCons (parallel, #pthread Paths.cflags, cflags)
899 :     val cflags = if debug
900 :     then #debug Paths.cflags :: cflags
901 :     else #ndebug Paths.cflags :: cflags
902 :     val cflags = #base Paths.cflags :: cflags
903 :     (* generate the loader flags *)
904 :     val extraLibs = condCons (parallel, #pthread Paths.extraLibs, [])
905 :     val extraLibs = Paths.teemLinkFlags @ #base Paths.extraLibs :: extraLibs
906 :     val rtLib = TargetUtil.runtimeName {
907 :     target = TargetUtil.TARGET_CL,
908 :     parallel = parallel, double = double, debug = debug
909 :     }
910 :     val ldOpts = rtLib :: extraLibs
911 :     in
912 :     genSrc (basename, prog)
913 :     end
914 :    
915 :     (*RunCC.compile (basename, cflags);
916 :     RunCC.link (basename, ldOpts)*)
917 : lamonts 1244
918 : lamonts 1264
919 : lamonts 1244 end
920 :     (* strands *)
921 :     structure Strand =
922 :     struct
923 : jhr 1261 fun define (Prog{strands, ...}, strandId) = let
924 :     val name = Atom.toString strandId
925 :     val strand = Strand{
926 :     name = name,
927 :     tyName = RN.strandTy name,
928 :     state = ref [],
929 :     output = ref NONE,
930 :     code = ref []
931 :     }
932 :     in
933 :     AtomTable.insert strands (strandId, strand);
934 :     strand
935 :     end
936 : lamonts 1244
937 :     (* return the strand with the given name *)
938 : jhr 1261 fun lookup (Prog{strands, ...}, strandId) = AtomTable.lookup strands strandId
939 : lamonts 1244
940 :     (* register the strand-state initialization code. The variables are the strand
941 :     * parameters.
942 :     *)
943 : jhr 1261 fun init (Strand{name, tyName, code, ...}, params, init) = let
944 :     val fName = RN.strandInit name
945 :     val params =
946 :     CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfOut") ::
947 :     List.map (fn (ToC.V(ty, x)) => CL.PARAM([], ty, x)) params
948 :     val initFn = CL.D_Func([], CL.voidTy, fName, params, init)
949 :     in
950 :     code := initFn :: !code
951 :     end
952 : lamonts 1244
953 :     (* register a strand method *)
954 : jhr 1261 fun method (Strand{name, tyName, code, ...}, methName, body) = let
955 :     val fName = concat[name, "_", methName]
956 :     val params = [
957 :     CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfIn"),
958 :     CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfOut")
959 :     ]
960 :     val methFn = CL.D_Func([], CL.int32, fName, params, body)
961 :     in
962 :     code := methFn :: !code
963 :     end
964 :    
965 :     fun output (Strand{output, ...}, ty, ToC.V(_, x)) = output := SOME(ty, x)
966 : lamonts 1244
967 :     end
968 :    
969 :     end
970 :    
971 :     structure CLBackEnd = CodeGenFn(CLTarget)

root@smlnj-gforge.cs.uchicago.edu
ViewVC Help
Powered by ViewVC 1.0.0