Home My Page Projects Code Snippets Project Openings diderot
Summary Activity Tracker Tasks SCM

SCM Repository

[diderot] Annotation of /branches/pure-cfg/src/compiler/cl-target/cl-target.sml
ViewVC logotype

Annotation of /branches/pure-cfg/src/compiler/cl-target/cl-target.sml

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1244 - (view) (download)

1 : lamonts 1244 (* c-target.sml
2 :     *
3 :     * COPYRIGHT (c) 2011 The Diderot Project (http://diderot-language.cs.uchicago.edu)
4 :     * All rights reserved.
5 :     *)
6 :    
7 :     structure CLTarget : TARGET =
8 :     struct
9 :    
10 :     structure IL = TreeIL
11 :     structure V = IL.Var
12 :     structure Ty = IL.Ty
13 :     structure CL = CLang
14 :     structure RN = RuntimeNames
15 :     structure ToC = TreeToCL
16 :    
17 :     type var = ToC.var
18 :     type exp = CL.exp
19 :     type stm = CL.stm
20 :    
21 :     datatype strand = Strand of {
22 :     name : string,
23 :     tyName : string,
24 :     state : var list ref,
25 :     output : (Ty.ty * CL.var) option ref, (* the strand's output variable (only one for now) *)
26 :     code : CL.decl list ref
27 :     }
28 :    
29 :     datatype program = Prog of {
30 :     double : bool, (* true for double-precision support *)
31 :     parallel : bool, (* true for multithreaded (or multi-GPU) target *)
32 :     debug : bool, (* true for debug support in executable *)
33 :     globals : CL.decl list ref,
34 :     topDecls : CL.decl list ref,
35 :     strands : strand AtomTable.hash_table,
36 :     initially : CL.decl ref,
37 :     numDims: int ref
38 :     }
39 :    
40 :     datatype env = ENV of {
41 :     info : env_info,
42 :     vMap : var V.Map.map,
43 :     scope : scope
44 :     }
45 :    
46 :     and env_info = INFO of {
47 :     prog : program
48 :     }
49 :    
50 :     and scope
51 :     = NoScope
52 :     | GlobalScope
53 :     | InitiallyScope
54 :     | StrandScope of TreeIL.var list (* strand initialization *)
55 :     | MethodScope of TreeIL.var list (* method body; vars are state variables *)
56 :    
57 :     (* the supprted widths of vectors of reals on the target. For the GNU vector extensions,
58 :     * the supported sizes are powers of two, but float2 is broken.
59 :     * NOTE: we should also consider the AVX vector hardware, which has 256-bit registers.
60 :     *)
61 :     fun vectorWidths () = if !RuntimeNames.doublePrecision
62 :     then [2, 4, 8]
63 :     else [4, 8]
64 :    
65 :     (* tests for whether various expression forms can appear inline *)
66 :     fun inlineCons n = (n < 2) (* vectors are inline, but not matrices *)
67 :     val inlineMatrixExp = false (* can matrix-valued expressions appear inline? *)
68 :    
69 :     (* TreeIL to target translations *)
70 :     structure Tr =
71 :     struct
72 :     fun fragment (ENV{info, vMap, scope}, blk) = let
73 :     val (vMap, stms) = ToC.trFragment (vMap, blk)
74 :     in
75 :     (ENV{info=info, vMap=vMap, scope=scope}, stms)
76 :     end
77 :     fun saveState cxt stateVars (env, args, stm) = (
78 :     ListPair.foldrEq
79 :     (fn (x, e, stms) => ToC.trAssign(env, x, e)@stms)
80 :     [stm]
81 :     (stateVars, args)
82 :     ) handle ListPair.UnequalLengths => (
83 :     print(concat["saveState ", cxt, ": length mismatch; ", Int.toString(List.length args), " args\n"]);
84 :     raise Fail(concat["saveState ", cxt, ": length mismatch"]))
85 :     fun block (ENV{vMap, scope, ...}, blk) = (case scope
86 :     of StrandScope stateVars => ToC.trBlock (vMap, saveState "StrandScope" stateVars, blk)
87 :     | MethodScope stateVars => ToC.trBlock (vMap, saveState "MethodScope" stateVars, blk)
88 :     | _ => ToC.trBlock (vMap, fn (_, _, stm) => [stm], blk)
89 :     (* end case *))
90 :     fun exp (ENV{vMap, ...}, e) = ToC.trExp(vMap, e)
91 :     end
92 :    
93 :     (* variables *)
94 :     structure Var =
95 :     struct
96 :     fun name (ToC.V(_, name)) = name
97 :     fun global (Prog{globals, ...}, name, ty) = let
98 :     val ty' = ToC.trType ty
99 :     in
100 :     globals := CL.D_Var([], ty', name, NONE) :: !globals;
101 :     ToC.V(ty', name)
102 :     end
103 :     fun param x = ToC.V(ToC.trType(V.ty x), V.name x)
104 :     fun state (Strand{state, ...}, x) = let
105 :     val ty' = ToC.trType(V.ty x)
106 :     val x' = ToC.V(ty', V.name x)
107 :     in
108 :     state := x' :: !state;
109 :     x'
110 :     end
111 :     end
112 :    
113 :     (* environments *)
114 :     structure Env =
115 :     struct
116 :     (* create a new environment *)
117 :     fun new prog = ENV{
118 :     info=INFO{prog = prog},
119 :     vMap = V.Map.empty,
120 :     scope = NoScope
121 :     }
122 :     (* define the current translation context *)
123 :     fun setScope scope (ENV{info, vMap, ...}) = ENV{info=info, vMap=vMap, scope=scope}
124 :     val scopeGlobal = setScope GlobalScope
125 :     val scopeInitially = setScope InitiallyScope
126 :     fun scopeStrand (env, svars) = setScope (StrandScope svars) env
127 :     fun scopeMethod (env, svars) = setScope (MethodScope svars) env
128 :     (* bind a TreeIL varaiable to a target variable *)
129 :     fun bind (ENV{info, vMap, scope}, x, x') = ENV{
130 :     info = info,
131 :     vMap = V.Map.insert(vMap, x, x'),
132 :     scope = scope
133 :     }
134 :     end
135 :    
136 :     (* programs *)
137 :     structure Program =
138 :     struct
139 :     fun new {double, parallel, debug} = (
140 :     RN.initTargetSpec double;
141 :     Prog{
142 :     double = double, parallel = parallel, debug = debug,
143 :     globals = ref [
144 :     CL.D_Verbatim[
145 :     if double
146 :     then "#define DIDEROT_DOUBLE_PRECISION"
147 :     else "#define DIDEROT_SINGLE_PRECISION",
148 :     "#include \"Diderot/opencl_types.h\""
149 :     ]],
150 :     topDecls = ref [],
151 :     strands = AtomTable.mkTable (16, Fail "strand table"),
152 :     initially = ref(CL.D_Comment["missing initially"]),
153 :     numDims = ref(0)
154 :     })
155 :     (* register the global initialization part of a program *)
156 :     fun init (Prog{topDecls,...}, init) = let
157 :     val params = [
158 :     CL.PARAM([], CL.T_Ptr(CL.T_Named RN.globalsTy), RN.globalsVarName)
159 :     ]
160 :     val initFn = CL.D_Func([], CL.voidTy, RN.initGlobals, params, init)
161 :    
162 :     in
163 :     topDecls := initFn :: !topDecls
164 :     end
165 :     (* create and register the initially function for a program *)
166 :     fun initially {
167 :     prog = Prog{strands, initially,numDims,...},
168 :     isArray : bool,
169 :     iterPrefix : stm list,
170 :     iters : (var * exp * exp) list,
171 :     createPrefix : stm list,
172 :     strand : Atom.atom,
173 :     args : exp list
174 :     } = let
175 :     val name = Atom.toString strand
176 :     val nDims = List.length iters
177 :     val worldTy = CL.T_Ptr(CL.T_Named RN.worldTy)
178 :     fun mapi f xs = let
179 :     fun mapf (_, []) = []
180 :     | mapf (i, x::xs) = f(i, x) :: mapf(i+1, xs)
181 :     in
182 :     mapf (0, xs)
183 :     end
184 :     val baseInit = mapi (fn (i, (_, e, _)) => (i, CL.I_Exp e)) iters
185 :     val sizeInit = mapi
186 :     (fn (i, (ToC.V(ty, _), lo, hi)) =>
187 :     (i, CL.I_Exp(CL.mkBinOp(CL.mkBinOp(hi, CL.#-, lo), CL.#+, CL.E_Int(1, ty))))
188 :     ) iters
189 :     val allocCode = [
190 :     CL.mkComment["allocate initial block of strands"],
191 :     CL.mkDecl(CL.T_Array(CL.int32, SOME nDims), "base", SOME(CL.I_Array baseInit)),
192 :     CL.mkDecl(CL.T_Array(CL.uint32, SOME nDims), "size", SOME(CL.I_Array sizeInit)),
193 :     CL.mkDecl(worldTy, "wrld",
194 :     SOME(CL.I_Exp(CL.E_Apply(RN.allocInitially, [
195 :     CL.mkUnOp(CL.%&, CL.E_Var(RN.strandDesc name)),
196 :     CL.E_Bool isArray,
197 :     CL.E_Int(IntInf.fromInt nDims, CL.int32),
198 :     CL.E_Var "base",
199 :     CL.E_Var "size"
200 :     ]))))
201 :     ]
202 :     (* create the loop nest for the initially iterations *)
203 :     val indexVar = "ix"
204 :     val strandTy = CL.T_Ptr(CL.T_Named(RN.strandTy name))
205 :     fun mkLoopNest [] = CL.mkBlock(createPrefix @ [
206 :     CL.mkDecl(strandTy, "sp",
207 :     SOME(CL.I_Exp(
208 :     CL.E_Cast(strandTy,
209 :     CL.E_Apply(RN.inState, [CL.E_Var "wrld", CL.E_Var indexVar]))))),
210 :     CL.mkCall(RN.strandInit name, CL.E_Var "sp" :: args),
211 :     CL.mkAssign(CL.E_Var indexVar, CL.mkBinOp(CL.E_Var indexVar, CL.#+, CL.E_Int(1, CL.uint32)))
212 :     ])
213 :     | mkLoopNest ((ToC.V(ty, param), lo, hi)::iters) = let
214 :     val body = mkLoopNest iters
215 :     in
216 :     CL.mkFor(
217 :     [(ty, param, lo)],
218 :     CL.mkBinOp(CL.E_Var param, CL.#<=, hi),
219 :     [CL.mkPostOp(CL.E_Var param, CL.^++)],
220 :     body)
221 :     end
222 :     val iterCode = [
223 :     CL.mkComment["initially"],
224 :     CL.mkDecl(CL.uint32, indexVar, SOME(CL.I_Exp(CL.E_Int(0, CL.uint32)))),
225 :     mkLoopNest iters
226 :     ]
227 :     val body = CL.mkBlock(iterPrefix @ allocCode @ iterCode @ [CL.mkReturn(SOME(CL.E_Var "wrld"))])
228 :     val initFn = CL.D_Func([], worldTy, RN.initially, [], body)
229 :     in
230 :     numDims := nDims;
231 :     initially := initFn
232 :     end
233 :    
234 :     (***** OUTPUT *****)
235 :     fun genStrand (Strand{name, tyName, state, output, code}) = let
236 :     (* the print function *)
237 :     val prFnName = concat[name, "_print"]
238 :     val prFn = let
239 :     val params = [
240 :     CL.PARAM([], CL.T_Ptr(CL.T_Named "FILE"), "outS"),
241 :     CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "self")
242 :     ]
243 :     val SOME(ty, x) = !output
244 :     val outState = CL.mkIndirect(CL.mkVar "self", x)
245 :     val prArgs = (case ty
246 :     of Ty.IVecTy 1 => [CL.E_Str(!RN.gIntFormat ^ "\n"), outState]
247 :     | Ty.IVecTy d => let
248 :     val fmt = CL.E_Str(
249 :     String.concatWith " " (List.tabulate(d, fn _ => !RN.gIntFormat))
250 :     ^ "\n")
251 :     val args = List.tabulate (d, fn i => ToC.ivecIndex(outState, d, i))
252 :     in
253 :     fmt :: args
254 :     end
255 :     | Ty.TensorTy[] => [CL.E_Str "%f\n", outState]
256 :     | Ty.TensorTy[d] => let
257 :     val fmt = CL.E_Str(
258 :     String.concatWith " " (List.tabulate(d, fn _ => "%f"))
259 :     ^ "\n")
260 :     val args = List.tabulate (d, fn i => ToC.vecIndex(outState, d, i))
261 :     in
262 :     fmt :: args
263 :     end
264 :     | _ => raise Fail("genStrand: unsupported output type " ^ Ty.toString ty)
265 :     (* end case *))
266 :     in
267 :     CL.D_Func(["static"], CL.voidTy, prFnName, params,
268 :     CL.mkCall("fprintf", CL.mkVar "outS" :: prArgs))
269 :     end
270 :     in
271 :     List.rev (prFn :: !code)
272 :     end
273 :     fun genStrandTyDef (Strand{tyName, state,...}) =
274 :     (* the type declaration for the strand's state struct *)
275 :     CL.D_StructDef(
276 :     List.rev (List.map (fn ToC.V(ty, x) => (ty, x)) (!state)),
277 :     tyName)
278 :    
279 :    
280 :     (* generates the load kernel function *)
281 :     fun genKernelLoader() =
282 :     CL.D_Verbatim ( ["/* Loads the Kernel from a file */",
283 :     "char * loadKernel (const char * filename) {",
284 :     "struct stat statbuf;",
285 :     "FILE *fh;",
286 :     "char *source;",
287 :     "fh = fopen(filename, \"r\");",
288 :     "if (fh == 0)",
289 :     " return 0;",
290 :     "stat(filename, &statbuf);",
291 :     "source = (char *) malloc(statbuf.st_size + 1);",
292 :     "fread(source, statbuf.st_size, 1, fh);",
293 :     "fread(source, statbuf.st_size, 1, fh);",
294 :     "return source;",
295 :     "}"])
296 :    
297 :     (* generates the main function of host code *)
298 :     fun genHostMain() = let
299 :     val setupCall = [CL.mkCall(RN.setupFName,[CL.E_Var RN.globalsVarName])]
300 :     val globalsDecl = CL.mkDecl(CL.T_Ptr(CL.T_Named RN.globalsTy), RN.globalsVarName,SOME(CL.I_Exp(CL.mkApply("malloc",
301 :     [CL.mkApply("sizeof",[CL.E_Var RN.globalsTy])]))))
302 :     val initGlobalsCall = CL.mkCall(RN.initGlobals,[CL.E_Var RN.globalsVarName])
303 :     val returnStm = [CL.mkReturn(SOME(CL.E_Int(0,CL.intTy)))]
304 :     val params = [
305 :     CL.PARAM([],CL.intTy, "argc"),
306 :     CL.PARAM([],CL.charArrayPtr,"argv")
307 :     ]
308 :     val body = CL.mkBlock([globalsDecl] @ [initGlobalsCall] @ setupCall @ returnStm)
309 :     in
310 :     CL.D_Func([],CL.intTy,"main",params,body)
311 :     end
312 :     (* generates the host-side setup function *)
313 :     fun genHostSetupFunc(strand as Strand{name,tyName,...}, filename, nDims) = let
314 :     (*Delcare opencl setup objects *)
315 :     val programVar= "program"
316 :     val kernelVar = "kernel"
317 :     val cmdVar = "queue"
318 :     val inStateVar = "selfin"
319 :     val outStateVar = "selfout"
320 :     val stateSizeVar= "state_mem_size"
321 :     val clInstateVar = "clSelfIn"
322 :     val clOutStateVar = "clSelfOut"
323 :     val clGlobals = "clGlobals"
324 :     val sourcesVar = "sources"
325 :     val contextVar = "context"
326 :     val errVar = "err"
327 :     val globalVar = "global_work_size"
328 :     val localVar = "local_work_size"
329 :     val clFNVar = "filename"
330 :     val numStrandsVar = "numStrandsVar"
331 :     val headerFNVar = "header"
332 :     val deviceVar = "device"
333 :     val platformsVar = "platforms"
334 :     val numPlatformsVar = "num_platforms"
335 :     val numDevicesVar = "num_devices"
336 :     val assertStm = CL.mkCall("assert",[CL.mkBinOp(CL.E_Var errVar, CL.#==, CL.E_Var "CL_SUCCESS")])
337 :     val params = [
338 :     CL.PARAM([],CL.T_Ptr(CL.T_Named RN.globalsTy), RN.globalsVarName)
339 :     ]
340 :     val delcarations = [CL.mkDecl(CL.clProgramTy, programVar, NONE),
341 :     CL.mkDecl(CL.clKernelTy, kernelVar, NONE),
342 :     CL.mkDecl(CL.clCmdQueueTy, cmdVar, NONE),
343 :     CL.mkDecl(CL.clContextTy, contextVar, NONE),
344 :     CL.mkDecl(CL.intTy, errVar, NONE),
345 :     CL.mkDecl(CL.intTy, numStrandsVar, NONE),
346 :     CL.mkDecl(CL.intTy, numPlatformsVar, NONE),
347 :     CL.mkDecl(CL.intTy, stateSizeVar, NONE),
348 :     CL.mkDecl(CL.clDeviceIdTy, deviceVar, NONE),
349 :     CL.mkDecl(CL.T_Ptr(CL.T_Named tyName), inStateVar,NONE),
350 :     CL.mkDecl(CL.clMemoryTy,clInstateVar,NONE),
351 :     CL.mkDecl(CL.clMemoryTy,clOutStateVar,NONE),
352 :     CL.mkDecl(CL.T_Ptr(CL.T_Named tyName), outStateVar,NONE),
353 :     CL.mkDecl(CL.charPtr, clFNVar,SOME(CL.I_Exp(CL.E_Str filename))),
354 :     CL.mkDecl(CL.charPtr, headerFNVar,SOME(CL.I_Exp(CL.E_Str "Diderot/opencl_types.h"))),
355 :     CL.mkDecl(CL.T_Array(CL.charPtr,SOME(2)),sourcesVar,NONE),
356 :     CL.mkDecl(CL.T_Array(CL.T_Named "size_t",SOME(nDims)),globalVar,NONE),
357 :     CL.mkDecl(CL.T_Array(CL.T_Named "size_t",SOME(nDims)),localVar,NONE),
358 :     CL.mkDecl(CL.intTy,numDevicesVar,SOME(CL.I_Exp(CL.E_Int(~1,CL.intTy)))),
359 :     CL.mkDecl(CL.T_Array(CL.clDeviceIdTy, SOME(1)), platformsVar, NONE),
360 :     CL.mkDecl(CL.intTy,"num_platforms",SOME(CL.I_Exp(CL.E_Int(~1,CL.intTy))))]
361 :    
362 :     (* Retrieve the platforms *)
363 :     val platformStm = [CL.mkAssign(CL.E_Var errVar, CL.mkApply("clGetPlatformIDs",
364 :     [CL.E_Int(10,CL.intTy),
365 :     CL.E_UnOp(CL.%&,CL.E_Var platformsVar),
366 :     CL.E_UnOp(CL.%&,CL.E_Var numDevicesVar)])),
367 :     assertStm]
368 :    
369 :     val devicesStm = [CL.mkAssign(CL.E_Var errVar, CL.mkApply("clGetDeviceIDs",
370 :     [CL.mkSubscript(CL.E_Var platformsVar,CL.E_Int(0,CL.intTy)),
371 :     CL.E_Var "CL_DEVICE_TYPE_GPU",
372 :     CL.E_Int(1,CL.intTy),
373 :     CL.E_UnOp(CL.%&,CL.E_Var deviceVar),
374 :     CL.E_UnOp(CL.%&,CL.E_Var numDevicesVar)])),
375 :     assertStm]
376 :    
377 :     (* Create Context *)
378 :     val contextStm = [CL.mkAssign(CL.E_Var contextVar, CL.mkApply("clCreateContext",
379 :     [CL.E_Int(0,CL.intTy),
380 :     CL.E_Int(1,CL.intTy),
381 :     CL.E_UnOp(CL.%&,CL.E_Var deviceVar),
382 :     CL.E_Var "NULL",
383 :     CL.E_Var "NULL",
384 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)])),
385 :     assertStm]
386 :    
387 :     (* Create Command Queue *)
388 :     val commandStm = [CL.mkAssign(CL.E_Var cmdVar, CL.mkApply("clCreateCommandQueue",
389 :     [CL.E_Var contextVar,
390 :     CL.E_Var deviceVar,
391 :     CL.E_Int(0,CL.intTy),
392 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)])),
393 :     assertStm]
394 :    
395 :     (* Create Memory Buffers for Strand States *)
396 :     val strandSize = CL.mkAssign(CL.E_Var stateSizeVar,CL.mkBinOp(CL.mkApply("sizeof",
397 :     [CL.E_Var tyName]), CL.#*,CL.E_Var numStrandsVar))
398 :     val strandObjects = [CL.mkAssign(CL.E_Var inStateVar, CL.mkApply("malloc",
399 :     [CL.E_Var stateSizeVar])),
400 :     CL.mkAssign(CL.E_Var outStateVar, CL.mkApply("malloc",
401 :     [CL.E_Var stateSizeVar]))]
402 :    
403 :     val clStrandObjects = [CL.mkAssign(CL.E_Var clInstateVar, CL.mkApply("clCreateBuffer",
404 :     [CL.E_Var contextVar,
405 :     CL.E_Var "CL_MEM_READ_WRITE",
406 :     CL.E_Var stateSizeVar,
407 :     CL.E_Var "NULL",
408 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)])),
409 :     CL.mkAssign(CL.E_Var clOutStateVar, CL.mkApply("clCreateBuffer",
410 :     [CL.E_Var contextVar,
411 :     CL.E_Var "CL_MEM_READ_WRITE",
412 :     CL.E_Var stateSizeVar,
413 :     CL.E_Var "NULL",
414 :     CL.E_UnOp(CL.%&,CL.E_Var errVar)]))]
415 :     (* Load the Kernel and Header Files *)
416 :     val sourceStms = [CL.mkAssign(CL.mkSubscript(CL.E_Var sourcesVar,CL.E_Int(0,CL.intTy)),
417 :     CL.mkApply(RN.clLoaderFN, [CL.E_Var clFNVar])),
418 :     CL.mkAssign(CL.mkSubscript(CL.E_Var sourcesVar,CL.E_Int(1,CL.intTy)),
419 :     CL.mkApply(RN.clLoaderFN, [CL.E_Var headerFNVar]))]
420 :    
421 :     (* Created Enqueue Statements *)
422 :     val enqueueStm = if nDims = 1
423 :     then [CL.mkAssign(CL.E_Var errVar,
424 :     CL.mkApply("clEnqueueNDRangeKernel",
425 :     [CL.E_Var cmdVar,
426 :     CL.E_Var kernelVar,
427 :     CL.E_Int(1,CL.intTy),
428 :     CL.E_Var "NULL",
429 :     CL.E_Var globalVar,
430 :     CL.E_Var localVar,
431 :     CL.E_Int(0,CL.intTy),
432 :     CL.E_Var "NULL",
433 :     CL.E_Var "NULL"])),CL.mkCall("clFinish",[CL.E_Var cmdVar])]
434 :     else [CL.mkAssign(CL.E_Var errVar,
435 :     CL.mkApply("clEnqueueNDRangeKernel",
436 :     [CL.E_Var cmdVar,
437 :     CL.E_Var kernelVar,
438 :     CL.E_Int(2,CL.intTy),
439 :     CL.E_Var "NULL",
440 :     CL.E_Var globalVar,
441 :     CL.E_Var localVar,
442 :     CL.E_Int(0,CL.intTy),
443 :     CL.E_Var "NULL",
444 :     CL.E_Var "NULL"])),CL.mkCall("clFinish",[CL.E_Var cmdVar])]
445 :    
446 :     (* Setup Global and Local variables *)
447 :     val globalAndlocalStms = [CL.mkAssign(CL.mkSubscript(CL.E_Var globalVar, CL.E_Int(0,CL.intTy)),
448 :     CL.E_Var numStrandsVar),
449 :     CL.mkAssign(CL.mkSubscript(CL.E_Var globalVar, CL.E_Int(1,CL.intTy)),
450 :     CL.E_Var numStrandsVar),
451 :     CL.mkAssign(CL.mkSubscript(CL.E_Var localVar, CL.E_Int(0,CL.intTy)),
452 :     CL.E_Var "16"),
453 :     CL.mkAssign(CL.mkSubscript(CL.E_Var localVar, CL.E_Int(1,CL.intTy)),
454 :     CL.E_Var "16")]
455 :    
456 :    
457 :     (* Setup Kernel arguments *)
458 :     val kernelArguments = [CL.mkAssign(CL.E_Var errVar,CL.mkApply("clSetKernelArg",
459 :     [CL.E_Var kernelVar,
460 :     CL.E_Int(0,CL.intTy),
461 :     CL.mkApply("sizeof",[CL.E_Var "cl_mem"]),
462 :     CL.E_UnOp(CL.%&,CL.E_Var clInstateVar)])),
463 :     CL.mkExpStm(CL.mkAssignOp(CL.E_Var errVar, CL.|=,CL.mkApply("clSetKernelArg",
464 :     [CL.E_Var kernelVar,
465 :     CL.E_Int(1,CL.intTy),
466 :     CL.mkApply("sizeof",[CL.E_Var "cl_mem"]),
467 :     CL.E_UnOp(CL.%&,CL.E_Var clOutStateVar)]))),
468 :     CL.mkExpStm(CL.mkAssignOp(CL.E_Var errVar, CL.|=,CL.mkApply("clSetKernelArg",
469 :     [CL.E_Var kernelVar,
470 :     CL.E_Int(2,CL.intTy),
471 :     CL.mkApply("sizeof",[CL.E_Var "cl_mem"]),
472 :     CL.E_UnOp(CL.%&,CL.E_Var clOutStateVar)])))]
473 :    
474 :     (* Retrieve output *)
475 :     val outputStm = CL.mkAssign(CL.E_Var errVar,
476 :     CL.mkApply("clEnqueueReadBuffer",
477 :     [CL.E_Var cmdVar,
478 :     CL.E_Var clOutStateVar,
479 :     CL.E_Var "CL_TRUE",
480 :     CL.E_Int(0,CL.intTy),
481 :     CL.E_Var stateSizeVar,
482 :     CL.E_Var outStateVar,
483 :     CL.E_Int(0,CL.intTy),
484 :     CL.E_Var "NULL",
485 :     CL.E_Var "NULL"]))
486 :    
487 :     (* Free all the objects *)
488 :     val freeStms = [CL.mkCall("clReleaseKernel",[CL.E_Var kernelVar]),
489 :     CL.mkCall("clReleaseProgram",[CL.E_Var programVar ]),
490 :     CL.mkCall("clReleaseCommandQueue",[CL.E_Var cmdVar]),
491 :     CL.mkCall("clReleaseContext",[CL.E_Var contextVar]),
492 :     CL.mkCall("clReleaseMemObject",[CL.E_Var clInstateVar]),
493 :     CL.mkCall("clReleaseMemObject",[CL.E_Var clOutStateVar])]
494 :    
495 :     (* Body put all the statments together *)
496 :     val body = delcarations @ platformStm @ devicesStm @ contextStm @ commandStm @ [strandSize] @
497 :     clStrandObjects @ sourceStms @ globalAndlocalStms @ kernelArguments @ enqueueStm @
498 :     [outputStm] @ freeStms
499 :    
500 :     in
501 :    
502 :     CL.D_Func([],CL.voidTy,RN.setupFName,params,CL.mkBlock(body))
503 :    
504 :     end
505 :    
506 :    
507 :     (* generate the main kernel function for the .cl file *)
508 :     fun genKernelFun(Strand{name, tyName, state, output, code},nDims) = let
509 :     val fName = RN.kernelFuncName;
510 :     val inState = "strand_in"
511 :     val outState = "strand_out"
512 :     val params = [
513 :     CL.PARAM(["__global"], CL.T_Ptr(CL.T_Named tyName), "selfIn"),
514 :     CL.PARAM(["__global"], CL.T_Ptr(CL.T_Named tyName), "selfOut"),
515 :     CL.PARAM(["__global"], CL.T_Ptr(CL.T_Named RN.globalsTy), "cl_globals"),
516 :     CL.PARAM(["__global"], CL.intTy, "width")
517 :     ]
518 :     val thread_ids = if nDims = 1
519 :     then [CL.mkDecl(CL.intTy, "x", SOME(CL.I_Exp(CL.E_Int(0, CL.intTy)))),
520 :     CL.mkAssign(CL.E_Var "x",CL.mkApply(RN.getGlobalThreadId,[CL.E_Int(0,CL.intTy)]))]
521 :     else
522 :     [CL.mkDecl(CL.intTy, "x", SOME(CL.I_Exp(CL.E_Int(0, CL.intTy)))),
523 :     CL.mkDecl(CL.intTy, "y", SOME(CL.I_Exp(CL.E_Int(0, CL.intTy)))),
524 :     CL.mkAssign(CL.E_Var "x", CL.mkApply(RN.getGlobalThreadId,[CL.E_Int(0,CL.intTy)])),
525 :     CL.mkAssign(CL.E_Var "y",CL.mkApply(RN.getGlobalThreadId,[CL.E_Int(1,CL.intTy)]))]
526 :    
527 :     val strandDecl = [CL.mkDecl(CL.T_Named tyName, inState, NONE),
528 :     CL.mkDecl(CL.T_Named tyName, outState,NONE)]
529 :     val strandObjects = if nDims = 1
530 :     then [CL.mkAssign(CL.mkSubscript(CL.E_Var "selfIn",CL.E_Str "x"),
531 :     CL.E_Var inState),
532 :     CL.mkAssign(CL.mkSubscript(CL.E_Var "selfOut",CL.E_Str "x"),
533 :     CL.E_Var outState)]
534 :     else let
535 :     val index = CL.mkBinOp(CL.mkBinOp(CL.E_Var "y",CL.#*,CL.E_Var "width"),CL.#+,CL.E_Var "x")
536 :     in
537 :     [CL.mkAssign(CL.mkSubscript(CL.E_Var "selfIn",index),
538 :     CL.E_Var inState),
539 :     CL.mkAssign(CL.mkSubscript(CL.E_Var "selfOut",index),
540 :     CL.E_Var outState)]
541 :     end
542 :     val status = CL.mkDecl(CL.intTy, "status", SOME(CL.I_Exp(CL.E_Int(0, CL.intTy))))
543 :     val strand_init_function = CL.mkCall(RN.strandInit name, [CL.E_Var inState])
544 :     val local_vars = thread_ids @ strandDecl @ strandObjects @ [status,strand_init_function]
545 :     val while_exp = CL.mkBinOp(CL.E_Var "status",CL.#!=, CL.E_Var RN.kStabilize)
546 :     val while_body = [CL.mkAssign(CL.E_Var "status", CL.mkApply(RN.strandUpdate name,[CL.E_Var inState,CL.E_Var outState])),
547 :     CL.mkCall(RN.strandStabilize name,[CL.E_Var inState,CL.E_Var outState]),
548 :     CL.mkIfThen(CL.mkBinOp(CL.E_Var "status",CL.#==, CL.E_Var RN.kStabilize),CL.mkBreak)]
549 :    
550 :     val whileBlock = [CL.mkWhile(while_exp,CL.mkBlock while_body)]
551 :    
552 :     val body = CL.mkBlock(local_vars @ whileBlock)
553 :     in
554 :     CL.D_Func(["__kernel"], CL.voidTy, fName, params, body)
555 :     end
556 :     (* generate a global structure from the globals *)
557 :     fun genGlobalStruct(globals) = let
558 :     fun getGlobals(CL.D_Var(_,ty,globalVar,_)::rest) = (ty,globalVar)::getGlobals(rest)
559 :     | getGlobals([]) = []
560 :     | getGlobals(_::rest) = getGlobals(rest)
561 :     in
562 :     CL.D_StructDef(getGlobals(globals),RN.globalsTy)
563 :     end
564 :     (* generate the table of strand descriptors *)
565 :     fun genStrandTable (ppStrm, strands) = let
566 :     val nStrands = length strands
567 :     fun genInit (Strand{name, ...}) = CL.I_Exp(CL.mkUnOp(CL.%&, CL.E_Var(RN.strandDesc name)))
568 :     fun genInits (_, []) = []
569 :     | genInits (i, s::ss) = (i, genInit s) :: genInits(i+1, ss)
570 :     fun ppDecl dcl = PrintAsC.output(ppStrm, dcl)
571 :     in
572 :     ppDecl (CL.D_Var([], CL.int32, RN.numStrands,
573 :     SOME(CL.I_Exp(CL.E_Int(IntInf.fromInt nStrands, CL.int32)))));
574 :     ppDecl (CL.D_Var([],
575 :     CL.T_Array(CL.T_Ptr(CL.T_Named RN.strandDescTy), SOME nStrands),
576 :     RN.strands,
577 :     SOME(CL.I_Array(genInits (0, strands)))))
578 :     end
579 :    
580 :     fun genSrc (baseName, Prog{globals, topDecls, strands, initially,numDims,...}) = let
581 :     val clFileName = OS.Path.joinBaseExt{base=baseName, ext=SOME "cl"}
582 :     val cFileName = OS.Path.joinBaseExt{base=baseName, ext=SOME "c"}
583 :     val clOutS = TextIO.openOut clFileName
584 :     val cOutS = TextIO.openOut cFileName
585 :     val clppStrm = PrintAsC.new clOutS
586 :     val cppStrm = PrintAsC.new cOutS
587 :     fun cppDecl dcl = PrintAsC.output(cppStrm, dcl)
588 :     fun clppDecl dcl = PrintAsC.output(clppStrm, dcl)
589 :     val strands = AtomTable.listItems strands
590 :     val single_strand as Strand{name, tyName, code, ...}= hd(strands)
591 :     in
592 :     (* Generate the Host file *)
593 :     cppDecl (CL.D_Verbatim([ "#include <OpenCL/OpenCL.h>",
594 :     "#include Diderot/diderot.h"]));
595 :     cppDecl (genGlobalStruct (!globals));
596 :     cppDecl (genStrandTyDef single_strand);
597 :     cppDecl (genKernelLoader());
598 :     List.app cppDecl (List.rev (!topDecls));
599 :     cppDecl (genHostSetupFunc (single_strand,clFileName,!numDims));
600 :     cppDecl (genHostMain());
601 :    
602 :     (* Generate the OpenCl file *)
603 :     clppDecl (genGlobalStruct (!globals));
604 :     clppDecl (genStrandTyDef single_strand);
605 :     List.app clppDecl (!code);
606 :     clppDecl (genKernelFun (single_strand,!numDims));
607 :    
608 :     (*List.app (fn strand => List.app ppDecl (genStrand strand)) strands;
609 :     genStrandTable (ppStrm, strands);
610 :     ppDecl (!initially);*)
611 :    
612 :     PrintAsC.close cppStrm;
613 :     PrintAsC.close clppStrm;
614 :     TextIO.closeOut cOutS;
615 :     TextIO.closeOut clOutS
616 :     end
617 :    
618 :     (* output the code to a file. The string is the basename of the file, the extension
619 :     * is provided by the target.
620 :     *)
621 :     fun generate (basename, prog as Prog{double, parallel, debug, ...}) = let
622 :     fun condCons (true, x, xs) = x::xs
623 :     | condCons (false, _, xs) = xs
624 :     (* generate the C compiler flags *)
625 :     val cflags = ["-I" ^ Paths.diderotInclude, "-I" ^ Paths.teemInclude]
626 :     val cflags = condCons (parallel, #pthread Paths.cflags, cflags)
627 :     val cflags = if debug
628 :     then #debug Paths.cflags :: cflags
629 :     else #ndebug Paths.cflags :: cflags
630 :     val cflags = #base Paths.cflags :: cflags
631 :     (* generate the loader flags *)
632 :     val extraLibs = condCons (parallel, #pthread Paths.extraLibs, [])
633 :     val extraLibs = Paths.teemLinkFlags @ #base Paths.extraLibs :: extraLibs
634 :     val rtLib = TargetUtil.runtimeName {
635 :     target = TargetUtil.TARGET_CL,
636 :     parallel = parallel, double = double, debug = debug
637 :     }
638 :     val ldOpts = rtLib :: extraLibs
639 :     in
640 :     genSrc (basename, prog)
641 :     end
642 :    
643 :     (*RunCC.compile (basename, cflags);
644 :     RunCC.link (basename, ldOpts)*)
645 :    
646 :    
647 :     end
648 :    
649 :     (* strands *)
650 :     structure Strand =
651 :     struct
652 :     fun define (Prog{strands, ...}, strandId) = let
653 :     val name = Atom.toString strandId
654 :     val strand = Strand{
655 :     name = name,
656 :     tyName = RN.strandTy name,
657 :     state = ref [],
658 :     output = ref NONE,
659 :     code = ref []
660 :     }
661 :     in
662 :     AtomTable.insert strands (strandId, strand);
663 :     strand
664 :     end
665 :    
666 :     (* return the strand with the given name *)
667 :     fun lookup (Prog{strands, ...}, strandId) = AtomTable.lookup strands strandId
668 :    
669 :     (* register the strand-state initialization code. The variables are the strand
670 :     * parameters.
671 :     *)
672 :     fun init (Strand{name, tyName, code, ...}, params, init) = let
673 :     val fName = RN.strandInit name
674 :     val params =
675 :     CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfOut") ::
676 :     List.map (fn (ToC.V(ty, x)) => CL.PARAM([], ty, x)) params
677 :     val initFn = CL.D_Func([], CL.voidTy, fName, params, init)
678 :     in
679 :     code := initFn :: !code
680 :     end
681 :    
682 :     (* register a strand method *)
683 :     fun method (Strand{name, tyName, code, ...}, methName, body) = let
684 :     val fName = concat[name, "_", methName]
685 :     val params = [
686 :     CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfIn"),
687 :     CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfOut")
688 :     ]
689 :     val methFn = CL.D_Func([], CL.int32, fName, params, body)
690 :     in
691 :     code := methFn :: !code
692 :     end
693 :    
694 :     fun output (Strand{output, ...}, ty, ToC.V(_, x)) = output := SOME(ty, x)
695 :    
696 :     end
697 :    
698 :     end
699 :    
700 :     structure CLBackEnd = CodeGenFn(CLTarget)

root@smlnj-gforge.cs.uchicago.edu
ViewVC Help
Powered by ViewVC 1.0.0