Home My Page Projects Code Snippets Project Openings diderot
Summary Activity Tracker Tasks SCM

SCM Repository

[diderot] Diff of /branches/pure-cfg/src/compiler/cl-target/cl-target.sml
ViewVC logotype

Diff of /branches/pure-cfg/src/compiler/cl-target/cl-target.sml

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1307, Sat Jun 11 13:58:02 2011 UTC revision 1321, Sun Jun 12 14:50:26 2011 UTC
# Line 1  Line 1 
1  (* c-target.sml  (* cl-target.sml
2   *   *
3   * COPYRIGHT (c) 2011 The Diderot Project (http://diderot-language.cs.uchicago.edu)   * COPYRIGHT (c) 2011 The Diderot Project (http://diderot-language.cs.uchicago.edu)
4   * All rights reserved.   * All rights reserved.
# Line 15  Line 15 
15      structure ToCL = TreeToCL      structure ToCL = TreeToCL
16      structure N = CNames      structure N = CNames
17    
18    (* variable translation *)    (* C variable translation *)
19      structure TrVar =      structure TrCVar =
20        struct        struct
21          type env = CL.typed_var TreeIL.Var.Map.map          type env = CL.typed_var TreeIL.Var.Map.map
22          fun lookup (env, x) = (case V.Map.find (env, x)          fun lookup (env, x) = (case V.Map.find (env, x)
23                 of SOME(CL.V(_, x')) => x'                 of SOME(CL.V(_, x')) => x'
24                  | NONE => raise Fail(concat["lookup(_, ", V.name x, ")"])                  | NONE => raise Fail(concat["TrCVar.lookup(_, ", V.name x, ")"])
25                (* end case *))                (* end case *))
26        (* translate a variable that occurs in an l-value context (i.e., as the target of an assignment) *)        (* translate a variable that occurs in an l-value context (i.e., as the target of an assignment) *)
27          fun lvalueVar (env, x) = (case V.kind x          fun lvalueVar (env, x) = (case V.kind x
28                 of IL.VK_Global => CL.mkVar(lookup(env, x))                 of IL.VK_Global => CL.mkIndirect(CL.mkVar RN.globalsVarName, lookup(env, x))
29                  | IL.VK_State strand => CL.mkIndirect(CL.mkVar "selfOut", lookup(env, x))                  | IL.VK_State strand => CL.mkIndirect(CL.mkVar "selfOut", lookup(env, x))
30                  | IL.VK_Local => CL.mkVar(lookup(env, x))                  | IL.VK_Local => CL.mkVar(lookup(env, x))
31                (* end case *))                (* end case *))
32        (* translate a variable that occurs in an r-value context *)        (* translate a variable that occurs in an r-value context *)
33          fun rvalueVar (env, x) = (case V.kind x          fun rvalueVar (env, x) = (case V.kind x
                of IL.VK_Global => CL.mkVar(lookup(env, x))  
                 | IL.VK_State strand => CL.mkIndirect(CL.mkVar "selfIn", lookup(env, x))  
                 | IL.VK_Local => CL.mkVar(lookup(env, x))  
               (* end case *))  
       end  
   
         structure ToC = TreeToCFn (TrVar)  
   
   (* C variable translation *)  
     structure TrCVar =  
       struct  
         type env = CL.typed_var TreeIL.Var.Map.map  
         fun lookup (env, x) = (case V.Map.find (env, x)  
                of SOME(CL.V(_, x')) => x'  
                 | NONE => raise Fail(concat["TrCVar.lookup(_, ", V.name x, ")"])  
               (* end case *))  
       (* translate a variable that occurs in an l-value context (i.e., as the target of an assignment) *)  
         fun lvalueVar (env, x) = (case V.kind x  
34                 of IL.VK_Global => CL.mkIndirect(CL.mkVar RN.globalsVarName, lookup(env, x))                 of IL.VK_Global => CL.mkIndirect(CL.mkVar RN.globalsVarName, lookup(env, x))
35                  | IL.VK_State strand => raise Fail "unexpected strand context"                  | IL.VK_State strand => CL.mkIndirect(CL.mkVar "selfIn", lookup(env, x))
36                  | IL.VK_Local => CL.mkVar(lookup(env, x))                  | IL.VK_Local => CL.mkVar(lookup(env, x))
37                (* end case *))                (* end case *))
       (* translate a variable that occurs in an r-value context *)  
         val rvalueVar = lvalueVar  
38        end        end
39    
40      structure ToC = TreeToCFn (TrCVar)      structure ToC = TreeToCFn (TrCVar)
# Line 64  Line 44 
44      type stm = CL.stm      type stm = CL.stm
45    
46    (* OpenCL specific types *)    (* OpenCL specific types *)
47        val clIntTy = CL.T_Named "cl_int"
48      val clProgramTy = CL.T_Named "cl_program"      val clProgramTy = CL.T_Named "cl_program"
49      val clKernelTy  = CL.T_Named "cl_kernel"      val clKernelTy  = CL.T_Named "cl_kernel"
50      val clCmdQueueTy = CL.T_Named "cl_command_queue"      val clCmdQueueTy = CL.T_Named "cl_command_queue"
# Line 71  Line 52 
52      val clDeviceIdTy = CL.T_Named "cl_device_id"      val clDeviceIdTy = CL.T_Named "cl_device_id"
53      val clPlatformIdTy = CL.T_Named "cl_platform_id"      val clPlatformIdTy = CL.T_Named "cl_platform_id"
54      val clMemoryTy = CL.T_Named "cl_mem"      val clMemoryTy = CL.T_Named "cl_mem"
55        val globPtrTy = CL.T_Ptr(CL.T_Named RN.globalsTy)
56    
57    (* variable or field that is mirrored between host and GPU *)    (* variable or field that is mirrored between host and GPU *)
58      type mirror_var = {      type mirror_var = {
# Line 130  Line 112 
112    (* TreeIL to target translations *)    (* TreeIL to target translations *)
113      structure Tr =      structure Tr =
114        struct        struct
       (* this function is used for the initially clause, so it generates OpenCL *)  
115          fun fragment (ENV{info, vMap, scope}, blk) = let          fun fragment (ENV{info, vMap, scope}, blk) = let
116                val (vMap, stms) = ToCL.trFragment (vMap, blk)                val (vMap, stms) = (case scope
117                         of GlobalScope => ToC.trFragment (vMap, blk)
118    (* NOTE: if we move strand initialization to the GPU, then we'll have to change the following code! *)
119                          | InitiallyScope => ToC.trFragment (vMap, blk)
120                          | _ => ToCL.trFragment (vMap, blk)
121                        (* end case *))
122                in                in
123                  (ENV{info=info, vMap=vMap, scope=scope}, stms)                  (ENV{info=info, vMap=vMap, scope=scope}, stms)
124                end                end
125          fun saveState cxt stateVars (env, args, stm) = (          fun block (ENV{vMap, scope, ...}, blk) = let
126                  fun saveState cxt stateVars trAssign (env, args, stm) = (
127                ListPair.foldrEq                ListPair.foldrEq
128                  (fn (x, e, stms) => ToCL.trAssign(env, x, e)@stms)                        (fn (x, e, stms) => trAssign(env, x, e)@stms)
129                    [stm]                    [stm]
130                      (stateVars, args)                      (stateVars, args)
131                ) handle ListPair.UnequalLengths => (                ) handle ListPair.UnequalLengths => (
132                  print(concat["saveState ", cxt, ": length mismatch; ", Int.toString(List.length args), " args\n"]);                  print(concat["saveState ", cxt, ": length mismatch; ", Int.toString(List.length args), " args\n"]);
133                  raise Fail(concat["saveState ", cxt, ": length mismatch"]))                  raise Fail(concat["saveState ", cxt, ": length mismatch"]))
134          fun block (ENV{vMap, scope, ...}, blk) = (case scope                in
135                 of StrandScope stateVars => ToCL.trBlock (vMap, saveState "StrandScope" stateVars, blk)                  case scope
136                  | MethodScope stateVars => ToCL.trBlock (vMap, saveState "MethodScope" stateVars, blk)  (* NOTE: if we move strand initialization to the GPU, then we'll have to change the following code! *)
137                  | InitiallyScope => ToCL.trBlock (vMap, fn (_, _, stm) => [stm], blk)                   of StrandScope stateVars =>
138                          ToC.trBlock (vMap, saveState "StrandScope" stateVars ToC.trAssign, blk)
139                      | MethodScope stateVars =>
140                          ToCL.trBlock (vMap, saveState "MethodScope" stateVars ToCL.trAssign, blk)
141                      | InitiallyScope => ToC.trBlock (vMap, fn (_, _, stm) => [stm], blk)
142                  | _ => ToC.trBlock (vMap, fn (_, _, stm) => [stm], blk)                  | _ => ToC.trBlock (vMap, fn (_, _, stm) => [stm], blk)
143                (* end case *))                  (* end case *)
144                  end
145          fun exp (ENV{vMap, ...}, e) = ToCL.trExp(vMap, e)          fun exp (ENV{vMap, ...}, e) = ToCL.trExp(vMap, e)
146        end        end
147    
# Line 218  Line 210 
210                    prFn = ref(CL.D_Comment(["No Print Function"]))                    prFn = ref(CL.D_Comment(["No Print Function"]))
211                  })                  })
212        (* register the global initialization part of a program *)        (* register the global initialization part of a program *)
213    (* FIXME: unused code; can this be removed??
214            fun globalIndirects (globals,stms) = let            fun globalIndirects (globals,stms) = let
215                  fun getGlobals ({name,target as TargetUtil.TARGET_CL}::rest) =                  fun getGlobals ({name,target as TargetUtil.TARGET_CL}::rest) =
216                        CL.mkAssign(CL.mkIndirect(CL.mkVar RN.globalsVarName,name),CL.mkVar name)                        CL.mkAssign(CL.mkIndirect(CL.mkVar RN.globalsVarName,name),CL.mkVar name)
# Line 227  Line 220 
220                  in                  in
221                    stms @ getGlobals globals                    stms @ getGlobals globals
222                  end                  end
223    *)
224        (* register the code that is used to register command-line options for input variables *)        (* register the code that is used to register command-line options for input variables *)
225          fun inputs (Prog{topDecls, ...}, stm) = let          fun inputs (Prog{topDecls, ...}, stm) = let
226                val inputsFn = CL.D_Func(                val inputsFn = CL.D_Func(
# Line 240  Line 233 
233    
234        (* register the global initialization part of a program *)        (* register the global initialization part of a program *)
235          fun init (Prog{topDecls, ...}, init) = let          fun init (Prog{topDecls, ...}, init) = let
236                val globPtrTy = CL.T_Ptr(CL.T_Named RN.globalsTy)                                    val globalsDecl = CL.mkAssign(CL.E_Var RN.globalsVarName,
237                        CL.mkApply("malloc", [CL.mkApply("sizeof",[CL.mkVar RN.globalsTy])]))
238    
239                  val initGlobalsCall = CL.mkCall(RN.initGlobalsHelper,[])
240    
241                val initFn = CL.D_Func(                val initFn = CL.D_Func(
242                      [], CL.voidTy, RN.initGlobals, [CL.PARAM([], globPtrTy, RN.globalsVarName)],                      [], CL.voidTy, RN.initGlobals, [],
243                        CL.mkBlock([globalsDecl,initGlobalsCall]))
244                  val initFn_helper = CL.D_Func(
245                        [], CL.voidTy, RN.initGlobalsHelper, [],
246                      init)                      init)
247                val shutdownFn = CL.D_Func(                val shutdownFn = CL.D_Func(
248                      [], CL.voidTy, RN.shutdown,                      [], CL.voidTy, RN.shutdown,
249                      [CL.PARAM([], CL.T_Ptr(CL.T_Named RN.worldTy), "wrld")],                      [CL.PARAM([], CL.T_Ptr(CL.T_Named RN.worldTy), "wrld")],
250                      CL.S_Block[])                      CL.S_Block[])
251                in                in
252                  topDecls := shutdownFn :: initFn :: !topDecls                  topDecls := shutdownFn :: initFn :: initFn_helper :: !topDecls
253                end                end
254           (* create and register the initially function for a program *)           (* create and register the initially function for a program *)
255          fun initially {          fun initially {
# Line 291  Line 291 
291                              CL.E_Var "size"                              CL.E_Var "size"
292                            ]))))                            ]))))
293                      ]                      ]
294              (* create the loop nest for the initially iterations *)              (* create the loop nest for the initially iterations
295                val indexVar = "ix"                val indexVar = "ix"
296                val strandTy = CL.T_Ptr(CL.T_Named(N.strandTy name))                val strandTy = CL.T_Ptr(CL.T_Named(N.strandTy name))
297                fun mkLoopNest [] = CL.mkBlock(createPrefix @ [                fun mkLoopNest [] = CL.mkBlock(createPrefix @ [
# Line 299  Line 299 
299                          SOME(CL.I_Exp(                          SOME(CL.I_Exp(
300                            CL.E_Cast(strandTy,                            CL.E_Cast(strandTy,
301                            CL.E_Apply(N.inState, [CL.E_Var "wrld", CL.E_Var indexVar]))))),                            CL.E_Apply(N.inState, [CL.E_Var "wrld", CL.E_Var indexVar]))))),
302                        CL.mkCall(N.strandInit name, CL.E_Var "sp" :: args),                        CL.mkCall(N.strandInit name,
303                            CL.E_Var RN.globalsVarName :: CL.E_Var "sp" :: args),
304                        CL.mkAssign(CL.E_Var indexVar, CL.mkBinOp(CL.E_Var indexVar, CL.#+, CL.E_Int(1, CL.uint32)))                        CL.mkAssign(CL.E_Var indexVar, CL.mkBinOp(CL.E_Var indexVar, CL.#+, CL.E_Int(1, CL.uint32)))
305                      ])                      ])
306                  | mkLoopNest ((CL.V(ty, param), lo, hi)::iters) = let                  | mkLoopNest ((CL.V(ty, param), lo, hi)::iters) = let
# Line 315  Line 316 
316                        CL.mkComment["initially"],                        CL.mkComment["initially"],
317                        CL.mkDecl(CL.uint32, indexVar, SOME(CL.I_Exp(CL.E_Int(0, CL.uint32)))),                        CL.mkDecl(CL.uint32, indexVar, SOME(CL.I_Exp(CL.E_Int(0, CL.uint32)))),
318                        mkLoopNest iters                        mkLoopNest iters
319                      ]                      ] *)
320                val body = CL.mkBlock(                val body = CL.mkBlock(
321                      iterPrefix @                      iterPrefix @
322                      allocCode @                      allocCode @
                     iterCode @  
323                      [CL.mkReturn(SOME(CL.E_Var "wrld"))])                      [CL.mkReturn(SOME(CL.E_Var "wrld"))])
324                val initFn = CL.D_Func([], worldTy, N.initially, [], body)                val initFn = CL.D_Func([], worldTy, N.initially, [], body)
325                in                in
# Line 340  Line 340 
340                      val prArgs = (case ty                      val prArgs = (case ty
341                             of Ty.IVecTy 1 => [CL.E_Str(!N.gIntFormat ^ "\n"), outState]                             of Ty.IVecTy 1 => [CL.E_Str(!N.gIntFormat ^ "\n"), outState]
342                              | Ty.IVecTy d => let                              | Ty.IVecTy d => let
343                                  val fmt = CL.E_Str(                                  val fmt = CL.mkStr(
344                                        String.concatWith " " (List.tabulate(d, fn _ => !N.gIntFormat))                                        String.concatWith " " (List.tabulate(d, fn _ => !N.gIntFormat))
345                                        ^ "\n")                                        ^ "\n")
346                                  val args = List.tabulate (d, fn i => ToC.ivecIndex(outState, d, i))                                  val args = List.tabulate (d, fn i => ToC.ivecIndex(outState, d, i))
347                                  in                                  in
348                                    fmt :: args                                    fmt :: args
349                                  end                                  end
350                              | Ty.TensorTy[] => [CL.E_Str "%f\n", outState]                              | Ty.TensorTy[] => [CL.mkStr "%f\n", outState]
351                              | Ty.TensorTy[d] => let                              | Ty.TensorTy[d] => let
352                                  val fmt = CL.E_Str(                                  val fmt = CL.mkStr(
353                                        String.concatWith " " (List.tabulate(d, fn _ => "%f"))                                        String.concatWith " " (List.tabulate(d, fn _ => "%f"))
354                                        ^ "\n")                                        ^ "\n")
355                                  val args = List.tabulate (d, fn i => ToC.vecIndex(outState, d, i))                                  val args = List.tabulate (d, fn i => ToC.vecIndex(outState, d, i))
# Line 372  Line 372 
372                  List.rev (List.map (fn x => (targetTy x, #var x)) (!state)),                  List.rev (List.map (fn x => (targetTy x, #var x)) (!state)),
373                  tyName)                  tyName)
374    
   
375          (* generates the load kernel function *)          (* generates the load kernel function *)
376    
377        (* generates the opencl buffers for the image data *)        (* generates the opencl buffers for the image data *)
# Line 386  Line 385 
385                          CL.mkVar RN.globalsVarName,                          CL.mkVar RN.globalsVarName,
386                          CL.mkUnOp(CL.%&,CL.mkVar errVar)                          CL.mkUnOp(CL.%&,CL.mkVar errVar)
387                        ]))                        ]))
   
388          fun genDataBuffers([],_,_) = []          fun genDataBuffers([],_,_) = []
389            | genDataBuffers((var,nDims)::globals,contextVar,errVar) = let            | genDataBuffers((var,nDims)::globals,contextVar,errVar) = let
390                        val hostVar = CL.mkIndirect(CL.mkVar RN.globalsVarName, var)
391  (* FIXME: use CL constructors to  build expressions (not strings) *)  (* FIXME: use CL constructors to  build expressions (not strings) *)
392                val size = if nDims = 1                      fun sizeExp i = CL.mkSubscript(CL.mkIndirect(hostVar, "size"), CL.mkInt i)
393                      then CL.mkBinOp(CL.mkApply("sizeof",[CL.mkVar "float"]), CL.#*,                      val size = CL.mkBinOp(CL.mkApply("sizeof",[CL.mkVar "float"]), CL.#*, sizeExp 0)
394                                           CL.mkIndirect(CL.mkVar var, "size[0]"))                      val size = if (nDims > 1)
395                                          else if nDims = 2 then                            then CL.mkBinOp(size, CL.#*, sizeExp 1)
396                                          CL.mkBinOp(CL.mkApply("sizeof",[CL.mkVar "float"]), CL.#*,                            else size
397                                            CL.mkIndirect(CL.mkVar var, concat["size[0]", " * ", var, "->size[1]"]))                      val size = if (nDims > 2)
398                                          else                            then CL.mkBinOp(size, CL.#*, sizeExp 2)
399                                           CL.mkBinOp(CL.mkApply("sizeof",[CL.mkVar "float"]), CL.#*,                            else size
                                           CL.mkIndirect(CL.mkVar var,concat["size[0]", " * ", var, "->size[1] * ", var, "->size[2]"]))  
   
400                   in                   in
401                     CL.mkDecl(clMemoryTy, RN.addBufferSuffix var ,NONE)::                     CL.mkDecl(clMemoryTy, RN.addBufferSuffix var ,NONE)::
402                     CL.mkDecl(clMemoryTy, RN.addBufferSuffixData var ,NONE)::                     CL.mkDecl(clMemoryTy, RN.addBufferSuffixData var ,NONE)::
403                     CL.mkAssign(CL.mkVar(RN.addBufferSuffix var), CL.mkApply("clCreateBuffer",                        CL.mkAssign(CL.mkVar(RN.addBufferSuffix var),
404                                                                  [CL.mkVar contextVar,                          CL.mkApply("clCreateBuffer", [
405                                CL.mkVar contextVar,
406                                                                  CL.mkVar "CL_MEM_COPY_HOST_PTR",                                                                  CL.mkVar "CL_MEM_COPY_HOST_PTR",
407                                                                  CL.mkApply("sizeof",[CL.mkVar (RN.imageTy nDims)]),                                                                  CL.mkApply("sizeof",[CL.mkVar (RN.imageTy nDims)]),
408                                                                  CL.mkVar var,                              hostVar,
409                                                                  CL.mkUnOp(CL.%&,CL.mkVar errVar)])) ::                              CL.mkUnOp(CL.%&,CL.mkVar errVar)
410                          CL.mkAssign(CL.mkVar(RN.addBufferSuffixData var), CL.mkApply("clCreateBuffer",                            ])) ::
411                                                                  [CL.mkVar contextVar,                        CL.mkAssign(CL.mkVar(RN.addBufferSuffixData var),
412                            CL.mkApply("clCreateBuffer", [
413                                CL.mkVar contextVar,
414                                                                   CL.mkVar "CL_MEM_COPY_HOST_PTR",                                                                   CL.mkVar "CL_MEM_COPY_HOST_PTR",
415                                                                  size,                                                                  size,
416                                                                  CL.mkIndirect(CL.mkVar var,"data"),                              CL.mkIndirect(hostVar, "data"),
417                                                                  CL.mkUnOp(CL.%&,CL.mkVar errVar)])):: genDataBuffers(globals,contextVar,errVar)                              CL.mkUnOp(CL.%&,CL.mkVar errVar)
418                              ])) :: genDataBuffers(globals,contextVar,errVar)
419                  end                  end
420                in                in
421                  [globalBufferDecl] @ [globalBuffer] @ genDataBuffers(globals,contextVar,errVar)                  globalBufferDecl :: globalBuffer :: genDataBuffers(globals,contextVar,errVar)
422                end                end
423    
   
424  (* generates the kernel arguments for the image data *)  (* generates the kernel arguments for the image data *)
425          fun genGlobalArguments(globals,count,kernelVar,errVar) = let          fun genGlobalArguments(globals,count,kernelVar,errVar) = let
426          val globalArgument = CL.mkExpStm(CL.mkAssignOp(CL.mkVar errVar,CL.|=,CL.mkApply("clSetKernelArg",                val globalArgument = CL.mkExpStm(CL.mkAssignOp(CL.mkVar errVar,CL.|=,
427                        CL.mkApply("clSetKernelArg",
428                                                                  [CL.mkVar kernelVar,                                                                  [CL.mkVar kernelVar,
429                                                                   CL.mkPostOp(CL.E_Var count, CL.^++),                                                                   CL.mkPostOp(CL.E_Var count, CL.^++),
430                                                                   CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),                                                                   CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),
431                                                                   CL.mkUnOp(CL.%&,CL.mkVar(concat[RN.globalsVarName,"_cl"]))])))                                                                   CL.mkUnOp(CL.%&,CL.mkVar(concat[RN.globalsVarName,"_cl"]))])))
   
432          fun genDataArguments([],_,_,_) = []          fun genDataArguments([],_,_,_) = []
433            | genDataArguments((var,nDims)::globals,count,kernelVar,errVar) =            | genDataArguments((var,nDims)::globals,count,kernelVar,errVar) =
434                        CL.mkExpStm(CL.mkAssignOp(CL.mkVar errVar,CL.|=,
435                  CL.mkExpStm(CL.mkAssignOp(CL.mkVar errVar,CL.|=, CL.mkApply("clSetKernelArg",                        CL.mkApply("clSetKernelArg",
436                                  [CL.mkVar kernelVar,                                  [CL.mkVar kernelVar,
437                                   CL.mkPostOp(CL.E_Var count, CL.^++),                                   CL.mkPostOp(CL.E_Var count, CL.^++),
438                                   CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),                                   CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),
439                                   CL.mkUnOp(CL.%&,CL.mkVar(RN.addBufferSuffix var))])))::                                   CL.mkUnOp(CL.%&,CL.mkVar(RN.addBufferSuffix var))])))::
440                        CL.mkExpStm(CL.mkAssignOp(CL.mkVar errVar,CL.|=,
441                          CL.mkExpStm(CL.mkAssignOp(CL.mkVar errVar,CL.|=,CL.mkApply("clSetKernelArg",                        CL.mkApply("clSetKernelArg",
442                                  [CL.mkVar kernelVar,                                  [CL.mkVar kernelVar,
443                                   CL.mkPostOp(CL.E_Var count, CL.^++),                                   CL.mkPostOp(CL.E_Var count, CL.^++),
444                                   CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),                                   CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),
445                                   CL.mkUnOp(CL.%&,CL.mkVar(RN.addBufferSuffixData var))]))):: genDataArguments (globals,count,kernelVar,errVar)                           CL.mkUnOp(CL.%&,CL.mkVar(RN.addBufferSuffixData var))]))) ::
446                        genDataArguments (globals,count,kernelVar,errVar)
447          in          in
448                    globalArgument :: genDataArguments(globals, count, kernelVar, errVar)
                 [globalArgument] @ genDataArguments(globals,count,kernelVar,errVar)  
   
449          end          end
450    
451        (* generates the globals buffers and arguments function *)        (* generates the globals buffers and arguments function *)
# Line 460  Line 458 
458                        CL.PARAM([],CL.T_Named("cl_kernel"), "kernel"),                        CL.PARAM([],CL.T_Named("cl_kernel"), "kernel"),
459                        CL.PARAM([],CL.T_Named("int"), "argStart")                        CL.PARAM([],CL.T_Named("int"), "argStart")
460                      ]                      ]
461                val clGlobalBuffers = getGlobalDataBuffers(!imgGlobals, "context", "err")                val clGlobalBuffers = getGlobalDataBuffers(!imgGlobals, "context", errVar)
462                val clGlobalArguments = genGlobalArguments(!imgGlobals, "argStart", "kernel", "err")                val clGlobalArguments = genGlobalArguments(!imgGlobals, "argStart", "kernel", errVar)
463              (* Body put all the statments together *)              (* Body put all the statments together *)
464                val body =  clGlobalBuffers @ clGlobalArguments                val body = CL.mkDecl(clIntTy, errVar, SOME(CL.I_Exp(CL.mkInt 0)))
465                        :: clGlobalBuffers @ clGlobalArguments
466                in                in
467                  CL.D_Func([],CL.voidTy,RN.globalsSetupName,params,CL.mkBlock(body))                  CL.D_Func([],CL.voidTy,RN.globalsSetupName,params,CL.mkBlock(body))
468                end                end
# Line 477  Line 476 
476            | genKeneralGlobalParams [] = []            | genKeneralGlobalParams [] = []
477    
478        (*generate code for intilizing kernel global data *)        (*generate code for intilizing kernel global data *)
         fun initKernelGlobals (globals, imgGlobals) = let  
479  (* FIXME: should use List.map here *)  (* FIXME: should use List.map here *)
               fun initGlobalStruct ({hostTy, gpuTy, var}::rest) =  
                     CL.mkAssign(CL.mkVar var, CL.mkIndirect(CL.mkVar RN.globalsVarName, var)) ::  
                     initGlobalStruct rest  
                 | initGlobalStruct [] = []  
480                fun initGlobalImages ((name, tyname)::rest) =                fun initGlobalImages ((name, tyname)::rest) =
481                      CL.mkAssign(CL.mkVar name, CL.mkVar (RN.addBufferSuffix name)) ::               CL.mkAssign(CL.mkIndirect(CL.E_Var RN.globalsVarName, name), CL.mkVar (RN.addBufferSuffix name)) ::
482                      CL.mkAssign(CL.mkIndirect(CL.mkVar name,"data"),CL.mkVar (RN.addBufferSuffixData name)) ::               CL.mkAssign(CL.mkIndirect(CL.E_Var RN.globalsVarName,concat[name,"->","data"]),CL.mkVar (RN.addBufferSuffixData name)) ::
483                      initGlobalImages rest                      initGlobalImages rest
484                    | initGlobalImages [] = []                    | initGlobalImages [] = []
               in  
                 initGlobalStruct globals @ initGlobalImages(imgGlobals)  
               end  
485    
486          (* generate the main kernel function for the .cl file *)          (* generate the main kernel function for the .cl file *)
487          fun genKernelFun (strand, nDims, globals, imgGlobals) = let          fun genKernelFun (strand, nDims, globals, imgGlobals) = let
# Line 505  Line 496 
496                      ] @ genKeneralGlobalParams(!imgGlobals)                      ] @ genKeneralGlobalParams(!imgGlobals)
497                val thread_ids = if nDims = 1                val thread_ids = if nDims = 1
498                      then [                      then [
499                          CL.mkDecl(CL.intTy, "x", SOME(CL.I_Exp(CL.mkInt(0, CL.intTy)))),                          CL.mkDecl(CL.intTy, "x", SOME(CL.I_Exp(CL.mkInt 0))),
500                          CL.mkAssign(CL.mkVar "x",CL.mkApply(RN.getGlobalThreadId,[CL.mkInt(0,CL.intTy)]))                          CL.mkAssign(CL.mkVar "x",CL.mkApply(RN.getGlobalThreadId,[CL.mkInt 0]))
501                        ]                        ]
502                      else [                      else [
503                          CL.mkDecl(CL.intTy, "x", SOME(CL.I_Exp(CL.mkInt(0, CL.intTy)))),                          CL.mkDecl(CL.intTy, "x", SOME(CL.I_Exp(CL.mkInt 0))),
504                          CL.mkDecl(CL.intTy, "y", SOME(CL.I_Exp(CL.mkInt(0, CL.intTy)))),                          CL.mkDecl(CL.intTy, "y", SOME(CL.I_Exp(CL.mkInt 0))),
505                          CL.mkAssign(CL.mkVar "x",  CL.mkApply(RN.getGlobalThreadId,[CL.mkInt(0,CL.intTy)])),                          CL.mkAssign(CL.mkVar "x",  CL.mkApply(RN.getGlobalThreadId,[CL.mkInt 0])),
506                          CL.mkAssign(CL.mkVar "y",CL.mkApply(RN.getGlobalThreadId,[CL.mkInt(1,CL.intTy)]))                          CL.mkAssign(CL.mkVar "y",CL.mkApply(RN.getGlobalThreadId,[CL.mkInt 1]))
507                        ]                        ]
508                val strandDecl = [                val strandDecl = [
509                      CL.mkDecl(CL.T_Named tyName, inState, NONE),                      CL.mkDecl(CL.T_Named tyName, inState, NONE),
# Line 524  Line 515 
515                            ]                            ]
516                          else let                          else let
517                                  val index = CL.mkBinOp(CL.mkBinOp(CL.mkVar "x",CL.#*,CL.mkVar "width"),CL.#+,CL.mkVar "y")                                  val index = CL.mkBinOp(CL.mkBinOp(CL.mkVar "x",CL.#*,CL.mkVar "width"),CL.#+,CL.mkVar "y")
518                                  in                        in [
519                                          [CL.mkAssign(CL.mkVar inState, CL.mkSubscript(CL.mkVar "selfIn",index)),                          CL.mkAssign(CL.mkVar inState, CL.mkSubscript(CL.mkVar "selfIn",index)),
520                                           CL.mkAssign(CL.mkVar outState,CL.mkSubscript(CL.mkVar "selfOut",index))]                          CL.mkAssign(CL.mkVar outState,CL.mkSubscript(CL.mkVar "selfOut",index))
521                                  end                        ] end
522                val status = CL.mkDecl(CL.intTy, "status", SOME(CL.I_Exp(CL.mkInt(0, CL.intTy))))                val status = CL.mkDecl(CL.intTy, "status", SOME(CL.I_Exp(CL.mkInt 0)))
523                val local_vars =  thread_ids @ initKernelGlobals(!globals,!imgGlobals)  @ strandDecl @ strandObjects @ [status]                val strand_Init_Stm = CL.mkCall(RN.strandInit name, [CL.E_Var RN.globalsVarName,CL.mkUnOp(CL.%&,CL.E_Var inState), CL.E_Var "x", CL.E_Var "y"])
524                val while_exp = CL.mkBinOp(CL.mkBinOp(CL.mkVar "status",CL.#!=, CL.mkVar RN.kStabilize),CL.#||,CL.mkBinOp(CL.mkVar "status", CL.#!=, CL.mkVar RN.kDie))                val local_vars = thread_ids @ initGlobalImages(!imgGlobals)  @ strandDecl @ strandObjects @ [strand_Init_Stm,status]
525                                      val while_exp = CL.mkBinOp(
526                        CL.mkBinOp(CL.mkVar "status",CL.#!=, CL.mkVar RN.kStabilize),
527                        CL.#||,
528                        CL.mkBinOp(CL.mkVar "status", CL.#!=, CL.mkVar RN.kDie))
529                val whileBody = CL.mkBlock [                val whileBody = CL.mkBlock [
530                        CL.mkAssign(CL.mkVar "status",                        CL.mkAssign(CL.mkVar "status",
531                          CL.mkApply(RN.strandUpdate name,                          CL.mkApply(RN.strandUpdate name,
532                            [CL.mkUnOp(CL.%&,CL.mkVar inState), CL.mkUnOp(CL.%&,CL.mkVar outState)])),                            [CL.mkUnOp(CL.%&,CL.mkVar inState), CL.mkUnOp(CL.%&,CL.mkVar outState),CL.E_Var RN.globalsVarName])),
533                        CL.mkCall(RN.strandStabilize name,                        CL.mkCall(RN.strandStabilize name,
534                          [CL.mkUnOp(CL.%&,CL.mkVar inState), CL.mkUnOp(CL.%&,CL.mkVar outState)])                          [CL.mkUnOp(CL.%&,CL.mkVar inState), CL.mkUnOp(CL.%&,CL.mkVar outState),CL.E_Var RN.globalsVarName])
535                      ]                      ]
536                val whileBlock = [CL.mkWhile(while_exp, whileBody)]                val whileBlock = [CL.mkWhile(while_exp, whileBody)]
537                val body = CL.mkBlock(local_vars  @ whileBlock)                val body = CL.mkBlock(local_vars  @ whileBlock)
# Line 555  Line 550 
550                  List.app doVar globals                  List.app doVar globals
551                end                end
552    
553          fun genSrc (baseName, Prog{double,globals, topDecls, strands, initially,imgGlobals,numDims,...}) = let          fun genStrandDesc (Strand{name, output, ...}) = let
554                (* the strand's descriptor object *)
555                  val descI = let
556                        fun fnPtr (ty, f) = CL.I_Exp(CL.mkCast(CL.T_Named ty, CL.mkVar f))
557                        val SOME(outTy, _) = !output
558                        in
559                          CL.I_Struct[
560                              ("name", CL.I_Exp(CL.mkStr name)),
561                              ("stateSzb", CL.I_Exp(CL.mkSizeof(CL.T_Named(N.strandTy name)))),
562    (*
563                              ("outputSzb", CL.I_Exp(CL.mkSizeof(ToC.trTy outTy))),
564    *)
565                              ("update", fnPtr("update_method_t", "0")),
566                              ("print", fnPtr("print_method_t", name ^ "_print"))
567                            ]
568                        end
569                  val desc = CL.D_Var([], CL.T_Named N.strandDescTy, N.strandDesc name, SOME descI)
570                  in
571                    desc
572                  end
573    
574          (* generate the table of strand descriptors *)
575            fun genStrandTable (declFn, strands) = let
576                  val nStrands = length strands
577                  fun genInit (Strand{name, ...}) = CL.I_Exp(CL.mkUnOp(CL.%&, CL.E_Var(N.strandDesc name)))
578                  fun genInits (_, []) = []
579                    | genInits (i, s::ss) = (i, genInit s) :: genInits(i+1, ss)
580                  in
581                    declFn (CL.D_Var([], CL.int32, N.numStrands,
582                      SOME(CL.I_Exp(CL.E_Int(IntInf.fromInt nStrands, CL.int32)))));
583                    declFn (CL.D_Var([],
584                      CL.T_Array(CL.T_Ptr(CL.T_Named N.strandDescTy), SOME nStrands),
585                      N.strands,
586                      SOME(CL.I_Array(genInits (0, strands)))))
587                  end
588    
589            fun genSrc (baseName, prog) = let
590                  val Prog{name,double, globals, topDecls, strands, initially, imgGlobals, numDims, ...} = prog
591                val clFileName = OS.Path.joinBaseExt{base=baseName, ext=SOME "cl"}                val clFileName = OS.Path.joinBaseExt{base=baseName, ext=SOME "cl"}
592                val cFileName = OS.Path.joinBaseExt{base=baseName, ext=SOME "c"}                val cFileName = OS.Path.joinBaseExt{base=baseName, ext=SOME "c"}
593                val clOutS = TextIO.openOut clFileName                val clOutS = TextIO.openOut clFileName
594                val cOutS = TextIO.openOut cFileName                val cOutS = TextIO.openOut cFileName
 (* FIXME: need to use PrintAsC and PrintAsCL *)  
595                val clppStrm = PrintAsCL.new clOutS                val clppStrm = PrintAsCL.new clOutS
596                val cppStrm = PrintAsC.new cOutS                val cppStrm = PrintAsC.new cOutS
597                  val progName = name
598                fun cppDecl dcl = PrintAsC.output(cppStrm, dcl)                fun cppDecl dcl = PrintAsC.output(cppStrm, dcl)
599                fun clppDecl dcl = PrintAsCL.output(clppStrm, dcl)                fun clppDecl dcl = PrintAsCL.output(clppStrm, dcl)
600                val strands = AtomTable.listItems strands                val strands = AtomTable.listItems strands
# Line 576  Line 608 
608                      "#define DIDEROT_TARGET_CL",                      "#define DIDEROT_TARGET_CL",
609                      "#include \"Diderot/cl-diderot.h\""                      "#include \"Diderot/cl-diderot.h\""
610                    ]));                    ]));
                 genGlobals (clppDecl, #gpuTy, !globals);  
611                  clppDecl (genGlobalStruct (#gpuTy, !globals));                  clppDecl (genGlobalStruct (#gpuTy, !globals));
612                  clppDecl (genStrandTyDef(#gpuTy, strand));                  clppDecl (genStrandTyDef(#gpuTy, strand));
613                    clppDecl  (!init_code);
614                  List.app clppDecl (!code);                  List.app clppDecl (!code);
615                  clppDecl (genKernelFun (strand, !numDims, globals, imgGlobals));                  clppDecl (genKernelFun (strand, !numDims, globals, imgGlobals));
   
616                (* Generate the Host C file *)                (* Generate the Host C file *)
617                  cppDecl (CL.D_Verbatim([                  cppDecl (CL.D_Verbatim([
618                      if double                      if double
# Line 590  Line 621 
621                      "#define DIDEROT_TARGET_CL",                      "#define DIDEROT_TARGET_CL",
622                      "#include \"Diderot/diderot.h\""                      "#include \"Diderot/diderot.h\""
623                    ]));                    ]));
624                  genGlobals (cppDecl, #hostTy, !globals);                  cppDecl (CL.D_Var(["static"], CL.charPtr, "ProgramName",
625                      SOME(CL.I_Exp(CL.mkStr progName))));
626                  cppDecl (genGlobalStruct (#hostTy, !globals));                  cppDecl (genGlobalStruct (#hostTy, !globals));
627                  cppDecl (genStrandTyDef (#gpuTy, strand));                  cppDecl (CL.D_Var(["static"], CL.T_Ptr(CL.T_Named RN.globalsTy), RN.globalsVarName, NONE));
628                  cppDecl  (!init_code);                  cppDecl (genStrandTyDef (#hostTy, strand));
629                  cppDecl (genStrandPrint strand);                  cppDecl (genStrandPrint strand);
630                  List.app cppDecl (List.rev (!topDecls));                  List.app cppDecl (List.rev (!topDecls));
631                  cppDecl (genGlobalBuffersArgs (imgGlobals));                  cppDecl (genGlobalBuffersArgs imgGlobals);
632                    List.app (fn strand => cppDecl (genStrandDesc strand)) strands;
633                    genStrandTable (cppDecl, strands);
634                  cppDecl (!initially);                  cppDecl (!initially);
635                  PrintAsC.close cppStrm;                  PrintAsC.close cppStrm;
636                  PrintAsCL.close clppStrm;                  PrintAsCL.close clppStrm;
# Line 661  Line 695 
695          fun init (Strand{name, tyName, code,init_code, ...}, params, init) = let          fun init (Strand{name, tyName, code,init_code, ...}, params, init) = let
696                val fName = RN.strandInit name                val fName = RN.strandInit name
697                val params =                val params =
698                        CL.PARAM([], globPtrTy, RN.globalsVarName) ::
699                      CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfOut") ::                      CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfOut") ::
700                        List.map (fn (ToCL.V(ty, x)) => CL.PARAM([], ty, x)) params                        List.map (fn (ToCL.V(ty, x)) => CL.PARAM([], ty, x)) params
701                val initFn = CL.D_Func([], CL.voidTy, fName, params, init)                val initFn = CL.D_Func([], CL.voidTy, fName, params, init)
# Line 673  Line 708 
708                val fName = concat[name, "_", methName]                val fName = concat[name, "_", methName]
709                val params = [                val params = [
710                        CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfIn"),                        CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfIn"),
711                        CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfOut")                        CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfOut"),
712                                                             CL.PARAM([], CL.T_Ptr(CL.T_Named (RN.globalsTy)), RN.globalsVarName)
713                      ]                      ]
714                val methFn = CL.D_Func([], CL.int32, fName, params, body)                val methFn = CL.D_Func([], CL.int32, fName, params, body)
715                in                in

Legend:
Removed from v.1307  
changed lines
  Added in v.1321

root@smlnj-gforge.cs.uchicago.edu
ViewVC Help
Powered by ViewVC 1.0.0