Home My Page Projects Code Snippets Project Openings diderot
Summary Activity Tracker Tasks SCM

SCM Repository

[diderot] Diff of /branches/vis12-cl/src/compiler/cl-target/cl-target.sml
ViewVC logotype

Diff of /branches/vis12-cl/src/compiler/cl-target/cl-target.sml

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 2404, Sun Jul 28 02:29:57 2013 UTC revision 2405, Sun Jul 28 11:19:13 2013 UTC
# Line 11  Line 11 
11      structure V = IL.Var      structure V = IL.Var
12      structure Ty = IL.Ty      structure Ty = IL.Ty
13      structure CL = CLang      structure CL = CLang
14      structure RN = RuntimeNames      structure CLN = CLNames
15      structure N = CNames      structure N = CNames
16      structure ToC = TreeToC      structure ToC = TreeToC
17      structure ToCL = TreeToCL      structure ToCL = TreeToCL
18      structure HF = CLHeaderFrag      structure SU = StrandUtil
     structure SF = CLSchedFrag  
19    
20    (* revmap f l == List.rev(List.map f l) *)      type props = Properties.props
     fun revmap f = let  
           fun rmap ([], l) = l  
             | rmap (x::r, l) = rmap (r, f x :: l)  
           in  
             fn l => rmap (l, [])  
           end  
   
   (* common arithmetic *)  
     fun #+# (a, b) = CL.mkBinOp(a, CL.#+, b)  
     fun #*# (a, b) = CL.mkBinOp(a, CL.#*, b)  
     infix 5 #+#  
     infix 6 #*#  
   
   (* translate TreeIL types to shadow types *)  
     fun shadowTy ty = (case ty  
            of Ty.BoolTy => CL.T_Named "cl_uint"  
             | Ty.IntTy => CL.T_Named(RN.shadowIntTy ())  
             | Ty.TensorTy[] => CL.T_Named(RN.shadowRealTy ())  
             | Ty.TensorTy[n] => CL.T_Named(RN.shadowVecTy n)  
             | Ty.TensorTy[n, m] => CL.T_Named(RN.shadowMatTy(n,m))  
             | Ty.ImageTy info => CL.T_Named(RN.shadowImageTy(ImageInfo.dim info))  
             | _ => raise Fail(concat["TreeToC.trType(", Ty.toString ty, ")"])  
           (* end case *))  
   
 (* FIXME: add comments that more clearly explain the difference between convertToShadow and  
  * convertStrandToShadow  
  *)  
    (* translate TreeIL types to shadow types *)  
     fun convertToShadow (ty, name) = (case ty  
            of Ty.IntTy => CL.mkAssign(  
                 CL.mkSelect(CL.mkVar RN.shadowGlaobalsName, name),  
                 CL.mkIndirect(CL.mkVar RN.globalsVarName, name))  
             | Ty.TensorTy[n]=> CL.mkCall(RN.convertToShadowVec n, [  
                   CL.mkUnOp(CL.%&, CL.mkSelect(CL.mkVar RN.shadowGlaobalsName, name)),  
                   CL.mkIndirect(CL.mkVar RN.globalsVarName, name)  
                 ])  
             | Ty.ImageTy info => CL.mkCall(RN.shadowImageFunc(ImageInfo.dim info), [  
                   CL.mkVar "context",  
                   CL.mkUnOp(CL.%&, CL.mkSelect(CL.mkVar RN.shadowGlaobalsName, name)),  
                   CL.mkIndirect(CL.mkVar RN.globalsVarName, name)  
                 ])  
             | Ty.TensorTy[n, m] => CL.mkCall(RN.convertToShadowMat(m,n), [  
                   CL.mkSelect(CL.mkVar RN.shadowGlaobalsName, name),  
                   CL.mkIndirect(CL.mkVar RN.globalsVarName, name)  
                 ])  
             | _ => CL.mkAssign(  
                 CL.mkSelect(CL.mkVar RN.shadowGlaobalsName,name),  
                 CL.mkIndirect(CL.mkVar RN.globalsVarName, name))  
           (* end case *))  
   
    (* generate code to convert strand TreeIL types to shadow types *)  
     fun convertStrandToShadow (ty, name, selfIn, selfOut) = (case ty  
            of Ty.IntTy => CL.mkAssign(  
                 CL.mkIndirect(CL.mkVar selfIn, name),  
                 CL.mkIndirect(CL.mkVar selfOut, name))  
             | Ty.TensorTy[n]=> CL.mkCall(RN.convertToShadowVec n, [  
                   CL.mkUnOp(CL.%&, CL.mkIndirect(CL.mkVar selfIn, name)),  
                   CL.mkIndirect(CL.mkVar selfOut, name)  
                 ])  
             | Ty.TensorTy[n, m] => CL.mkCall(RN.convertToShadowMat(m,n), [  
                   CL.mkUnOp(CL.%&, CL.mkIndirect(CL.mkVar selfIn, name)),  
                   CL.mkIndirect(CL.mkVar selfOut, name)  
                 ])  
             | _ => CL.mkAssign(  
                 CL.mkIndirect(CL.mkVar selfIn, name),  
                 CL.mkIndirect(CL.mkVar selfOut, name))  
           (* end case *))  
   
   (* helper functions for specifying parameters in various address spaces *)  
     fun clParam spc (ty, x) = CL.PARAM([spc], ty, x)  
     val globalParam = clParam "__global"  
     val constantParam = clParam "__constant"  
     val localParam = clParam "__local"  
     val privateParam = clParam "__private"  
   
   (* OpenCL global pointer type *)  
     fun globalPtr ty = CL.T_Qual("__global", CL.T_Ptr ty)  
   
   (* lvalue/rvalue state variable *)  
     fun lvalueSV name = CL.mkIndirect(CL.mkVar "selfOut", name)  
     fun rvalueSV name = CL.mkIndirect(CL.mkVar "selfIn", name)  
21    
22      type var = CL.typed_var      type var = CL.typed_var
23      type exp = CL.exp      type exp = CL.exp
24      type stm = CL.stm      type stm = CL.stm
25    
   (* OpenCL specific types *)  
     val clIntTy = CL.T_Named "cl_int"  
     val clProgramTy = CL.T_Named "cl_program"  
     val clKernelTy  = CL.T_Named "cl_kernel"  
     val clCmdQueueTy = CL.T_Named "cl_command_queue"  
     val clContextTy = CL.T_Named "cl_context"  
     val clDeviceIdTy = CL.T_Named "cl_device_id"  
     val clPlatformIdTy = CL.T_Named "cl_platform_id"  
     val clMemoryTy = CL.T_Named "cl_mem"  
     val globPtrTy = CL.T_Ptr(CL.T_Named RN.globalsTy)  
 (* FIXME: what are these for? *)  
     datatype shadow_env = STRAND_SHADOW | GLOBAL_SHADOW  
   
26    (* variable or field that is mirrored between host and GPU *)    (* variable or field that is mirrored between host and GPU *)
27      type mirror_var = {      datatype mirror_var = MV of {
28  (* FIXME: perhaps it would be cleaner to just track the TreeIL type of the variable? *)          var : CL.var,           (* variable name *)
29              hostTy : CL.ty,             (* variable type on Host (i.e., C type) *)          ty : IL.Ty.ty,          (* tree IL type *)
30              shadowTy : CL.ty,           (* host-side shadow type of GPU type *)          hToS : stm              (* the statement that converts the variable to its *)
             gpuTy : CL.ty,              (* variable's type on GPU (i.e., OpenCL type) *)  
             hToS: stm,                  (* the statement that converts the variable to its *)  
31                                          (* shadow representation *)                                          (* shadow representation *)
             var : CL.var                (* variable name *)  
32            }            }
33    
34      datatype strand = Strand of {      datatype strand = Strand of {
35            prog : program,
36          name : string,          name : string,
37          tyName : string,          tyName : string,
38          state : mirror_var list,          state : mirror_var list,
39          output : (Ty.ty * CL.var),      (* the strand's output variable (only one for now) *)          output : (Ty.ty * CL.var),      (* the strand's output variable (only one for now) *)
40          code : CL.decl list ref,          code : CL.decl list ref
         init_code: CL.decl ref  
41        }        }
42    
43      datatype program = Prog of {      and program = Prog of {
44          props : Properties.props,          props : Properties.props,
45          globals : mirror_var list ref,          globals : mirror_var list ref,
46          topDecls : CL.decl list ref,          topDecls : CL.decl list ref,
47          strands : strand AtomTable.hash_table,          strands : strand AtomTable.hash_table,
48          initially :  CL.decl ref,          nAxes : int option ref,         (* number of axes in initial grid (NONE means collection) *)
49          numDims: int ref,               (* number of dimensions in initially iteration *)          initially : CL.decl ref
         imgGlobals: (string * int) list ref,  
         prFn: CL.decl ref,  
         outFn: CL.decl ref  
50        }        }
51    
52      datatype env = ENV of {      datatype env = ENV of {
# Line 178  Line 77 
77      fun inlineCons n = (n < 2)          (* vectors are inline, but not matrices *)      fun inlineCons n = (n < 2)          (* vectors are inline, but not matrices *)
78      val inlineMatrixExp = false         (* can matrix-valued expressions appear inline? *)      val inlineMatrixExp = false         (* can matrix-valued expressions appear inline? *)
79    
80      (* helper functions for specifying parameters in various address spaces *)
81        local
82          fun param spc (ty, x) = CL.PARAM([spc], ty, x)
83        in
84        val globalParam = param "__global"
85        val constantParam = param "__constant"
86        val localParam = param "__local"
87        val privateParam = param "__private"
88        fun clParam (ty, x) = CL.PARAM([], ty, x)
89        end (* local *)
90    
91      (* OpenCL global pointer type *)
92        fun globalPtr ty = CL.T_Qual("__global", CL.T_Ptr ty)
93    
94      (* lvalue/rvalue state variable *)
95        fun lvalueSV name = CL.mkIndirect(CL.mkVar "selfOut", name)
96        fun rvalueSV name = CL.mkIndirect(CL.mkVar "selfIn", name)
97    
98    (* TreeIL to target translations *)    (* TreeIL to target translations *)
99      structure Tr =      structure Tr =
100        struct        struct
# Line 203  Line 120 
120    (* variables *)    (* variables *)
121      structure Var =      structure Var =
122        struct        struct
123          fun mirror (ty, name, shadowEnv) = {          fun mirror (ty, name, shadowEnv) = MV{
124                  hostTy = ToC.trType ty,                  var = name,
125                  shadowTy = shadowTy ty,                  ty = ty,
126                  gpuTy = ToCL.trType ty,                  hToS = (case shadowEnv
                 hToS = case shadowEnv  
127                     of GLOBAL_SHADOW => convertToShadow (ty, name)                     of GLOBAL_SHADOW => convertToShadow (ty, name)
128                      | STRAND_SHADOW => convertStrandToShadow(ty, name, "selfIn", "selfOut")                      | STRAND_SHADOW => convertStrandToShadow(ty, name, "selfIn", "selfOut")
129                    (* end case *),                    (* end case *))
                 var = name  
130                }                }
131          fun name (ToCL.V(_, name)) = name          fun name (ToCL.V(_, name)) = name
132          fun global (Prog{globals, imgGlobals, ...}, name, ty) = let          fun global (Prog{globals, imgGlobals, ...}, name, ty) = let
# Line 224  Line 139 
139                  isImgGlobal (ty, name);                  isImgGlobal (ty, name);
140                  ToCL.V(#gpuTy x, name)                  ToCL.V(#gpuTy x, name)
141                end                end
142          fun param x = ToCL.V(ToCL.trType(V.ty x), V.name x)          fun param x = ToCL.V(CLTyTranslate.toGPUType(V.ty x), V.name x)
143        end        end
144    
145    (* environments *)    (* environments *)
# Line 255  Line 170 
170                  scope = scope                  scope = scope
171                }                }
172        (* define the current translation context *)        (* define the current translation context *)
173          val scopeGlobal = setScope (GlobalScope, RN.globalsVarName, "_bogus_", "_bogus_")          val scopeGlobal = setScope (GlobalScope, CLN.globalsVarName, "_bogus_", "_bogus_")
174          val scopeInitially =          val scopeInitially =
175                setScope (InitiallyScope, RN.globalsVarName, "_bogus_", "_bogus_")                setScope (InitiallyScope, CLN.globalsVarName, "_bogus_", "_bogus_")
176          val scopeStrand = setScope (StrandScope, RN.globalsVarName, "selfIn", "selfOut")          val scopeStrand = setScope (StrandScope, CLN.globalsVarName, "selfIn", "selfOut")
177          fun scopeMethod (env, name) =          fun scopeMethod (env, name) =
178                setScope (MethodScope name, RN.globalsVarName, "selfIn", "selfOut") env                setScope (MethodScope name, CLN.globalsVarName, "selfIn", "selfOut") env
179        end        end
180    
181    (* strands *)    (* strands *)
182      structure Strand =      structure Strand =
183        struct        struct
184            fun define (prog as Prog{strands, ...}, strandId, state) = let
         fun define (Prog{strands, ...}, strandId, state) = let  
185                val name = Atom.toString strandId                val name = Atom.toString strandId
186              (* the output state variable *)              (* the output state variable *)
187                val outputVar = (case List.filter IL.StateVar.isOutput state                val outputVar = (case List.filter IL.StateVar.isOutput state
# Line 282  Line 196 
196                        List.map cvt state                        List.map cvt state
197                      end                      end
198                val strand = Strand{                val strand = Strand{
199                          prog = prog,
200                        name = name,                        name = name,
201                        tyName = RN.strandTy name,                        tyName = N.strandTy name,
202                        state = state,                        state = state,
203                        output = outputVar,                        output = outputVar,
204                        code = ref [],                        code = ref []
                       init_code = ref (CL.D_Comment(["no init code"]))  
205                      }                      }
206                in                in
207                  AtomTable.insert strands (strandId, strand);                  AtomTable.insert strands (strandId, strand);
# Line 300  Line 214 
214        (* register the strand-state initialization code.  The variables are the strand        (* register the strand-state initialization code.  The variables are the strand
215         * parameters.         * parameters.
216         *)         *)
217          fun init (Strand{name, tyName, code, init_code, ...}, params, init) = let          fun init (Strand{prog=Prog{props, ...}, name, tyName, code, ...}, params, init) = let
218                val fName = RN.strandInit name                val globTy = CL.T_Ptr(CL.T_Named(N.globalTy props))
219                  val fName = N.strandInit name
220                  val selfParam = if Properties.dualState props
221                        then "selfOut"
222                        else "self"
223                val params =                val params =
224                      clParam "" (CL.T_Ptr(CL.T_Named tyName), "selfOut") ::                      CL.PARAM([], globTy, "glob") ::
225                        List.map (fn (ToCL.V(ty, x)) => CL.PARAM([], ty, x)) params                      CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), selfParam) ::
226                          List.map (fn (CL.V(ty, x)) => CL.PARAM([], ty, x)) params
227                val initFn = CL.D_Func([], CL.voidTy, fName, params, init)                val initFn = CL.D_Func([], CL.voidTy, fName, params, init)
228                in                in
229                  init_code := initFn                  code := initFn :: !code
230                end                end
231    
232        (* register a strand method *)        (* register a strand method *)
233          fun method (Strand{name, tyName, code,...}, methName, body) = let          fun method (Strand{prog=Prog{props, ...}, name, tyName, code, ...}, methName, body) = let
234                val params = [                val globTy = CL.T_Ptr(CL.T_Named(N.globalTy props))
235                        globalParam (CL.T_Ptr(CL.T_Named tyName), "selfIn"),                val fName = concat[name, "_", StrandUtil.nameToString methName]
236                        globalParam (CL.T_Ptr(CL.T_Named tyName), "selfOut"),                val stateParams = if Properties.dualState props
237                        globalParam (CL.T_Ptr(CL.T_Named (RN.globalsTy)), RN.globalsVarName),                      then [
238                        clParam "" (CL.T_Named(RN.imageDataType), RN.globalImageDataName)                          CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfIn"),
239                            CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfOut")
240                      ]                      ]
241                val (fName,resTy) = (case methName                      else [CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "self")]
242                       of StrandUtil.Update => (RN.strandUpdate,CL.T_Named "StrandStatus_t")                val params =
243                        | StrandUtil.Stabilize => (name ^ StrandUtil.nameToString methName, CL.voidTy)                      globalParam (globTy, "glob") ::
244                        clParam (CL.T_Named(CLN.imageDataType), CLN.globalImageDataName) ::
245                        stateParams
246                  val resTy = (case methName
247                         of StrandUtil.Update => CL.T_Named "StrandStatus_t"
248                          | StrandUtil.Stabilize => CL.voidTy
249                      (* end case *))                      (* end case *))
250                val methFn = CL.D_Func([], resTy, fName, params, body)                val methFn = CL.D_Func([], resTy, fName, params, body)
251                in                in
252                  code := methFn :: !code                  code := methFn :: !code
253                end                end
254    
255        end (* Strand *)        end
256    
257    (* programs *)    (* programs *)
258      structure Program =      structure Program =
259        struct        struct
260          fun new (tgt : TargetUtil.target_desc, props) = (          fun new (tgt : TargetUtil.target_desc, props) = (
261                RN.initTargetSpec (#double tgt);                N.initTargetSpec {double= #double tgt, long=false};
               CNames.initTargetSpec {double = #double tgt, long = false};  
262                Prog{                Prog{
263                    props = Properties.mkProps (tgt, props),                    props = Properties.mkProps (tgt, props),
264                      inputs = ref [],
265                    globals = ref [],                    globals = ref [],
266                    topDecls = ref [],                    topDecls = ref [],
267                    strands = AtomTable.mkTable (16, Fail "strand table"),                    strands = AtomTable.mkTable (16, Fail "strand table"),
268                    initially = ref(CL.D_Comment["missing initially"]),                    nAxes = ref(SOME ~1),
269                    numDims = ref 0,                    initially = ref(CL.D_Comment["missing initially"])
                   imgGlobals = ref[],  
                   prFn = ref(CL.D_Comment(["No Print Function"])),  
                   outFn = ref(CL.D_Comment(["No Output Function"]))  
270                  })                  })
271    (* FIXME: for standalone exes, the defaults should be set in the inputs struct;
272        (* register the code that is used to register command-line options for input variables *)   * not sure how to handle library inputs yet.
273          fun inputs (Prog{topDecls, ...}, env, blk) = let   *)
274    (* DEPRECATED
275          (* register the code that is used to set defaults for input variables *)
276            fun inputs (Prog{props, inputs, topDecls, ...}, env, blk) = let
277                  val worldTy = CL.T_Ptr(CL.T_Named(N.worldTy props))
278                  val globTy = CL.T_Ptr(CL.T_Named(N.globalTy props))
279                  val body = CL.mkBlock(
280                        CL.mkDeclInit(globTy, "glob", CL.mkIndirect(CL.mkVar "wrld", "globals")) ::
281                        CL.unBlock (Tr.block (env, blk)))
282                val inputsFn = CL.D_Func(                val inputsFn = CL.D_Func(
283                      [], CL.voidTy, RN.registerOpts,                      ["static"], CL.voidTy, N.initDefaults,
284                      [CL.PARAM([], CL.T_Ptr(CL.T_Named RN.optionsTy), "opts")],                      [CL.PARAM([], worldTy, "wrld")],
285                      Tr.block (env, blk))                      body)
286                in                in
287                    inputs := GenInputs.gatherInputs blk;
288                  topDecls := inputsFn :: !topDecls                  topDecls := inputsFn :: !topDecls
289                end                end
290    *)
291          (* gather the inputs *)
292            fun inputs (Prog{inputs, ...}, env, blk) = inputs := GenInputs.gatherInputs blk
293        (* register the global initialization part of a program *)        (* register the global initialization part of a program *)
294          fun init (Prog{topDecls, ...}, init) = let          fun init (Prog{props, topDecls, ...}, init) = let
295                val globalsDecl = CL.mkAssign(CL.mkVar RN.globalsVarName,                val worldTy = CL.T_Ptr(CL.T_Named(N.worldTy props))
296                      CL.mkApply("malloc", [CL.mkSizeof(CL.T_Named RN.globalsTy)]))                val globTy = CL.T_Ptr(CL.T_Named(N.globalTy props))
297                  val wrldV = CL.mkVar "wrld"
298                (* the body of the global initializtion code *)
299                  val initStms =
300                        CL.mkDeclInit(globTy, "glob", CL.mkIndirect(wrldV, "globals")) ::
301                        CL.unBlock init @ [CL.mkReturn(SOME(CL.mkVar "false"))]
302                (* for libraries, we need to make sure that the inputs are initialized *)
303                  val initStms = if not(#exec props)
304                        then CL.mkIfThen(
305                          CL.mkApply(N.checkDefined props, [wrldV]),
306                          CL.mkReturn(SOME(CL.mkBool true))) :: initStms
307                        else initStms
308                val initFn = CL.D_Func(                val initFn = CL.D_Func(
309                      [], CL.voidTy, RN.initGlobals, [],                      ["static"], CL.boolTy, N.initGlobals,
310                      CL.mkBlock[                      [CL.PARAM([], worldTy, "wrld")],
311                          globalsDecl,                      CL.mkBlock initStms)
                         CL.mkCall(RN.initGlobalsHelper, [CL.mkVar RN.globalsVarName])  
                       ])  
               val initHelperFn = CL.D_Func(  
                     [], CL.voidTy, RN.initGlobalsHelper,  
                     [CL.PARAM([], globPtrTy, RN.globalsVarName)],  
                     init)  
               val shutdownFn = CL.D_Func(  
                     [], CL.voidTy, RN.shutdown,  
                     [CL.PARAM([], CL.T_Ptr(CL.T_Named RN.worldTy), "wrld")],  
                     CL.S_Block[])  
312                in                in
313                  topDecls := shutdownFn :: initFn :: initHelperFn :: !topDecls                  topDecls := initFn :: !topDecls
314                end                end
315        (* register the global destruction part of a program *)        (* register the global destruction part of a program *)
316          fun free (Prog{props, topDecls, ...}, free) = let          fun free (Prog{props, topDecls, ...}, free) = let
# Line 392  Line 326 
326                in                in
327                  topDecls := freeFn :: !topDecls                  topDecls := freeFn :: !topDecls
328                end                end
   
329        (* create and register the initially function for a program *)        (* create and register the initially function for a program *)
330          fun initially {          fun initially {
331                prog = Prog{props, strands, initially, numDims, ...},                prog = Prog{props, strands, initially, numDims, ...},
# Line 406  Line 339 
339                val name = Atom.toString strand                val name = Atom.toString strand
340                val nDims = List.length iters                val nDims = List.length iters
341                val worldTy = CL.T_Ptr(CL.T_Named(N.worldTy props))                val worldTy = CL.T_Ptr(CL.T_Named(N.worldTy props))
342                  val globTy = CL.T_Ptr(CL.T_Named(N.globalTy props))
343                fun mapi f xs = let                fun mapi f xs = let
344                      fun mapf (_, []) = []                      fun mapf (_, []) = []
345                        | mapf (i, x::xs) = f(i, x) :: mapf(i+1, xs)                        | mapf (i, x::xs) = f(i, x) :: mapf(i+1, xs)
# Line 415  Line 349 
349                val baseInit = mapi (fn (i, (_, e, _)) => (i, CL.I_Exp e)) iters                val baseInit = mapi (fn (i, (_, e, _)) => (i, CL.I_Exp e)) iters
350                val sizeInit = mapi                val sizeInit = mapi
351                      (fn (i, (CL.V(ty, _), lo, hi)) =>                      (fn (i, (CL.V(ty, _), lo, hi)) =>
352                          (i, CL.I_Exp(CL.mkBinOp(hi, CL.#-, lo) #+# CL.mkIntTy(1, ty)))                          (i, CL.I_Exp(CL.mkBinOp(CL.mkBinOp(hi, CL.#-, lo), CL.#+, CL.E_Int(1, ty))))
353                      ) iters                      ) iters
354              (* code to allocate the world and initial strands *)              (* code to allocate the world and initial strands *)
               val wrld = "wrld"  
355                val allocCode = [                val allocCode = [
356                        CL.mkComment["allocate initial block of strands"],                        CL.mkComment["allocate initial block of strands"],
357                        CL.mkDecl(CL.T_Array(CL.int32, SOME nDims), "base", SOME(CL.I_Array baseInit)),                        CL.mkDecl(CL.T_Array(CL.uint32, SOME nDims), "base", SOME(CL.I_Array baseInit)),
358                        CL.mkDecl(CL.T_Array(CL.uint32, SOME nDims), "size", SOME(CL.I_Array sizeInit)),                        CL.mkDecl(CL.T_Array(CL.uint32, SOME nDims), "size", SOME(CL.I_Array sizeInit)),
359                        CL.mkDecl(worldTy, wrld,                        CL.mkIfThen(CL.mkApply(N.allocInitially, [
360                          SOME(CL.I_Exp(CL.mkApply(N.allocInitially, [                            CL.mkVar "wrld",
361                              CL.mkVar "ProgramName",                            CL.E_Bool isArray,
362                              CL.mkUnOp(CL.%&, CL.mkVar(N.strandDesc name)),                            CL.E_Int(IntInf.fromInt nDims, CL.int32),
363                              CL.mkBool isArray,                            CL.E_Var "base",
364                              CL.mkIntTy(IntInf.fromInt nDims, CL.int32),                            CL.E_Var "size"
365                              CL.mkVar "base",                          ]),
366                              CL.mkVar "size"                        (* then *)
367                            ]))))                          CL.mkBlock [
368    (* FIXME: anything else? *)
369                                CL.mkReturn(SOME(CL.mkVar "true"))
370                              ])
371                          (* endif *)
372                      ]                      ]
373              (* create the loop nest for the initially iterations *)              (* create the loop nest for the initially iterations *)
374                val indexVar = "ix"                val indexVar = "ix"
375                val strandTy = CL.T_Ptr(CL.T_Named(N.strandTy name))                val strandTy = CL.T_Ptr(CL.T_Named(N.strandTy name))
376                  fun statePtr inout = CL.mkSubscript(CL.mkIndirect(CL.mkVar "wrld", inout), CL.mkVar indexVar)
377                fun mkLoopNest [] = CL.mkBlock(createPrefix @ [                fun mkLoopNest [] = CL.mkBlock(createPrefix @ [
378                        CL.mkDecl(strandTy, "sp",                        CL.mkCall(N.strandInit name, CL.mkVar "glob" :: statePtr "inState" :: args),
379                          SOME(CL.I_Exp(                        CL.mkCall("memcpy", [
380                            CL.mkCast(strandTy,                            statePtr "outState", statePtr "inState",
381                            CL.mkApply(N.inState, [CL.mkVar "wrld", CL.mkVar indexVar]))))),                            CL.mkSizeof(CL.T_Named(N.strandTy name))
382                        CL.mkCall(N.strandInit name, CL.mkVar "sp" :: args),                          ]),
383                        CL.mkAssign(CL.mkVar indexVar, CL.mkVar indexVar #+# CL.mkIntTy(1, CL.uint32))                        CL.S_Exp(CL.mkPostOp(CL.mkVar indexVar, CL.^++))
384                      ])                      ])
385                  | mkLoopNest ((CL.V(ty, param), lo, hi)::iters) = let                  | mkLoopNest ((CL.V(ty, param), lo, hi)::iters) = let
386                      val body = mkLoopNest iters                      val body = mkLoopNest iters
387                      in                      in
388                        CL.mkFor(                        CL.mkFor(
389                          [(ty, param, lo)],                          [(ty, param, lo)],
390                          CL.mkBinOp(CL.mkVar param, CL.#<=, hi),                          CL.mkBinOp(CL.E_Var param, CL.#<=, hi),
391                          [CL.mkPostOp(CL.mkVar param, CL.^++)],                          [CL.mkPostOp(CL.E_Var param, CL.^++)],
392                          body)                          body)
393                      end                      end
394                val iterCode = [                val iterCode = [
395                        CL.mkComment["initially"],                        CL.mkComment["initially"],
396                        CL.mkDecl(CL.uint32, indexVar, SOME(CL.I_Exp(CL.mkIntTy(0, CL.uint32)))),                        CL.mkDecl(CL.uint32, indexVar, SOME(CL.I_Exp(CL.E_Int(0, CL.uint32)))),
397                        mkLoopNest iters                        mkLoopNest iters
398                      ]                      ]
399                val body = CL.mkBlock(                val body = CL.mkBlock(
400                        CL.mkIfThen (CL.mkApply (N.initGlobals, [CL.mkVar "wrld"]),
401                            CL.mkReturn(SOME(CL.mkVar "true"))
402                          ) ::
403                        CL.mkDeclInit (globTy, "glob", CL.mkIndirect(CL.mkVar "wrld", "globals")) ::
404                      iterPrefix @                      iterPrefix @
405                      allocCode @                      allocCode @
406                      iterCode @                      iterCode @
407                      [CL.mkReturn(SOME(CL.mkVar "wrld"))])                      [CL.mkReturn(SOME(CL.mkVar "wrld"))])
408                val initFn = CL.D_Func([], worldTy, N.initially props, [], body)                val initFn = CL.D_Func([], worldTy, N.initially props, [], body)
409                in                in
410                  numDims := nDims;                  nAxes := (if isArray then SOME nDims else NONE);
411                  initially := initFn                  initially := initFn
412                end                end
413    
   
414        (***** OUTPUT *****)        (***** OUTPUT *****)
415    
416          fun genStrandPrint (Strand{name, tyName, state, output, code, ...}) = let        (* create the target-specific substitution list *)
417              (* the print function *)          fun mkSubs (props : props, Strand{name, tyName, ...}) = [
418                val prFnName = concat[name, "Print"]                  ("CFILE",       OS.Path.joinBaseExt{base= #outBase props, ext= SOME "c"}),
419                val prFn = let                  ("HDRFILE",     OS.Path.joinBaseExt{base= #outBase props, ext= SOME "h"}),
420                      val params = [                  ("PREFIX",      #namespace props),
421                            CL.PARAM([], CL.T_Ptr(CL.T_Named "FILE"), "outS"),                  ("SRCFILE",     #srcFile props),
422                            CL.PARAM([], CL.T_Ptr(CL.T_Named(RN.strandShadowTy tyName)), "self")                  ("STRAND",      name),
423                          ]                  ("STRANDTY",    tyName)
                     val (ty, x) = output  
                     val outState = CL.mkIndirect(CL.mkVar "self", x)  
                     val prArgs = (case ty  
                            of Ty.IntTy => [CL.mkStr(!N.gIntFormat ^ "\n"), outState]  
                             | Ty.SeqTy(Ty.IntTy, d) => let  
                                 fun sel i = CL.mkApply(  
                                           "VSUB",  
                                           [outState, CL.mkInt(IntInf.fromInt i)])  
                                 val fmt = CL.mkStr(  
                                       String.concatWith " " (List.tabulate(d, fn _ => !N.gIntFormat))  
                                       ^ "\n")  
                                 val args = List.tabulate (d, sel)  
                                 in  
                                   fmt :: args  
                                 end  
                             | Ty.TensorTy[] => [CL.mkStr "%f\n", outState]  
                             | Ty.TensorTy[d] => let  
                                 fun sel i = CL.mkApply(  
                                         "VSUB",  
                                         [outState, CL.mkInt(IntInf.fromInt i)])  
                                 val fmt = CL.mkStr(  
                                       String.concatWith " " (List.tabulate(d, fn _ => "%f"))  
                                       ^ "\n")  
                                 val args = List.tabulate (d, sel)  
                                 in  
                                   fmt :: args  
                                 end  
                             | _ => raise Fail("genStrand: unsupported output type " ^ Ty.toString ty)  
                           (* end case *))  
                     in  
                       CL.D_Func(["static"], CL.voidTy, prFnName, params,  
                         CL.mkCall("fprintf", CL.mkVar "outS" :: prArgs))  
                     end  
               in  
                 prFn  
               end  
   
         fun genStrandTyDef (targetTy,Strand{state,...}, tyName) = (case state  
                of [] => CL.D_Comment(["No Strand Defintiion Included"])  
                 | _ => CL.D_StructDef(  
                     NONE,  
                     revmap (fn x => (targetTy x, #var x)) state,  
                     SOME tyName)  
              (* end case *))  
   
      (* generates the globals buffers and arguments function *)  
         fun genConvertShadowTypes (Strand{name, tyName, state,...}) = let  
             (* Declare opencl setup objects *)  
               val errVar = "err"  
               val params = [  
                       CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfOut"),  
                       CL.PARAM([], CL.T_Ptr(CL.T_Named(RN.strandShadowTy tyName)), "selfIn")  
                     ]  
               val body = List.map (fn (x:mirror_var) => #hToS x) state  
               in  
                 CL.D_Func([], CL.voidTy, RN.strandConvertName name, params, CL.mkBlock body)  
               end  
   
       (* generates the opencl buffers for the image data *)  
         fun getGlobalDataBuffers (globals, imgGlobals, contextVar, errVar) = let  
               val globalBuffErr = "error creating OpenCL global buffer\n"  
               fun errorFn msg = CL.mkIfThen(CL.mkBinOp(CL.mkVar errVar, CL.#!=, CL.mkVar "CL_SUCCESS"),  
                     CL.mkBlock([CL.mkCall("fprintf",[CL.mkVar "stderr", CL.mkStr msg]),  
                     CL.mkCall("exit",[CL.mkInt 1])]))  
               val shadowTypeDecl =  
                     CL.mkDecl(CL.T_Named(RN.shadowGlobalsTy), RN.shadowGlaobalsName, NONE)  
               val globalToShadowStms = List.map (fn (x:mirror_var) => #hToS x) globals  
               val globalBufferDecl = CL.mkDecl(clMemoryTy,concat[RN.globalsVarName,"_cl"],NONE)  
               val globalBuffer = CL.mkAssign(CL.mkVar(concat[RN.globalsVarName,"_cl"]),  
                     CL.mkApply("clCreateBuffer", [  
                         CL.mkVar contextVar,  
                         CL.mkBinOp(CL.mkVar "CL_MEM_READ_ONLY", CL.#|, CL.mkVar "CL_MEM_COPY_HOST_PTR"),  
                         CL.mkSizeof(CL.T_Named RN.shadowGlobalsTy),  
                         CL.mkUnOp(CL.%&,CL.mkVar RN.shadowGlaobalsName),  
                         CL.mkUnOp(CL.%&,CL.mkVar errVar)  
                       ]))  
               fun genDataBuffers ([],_,_,_) = []  
                 | genDataBuffers ((var,nDims)::globals, contextVar, errVar,errFn) = let  
                     val hostVar = CL.mkIndirect(CL.mkVar RN.globalsVarName, var)  
                     val size = CL.mkIndirect(hostVar, "dataSzb")  
                     in  
                       CL.mkDecl(clMemoryTy, RN.addBufferSuffixData var ,NONE) ::  
                       CL.mkAssign(CL.mkVar(RN.addBufferSuffixData var),  
                         CL.mkApply("clCreateBuffer", [  
                             CL.mkVar contextVar,  
                             CL.mkVar "CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR",  
                             size,  
                             CL.mkIndirect(hostVar, "data"),  
                             CL.mkUnOp(CL.%&,CL.mkVar errVar)  
                           ])) ::  
                         errFn(concat["error in creating ",RN.addBufferSuffixData var, " global buffer\n"]) ::  
                         genDataBuffers(globals,contextVar,errVar,errFn)  
                     end  
               in  
                 [shadowTypeDecl] @ globalToShadowStms  
                 @ [globalBufferDecl, globalBuffer,errorFn(globalBuffErr)]  
                 @ genDataBuffers(imgGlobals,contextVar,errVar,errorFn)  
               end  
   
       (* generates the kernel arguments for the image data *)  
         fun genGlobalArguments (globals, count, kernelVar, errVar) = let  
               val globalArgErr = "error creating OpenCL global argument\n"  
               fun errorFn msg = CL.mkIfThen(CL.mkBinOp(CL.mkVar errVar, CL.#!=, CL.mkVar "CL_SUCCESS"),  
                     CL.mkBlock([CL.mkCall("fprintf",[CL.mkVar "stderr", CL.mkStr msg]),  
                     CL.mkCall("exit",[CL.mkInt 1])]))  
               val globalArgument = CL.mkExpStm(CL.mkAssignOp(CL.mkVar errVar,CL.&=,  
                     CL.mkApply("clSetKernelArg",  
                       [CL.mkVar kernelVar,  
                        CL.mkPostOp(CL.mkVar count, CL.^++),  
                        CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),  
                        CL.mkUnOp(CL.%&,CL.mkVar(concat[RN.globalsVarName,"_cl"]))])))  
               fun genDataArguments ([],_,_,_,_) = []  
                 | genDataArguments ((var,nDims)::globals,count,kernelVar,errVar,errFn) =  
                     CL.mkExpStm(CL.mkAssignOp(CL.mkVar errVar,CL.$=,  
                       CL.mkApply("clSetKernelArg",  
                         [CL.mkVar kernelVar,  
                          CL.mkPostOp(CL.mkVar count, CL.^++),  
                          CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),  
                          CL.mkUnOp(CL.%&,CL.mkVar(RN.addBufferSuffixData var))]))) ::  
                          errFn(concat["error in creating ",RN.addBufferSuffixData var, " argument\n"]) ::  
                     genDataArguments (globals,count,kernelVar,errVar,errFn)  
               in  
                 globalArgument :: errorFn globalArgErr ::  
                   genDataArguments(globals, count, kernelVar, errVar,errorFn)  
               end  
   
       (* generates the globals buffers and arguments function *)  
         fun genGlobalBuffersArgs (globals,imgGlobals) = let  
             (* Delcare opencl setup objects *)  
               val errVar = "err"  
               val params = [  
                       CL.PARAM([],CL.T_Named("cl_context"), "context"),  
                       CL.PARAM([],CL.T_Named("cl_kernel"), "kernel"),  
                       CL.PARAM([],CL.T_Named("cl_command_queue"), "cmdQ"),  
                       CL.PARAM([],CL.T_Named("int"), "argStart")  
                     ]  
               val body = (case globals  
                      of [] => [CL.mkReturn(NONE)]  
                       | _ => let  
                             val clGlobalBuffers =  
                                   getGlobalDataBuffers(globals, !imgGlobals, "context", errVar)  
                             val clGlobalArguments =  
                                   genGlobalArguments(!imgGlobals, "argStart", "kernel", errVar)  
                             in  
                             (* Body: put all the statments together *)  
                               CL.mkDecl(clIntTy, errVar, SOME(CL.I_Exp(CL.mkInt 0)))  
                               :: clGlobalBuffers @ clGlobalArguments  
                             end  
                     (*end of case*))  
               in  
                 CL.D_Func([],CL.voidTy,RN.globalsSetupName,params,CL.mkBlock(body))  
               end  
   
       (* generate the global image meta-data and data parameters *)  
         fun genKeneralGlobalParams ((name,tyname)::[],line) =  
               concat[line, "__global void *", RN.addBufferSuffixData name]  
           | genKeneralGlobalParams ([],line) = line  
           | genKeneralGlobalParams ((name,tyname)::rest, line) =  
               genKeneralGlobalParams(rest, concat[line, "__global void *", RN.addBufferSuffixData name, ",\n"])  
   
         fun genUpdateMethod (Strand{name, tyName, state,...}, globals, imgGlobals) = let  
               val imageDataStms = List.map  
                       (fn (x,_) => concat[  
                           RN.globalImageDataName, ".", RN.imageDataName x, " = ",  
                           RN.addBufferSuffixData x, ";","\n"  
                         ])  
                         (!imgGlobals)  
               fun select ([], a, _) = a  
                 | select (_, _, b) = b  
               val placeHolders = [  
                       (RN.place_holders, tyName),  
                       (RN.p_addDatPtr, select (!imgGlobals, "", ",")),  
                       (RN.p_addGlobals, select (!globals, "", ",")),  
                       (RN.p_globals, select (!globals, "", "__global Diderot_Globals_t *diderotGlobals")),  
                       (RN.p_globalVar, select (!globals, "0", RN.globalsVarName)),  
                       (RN.p_dataVar, select (!globals, "0", RN.globalImageDataName)),  
                       (RN.p_dataPtr, genKeneralGlobalParams (!imgGlobals, "")),  
                       (RN.p_dataAssign,  select (!imgGlobals, "",  
                         String.concat("Diderot_data_ptr_t diderotDataPtrs;\n" :: imageDataStms)))  
424                      ]                      ]
               in  
                 CL.verbatimDcl [CLUpdateFrag.text] placeHolders  
               end  
425    
426          fun genStrandCopy(Strand{tyName,name,state,...}) = let          fun condCons (true, x, xs) = x::xs
427                val params = [            | condCons (false, _, xs) = xs
                       CL.PARAM(["__global"], CL.T_Ptr(CL.T_Named tyName), "selfIn"),  
                       CL.PARAM(["__global"], CL.T_Ptr(CL.T_Named tyName), "selfOut")  
                     ]  
               val assignStms = List.rev(  
                     List.map  
                       (fn x => CL.mkAssign(lvalueSV(#var x), rvalueSV(#var x)))  
                         state)  
               in  
                 CL.D_Func([""], CL.voidTy, RN.strandCopy, params,CL.mkBlock(assignStms))  
               end  
428    
429        (* generate a global structure type definition from the list of globals *)          fun verbFrag (props : props, parFrag, seqFrag, subs) =
430          fun genGlobalStruct (_, [], _) = CL.D_Comment(["No Global Definition"])                CL.verbatimDcl [if (#parallel props) then parFrag else seqFrag] subs
           | genGlobalStruct (targetTy, globals, tyName) = let  
               val globs = List.map (fn (x : mirror_var) => (targetTy x, #var x)) globals  
               in  
                 CL.D_StructDef(NONE, globs, SOME tyName)  
               end  
431    
432        (* generate a global structure type definition from the image data of the image globals *)          fun compile (props : props, basename) = let
433          fun genImageDataStruct ([], _) = CL.D_Comment(["No Image Data Ptrs Definition"])              (* generate the C compiler flags *)
434            | genImageDataStruct (imgGlobals, tyName) = let                val cflags = ["-I" ^ Paths.diderotInclude, "-I" ^ Paths.teemInclude]
435                val globs = List.map                val cflags = condCons (#parallel props, #pthread Paths.cflags, cflags)
436                      (fn (x, _) => (globalPtr CL.voidTy, RN.imageDataName x))                val cflags = if #debug props
437                        imgGlobals                      then #debug Paths.cflags :: cflags
438                        else #ndebug Paths.cflags :: cflags
439                  val cflags = #base Paths.cflags :: cflags
440                in                in
441                  CL.D_StructDef(NONE, globs, SOME tyName)                  RunCC.compile (basename, cflags)
442                end                end
443    
444          fun genGlobals (declFn, targetTy, globals) = let          fun ldFlags (props : props) = if #exec props
445                fun doVar (x : mirror_var) = declFn (CL.D_Var([], targetTy x, #var x, NONE))                then let
446                    val extraLibs = condCons (#parallel props, #pthread Paths.extraLibs, [])
447                    val extraLibs = Paths.teemLinkFlags @ #base Paths.extraLibs :: extraLibs
448                    val rtLib = Properties.runtimeName props
449                in                in
450                  List.app doVar globals                    rtLib :: extraLibs
451                end                end
452                  else [Properties.runtimeName props]
453    
454          fun genOutputFun(Strand{name, output,tyName, state, code,...}) = let          fun genStrand (Strand{prog=Prog{props, ...}, name, tyName, state, output, code}) = let
455              (* the output function *)              (* the type declaration for the strand's state struct *)
456                val outFnName = concat[name, "_Output"]                val selfTyDef = CL.D_StructDef(
457                val outFun = let                        SOME(concat[#namespace props, "struct_", name]),
458                      val params = [                        List.rev (List.map (fn CL.V(ty, x) => (ty, x)) state),
459                            CL.PARAM([], CL.T_Ptr CL.voidTy, "outS"),                        NONE)
                           CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "self")  
                         ]  
460              (* the type and access expression for the strand's output variable *)              (* the type and access expression for the strand's output variable *)
461                val (outTy, outState) = (#1 output, CL.mkIndirect(CL.mkVar "self", #2 output))                val (outTy, outState) = (#1 output, CL.mkIndirect(CL.mkVar "self", #2 output))
                     val outState = CL.mkUnOp(CL.%&, outState)  
                     in  
                       CL.D_Func(["static"], CL.voidTy, outFnName, params,  
                         CL.mkCall("memcpy", [CL.mkVar "outS", outState, CL.mkSizeof(shadowTy outTy)] ))  
                     end  
             in  
               outFun  
             end  
   
         fun genStrandDesc (outFn,Strand{name, output,tyName, state, code,...}) = let  
             (* the output function *)  
               val outFnName = concat[name, "_Output"]  
462              (* the strand's descriptor object *)              (* the strand's descriptor object *)
463                val descI = let                val descI = let
464                      fun fnPtr (ty, f) = CL.I_Exp(CL.mkCast(CL.T_Named ty, CL.mkVar f))                      fun fnPtr (ty, f) = CL.I_Exp(CL.mkCast(CL.T_Named ty, CL.mkVar f))
                     val (outTy, _) = output  
465                      in                      in
466                        CL.I_Struct[                        CL.I_Struct[
467                            ("name", CL.I_Exp(CL.mkStr name)),                            ("name", CL.I_Exp(CL.mkStr name)),
468                            ("stateSzb", CL.I_Exp(CL.mkSizeof(CL.T_Named(RN.strandTy name)))),                            ("stateSzb", CL.I_Exp(CL.mkSizeof(CL.T_Named(N.strandTy name)))),
469                            ("shadowStrandSzb", CL.I_Exp(CL.mkSizeof(CL.T_Named(RN.strandShadowTy (RN.strandTy name))))),                            ("update", fnPtr("update_method_t", name ^ "_Update")),
470  (* FIXME: we may need to add a shadowOutputSzb field too for OpenCL *)                            ("stabilize", fnPtr("stabilize_method_t", name ^ "_Stabilize"))
                           ("outputSzb", CL.I_Exp(CL.mkSizeof(shadowTy outTy))),  
 (* DEPRECATED  
                           ("nrrdType", CL.I_Exp(CL.mkInt (NrrdTypes.toNrrdType outTy))),  
                           ("nrrdSzb", CL.I_Exp(CL.mkInt (NrrdTypes.toNrrdSize outTy))),  
 *)  
                           ("update", fnPtr("update_method_t", "0")),  
                           ("strandCopy",  fnPtr("convert_method_t", RN.strandConvertName name)),  
                           ("print", fnPtr("print_method_t", RN.strandPrintName name)),  
                           ("output", fnPtr("output_method_t", outFnName)) (* FIXME *)  
471                          ]                          ]
472                      end                      end
473                val desc = CL.D_Var([], CL.T_Named N.strandDescTy, N.strandDesc name, SOME descI)                val desc = CL.D_Var([], CL.T_Named N.strandDescTy, N.strandDesc name, SOME descI)
474                in                in
475                  desc                  selfTyDef :: List.rev (desc :: !code)
476                  end
477    
478            fun genGlobalStruct (props : props, globals) =
479                  CL.D_StructDef(NONE, globals, SOME(#namespace props ^ "Globals_t"))
480    
481          (* generate the struct declaration for the world representation *)
482            fun genWorldStruct (props, Strand{tyName, ...}) = let
483                  val extras = [
484                        (* target-specific world components *)
485                          (CL.T_Ptr(CL.T_Named(N.globalsTy props)), "globals"),
486                          (CL.T_Ptr CL.uint8,                       "status"),
487                          (CL.T_Ptr(CL.T_Ptr(CL.T_Named tyName)),   "inState"),
488                          (CL.T_Ptr(CL.T_Ptr(CL.T_Named tyName)),   "outState")
489                        ]
490                  val extras = if #exec props
491                        then extras
492                        else (CL.T_Named(N.definedInpTy props), "definedInp") :: extras
493                  val extras = if #parallel props
494                        then (CL.T_Ptr(CL.T_Named "Diderot_Sched_t"), "sched") :: extras
495                        else (CL.T_Named "uint32_t", "numActive") :: extras
496                  in
497                    World.genStruct (props, extras)
498                end                end
499    
500        (* generate the table of strand descriptors *)        (* generate the table of strand descriptors *)
501          fun genStrandTable (declFn, strands) = let          fun ppStrandTable (ppStrm, strands) = let
502                val nStrands = length strands                val nStrands = length strands
503                fun genInit (Strand{name, ...}) = CL.I_Exp(CL.mkUnOp(CL.%&, CL.mkVar(N.strandDesc name)))                fun genInit (Strand{name, ...}) = CL.I_Exp(CL.mkUnOp(CL.%&, CL.E_Var(N.strandDesc name)))
504                fun genInits (_, []) = []                fun genInits (_, []) = []
505                  | genInits (i, s::ss) = (i, genInit s) :: genInits(i+1, ss)                  | genInits (i, s::ss) = (i, genInit s) :: genInits(i+1, ss)
506                  fun ppDecl dcl = PrintAsC.output(ppStrm, dcl)
507                in                in
508                  declFn (CL.D_Var([], CL.int32, N.numStrands,                  ppDecl (CL.D_Var(["static const"], CL.int32, "NumStrands",
509                    SOME(CL.I_Exp(CL.mkIntTy(IntInf.fromInt nStrands, CL.int32)))));                    SOME(CL.I_Exp(CL.E_Int(IntInf.fromInt nStrands, CL.int32)))));
510                  declFn (CL.D_Var([],                  ppDecl (CL.D_Var([],
511                    CL.T_Array(CL.T_Ptr(CL.T_Named N.strandDescTy), SOME nStrands),                    CL.T_Array(CL.T_Ptr(CL.T_Named N.strandDescTy), SOME nStrands),
512                    N.strands,                    N.strands,
513                    SOME(CL.I_Array(genInits (0, strands)))))                    SOME(CL.I_Array(genInits (0, strands)))))
514                end                end
515    
516          fun genSrc (baseName, prog) = let        (* generate the OpenCL source code. *)
517                val Prog{          fun outputCLSrc (baseName, prog as Prog{props, ...}) = let
518                        props,                val fileName = OS.Path.joinBaseExt{base=baseName, ext=SOME "cl"}
519                        globals, topDecls, strands, initially,                val outS = TextIO.openOut fileName
520                        imgGlobals, numDims,outFn, ...                val ppStrm = PrintAsCL.new outS
521                      } = prog                fun ppDecl dcl = PrintAsCL.output(ppStrm, dcl)
               val clFileName = OS.Path.joinBaseExt{base=baseName, ext=SOME "cl"}  
               val cFileName = OS.Path.joinBaseExt{base=baseName, ext=SOME "c"}  
               val clOutS = TextIO.openOut clFileName  
               val cOutS = TextIO.openOut cFileName  
               val clppStrm = PrintAsCL.new clOutS  
               val cppStrm = PrintAsC.new cOutS  
               fun cppDecl dcl = PrintAsC.output(cppStrm, dcl)  
               fun clppDecl dcl = PrintAsCL.output(clppStrm, dcl)  
               val strands = AtomTable.listItems strands  
               val [strand as Strand{name, tyName, code, init_code, ...}] = strands  
522                in                in
               (* Generate the OpenCL file *)  
523                (* Retrieve the header information *)                (* Retrieve the header information *)
524                  clppDecl (CL.verbatimDcl [HF.text] [                  ppDecl (CL.verbatimDcl [CLHeadFrag.text] [
525                      ("OUTFILE", clFileName),                      ("OUTFILE", fileName),
526                      ("SRCFILE", OS.Path.joinBaseExt{base=baseName, ext=SOME "diderot"}),                      ("SRCFILE", #srcFile props),
527                      ("DIDEROT_FLOAT_PRECISION", Properties.floatPrecisionDef props),                      ("DIDEROT_FLOAT_PRECISION", Properties.floatPrecisionDef props),
528                      ("DIDEROT_INT_PRECISION", Properties.intPrecisionDef props)                      ("DIDEROT_INT_PRECISION", Properties.intPrecisionDef props)
529                    ]);                    ]);
530    (* FIXME: check to see if we really need the DUAL_STATE define for OpenCL *)
531                    if Properties.dualState props
532                      then ppDecl (CL.D_Verbatim ["#define DIDEROT_DUAL_STATE\n"])
533                      else ();
534                (* if there are no globals, then define a dummy type *)                (* if there are no globals, then define a dummy type *)
535                  if List.null(!globals)                  if List.null(!globals)
536                    then clppDecl (CL.D_Verbatim["typedef void ", RN.globalsTy, ";\n"])                    then ppDecl (CL.D_Verbatim["typedef void ", CLN.globalsTy, ";\n"])
537                    else ();                    else ();
538                (* if there are no images, then define a dummy type *)                (* if there are no images, then define a dummy type *)
539                  if List.null(!imgGlobals)                  if List.null(!imgGlobals)
540                    then clppDecl (CL.D_Verbatim["typedef void * ", RN.imageDataType, ";\n"])                    then ppDecl (CL.D_Verbatim["typedef void * ", CLN.imageDataType, ";\n"])
541                    else ();                    else ();
542                (* Retrieve the scheduler kernels and functions *)                (* Retrieve the scheduler kernels and functions *)
543                  clppDecl (CL.D_Verbatim[SF.text]);                  ppDecl (CL.D_Verbatim[CLSchedFrag.text]);
544                  clppDecl (CL.D_Verbatim[CLEigen2x2Frag.text]);  (* FIXME: should only include eigen code fragments if they are being used! *)
545                  clppDecl (CL.D_Verbatim[CLEigen3x3Frag.text]);                  ppDecl (CL.D_Verbatim[CLEigen2x2Frag.text]);
546                  clppDecl (genGlobalStruct (#gpuTy, !globals, RN.globalsTy));  (* FIXME: should only include eigen code fragments if they are being used! *)
547                  clppDecl (genImageDataStruct(!imgGlobals, RN.imageDataType));                  ppDecl (CL.D_Verbatim[CLEigen3x3Frag.text]);
548                  clppDecl (genStrandTyDef(#gpuTy, strand, tyName));                  ppDecl (genGlobalStruct (#gpuTy, !globals, CLN.globalsTy));
549                  List.app clppDecl (!code);                  ppDecl (genImageDataStruct(!imgGlobals, CLN.imageDataType));
550                  clppDecl (genStrandCopy strand);                  ppDecl (genStrandTyDef(#gpuTy, strand, tyName));
551                  clppDecl (genUpdateMethod(strand, globals, imgGlobals));                  List.app clppDppDeclecl (!code);
552                (* Generate the Host C file *)                  ppDecl (genStrandCopy strand);
553                  cppDecl (CL.D_Verbatim[                  ppDecl (genUpdateMethod(strand, globals, imgGlobals))
554                      concat["#define " ^ Properties.floatPrecisionDef props, "\n"],                end
555                      concat["#define " ^ Properties.intPrecisionDef props, "\n"],  
556                      concat["#define " ^ Properties.targetDef props, "\n"],          fun outputLibSrc (baseName, Prog{
557                      "#include \"Diderot/diderot.h\"\n"                  props, inputs, globals, topDecls, strands, nAxes, initially, ...
558                    ]);                }) = let
559                  case !globals                val [strand as Strand{name, tyName, state, output, ...}] = AtomTable.listItems strands
560                   of [] => cppDecl (CL.D_Verbatim[concat["typedef void ", RN.globalsTy, ";\n"] ])                val outputs = GenOutput.gen (props, !nAxes) [output]
561                    | _ => ()                val substitutions = mkSubs (props, strand)
562                  (* end case *);              (* output to C file *)
563                  cppDecl (CL.D_Var(["static"], CL.charPtr, "ProgramName",                val fileName = OS.Path.joinBaseExt{base=baseName, ext=SOME "c"}
564                    SOME(CL.I_Exp(CL.mkStr(#srcFile props)))));                val outS = TextIO.openOut fileName
565                  cppDecl (genGlobalStruct (#hostTy, !globals, RN.globalsTy));                val ppStrm = PrintAsC.new outS
566                  cppDecl (genGlobalStruct (#shadowTy, !globals, RN.shadowGlobalsTy));                fun ppDecl dcl = PrintAsC.output(ppStrm, dcl)
567  (* FIXME: does this really need to be a global? *)                in
568                  cppDecl (CL.D_Var(["static"], globPtrTy, RN.globalsVarName, NONE));                  ppDecl (CL.verbatimDcl [CHeadFrag.text] substitutions);
569                  cppDecl (genStrandTyDef (#hostTy, strand, tyName));                  if Properties.dualState props
570                  cppDecl (genStrandTyDef (#shadowTy, strand, RN.strandShadowTy tyName));                    then ppDecl (CL.D_Verbatim ["#define DIDEROT_DUAL_STATE\n"])
571                  cppDecl (genConvertShadowTypes strand);                    else ();
572                  cppDecl  (!init_code);                  ppDecl (GenInputs.genDefinedInpStruct (props, !inputs));
573                  cppDecl (genStrandPrint strand);                  ppDecl (genGlobalStruct (props, List.rev(!globals)));
574                  cppDecl (genOutputFun strand);                  ppDecl (genWorldStruct(props, strand));
575                  List.app cppDecl (List.rev (!topDecls));                  List.app ppDecl (GenInputs.genInputFuns(props, !inputs));
576                  cppDecl (genGlobalBuffersArgs (!globals,imgGlobals));                  List.app ppDecl (List.rev (!topDecls));
577                  List.app (fn strand => cppDecl (genStrandDesc (outFn,strand))) strands;                  List.app ppDecl (genStrand strand);
578                  genStrandTable (cppDecl, strands);                  List.app ppDecl outputs;
579                  cppDecl (!initially);                  ppStrandTable (ppStrm, [strand]);
580                  PrintAsC.close cppStrm;                  ppDecl (CL.verbatimDcl [CBodyFrag.text] substitutions);
581                  PrintAsCL.close clppStrm;                  ppDecl (CL.verbatimDcl [InitFrag.text] substitutions);
582                  TextIO.closeOut cOutS;                  ppDecl (CL.verbatimDcl [AllocFrag.text] substitutions);
583                  TextIO.closeOut clOutS                  ppDecl (!initially);
584                    ppDecl (CL.verbatimDcl [RunFrag.text] substitutions);
585                    ppDecl (CL.verbatimDcl [ShutdownFrag.text] substitutions);
586                    PrintAsC.close ppStrm;
587                    TextIO.closeOut outS
588                end                end
589    
590        (* output the code to the filesystem.  The string is the basename of the source file *)          fun generateLib (prog as Prog{props, inputs, strands, ...}) = let
         fun generate (prog as Prog{props, ...}) = let  
591                val {outDir, outBase, exec, double, parallel, debug, ...} = props                val {outDir, outBase, exec, double, parallel, debug, ...} = props
               fun condCons (true, x, xs) = x::xs  
                 | condCons (false, _, xs) = xs  
             (* generate the C compiler flags *)  
               val cflags = ["-I" ^ Paths.diderotInclude, "-I" ^ Paths.teemInclude]  
               val cflags = condCons (#cl Paths.cflags <> "", #cl Paths.cflags, cflags)  
               val cflags = condCons (parallel, #pthread Paths.cflags, cflags)  
               val cflags = if debug  
                     then #debug Paths.cflags :: cflags  
                     else #ndebug Paths.cflags :: cflags  
               val cflags = #base Paths.cflags :: cflags  
             (* generate the loader flags *)  
               val extraLibs = condCons (parallel, #pthread Paths.extraLibs, [])  
               val extraLibs = Paths.teemLinkFlags @  #base Paths.extraLibs :: extraLibs  
                    val extraLibs =  #cl Paths.extraLibs :: extraLibs  
               val rtLib = Properties.runtimeName props  
               val ldOpts = rtLib :: extraLibs  
592                val basename = OS.Path.joinDirFile{dir=outDir, file=outBase}                val basename = OS.Path.joinDirFile{dir=outDir, file=outBase}
593                  val [Strand{state, output, ...}] = AtomTable.listItems strands
594                in                in
595                  genSrc (basename, prog);                (* generate the library .h file *)
596                  RunCC.compile (basename, cflags);                  GenLibraryInterface.gen {
597                  RunCC.linkExec (basename, ldOpts)                      props = props,
598                        rt = SOME LibInterfaceCLFrag.text,
599                        inputs = !inputs,
600                        outputs = [output]
601                      };
602                  (* *)
603                    outputLibSrc (basename, prog);
604                    outputCLSrc (basename, prog);
605                  (* compile and link *)
606                    compile (props, basename);
607                    RunCC.linkLib (basename, ldFlags props)
608                  end
609    
610            fun outputExecSrc (baseName, prog) = let
611                  val Prog{props, inputs, globals, topDecls, strands, nAxes, initially, ...} = prog
612                  val [strand as Strand{name, tyName, state, output, ...}] = AtomTable.listItems strands
613                  val outputs = GenOutput.gen (props, !nAxes) [output]
614                  val substitutions =
615                        ("DIDEROT_FLOAT_PRECISION", Properties.floatPrecisionDef props) ::
616                        ("DIDEROT_INT_PRECISION", Properties.intPrecisionDef props) ::
617                        ("DIDEROT_TARGET", Properties.targetDef props) ::
618                        mkSubs (props, strand)
619                  val fileName = OS.Path.joinBaseExt{base=baseName, ext=SOME "c"}
620                  val outS = TextIO.openOut fileName
621                  val ppStrm = PrintAsC.new outS
622                  fun ppDecl dcl = PrintAsC.output(ppStrm, dcl)
623                  in
624                    ppDecl (CL.verbatimDcl [ExecHdrFrag.text] substitutions);
625                    if Properties.dualState props
626                      then ppDecl (CL.D_Verbatim ["#define DIDEROT_DUAL_STATE\n"])
627                      else ();
628                    ppDecl (genGlobalStruct (props, List.rev(!globals)));
629                    ppDecl (genWorldStruct(props, strand));
630                    ppDecl (GenInputs.genInputsStruct (props, !inputs));
631                    List.app ppDecl (List.rev (!topDecls));
632                    List.app ppDecl (GenInputs.genExecInputFuns (props, !inputs));
633                    List.app ppDecl (genStrand strand);
634                    List.app ppDecl outputs;
635                    ppStrandTable (ppStrm, [strand]);
636                    ppDecl (CL.verbatimDcl [InitFrag.text] substitutions);
637                    ppDecl (CL.verbatimDcl [AllocFrag.text] substitutions);
638                    ppDecl (!initially);
639                    ppDecl (CL.verbatimDcl [RunFrag.text] substitutions);
640                    ppDecl (CL.verbatimDcl [ShutdownFrag.text] substitutions);
641                    ppDecl (CL.verbatimDcl [MainFrag.text] substitutions);
642                    PrintAsC.close ppStrm;
643                    TextIO.closeOut outS
644                end                end
645    
646        end (* Program *)        (* output the code to a file.  The string is the basename of the file, the extension
647           * is provided by the target.
648           *)
649            fun generateExec (prog as Prog{props, ...}) = let
650                  val {outDir, outBase, exec, double, parallel, debug, ...} = props
651                  val basename = OS.Path.joinDirFile{dir=outDir, file=outBase}
652                  in
653                    outputExecSrc (basename, prog);
654                    outputCLSrc (basename, prog);
655                    compile (props, basename);
656                    RunCC.linkExec (basename, ldFlags props)
657                  end
658    
659            fun generate (prog as Prog{props, ...}) = if #exec props
660                  then generateExec prog
661                  else generateLib prog
662    
663          end
664    
665    end    end
666    

Legend:
Removed from v.2404  
changed lines
  Added in v.2405

root@smlnj-gforge.cs.uchicago.edu
ViewVC Help
Powered by ViewVC 1.0.0