Home My Page Projects Code Snippets Project Openings diderot
Summary Activity Tracker Tasks SCM

SCM Repository

[diderot] Diff of /branches/pure-cfg/src/compiler/cl-target/cl-target.sml
ViewVC logotype

Diff of /branches/pure-cfg/src/compiler/cl-target/cl-target.sml

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1321, Sun Jun 12 14:50:26 2011 UTC revision 1462, Tue Aug 9 07:22:45 2011 UTC
# Line 15  Line 15 
15      structure ToCL = TreeToCL      structure ToCL = TreeToCL
16      structure N = CNames      structure N = CNames
17    
18      (* translate TreeIL types to shadow types *)
19        fun shadowTy ty = (case ty
20               of Ty.BoolTy => CL.T_Named "cl_bool"
21                | Ty.StringTy => raise Fail "unexpected string type"
22                | Ty.IVecTy 1 => CL.T_Named(RN.shadowIntTy ())
23                | Ty.IVecTy n => raise Fail "unexpected int vector type"
24                | Ty.TensorTy[] => CL.T_Named(RN.shadowRealTy ())
25                | Ty.TensorTy[n] => CL.T_Named(RN.shadowVecTy n)
26                | Ty.TensorTy[n, m] => CL.T_Named(RN.shadowMatTy(n,m))
27                | Ty.ImageTy(ImageInfo.ImgInfo{dim, ...}) => CL.T_Named(RN.shadowImageTy dim)
28                | _ => raise Fail(concat["TreeToC.trType(", Ty.toString ty, ")"])
29              (* end case *))
30    
31       (* translate TreeIL types to shadow types *)
32        fun convertToShadow (ty, name) = (case ty
33               of Ty.IVecTy 1 => CL.mkAssign(
34                    CL.mkSelect(CL.mkVar(RN.shadowGlaobalsName),name),
35                    CL.mkIndirect(CL.mkVar(RN.globalsVarName), name))
36                | Ty.TensorTy[n]=> CL.mkCall(RN.convertToShadowVec n, [
37                      CL.mkUnOp(CL.%&,CL.mkSelect(CL.mkVar(RN.shadowGlaobalsName),name)),
38                      CL.mkIndirect(CL.mkVar(RN.globalsVarName), name)
39                    ])
40                | Ty.ImageTy(ImageInfo.ImgInfo{dim, ...}) => CL.mkCall(RN.shadowImageFunc dim, [
41                      CL.mkVar "context",
42                      CL.mkUnOp(CL.%&,CL.mkSelect(CL.mkVar(RN.shadowGlaobalsName),name)),
43                      CL.mkIndirect(CL.mkVar(RN.globalsVarName),name)
44                    ])
45                | Ty.TensorTy[n, m] => CL.mkCall(RN.convertToShadowMat(m,n), [
46                      CL.mkSelect(CL.mkVar(RN.shadowGlaobalsName),name),
47                      CL.mkIndirect(CL.mkVar(RN.globalsVarName), name)
48                    ])
49                | _ => CL.mkAssign(
50                    CL.mkSelect(CL.mkVar(RN.shadowGlaobalsName),name),
51                    CL.mkIndirect(CL.mkVar(RN.globalsVarName), name))
52              (* end case *))
53    
54       (* translate strand TreeIL types to shadow types *)
55        fun convertStrandToShadow (ty, name, selfIn, selfOut) = (case ty
56               of Ty.IVecTy 1 => CL.mkAssign(
57                    CL.mkIndirect(CL.mkVar selfIn,name),
58                    CL.mkIndirect(CL.mkVar selfOut, name))
59                | Ty.TensorTy[n]=> CL.mkCall(RN.convertToShadowVec n, [
60                      CL.mkUnOp(CL.%&,CL.mkIndirect(CL.mkVar selfOut,name)),
61                      CL.mkIndirect(CL.mkVar selfIn, name)
62                    ])
63                | Ty.TensorTy[n, m] => CL.mkCall(RN.convertToShadowMat(m,n), [
64                      CL.mkUnOp(CL.%&,CL.mkIndirect(CL.mkVar selfOut,name)),
65                      CL.mkIndirect(CL.mkVar selfIn, name)
66                    ])
67                | _ => CL.mkAssign(
68                    CL.mkIndirect(CL.mkVar selfIn,name),
69                    CL.mkIndirect(CL.mkVar selfOut, name))
70              (* end case *))
71    
72    
73      (* helper functions for specifying parameters in various address spaces *)
74        fun clParam (spc, ty, x) = CL.PARAM([spc], ty, x)
75        fun globalParam (ty, x) = CL.PARAM(["__global"], ty, x)
76        fun constantParam (ty, x) = CL.PARAM(["__constant"], ty, x)
77        fun localParam (ty, x) = CL.PARAM(["__local"], ty, x)
78        fun privateParam (ty, x) = CL.PARAM(["__private"], ty, x)
79    
80      (* OpenCL global pointer type *)
81        fun globalPtr ty = CL.T_Qual("__global", CL.T_Ptr ty)
82    
83    (* C variable translation *)    (* C variable translation *)
84      structure TrCVar =      structure TrCVar =
85        struct        struct
# Line 53  Line 118 
118      val clPlatformIdTy = CL.T_Named "cl_platform_id"      val clPlatformIdTy = CL.T_Named "cl_platform_id"
119      val clMemoryTy = CL.T_Named "cl_mem"      val clMemoryTy = CL.T_Named "cl_mem"
120      val globPtrTy = CL.T_Ptr(CL.T_Named RN.globalsTy)      val globPtrTy = CL.T_Ptr(CL.T_Named RN.globalsTy)
121        val strandShadowEnv = 1
122        val globalShadowEnv = 2
123    
124    (* variable or field that is mirrored between host and GPU *)    (* variable or field that is mirrored between host and GPU *)
125      type mirror_var = {      type mirror_var = {
126    (* FIXME: perhaps it would be cleaner to just track the TreeIL type of the variable? *)
127              hostTy : CL.ty,             (* variable type on Host (i.e., C type) *)              hostTy : CL.ty,             (* variable type on Host (i.e., C type) *)
128                shadowTy : CL.ty,           (* host-side shadow type of GPU type *)
129              gpuTy : CL.ty,              (* variable's type on GPU (i.e., OpenCL type) *)              gpuTy : CL.ty,              (* variable's type on GPU (i.e., OpenCL type) *)
130                hToS: stm,                  (* the statement that converts the variable to its *)
131                                            (* shadow representation *)
132              var : CL.var                (* variable name *)              var : CL.var                (* variable name *)
133            }            }
134    
# Line 79  Line 150 
150          topDecls : CL.decl list ref,          topDecls : CL.decl list ref,
151          strands : strand AtomTable.hash_table,          strands : strand AtomTable.hash_table,
152          initially :  CL.decl ref,          initially :  CL.decl ref,
153          numDims: int ref,          numDims: int ref,               (* number of dimensions in initially iteration *)
154          imgGlobals: (string * int) list ref,          imgGlobals: (string * int) list ref,
155          prFn: CL.decl ref          prFn: CL.decl ref
156        }        }
# Line 99  Line 170 
170        | GlobalScope        | GlobalScope
171        | InitiallyScope        | InitiallyScope
172        | StrandScope of TreeIL.var list  (* strand initialization *)        | StrandScope of TreeIL.var list  (* strand initialization *)
173        | MethodScope of TreeIL.var list  (* method body; vars are state variables *)        | MethodScope of MethodName.name * TreeIL.var list  (* method body; vars are state variables *)
174    
175    (* the supprted widths of vectors of reals on the target. *)    (* the supprted widths of vectors of reals on the target. *)
176  (* FIXME: for OpenCL 1.1, 3 is also valid *)  (* FIXME: for OpenCL 1.1, 3 is also valid *)
# Line 136  Line 207 
207  (* NOTE: if we move strand initialization to the GPU, then we'll have to change the following code! *)  (* NOTE: if we move strand initialization to the GPU, then we'll have to change the following code! *)
208                   of StrandScope stateVars =>                   of StrandScope stateVars =>
209                        ToC.trBlock (vMap, saveState "StrandScope" stateVars ToC.trAssign, blk)                        ToC.trBlock (vMap, saveState "StrandScope" stateVars ToC.trAssign, blk)
210                    | MethodScope stateVars =>                    | MethodScope(name, stateVars) =>
211                        ToCL.trBlock (vMap, saveState "MethodScope" stateVars ToCL.trAssign, blk)                        ToCL.trBlock (vMap, saveState "MethodScope" stateVars ToCL.trAssign, blk)
212                    | InitiallyScope => ToC.trBlock (vMap, fn (_, _, stm) => [stm], blk)                    | InitiallyScope => ToCL.trBlock (vMap, fn (_, _, stm) => [stm], blk)
213                    | _ => ToC.trBlock (vMap, fn (_, _, stm) => [stm], blk)                    | _ => ToC.trBlock (vMap, fn (_, _, stm) => [stm], blk)
214                  (* end case *)                  (* end case *)
215                end                end
# Line 148  Line 219 
219    (* variables *)    (* variables *)
220      structure Var =      structure Var =
221        struct        struct
222            fun mirror (ty, name, shadowEnv ) = {
223                    hostTy = ToC.trType ty,
224                    shadowTy = shadowTy ty,
225                    gpuTy = ToCL.trType ty,
226                    hToS = if globalShadowEnv = shadowEnv then
227                              convertToShadow(ty,name)
228                           else
229                              convertStrandToShadow(ty,name,"selfIn", "selfOut"),
230    
231                    var = name
232                  }
233          fun name (ToCL.V(_, name)) = name          fun name (ToCL.V(_, name)) = name
234          fun global (Prog{globals, imgGlobals, ...}, name, ty) = let          fun global (Prog{globals, imgGlobals, ...}, name, ty) = let
235                val x = {hostTy = ToC.trType ty, gpuTy = ToCL.trType ty, var = name}                val x = mirror (ty, name, globalShadowEnv)
236                fun isImgGlobal (Ty.ImageTy(ImageInfo.ImgInfo{dim, ...}), name) =                fun isImgGlobal (Ty.ImageTy(ImageInfo.ImgInfo{dim, ...}), name) =
237                      imgGlobals  := (name,dim) :: !imgGlobals                      imgGlobals  := (name,dim) :: !imgGlobals
238                  | isImgGlobal _ =  ()                  | isImgGlobal _ =  ()
# Line 162  Line 244 
244          fun param x = ToCL.V(ToCL.trType(V.ty x), V.name x)          fun param x = ToCL.V(ToCL.trType(V.ty x), V.name x)
245          fun state (Strand{state, ...}, x) = let          fun state (Strand{state, ...}, x) = let
246                val ty = V.ty x                val ty = V.ty x
247                val x' = {hostTy = ToC.trType ty, gpuTy = ToCL.trType ty, var = V.name x}                val x' = mirror (ty, V.name x, strandShadowEnv)
248                in                in
249                  state := x' :: !state;                  state := x' :: !state;
250                  ToCL.V(#gpuTy x', #var x')                  ToCL.V(#gpuTy x', #var x')
# Line 183  Line 265 
265          val scopeGlobal = setScope GlobalScope          val scopeGlobal = setScope GlobalScope
266          val scopeInitially = setScope InitiallyScope          val scopeInitially = setScope InitiallyScope
267          fun scopeStrand (env, svars) = setScope (StrandScope svars) env          fun scopeStrand (env, svars) = setScope (StrandScope svars) env
268          fun scopeMethod (env, svars) = setScope (MethodScope svars) env          fun scopeMethod (env, name, svars) = setScope (MethodScope(name, svars)) env
269        (* bind a TreeIL varaiable to a target variable *)        (* bind a TreeIL varaiable to a target variable *)
270          fun bind (ENV{info, vMap, scope}, x, x') = ENV{          fun bind (ENV{info, vMap, scope}, x, x') = ENV{
271                  info = info,                  info = info,
# Line 205  Line 287 
287                    topDecls = ref [],                    topDecls = ref [],
288                    strands = AtomTable.mkTable (16, Fail "strand table"),                    strands = AtomTable.mkTable (16, Fail "strand table"),
289                    initially = ref(CL.D_Comment["missing initially"]),                    initially = ref(CL.D_Comment["missing initially"]),
290                    numDims = ref(0),                    numDims = ref 0,
291                    imgGlobals = ref[],                    imgGlobals = ref[],
292                    prFn = ref(CL.D_Comment(["No Print Function"]))                    prFn = ref(CL.D_Comment(["No Print Function"]))
293                  })                  })
294        (* register the global initialization part of a program *)  
 (* FIXME: unused code; can this be removed??  
           fun globalIndirects (globals,stms) = let  
                 fun getGlobals ({name,target as TargetUtil.TARGET_CL}::rest) =  
                       CL.mkAssign(CL.mkIndirect(CL.mkVar RN.globalsVarName,name),CL.mkVar name)  
                         ::getGlobals rest  
                   | getGlobals [] = []  
                   | getGlobals (_::rest) = getGlobals rest  
                 in  
                   stms @ getGlobals globals  
                 end  
 *)  
295        (* register the code that is used to register command-line options for input variables *)        (* register the code that is used to register command-line options for input variables *)
296          fun inputs (Prog{topDecls, ...}, stm) = let          fun inputs (Prog{topDecls, ...}, stm) = let
297                val inputsFn = CL.D_Func(                val inputsFn = CL.D_Func(
# Line 234  Line 305 
305        (* register the global initialization part of a program *)        (* register the global initialization part of a program *)
306          fun init (Prog{topDecls, ...}, init) = let          fun init (Prog{topDecls, ...}, init) = let
307                                    val globalsDecl = CL.mkAssign(CL.E_Var RN.globalsVarName,                                    val globalsDecl = CL.mkAssign(CL.E_Var RN.globalsVarName,
308                      CL.mkApply("malloc", [CL.mkApply("sizeof",[CL.mkVar RN.globalsTy])]))                      CL.mkApply("malloc", [CL.mkSizeof(CL.T_Named RN.globalsTy)]))
   
               val initGlobalsCall = CL.mkCall(RN.initGlobalsHelper,[])  
   
309                                          val initFn = CL.D_Func(                                          val initFn = CL.D_Func(
310                      [], CL.voidTy, RN.initGlobals, [],                      [], CL.voidTy, RN.initGlobals, [],
311                      CL.mkBlock([globalsDecl,initGlobalsCall]))                      CL.mkBlock[
312                val initFn_helper = CL.D_Func(                          globalsDecl,
313                      [], CL.voidTy, RN.initGlobalsHelper, [],                          CL.mkCall(RN.initGlobalsHelper, [CL.mkVar RN.globalsVarName])
314                          ])
315                  val initHelperFn = CL.D_Func(
316                        [], CL.voidTy, RN.initGlobalsHelper,
317                        [CL.PARAM([], globPtrTy, RN.globalsVarName)],
318                      init)                      init)
319                val shutdownFn = CL.D_Func(                val shutdownFn = CL.D_Func(
320                      [], CL.voidTy, RN.shutdown,                      [], CL.voidTy, RN.shutdown,
321                      [CL.PARAM([], CL.T_Ptr(CL.T_Named RN.worldTy), "wrld")],                      [CL.PARAM([], CL.T_Ptr(CL.T_Named RN.worldTy), "wrld")],
322                      CL.S_Block[])                      CL.S_Block[])
323                in                in
324                  topDecls := shutdownFn :: initFn :: initFn_helper :: !topDecls                  topDecls := shutdownFn :: initFn :: initHelperFn :: !topDecls
325                end                end
326    
327           (* create and register the initially function for a program *)           (* create and register the initially function for a program *)
328          fun initially {          fun initially {
329                prog = Prog{name=progName, strands, initially, ...},                prog = Prog{name=progName, strands, initially,numDims, ...},
330                isArray : bool,                isArray : bool,
331                iterPrefix : stm list,                iterPrefix : stm list,
332                iters : (var * exp * exp) list,                iters : (var * exp * exp) list,
# Line 291  Line 364 
364                              CL.E_Var "size"                              CL.E_Var "size"
365                            ]))))                            ]))))
366                      ]                      ]
367              (* create the loop nest for the initially iterations              (* create the loop nest for the initially iterations *)
368                val indexVar = "ix"                val indexVar = "ix"
369                val strandTy = CL.T_Ptr(CL.T_Named(N.strandTy name))                val strandTy = CL.T_Ptr(CL.T_Named(N.strandTy name))
370                fun mkLoopNest [] = CL.mkBlock(createPrefix @ [                fun mkLoopNest [] = CL.mkBlock(createPrefix @ [
371                        CL.mkDecl(strandTy, "sp",                        CL.mkDecl(strandTy, "sp",
372                          SOME(CL.I_Exp(                          SOME(CL.I_Exp(
373                            CL.E_Cast(strandTy,                            CL.E_Cast(strandTy,
374                            CL.E_Apply(N.inState, [CL.E_Var "wrld", CL.E_Var indexVar]))))),                            CL.E_Apply(N.inState, [CL.E_Var "wrld", CL.mkBinOp(CL.mkVar indexVar, CL.#*, CL.mkSizeof(CL.T_Named (N.strandTy name)))]))))),
375                        CL.mkCall(N.strandInit name,                        CL.mkCall(N.strandInit name, CL.E_Var "sp" :: args),
                         CL.E_Var RN.globalsVarName :: CL.E_Var "sp" :: args),  
376                        CL.mkAssign(CL.E_Var indexVar, CL.mkBinOp(CL.E_Var indexVar, CL.#+, CL.E_Int(1, CL.uint32)))                        CL.mkAssign(CL.E_Var indexVar, CL.mkBinOp(CL.E_Var indexVar, CL.#+, CL.E_Int(1, CL.uint32)))
377                      ])                      ])
378                  | mkLoopNest ((CL.V(ty, param), lo, hi)::iters) = let                  | mkLoopNest ((CL.V(ty, param), lo, hi)::iters) = let
# Line 316  Line 388 
388                        CL.mkComment["initially"],                        CL.mkComment["initially"],
389                        CL.mkDecl(CL.uint32, indexVar, SOME(CL.I_Exp(CL.E_Int(0, CL.uint32)))),                        CL.mkDecl(CL.uint32, indexVar, SOME(CL.I_Exp(CL.E_Int(0, CL.uint32)))),
390                        mkLoopNest iters                        mkLoopNest iters
391                      ] *)                      ]
392                val body = CL.mkBlock(                val body = CL.mkBlock(
393                      iterPrefix @                      iterPrefix @
394                      allocCode @                      allocCode @
395                        iterCode @
396                      [CL.mkReturn(SOME(CL.E_Var "wrld"))])                      [CL.mkReturn(SOME(CL.E_Var "wrld"))])
397                val initFn = CL.D_Func([], worldTy, N.initially, [], body)                val initFn = CL.D_Func([], worldTy, N.initially, [], body)
398                in                in
399                    numDims := nDims;
400                  initially := initFn                  initially := initFn
401                end                end
402    
403    
404        (***** OUTPUT *****)        (***** OUTPUT *****)
405    (* FIXME: I think that the iteration and test for stable strands can be moved into the runtime, which
406     * will make the print function compatible with the C target version.
407     *)
408          fun genStrandPrint (Strand{name, tyName, state, output, code,...}) = let          fun genStrandPrint (Strand{name, tyName, state, output, code,...}) = let
409              (* the print function *)              (* the print function *)
410                val prFnName = concat[name, "_print"]                val prFnName = concat[name, "_print"]
411                val prFn = let                val prFn = let
412                      val params = [                      val params = [
413                              CL.PARAM([], CL.T_Ptr(CL.T_Named "FILE"), "outS"),                              CL.PARAM([], CL.T_Ptr(CL.T_Named "FILE"), "outS"),
414                              CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "self")                            CL.PARAM([], CL.T_Ptr(CL.T_Named (RN.strandShadowTy tyName)), "self")
415                            ]                            ]
416                      val SOME(ty, x) = !output                      val SOME(ty, x) = !output
417                      val outState = CL.mkIndirect(CL.mkVar "self", x)                      val outState = CL.mkIndirect(CL.mkVar "self", x)
418                      val prArgs = (case ty                      val prArgs = (case ty
419                             of Ty.IVecTy 1 => [CL.E_Str(!N.gIntFormat ^ "\n"), outState]                             of Ty.IVecTy 1 => [CL.E_Str(!N.gIntFormat ^ "\n"), outState]
420                              | Ty.IVecTy d => let                              | Ty.IVecTy d => let
421                                  val fmt = CL.mkStr(                                  val fmt = CL.E_Str(
422                                        String.concatWith " " (List.tabulate(d, fn _ => !N.gIntFormat))                                        String.concatWith " " (List.tabulate(d, fn _ => !N.gIntFormat))
423                                        ^ "\n")                                        ^ "\n")
424                                  val args = List.tabulate (d, fn i => ToC.ivecIndex(outState, d, i))                                  val args = List.tabulate (d, fn i => CL.mkApply("VSUBP",[outState, CL.mkInt (IntInf.fromInt i)] ))
425                                  in                                  in
426                                    fmt :: args                                    fmt :: args
427                                  end                                  end
428                              | Ty.TensorTy[] => [CL.mkStr "%f\n", outState]                              | Ty.TensorTy[] => [CL.E_Str "%f\n", outState]
429                              | Ty.TensorTy[d] => let                              | Ty.TensorTy[d] => let
430                                  val fmt = CL.mkStr(                                  val fmt = CL.E_Str(
431                                        String.concatWith " " (List.tabulate(d, fn _ => "%f"))                                        String.concatWith " " (List.tabulate(d, fn _ => "%f"))
432                                        ^ "\n")                                        ^ "\n")
433                                  val args = List.tabulate (d, fn i => ToC.vecIndex(outState, d, i))                                  val args = List.tabulate (d, fn i => CL.mkApply("VSUBP",[outState, CL.mkInt (IntInf.fromInt i)]))
434                                  in                                  in
435                                    fmt :: args                                    fmt :: args
436                                  end                                  end
# Line 366  Line 444 
444                  prFn                  prFn
445                end                end
446    
447          fun genStrandTyDef (targetTy, Strand{tyName, state,...}) =          fun genStrandTyDef (targetTy, Strand{state,...},tyName) =
448              (* the type declaration for the strand's state struct *)              (* the type declaration for the strand's state struct *)
449                CL.D_StructDef(                CL.D_StructDef(
450                  List.rev (List.map (fn x => (targetTy x, #var x)) (!state)),                  List.rev (List.map (fn x => (targetTy x, #var x)) (!state)),
451                  tyName)                  tyName)
452    
453        (* generates the load kernel function *)       (* generates the globals buffers and arguments function *)
454            fun genConvertShadowTypes (Strand{tyName, state,...}) = let
455                (* Delcare opencl setup objects *)
456                  val errVar = "err"
457                  val imgDataSizeVar = "image_dataSize"
458                  val params = [
459                          CL.PARAM([],CL.T_Ptr(CL.T_Named(tyName)), "selfIn"),
460                          CL.PARAM([],CL.T_Ptr(CL.T_Named(RN.strandShadowTy tyName)), "selfOut")
461                        ]
462                  val body = List.map (fn (x:mirror_var) => #hToS x ) (!state)
463                  in
464                    CL.D_Func([],CL.voidTy,RN.strandConvertName,params,CL.mkBlock(body))
465                  end
466        (* generates the opencl buffers for the image data *)        (* generates the opencl buffers for the image data *)
467          fun getGlobalDataBuffers (globals,contextVar,errVar) = let          fun getGlobalDataBuffers (globals, imgGlobals, contextVar, errVar) = let
468                  val globalBuffErr = "error creating OpenCL global buffer\n"
469                  fun errorFn msg = CL.mkIfThen(CL.mkBinOp(CL.E_Var errVar, CL.#!=, CL.E_Var "CL_SUCCESS"),
470                        CL.mkBlock([CL.mkCall("fprintf",[CL.E_Var "stderr", CL.E_Str msg]),
471                        CL.mkCall("exit",[CL.mkInt 1])]))
472                  val shadowTypeDecl =
473                        CL.mkDecl(CL.T_Named(RN.shadowGlobalsTy), RN.shadowGlaobalsName, NONE)
474                  val globalToShadowStms = List.map (fn (x:mirror_var) => #hToS x ) globals
475                val globalBufferDecl =  CL.mkDecl(clMemoryTy,concat[RN.globalsVarName,"_cl"],NONE)                val globalBufferDecl =  CL.mkDecl(clMemoryTy,concat[RN.globalsVarName,"_cl"],NONE)
476                val globalBuffer = CL.mkAssign(CL.mkVar(concat[RN.globalsVarName,"_cl"]),                val globalBuffer = CL.mkAssign(CL.mkVar(concat[RN.globalsVarName,"_cl"]),
477                      CL.mkApply("clCreateBuffer", [                      CL.mkApply("clCreateBuffer", [
478                          CL.mkVar contextVar,                          CL.mkVar contextVar,
479                          CL.mkVar "CL_MEM_COPY_HOST_PTR",                          CL.mkBinOp(CL.mkVar "CL_MEM_READ_ONLY", CL.#|, CL.mkVar "CL_MEM_COPY_HOST_PTR"),
480                          CL.mkApply("sizeof",[CL.mkVar RN.globalsTy]),                          CL.mkSizeof(CL.T_Named RN.shadowGlobalsTy),
481                          CL.mkVar RN.globalsVarName,                          CL.mkUnOp(CL.%&,CL.mkVar RN.shadowGlaobalsName),
482                          CL.mkUnOp(CL.%&,CL.mkVar errVar)                          CL.mkUnOp(CL.%&,CL.mkVar errVar)
483                        ]))                        ]))
484                fun genDataBuffers ([],_,_) = []                fun genDataBuffers ([],_,_,_) = []
485                  | genDataBuffers ((var,nDims)::globals, contextVar, errVar) = let                  | genDataBuffers ((var,nDims)::globals, contextVar, errVar,errFn) = let
486                      val hostVar = CL.mkIndirect(CL.mkVar RN.globalsVarName, var)                      val hostVar = CL.mkIndirect(CL.mkVar RN.globalsVarName, var)
487  (* FIXME: use CL constructors to build expressions (not strings) *)                      val size = CL.mkIndirect(hostVar, "dataSzb")
                     fun sizeExp i = CL.mkSubscript(CL.mkIndirect(hostVar, "size"), CL.mkInt i)  
                     val size = CL.mkBinOp(CL.mkApply("sizeof",[CL.mkVar "float"]), CL.#*, sizeExp 0)  
                     val size = if (nDims > 1)  
                           then CL.mkBinOp(size, CL.#*, sizeExp 1)  
                           else size  
                     val size = if (nDims > 2)  
                           then CL.mkBinOp(size, CL.#*, sizeExp 2)  
                           else size  
488                      in                      in
                       CL.mkDecl(clMemoryTy, RN.addBufferSuffix var ,NONE)::  
489                        CL.mkDecl(clMemoryTy, RN.addBufferSuffixData var ,NONE)::                        CL.mkDecl(clMemoryTy, RN.addBufferSuffixData var ,NONE)::
                       CL.mkAssign(CL.mkVar(RN.addBufferSuffix var),  
                         CL.mkApply("clCreateBuffer", [  
                             CL.mkVar contextVar,  
                             CL.mkVar "CL_MEM_COPY_HOST_PTR",  
                             CL.mkApply("sizeof",[CL.mkVar (RN.imageTy nDims)]),  
                             hostVar,  
                             CL.mkUnOp(CL.%&,CL.mkVar errVar)  
                           ])) ::  
490                        CL.mkAssign(CL.mkVar(RN.addBufferSuffixData var),                        CL.mkAssign(CL.mkVar(RN.addBufferSuffixData var),
491                          CL.mkApply("clCreateBuffer", [                          CL.mkApply("clCreateBuffer", [
492                              CL.mkVar contextVar,                              CL.mkVar contextVar,
493                              CL.mkVar "CL_MEM_COPY_HOST_PTR",                              CL.mkVar "CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR",
494                              size,                              size,
495                              CL.mkIndirect(hostVar, "data"),                              CL.mkIndirect(hostVar, "data"),
496                              CL.mkUnOp(CL.%&,CL.mkVar errVar)                              CL.mkUnOp(CL.%&,CL.mkVar errVar)
497                            ])) :: genDataBuffers(globals,contextVar,errVar)                            ])) ::
498                            errFn(concat["error in creating ",RN.addBufferSuffixData var, " global buffer\n"]) ::
499                            genDataBuffers(globals,contextVar,errVar,errFn)
500                      end                      end
501                in                in
502                  globalBufferDecl :: globalBuffer :: genDataBuffers(globals,contextVar,errVar)                  [shadowTypeDecl] @ globalToShadowStms
503                    @ [globalBufferDecl, globalBuffer,errorFn(globalBuffErr)]
504                    @ genDataBuffers(imgGlobals,contextVar,errVar,errorFn)
505                end                end
506    
507        (* generates the kernel arguments for the image data *)        (* generates the kernel arguments for the image data *)
508          fun genGlobalArguments (globals, count, kernelVar, errVar) = let          fun genGlobalArguments (globals, count, kernelVar, errVar) = let
509                val globalArgument = CL.mkExpStm(CL.mkAssignOp(CL.mkVar errVar,CL.|=,                val globalArgErr = "error creating OpenCL global argument\n"
510                  fun errorFn msg = CL.mkIfThen(CL.mkBinOp(CL.E_Var errVar, CL.#!=, CL.E_Var "CL_SUCCESS"),
511                        CL.mkBlock([CL.mkCall("fprintf",[CL.E_Var "stderr", CL.E_Str msg]),
512                        CL.mkCall("exit",[CL.mkInt 1])]))
513                  val globalArgument = CL.mkExpStm(CL.mkAssignOp(CL.mkVar errVar,CL.&=,
514                      CL.mkApply("clSetKernelArg",                      CL.mkApply("clSetKernelArg",
515                        [CL.mkVar kernelVar,                        [CL.mkVar kernelVar,
516                         CL.mkPostOp(CL.E_Var count, CL.^++),                         CL.mkPostOp(CL.E_Var count, CL.^++),
517                         CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),                         CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),
518                         CL.mkUnOp(CL.%&,CL.mkVar(concat[RN.globalsVarName,"_cl"]))])))                         CL.mkUnOp(CL.%&,CL.mkVar(concat[RN.globalsVarName,"_cl"]))])))
519                fun genDataArguments ([],_,_,_) = []                fun genDataArguments ([],_,_,_,_) = []
520                  | genDataArguments ((var,nDims)::globals,count,kernelVar,errVar) =                  | genDataArguments ((var,nDims)::globals,count,kernelVar,errVar,errFn) =
521                      CL.mkExpStm(CL.mkAssignOp(CL.mkVar errVar,CL.|=,                      CL.mkExpStm(CL.mkAssignOp(CL.mkVar errVar,CL.$=,
                       CL.mkApply("clSetKernelArg",  
                         [CL.mkVar kernelVar,  
                          CL.mkPostOp(CL.E_Var count, CL.^++),  
                          CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),  
                          CL.mkUnOp(CL.%&,CL.mkVar(RN.addBufferSuffix var))]))) ::  
                     CL.mkExpStm(CL.mkAssignOp(CL.mkVar errVar,CL.|=,  
522                        CL.mkApply("clSetKernelArg",                        CL.mkApply("clSetKernelArg",
523                          [CL.mkVar kernelVar,                          [CL.mkVar kernelVar,
524                           CL.mkPostOp(CL.E_Var count, CL.^++),                           CL.mkPostOp(CL.E_Var count, CL.^++),
525                           CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),                           CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),
526                           CL.mkUnOp(CL.%&,CL.mkVar(RN.addBufferSuffixData var))]))) ::                           CL.mkUnOp(CL.%&,CL.mkVar(RN.addBufferSuffixData var))]))) ::
527                      genDataArguments (globals,count,kernelVar,errVar)                           errFn(concat["error in creating ",RN.addBufferSuffixData var, " argument\n"]) ::
528                        genDataArguments (globals,count,kernelVar,errVar,errFn)
529                in                in
530                  globalArgument :: genDataArguments(globals, count, kernelVar, errVar)                  globalArgument :: errorFn globalArgErr ::
531                      genDataArguments(globals, count, kernelVar, errVar,errorFn)
532                end                end
533    
534        (* generates the globals buffers and arguments function *)        (* generates the globals buffers and arguments function *)
535          fun genGlobalBuffersArgs (imgGlobals) = let          fun genGlobalBuffersArgs (globals,imgGlobals) = let
536              (* Delcare opencl setup objects *)              (* Delcare opencl setup objects *)
537                val errVar = "err"                val errVar = "err"
538                val imgDataSizeVar = "image_dataSize"                val imgDataSizeVar = "image_dataSize"
539                val params = [                val params = [
540                        CL.PARAM([],CL.T_Named("cl_context"), "context"),                        CL.PARAM([],CL.T_Named("cl_context"), "context"),
541                        CL.PARAM([],CL.T_Named("cl_kernel"), "kernel"),                        CL.PARAM([],CL.T_Named("cl_kernel"), "kernel"),
542                          CL.PARAM([],CL.T_Named("cl_command_queue"), "cmdQ"),
543                        CL.PARAM([],CL.T_Named("int"), "argStart")                        CL.PARAM([],CL.T_Named("int"), "argStart")
544                      ]                      ]
545                val clGlobalBuffers = getGlobalDataBuffers(!imgGlobals, "context", errVar)                val clGlobalBuffers = getGlobalDataBuffers(globals,!imgGlobals, "context", errVar)
546                val clGlobalArguments = genGlobalArguments(!imgGlobals, "argStart", "kernel", errVar)                val clGlobalArguments = genGlobalArguments(!imgGlobals, "argStart", "kernel", errVar)
547              (* Body put all the statments together *)              (* Body put all the statments together *)
548                val body = CL.mkDecl(clIntTy, errVar, SOME(CL.I_Exp(CL.mkInt 0)))                val body = CL.mkDecl(clIntTy, errVar, SOME(CL.I_Exp(CL.mkInt 0)))
# Line 469  Line 553 
553    
554        (* generate the data and global parameters *)        (* generate the data and global parameters *)
555          fun genKeneralGlobalParams ((name,tyname)::rest) =          fun genKeneralGlobalParams ((name,tyname)::rest) =
556                CL.PARAM([], CL.T_Ptr(CL.T_Named RN.globalsTy), concat[RN.globalsVarName]) ::                globalParam (CL.T_Ptr(CL.voidTy), RN.addBufferSuffixData name) ::
               CL.PARAM([], CL.T_Ptr(CL.T_Named (RN.imageTy tyname)),RN.addBufferSuffix name) ::  
               CL.PARAM([], CL.T_Ptr(CL.voidTy),RN.addBufferSuffixData name) ::  
557                genKeneralGlobalParams rest                genKeneralGlobalParams rest
558            | genKeneralGlobalParams [] = []            | genKeneralGlobalParams [] = []
559    
       (*generate code for intilizing kernel global data *)  
 (* FIXME: should use List.map here *)  
         fun initGlobalImages ((name, tyname)::rest) =  
              CL.mkAssign(CL.mkIndirect(CL.E_Var RN.globalsVarName, name), CL.mkVar (RN.addBufferSuffix name)) ::  
              CL.mkAssign(CL.mkIndirect(CL.E_Var RN.globalsVarName,concat[name,"->","data"]),CL.mkVar (RN.addBufferSuffixData name)) ::  
              initGlobalImages rest  
           | initGlobalImages [] = []  
   
560          (* generate the main kernel function for the .cl file *)          (* generate the main kernel function for the .cl file *)
561          fun genKernelFun (strand, nDims, globals, imgGlobals) = let          fun genKernelFun (strand, nDims, globals, imgGlobals) = let
562                val Strand{name, tyName, state, output, code,...} = strand                val Strand{name, tyName, state, output, code,...} = strand
563                val fName = RN.kernelFuncName;                val fName = RN.kernelFuncName;
564                val inState = "strand_in"                val inState = "selfIn"
565                val outState = "strand_out"                val outState = "selfOut"
566                  val tempVar = "tmp"
567    
568                  val (workerOffset,localOffset) = if nDims = 1 then
569                            ( CL.mkApply(RN.getGroupId,[CL.mkInt 0]), CL.mkApply(RN.getLocalThreadId,[CL.mkInt 0]) )
570                           else if nDims = 2 then
571                         (CL.mkBinOp(CL.mkBinOp(CL.mkApply(RN.getGroupId,[CL.mkInt 0]),CL.#*, CL.mkApply(RN.getNumGroups,[CL.mkInt 1])),CL.#+,CL.mkApply(RN.getGroupId,[CL.mkInt 1])),
572                                CL.mkBinOp(CL.mkBinOp(CL.mkApply(RN.getLocalThreadId,[CL.mkInt 0]),CL.#*, CL.mkApply(RN.getLocalSize,[CL.mkInt 1])),CL.#+,CL.mkApply(RN.getLocalThreadId,[CL.mkInt 1])))
573                    else
574                              ( CL.mkBinOp(CL.mkBinOp(CL.mkBinOp(
575                                CL.mkBinOp(CL.mkApply(RN.getGroupId,[CL.mkInt 0]), CL.#*, CL.mkApply(RN.getNumGroups,[CL.mkInt 1])),CL.#*, CL.mkApply(RN.getNumGroups,[CL.mkInt 2])), CL.#+,
576                                CL.mkBinOp(CL.mkApply(RN.getGroupId,[CL.mkInt 1]),CL.#*,CL.mkApply(RN.getNumGroups,[CL.mkInt 1]))),CL.#+,CL.mkApply(RN.getGroupId,[CL.mkInt 2])),
577                               CL.mkBinOp(CL.mkBinOp(CL.mkBinOp(
578                                CL.mkBinOp(CL.mkApply(RN.getLocalThreadId,[CL.mkInt 0]), CL.#*, CL.mkApply(RN.getLocalSize,[CL.mkInt 1])),CL.#*, CL.mkApply(RN.getLocalSize,[CL.mkInt 2])), CL.#+,
579                                CL.mkBinOp(CL.mkApply(RN.getLocalThreadId,[CL.mkInt 1]),CL.#*,CL.mkApply(RN.getLocalSize,[CL.mkInt 1]))),CL.#+,CL.mkApply(RN.getLocalThreadId,[CL.mkInt 2])) )
580    
581    
582                val copyInStm =  List.rev(List.map(fn x => CL.mkAssign(CL.mkSelect(CL.mkVar "selfIn", #var x),
583                                                                                                           CL.mkIndirect(CL.mkGrp(CL.mkBinOp(CL.mkVar "strands",CL.#+, CL.mkVar "strandIndex")), #var x))) (!state))
584    
585                val copyOutStm =  List.rev(List.map(fn x => CL.mkAssign(CL.mkIndirect(CL.mkGrp(CL.mkBinOp(CL.mkVar "strands",CL.#+, CL.mkVar "strandIndex")), #var x), CL.mkSelect(CL.mkVar "selfOut", #var x))) (!state))
586    
587                val params = [                val params = [
588                        CL.PARAM(["__global"], CL.T_Ptr(CL.T_Named tyName), "selfIn"),                        globalParam(CL.T_Ptr(CL.T_Named tyName), "strands"),
589                        CL.PARAM(["__global"], CL.T_Ptr(CL.T_Named tyName), "selfOut"),                        globalParam(CL.T_Ptr(CL.intTy), "strandStatus"),
590                        CL.PARAM(["__global"], CL.intTy, "width")                        globalParam(CL.T_Ptr(CL.intTy), "workQueue"),
591                      ] @ genKeneralGlobalParams(!imgGlobals)                        globalParam(CL.T_Ptr(CL.intTy),"numAvail"),
592                val thread_ids = if nDims = 1                        clParam("",CL.intTy,"numStrands"),
593                      then [                        clParam("",CL.intTy,"limit")] @
594                          CL.mkDecl(CL.intTy, "x", SOME(CL.I_Exp(CL.mkInt 0))),                        [globalParam(globPtrTy, RN.globalsVarName)] @
595                          CL.mkAssign(CL.mkVar "x",CL.mkApply(RN.getGlobalThreadId,[CL.mkInt 0]))                        genKeneralGlobalParams(!imgGlobals)
596                        ]  
597                      else [              val index_ids = [
598                          CL.mkDecl(CL.intTy, "x", SOME(CL.I_Exp(CL.mkInt 0))),                            CL.mkDecl(CL.intTy, "workerIndex",
599                          CL.mkDecl(CL.intTy, "y", SOME(CL.I_Exp(CL.mkInt 0))),                              SOME(CL.I_Exp(workerOffset))),
600                          CL.mkAssign(CL.mkVar "x",  CL.mkApply(RN.getGlobalThreadId,[CL.mkInt 0])),                            CL.mkDecl(CL.intTy, "strandIndex",
601                          CL.mkAssign(CL.mkVar "y",CL.mkApply(RN.getGlobalThreadId,[CL.mkInt 1]))                              SOME(CL.I_Exp(CL.mkBinOp(CL.mkSubscript(CL.mkVar "workQueue",CL.mkVar "workerIndex"),CL.#+,CL.mkBinOp(localOffset,CL.#*,CL.mkVar "limit")))))
602                        ]                        ]
603    
604                val strandDecl = [                val strandDecl = [
605                      CL.mkDecl(CL.T_Named tyName, inState, NONE),                        CL.mkDecl(CL.T_Named tyName, "selfIn", NONE),
606                      CL.mkDecl(CL.T_Named tyName, outState,NONE)]                        CL.mkDecl(CL.T_Named tyName, "selfOut", NONE)
               val strandObjects = if nDims = 1  
                     then [  
                         CL.mkAssign( CL.mkVar inState, CL.mkSubscript(CL.mkVar "selfIn", CL.mkStr "x")),  
                         CL.mkAssign(CL.mkVar outState,CL.mkSubscript(CL.mkVar "selfOut", CL.mkStr "x"))  
607                        ]                        ]
608                      else let                val imageDataDecl = CL.mkDecl(CL.T_Named(RN.imageDataType),RN.globalImageDataName,NONE)
609                        val index = CL.mkBinOp(CL.mkBinOp(CL.mkVar "x",CL.#*,CL.mkVar "width"),CL.#+,CL.mkVar "y")                val imageDataStms = List.map (fn (x,_) =>
610                        in [                    CL.mkAssign(CL.mkSelect(CL.mkVar(RN.globalImageDataName),RN.imageDataName x),
611                          CL.mkAssign(CL.mkVar inState, CL.mkSubscript(CL.mkVar "selfIn",index)),                                CL.mkVar(RN.addBufferSuffixData x))) (!imgGlobals)
612                          CL.mkAssign(CL.mkVar outState,CL.mkSubscript(CL.mkVar "selfOut",index))  
613                        ] end              val status = [CL.mkDecl(CL.intTy, "status", NONE)]
614                val status = CL.mkDecl(CL.intTy, "status", SOME(CL.I_Exp(CL.mkInt 0)))  
615                val strand_Init_Stm = CL.mkCall(RN.strandInit name, [CL.E_Var RN.globalsVarName,CL.mkUnOp(CL.%&,CL.E_Var inState), CL.E_Var "x", CL.E_Var "y"])  
616                val local_vars = thread_ids @ initGlobalImages(!imgGlobals)  @ strandDecl @ strandObjects @ [strand_Init_Stm,status]         val updateStm =  CL.mkAssign(CL.mkVar "status",
                                   val while_exp = CL.mkBinOp(  
                     CL.mkBinOp(CL.mkVar "status",CL.#!=, CL.mkVar RN.kStabilize),  
                     CL.#||,  
                     CL.mkBinOp(CL.mkVar "status", CL.#!=, CL.mkVar RN.kDie))  
               val whileBody = CL.mkBlock [  
                       CL.mkAssign(CL.mkVar "status",  
617                          CL.mkApply(RN.strandUpdate name,                          CL.mkApply(RN.strandUpdate name,
618                            [CL.mkUnOp(CL.%&,CL.mkVar inState), CL.mkUnOp(CL.%&,CL.mkVar outState),CL.E_Var RN.globalsVarName])),                            [CL.mkUnOp(CL.%&,CL.mkVar inState),
619                        CL.mkCall(RN.strandStabilize name,                             CL.mkUnOp(CL.%&,CL.mkVar outState),
620                          [CL.mkUnOp(CL.%&,CL.mkVar inState), CL.mkUnOp(CL.%&,CL.mkVar outState),CL.E_Var RN.globalsVarName])                             CL.mkVar RN.globalsVarName,
621                      ]                             CL.mkVar RN.globalImageDataName]))
622                val whileBlock = [CL.mkWhile(while_exp, whileBody)]  
623                val body = CL.mkBlock(local_vars  @ whileBlock)         val statusIf = CL.mkIfThenElse(CL.mkBinOp(CL.E_Var "status", CL.#==, CL.E_Var RN.kStabilize),
624                        CL.mkBlock([CL.mkAssign(CL.mkSubscript(CL.mkVar "strandStatus",CL.mkVar "strandIndex"),CL.mkVar RN.kStable)] @
625                                    copyOutStm @
626                                    [CL.mkCall(RN.atom_dec,[CL.mkUnOp(CL.%&,CL.mkSubscript(CL.mkVar "numAvail",CL.mkInt 0))])]),
627                        CL.mkBlock([CL.mkIfThen(CL.mkBinOp(CL.E_Var "status", CL.#==, CL.E_Var RN.kDie),
628                                    CL.mkBlock([CL.mkAssign(CL.mkSubscript(CL.mkVar "strandStatus",CL.mkVar "strandIndex"),CL.mkVar RN.kDie)] @
629                                    copyOutStm @
630                                    [CL.mkCall(RN.atom_dec,[CL.mkUnOp(CL.%&,CL.mkSubscript(CL.mkVar "numAvail",CL.mkInt 0))])]))]))
631    
632           val incStrand = CL.mkExpStm(CL.mkPostOp(CL.mkVar "strandIndex",CL.^++))
633    
634            val forStablize = CL.mkFor( [(CL.intTy,"idx",CL.mkInt 0)], CL.mkBinOp(CL.mkBinOp(CL.mkVar "idx", CL.#<, CL.mkVar "limit"),CL.#&&,
635                                                                         CL.mkBinOp(CL.mkVar "strandIndex", CL.#<, CL.mkVar "numStrands")),
636                                           [CL.mkPostOp(CL.mkVar "idx", CL.^++)], CL.mkBlock(
637    
638                                             copyInStm @
639                                            [ updateStm,
640                                             statusIf,
641                                             incStrand
642                                           ]))
643    
644                  val local_vars = index_ids
645                        @ [imageDataDecl]
646                        @ imageDataStms
647                        @ strandDecl
648                        @ status
649    
650                  val body = CL.mkBlock(local_vars @ [forStablize])
651                in                in
652                  CL.D_Func(["__kernel"], CL.voidTy, fName, params, body)                  CL.D_Func(["__kernel"], CL.voidTy, fName, params, body)
653                end                end
654        (* generate a global structure from the globals *)  
655          fun genGlobalStruct (targetTy, globals) = let        (* generate a global structure type definition from the list of globals *)
656            fun genGlobalStruct (targetTy, globals, tyName) = let
657                val globs = List.map (fn (x : mirror_var) => (targetTy x, #var x)) globals                val globs = List.map (fn (x : mirror_var) => (targetTy x, #var x)) globals
658                in                in
659                  CL.D_StructDef(globs, RN.globalsTy)                  CL.D_StructDef(globs, tyName)
660                  end
661    
662          (* generate a global structure type definition from the image data of the image globals *)
663            fun genImageDataStruct (imgGlobals, tyName) = let
664                  val globs = List.map
665                        (fn (x, _) => (globalPtr CL.voidTy, RN.imageDataName x))
666                          imgGlobals
667                  in
668                    CL.D_StructDef(globs, tyName)
669                end                end
670    
671          fun genGlobals (declFn, targetTy, globals) = let          fun genGlobals (declFn, targetTy, globals) = let
672                fun doVar (x : mirror_var) = declFn (CL.D_Var([], targetTy x, #var x, NONE))                fun doVar (x : mirror_var) = declFn (CL.D_Var([], targetTy x, #var x, NONE))
673                in                in
# Line 558  Line 682 
682                      in                      in
683                        CL.I_Struct[                        CL.I_Struct[
684                            ("name", CL.I_Exp(CL.mkStr name)),                            ("name", CL.I_Exp(CL.mkStr name)),
685                            ("stateSzb", CL.I_Exp(CL.mkSizeof(CL.T_Named(N.strandTy name)))),                            ("stateSzb", CL.I_Exp(CL.mkSizeof(CL.T_Named(RN.strandTy name)))),
686                              ("shadowStrandSzb",CL.I_Exp(CL.mkSizeof(CL.T_Named(RN.strandShadowTy (RN.strandTy name))))),
687  (*  (*
688                            ("outputSzb", CL.I_Exp(CL.mkSizeof(ToC.trTy outTy))),                            ("outputSzb", CL.I_Exp(CL.mkSizeof(ToC.trTy outTy))),
689  *)  *)
690                            ("update", fnPtr("update_method_t", "0")),                            ("update", fnPtr("update_method_t", "0")),
691                              ("strandCopy",  fnPtr("convert_method_t", "Diderot_Strand_Covert_To_Shadow")),
692                            ("print", fnPtr("print_method_t", name ^ "_print"))                            ("print", fnPtr("print_method_t", name ^ "_print"))
693                          ]                          ]
694                      end                      end
# Line 605  Line 731 
731                      if double                      if double
732                        then "#define DIDEROT_DOUBLE_PRECISION"                        then "#define DIDEROT_DOUBLE_PRECISION"
733                        else "#define DIDEROT_SINGLE_PRECISION",                        else "#define DIDEROT_SINGLE_PRECISION",
734                        "#pragma OPENCL EXTENSION cl_khr_global_int32_base_atomics: enable",
735                      "#define DIDEROT_TARGET_CL",                      "#define DIDEROT_TARGET_CL",
736                      "#include \"Diderot/cl-diderot.h\""                      "#include \"Diderot/cl-diderot.h\""
737                    ]));                    ]));
738                  clppDecl (genGlobalStruct (#gpuTy, !globals));                  clppDecl (genGlobalStruct (#gpuTy, !globals, RN.globalsTy));
739                  clppDecl (genStrandTyDef(#gpuTy, strand));                  clppDecl (genImageDataStruct(!imgGlobals,RN.imageDataType));
740                  clppDecl  (!init_code);                  clppDecl (genStrandTyDef(#gpuTy, strand,tyName));
741                  List.app clppDecl (!code);                  List.app clppDecl (!code);
742                  clppDecl (genKernelFun (strand, !numDims, globals, imgGlobals));                  clppDecl (genKernelFun (strand, !numDims, globals, imgGlobals));
743                (* Generate the Host C file *)                (* Generate the Host C file *)
# Line 623  Line 750 
750                    ]));                    ]));
751                  cppDecl (CL.D_Var(["static"], CL.charPtr, "ProgramName",                  cppDecl (CL.D_Var(["static"], CL.charPtr, "ProgramName",
752                    SOME(CL.I_Exp(CL.mkStr progName))));                    SOME(CL.I_Exp(CL.mkStr progName))));
753                  cppDecl (genGlobalStruct (#hostTy, !globals));                  cppDecl (genGlobalStruct (#hostTy, !globals, RN.globalsTy));
754                  cppDecl (CL.D_Var(["static"], CL.T_Ptr(CL.T_Named RN.globalsTy), RN.globalsVarName, NONE));                  cppDecl (genGlobalStruct (#shadowTy, !globals, RN.shadowGlobalsTy));
755                  cppDecl (genStrandTyDef (#hostTy, strand));  (* FIXME: does this really need to be a global? *)
756                    cppDecl (CL.D_Var(["static"], globPtrTy, RN.globalsVarName, NONE));
757                    cppDecl (genStrandTyDef (#hostTy, strand, tyName));
758                    cppDecl (genStrandTyDef (#shadowTy, strand, RN.strandShadowTy tyName));
759                    cppDecl (genConvertShadowTypes strand);
760                    cppDecl  (!init_code);
761                  cppDecl (genStrandPrint strand);                  cppDecl (genStrandPrint strand);
762                  List.app cppDecl (List.rev (!topDecls));                  List.app cppDecl (List.rev (!topDecls));
763                  cppDecl (genGlobalBuffersArgs imgGlobals);                  cppDecl (genGlobalBuffersArgs (!globals,imgGlobals));
764                  List.app (fn strand => cppDecl (genStrandDesc strand)) strands;                  List.app (fn strand => cppDecl (genStrandDesc strand)) strands;
765                  genStrandTable (cppDecl, strands);                  genStrandTable (cppDecl, strands);
766                  cppDecl (!initially);                  cppDecl (!initially);
# Line 638  Line 770 
770                  TextIO.closeOut clOutS                  TextIO.closeOut clOutS
771                end                end
772    
773        (* output the code to a file.  The string is the basename of the file, the extension        (* output the code to the filesystem.  The string is the basename of the source file *)
        * is provided by the target.  
        *)  
774          fun generate (basename, prog as Prog{double, parallel, debug, ...}) = let          fun generate (basename, prog as Prog{double, parallel, debug, ...}) = let
775                fun condCons (true, x, xs) = x::xs                fun condCons (true, x, xs) = x::xs
776                  | condCons (false, _, xs) = xs                  | condCons (false, _, xs) = xs
# Line 666  Line 796 
796                  RunCC.link (basename, ldOpts)                  RunCC.link (basename, ldOpts)
797                end                end
798    
799        end        end (* Program *)
800    
801    (* strands *)    (* strands *)
802      structure Strand =      structure Strand =
# Line 695  Line 825 
825          fun init (Strand{name, tyName, code, init_code, ...}, params, init) = let          fun init (Strand{name, tyName, code, init_code, ...}, params, init) = let
826                val fName = RN.strandInit name                val fName = RN.strandInit name
827                val params =                val params =
828                      CL.PARAM([], globPtrTy, RN.globalsVarName) ::                      clParam ("",CL.T_Ptr(CL.T_Named tyName), "selfOut") ::
                     CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfOut") ::  
829                        List.map (fn (ToCL.V(ty, x)) => CL.PARAM([], ty, x)) params                        List.map (fn (ToCL.V(ty, x)) => CL.PARAM([], ty, x)) params
830                val initFn = CL.D_Func([], CL.voidTy, fName, params, init)                val initFn = CL.D_Func([], CL.voidTy, fName, params, init)
831                in                in
# Line 705  Line 834 
834    
835        (* register a strand method *)        (* register a strand method *)
836          fun method (Strand{name, tyName, code,...}, methName, body) = let          fun method (Strand{name, tyName, code,...}, methName, body) = let
837                val fName = concat[name, "_", methName]                val fName = concat[name, "_", MethodName.toString methName]
838                val params = [                val params = [
839                        CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfIn"),                        clParam ("",CL.T_Ptr(CL.T_Named tyName), "selfIn"),
840                        CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "selfOut"),                        clParam ("",CL.T_Ptr(CL.T_Named tyName), "selfOut"),
841                                                           CL.PARAM([], CL.T_Ptr(CL.T_Named (RN.globalsTy)), RN.globalsVarName)                        globalParam (CL.T_Ptr(CL.T_Named (RN.globalsTy)), RN.globalsVarName),
842                          CL.PARAM([],CL.T_Named(RN.imageDataType),RN.globalImageDataName)
843                      ]                      ]
844                val methFn = CL.D_Func([], CL.int32, fName, params, body)                val resTy = (case methName
845                         of MethodName.Update => CL.T_Named "StrandStatus_t"
846                          | MethodName.Stabilize => CL.voidTy
847                        (* end case *))
848                  val methFn = CL.D_Func([], resTy, fName, params, body)
849                in                in
850                  code := methFn :: !code                  code := methFn :: !code
851                end                end

Legend:
Removed from v.1321  
changed lines
  Added in v.1462

root@smlnj-gforge.cs.uchicago.edu
ViewVC Help
Powered by ViewVC 1.0.0