Home My Page Projects Code Snippets Project Openings diderot
Summary Activity Tracker Tasks SCM

SCM Repository

[diderot] Diff of /branches/pure-cfg/src/compiler/cl-target/cl-target.sml
ViewVC logotype

Diff of /branches/pure-cfg/src/compiler/cl-target/cl-target.sml

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1425, Fri Jul 1 18:05:07 2011 UTC revision 1458, Sun Aug 7 08:17:35 2011 UTC
# Line 30  Line 30 
30    
31     (* translate TreeIL types to shadow types *)     (* translate TreeIL types to shadow types *)
32      fun convertToShadow (ty,name) = (case ty      fun convertToShadow (ty,name) = (case ty
33             of Ty.IVecTy 1 => CL.mkAssign(CL.mkSelect(CL.mkVar(RN.shadowGlaobalsName),name),             of Ty.IVecTy 1 => CL.mkAssign(
34                    CL.mkSelect(CL.mkVar(RN.shadowGlaobalsName),name),
35                                  CL.mkIndirect(CL.mkVar(RN.globalsVarName), name))                                  CL.mkIndirect(CL.mkVar(RN.globalsVarName), name))
36              | Ty.TensorTy[n]=> CL.mkCall(RN.convertToShadowVec n,[              | Ty.TensorTy[n]=> CL.mkCall(RN.convertToShadowVec n,[
37                           CL.mkSelect(CL.mkVar(RN.shadowGlaobalsName),name),                           CL.mkSelect(CL.mkVar(RN.shadowGlaobalsName),name),
38                            CL.mkIndirect(CL.mkVar(RN.globalsVarName), name)])                    CL.mkIndirect(CL.mkVar(RN.globalsVarName), name)
39                    ])
40              | Ty.ImageTy(ImageInfo.ImgInfo{dim, ...}) =>  CL.mkCall(RN.shadowImageFunc dim, [              | Ty.ImageTy(ImageInfo.ImgInfo{dim, ...}) =>  CL.mkCall(RN.shadowImageFunc dim, [
41                           CL.mkVar "context",                           CL.mkVar "context",
42                           CL.mkUnOp(CL.%&,CL.mkSelect(CL.mkVar(RN.shadowGlaobalsName),name)),                           CL.mkUnOp(CL.%&,CL.mkSelect(CL.mkVar(RN.shadowGlaobalsName),name)),
# Line 42  Line 44 
44                           ])                           ])
45              | Ty.TensorTy[n, m] => CL.mkCall(RN.convertToShadowMat(m,n),[              | Ty.TensorTy[n, m] => CL.mkCall(RN.convertToShadowMat(m,n),[
46                           CL.mkSelect(CL.mkVar(RN.shadowGlaobalsName),name),                           CL.mkSelect(CL.mkVar(RN.shadowGlaobalsName),name),
47                            CL.mkIndirect(CL.mkVar(RN.globalsVarName), name)])                    CL.mkIndirect(CL.mkVar(RN.globalsVarName), name)
48              | _ => CL.mkAssign(CL.mkSelect(CL.mkVar(RN.shadowGlaobalsName),name),                  ])
49                | _ => CL.mkAssign(
50                    CL.mkSelect(CL.mkVar(RN.shadowGlaobalsName),name),
51                                  CL.mkIndirect(CL.mkVar(RN.globalsVarName), name))                                  CL.mkIndirect(CL.mkVar(RN.globalsVarName), name))
52             (*end case *))             (*end case *))
53    
# Line 98  Line 102 
102    
103    (* variable or field that is mirrored between host and GPU *)    (* variable or field that is mirrored between host and GPU *)
104      type mirror_var = {      type mirror_var = {
105    (* FIXME: perhaps it would be cleaner to just track the TreeIL type of the variable? *)
106              hostTy : CL.ty,             (* variable type on Host (i.e., C type) *)              hostTy : CL.ty,             (* variable type on Host (i.e., C type) *)
107              shadowTy : CL.ty,           (* host-side shadow type of GPU type *)              shadowTy : CL.ty,           (* host-side shadow type of GPU type *)
108              gpuTy : CL.ty,              (* variable's type on GPU (i.e., OpenCL type) *)              gpuTy : CL.ty,              (* variable's type on GPU (i.e., OpenCL type) *)
109              hToS: stm,                                  (*the statement that converts the variable to its shadow representation *)              hToS: stm,                  (* the statement that converts the variable to its *)
110                                            (* shadow representation *)
111              var : CL.var                (* variable name *)              var : CL.var                (* variable name *)
112            }            }
113    
# Line 143  Line 149 
149        | GlobalScope        | GlobalScope
150        | InitiallyScope        | InitiallyScope
151        | StrandScope of TreeIL.var list  (* strand initialization *)        | StrandScope of TreeIL.var list  (* strand initialization *)
152        | MethodScope of TreeIL.var list  (* method body; vars are state variables *)        | MethodScope of MethodName.name * TreeIL.var list  (* method body; vars are state variables *)
153    
154    (* the supprted widths of vectors of reals on the target. *)    (* the supprted widths of vectors of reals on the target. *)
155  (* FIXME: for OpenCL 1.1, 3 is also valid *)  (* FIXME: for OpenCL 1.1, 3 is also valid *)
# Line 180  Line 186 
186  (* NOTE: if we move strand initialization to the GPU, then we'll have to change the following code! *)  (* NOTE: if we move strand initialization to the GPU, then we'll have to change the following code! *)
187                   of StrandScope stateVars =>                   of StrandScope stateVars =>
188                        ToCL.trBlock (vMap, saveState "StrandScope" stateVars ToCL.trAssign, blk)                        ToCL.trBlock (vMap, saveState "StrandScope" stateVars ToCL.trAssign, blk)
189                    | MethodScope stateVars =>                    | MethodScope(name, stateVars) =>
190                        ToCL.trBlock (vMap, saveState "MethodScope" stateVars ToCL.trAssign, blk)                        ToCL.trBlock (vMap, saveState "MethodScope" stateVars ToCL.trAssign, blk)
191                    | InitiallyScope => ToCL.trBlock (vMap, fn (_, _, stm) => [stm], blk)                    | InitiallyScope => ToCL.trBlock (vMap, fn (_, _, stm) => [stm], blk)
192                    | _ => ToC.trBlock (vMap, fn (_, _, stm) => [stm], blk)                    | _ => ToC.trBlock (vMap, fn (_, _, stm) => [stm], blk)
# Line 234  Line 240 
240          val scopeGlobal = setScope GlobalScope          val scopeGlobal = setScope GlobalScope
241          val scopeInitially = setScope InitiallyScope          val scopeInitially = setScope InitiallyScope
242          fun scopeStrand (env, svars) = setScope (StrandScope svars) env          fun scopeStrand (env, svars) = setScope (StrandScope svars) env
243          fun scopeMethod (env, svars) = setScope (MethodScope svars) env          fun scopeMethod (env, name, svars) = setScope (MethodScope(name, svars)) env
244        (* bind a TreeIL varaiable to a target variable *)        (* bind a TreeIL varaiable to a target variable *)
245          fun bind (ENV{info, vMap, scope}, x, x') = ENV{          fun bind (ENV{info, vMap, scope}, x, x') = ENV{
246                  info = info,                  info = info,
# Line 324  Line 330 
330                        CL.mkDecl(CL.T_Array(CL.int32, SOME nDims), "base", SOME(CL.I_Array baseInit)),                        CL.mkDecl(CL.T_Array(CL.int32, SOME nDims), "base", SOME(CL.I_Array baseInit)),
331                        CL.mkDecl(CL.T_Array(CL.uint32, SOME nDims), "size", SOME(CL.I_Array sizeInit)),                        CL.mkDecl(CL.T_Array(CL.uint32, SOME nDims), "size", SOME(CL.I_Array sizeInit)),
332                        CL.mkDecl(worldTy, wrld,                        CL.mkDecl(worldTy, wrld,
333                          SOME(CL.I_Exp(CL.E_Apply(RN.allocInitially, [                          SOME(CL.I_Exp(CL.E_Apply(N.allocInitially, [
334                              CL.mkVar "ProgramName",                              CL.mkVar "ProgramName",
335                              CL.mkUnOp(CL.%&, CL.E_Var(N.strandDesc name)),                              CL.mkUnOp(CL.%&, CL.E_Var(N.strandDesc name)),
336                              CL.E_Bool isArray,                              CL.E_Bool isArray,
# Line 333  Line 339 
339                              CL.E_Var "size"                              CL.E_Var "size"
340                            ]))))                            ]))))
341                      ]                      ]
342              (* create the loop nest for the initially iterations              (* create the loop nest for the initially iterations *)
343                val indexVar = "ix"                val indexVar = "ix"
344                val strandTy = CL.T_Ptr(CL.T_Named(N.strandTy name))                val strandTy = CL.T_Ptr(CL.T_Named(N.strandTy name))
345                fun mkLoopNest [] = CL.mkBlock(createPrefix @ [                fun mkLoopNest [] = CL.mkBlock(createPrefix @ [
346                        CL.mkDecl(strandTy, "sp",                        CL.mkDecl(strandTy, "sp",
347                          SOME(CL.I_Exp(                          SOME(CL.I_Exp(
348                            CL.E_Cast(strandTy,                            CL.E_Cast(strandTy,
349                            CL.E_Apply(N.inState, [CL.E_Var "wrld", CL.E_Var indexVar]))))),                            CL.E_Apply(N.inState, [CL.E_Var "wrld", CL.mkBinOp(CL.mkVar indexVar, CL.#*, CL.mkSizeof(CL.T_Named (N.strandDesc name)))]))))),
350                        CL.mkCall(N.strandInit name,                        CL.mkCall(N.strandInit name, CL.E_Var "sp" :: args),
                         CL.E_Var RN.globalsVarName :: CL.E_Var "sp" :: args),  
351                        CL.mkAssign(CL.E_Var indexVar, CL.mkBinOp(CL.E_Var indexVar, CL.#+, CL.E_Int(1, CL.uint32)))                        CL.mkAssign(CL.E_Var indexVar, CL.mkBinOp(CL.E_Var indexVar, CL.#+, CL.E_Int(1, CL.uint32)))
352                      ])                      ])
353                  | mkLoopNest ((CL.V(ty, param), lo, hi)::iters) = let                  | mkLoopNest ((CL.V(ty, param), lo, hi)::iters) = let
# Line 358  Line 363 
363                        CL.mkComment["initially"],                        CL.mkComment["initially"],
364                        CL.mkDecl(CL.uint32, indexVar, SOME(CL.I_Exp(CL.E_Int(0, CL.uint32)))),                        CL.mkDecl(CL.uint32, indexVar, SOME(CL.I_Exp(CL.E_Int(0, CL.uint32)))),
365                        mkLoopNest iters                        mkLoopNest iters
366                      ] *)                      ]
367                val body = CL.mkBlock(                val body = CL.mkBlock(
368                      iterPrefix @                      iterPrefix @
369                      allocCode @                      allocCode @
370                        iterCode @
371                      [CL.mkReturn(SOME(CL.E_Var "wrld"))])                      [CL.mkReturn(SOME(CL.E_Var "wrld"))])
372                val initFn = CL.D_Func([], worldTy, N.initially, [], body)                val initFn = CL.D_Func([], worldTy, N.initially, [], body)
373                in                in
# Line 369  Line 375 
375                  initially := initFn                  initially := initFn
376                end                end
377    
378    
379        (***** OUTPUT *****)        (***** OUTPUT *****)
380    (* FIXME: I think that the iteration and test for stable strands can be moved into the runtime, which
381     * will make the print function compatible with the C target version.
382     *)
383          fun genStrandPrint (Strand{name, tyName, state, output, code,...}) = let          fun genStrandPrint (Strand{name, tyName, state, output, code,...}) = let
384              (* the print function *)              (* the print function *)
385                val prFnName = concat[name, "Print"]                val prFnName = concat[name, "Print"]
386                val prFn = let                val prFn = let
387                      val params = [                      val params = [
388                              CL.PARAM([], CL.T_Ptr(CL.T_Named "FILE"), "outS"),                              CL.PARAM([], CL.T_Ptr(CL.T_Named "FILE"), "outS"),
                             CL.PARAM([], CL.T_Ptr(CL.T_Num(RawTypes.RT_UInt8)),"status"),  
                             CL.PARAM([], CL.intTy,"numStrands"),  
389                              CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "self")                              CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "self")
390                            ]                            ]
391                      val SOME(ty, x) = !output                      val SOME(ty, x) = !output
392                      val outState = CL.mkSelect(CL.mkSubscript(CL.mkVar "self", CL.E_Var "i"), x)                      val outState = CL.mkIndirect(CL.mkVar "self", x)
393                      val prArgs = (case ty                      val prArgs = (case ty
394                             of Ty.IVecTy 1 => [CL.E_Str(!N.gIntFormat ^ "\n"), outState]                             of Ty.IVecTy 1 => [CL.E_Str(!N.gIntFormat ^ "\n"), outState]
395                              | Ty.IVecTy d => let                              | Ty.IVecTy d => let
396                                    fun sel i = CL.mkSubscript(CL.mkSelect(outState, "s"),
397                                          CL.mkInt(IntInf.fromInt i))
398                                  val fmt = CL.mkStr(                                  val fmt = CL.mkStr(
399                                        String.concatWith " " (List.tabulate(d, fn _ => !N.gIntFormat))                                        String.concatWith " " (List.tabulate(d, fn _ => !N.gIntFormat))
400                                        ^ "\n")                                        ^ "\n")
401                                  val args = List.tabulate (d, fn i => ToC.ivecIndex(outState, d, i))                                  val args = List.tabulate (d, sel)
402                                  in                                  in
403                                    fmt :: args                                    fmt :: args
404                                  end                                  end
405                              | Ty.TensorTy[] => [CL.mkStr "%f\n", outState]                              | Ty.TensorTy[] => [CL.mkStr "%f\n", outState]
406                              | Ty.TensorTy[d] => let                              | Ty.TensorTy[d] => let
407                                    fun sel i = CL.mkSubscript(CL.mkSelect(outState, "s"),
408                                          CL.mkInt(IntInf.fromInt i))
409                                  val fmt = CL.mkStr(                                  val fmt = CL.mkStr(
410                                        String.concatWith " " (List.tabulate(d, fn _ => "%f"))                                        String.concatWith " " (List.tabulate(d, fn _ => "%f"))
411                                        ^ "\n")                                        ^ "\n")
412                                  val args = List.tabulate (d, fn i => ToC.vecIndex(outState, d, i))                                  val args = List.tabulate (d, sel)
413                                  in                                  in
414                                    fmt :: args                                    fmt :: args
415                                  end                                  end
416                              | _ => raise Fail("genStrand: unsupported output type " ^ Ty.toString ty)                              | _ => raise Fail("genStrand: unsupported output type " ^ Ty.toString ty)
417                            (* end case *))                            (* end case *))
                     val forBody = CL.mkIfThen(  
                           CL.mkBinOp(CL.mkSubscript(CL.E_Var "status",CL.E_Var "i"), CL.#==, CL.E_Var "DIDEROT_STABILIZE"),  
                           CL.mkBlock([CL.mkCall("fprintf", CL.mkVar "outS" :: prArgs)]))  
                     val body =  CL.mkFor(  
                         [(CL.intTy, "i", CL.mkInt 0)],  
                         CL.mkBinOp(CL.E_Var "i", CL.#<, CL.E_Var "numStrands"),  
                         [CL.mkPostOp(CL.E_Var "i", CL.^++)],  
                         forBody)  
418                      in                      in
419                        CL.D_Func(["static"], CL.voidTy, prFnName, params, body)                        CL.D_Func(["static"], CL.voidTy, prFnName, params,
420                            CL.mkCall("fprintf", CL.mkVar "outS" :: prArgs))
421                      end                      end
422                in                in
423                  prFn                  prFn
424                end                end
425    
426          fun genStrandTyDef (targetTy, Strand{tyName, state,...}) =          fun genStrandTyDef (targetTy, Strand{state,...},tyName) =
427              (* the type declaration for the strand's state struct *)              (* the type declaration for the strand's state struct *)
428                CL.D_StructDef(                CL.D_StructDef(
429                  List.rev (List.map (fn x => (targetTy x, #var x)) (!state)),                  List.rev (List.map (fn x => (targetTy x, #var x)) (!state)),
430                  tyName)                  tyName)
431    
432    
433             fun genStrandCopy(Strand{tyName,name,state,...}) = let
434                  val params = [
435                          CL.PARAM(["__global"], CL.T_Ptr(CL.T_Named tyName), "selfIn"),
436                          CL.PARAM(["__global"], CL.T_Ptr(CL.T_Named tyName), "selfOut")
437                      ]
438                    val assignStms = List.rev(List.map(fn x => CL.mkAssign(CL.mkIndirect(CL.E_Var "selfOut", #var x),
439                                                                                                           CL.mkIndirect(CL.E_Var "selfIn", #var x))) (!state))
440                     in
441                            CL.D_Func([""], CL.voidTy, RN.strandCopy name, params,CL.mkBlock(assignStms))
442                     end
443    
444        (* generates the opencl buffers for the image data *)        (* generates the opencl buffers for the image data *)
445          fun getGlobalDataBuffers (globals, imgGlobals, contextVar, errVar) = let          fun getGlobalDataBuffers (globals, imgGlobals, contextVar, errVar) = let
446                val globalBuffErr = "error creating OpenCL global buffer"                val globalBuffErr = "error creating OpenCL global buffer\n"
447                fun errorFn msg = CL.mkIfThen(CL.mkBinOp(CL.E_Var errVar, CL.#!=, CL.E_Var "CL_SUCCESS"),                fun errorFn msg = CL.mkIfThen(CL.mkBinOp(CL.E_Var errVar, CL.#!=, CL.E_Var "CL_SUCCESS"),
448                      CL.mkBlock([CL.mkCall("fprintf",[CL.E_Var "stderr", CL.E_Str msg]),                      CL.mkBlock([CL.mkCall("fprintf",[CL.E_Var "stderr", CL.E_Str msg]),
449                      CL.mkCall("exit",[CL.mkInt 1])]))                      CL.mkCall("exit",[CL.mkInt 1])]))
# Line 456  Line 473 
473                              CL.mkIndirect(hostVar, "data"),                              CL.mkIndirect(hostVar, "data"),
474                              CL.mkUnOp(CL.%&,CL.mkVar errVar)                              CL.mkUnOp(CL.%&,CL.mkVar errVar)
475                            ])) ::                            ])) ::
476                          errFn(concat["error in creating ",RN.addBufferSuffixData var, " global buffer"]) ::                          errFn(concat["error in creating ",RN.addBufferSuffixData var, " global buffer\n"]) ::
477                          genDataBuffers(globals,contextVar,errVar,errFn)                          genDataBuffers(globals,contextVar,errVar,errFn)
478                      end                      end
479                in                in
# Line 467  Line 484 
484    
485        (* generates the kernel arguments for the image data *)        (* generates the kernel arguments for the image data *)
486          fun genGlobalArguments (globals, count, kernelVar, errVar) = let          fun genGlobalArguments (globals, count, kernelVar, errVar) = let
487                val globalArgErr = "error creating OpenCL global argument"                val globalArgErr = "error creating OpenCL global argument\n"
488                fun errorFn msg = CL.mkIfThen(CL.mkBinOp(CL.E_Var errVar, CL.#!=, CL.E_Var "CL_SUCCESS"),                fun errorFn msg = CL.mkIfThen(CL.mkBinOp(CL.E_Var errVar, CL.#!=, CL.E_Var "CL_SUCCESS"),
489                      CL.mkBlock([CL.mkCall("fprintf",[CL.E_Var "stderr", CL.E_Str msg]),                      CL.mkBlock([CL.mkCall("fprintf",[CL.E_Var "stderr", CL.E_Str msg]),
490                      CL.mkCall("exit",[CL.mkInt 1])]))                      CL.mkCall("exit",[CL.mkInt 1])]))
# Line 485  Line 502 
502                           CL.mkPostOp(CL.E_Var count, CL.^++),                           CL.mkPostOp(CL.E_Var count, CL.^++),
503                           CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),                           CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),
504                           CL.mkUnOp(CL.%&,CL.mkVar(RN.addBufferSuffixData var))]))) ::                           CL.mkUnOp(CL.%&,CL.mkVar(RN.addBufferSuffixData var))]))) ::
505                           errFn(concat["error in creating ",RN.addBufferSuffixData var, " argument"]) ::                           errFn(concat["error in creating ",RN.addBufferSuffixData var, " argument\n"]) ::
506                      genDataArguments (globals,count,kernelVar,errVar,errFn)                      genDataArguments (globals,count,kernelVar,errVar,errFn)
507                in                in
508                 [globalArgument,errorFn(globalArgErr)] @ genDataArguments(globals, count, kernelVar, errVar,errorFn)                  globalArgument :: errorFn globalArgErr ::
509                      genDataArguments(globals, count, kernelVar, errVar,errorFn)
510                end                end
511    
512        (* generates the globals buffers and arguments function *)        (* generates the globals buffers and arguments function *)
# Line 524  Line 542 
542                val inState = "strand_in"                val inState = "strand_in"
543                val outState = "strand_out"                val outState = "strand_out"
544                val tempVar = "tmp"                val tempVar = "tmp"
545                val sizeParams = if nDims = 1 then  
546                          []                val (workerOffset,localOffset) = if nDims = 1 then
547                            ( CL.mkApply(RN.getGroupId,[CL.mkInt 0]), CL.mkApply(RN.getLocalThreadId,[CL.mkInt 0]) )
548                      else if nDims = 2 then                      else if nDims = 2 then
549                          [CL.PARAM([], CL.intTy, "width")]                       (CL.mkBinOp(CL.mkBinOp(CL.mkApply(RN.getGroupId,[CL.mkInt 0]),CL.#*, CL.mkApply(RN.getNumGroups,[CL.mkInt 1])),CL.#+,CL.mkApply(RN.getGroupId,[CL.mkInt 1])),
550                                CL.mkBinOp(CL.mkBinOp(CL.mkApply(RN.getLocalThreadId,[CL.mkInt 0]),CL.#*, CL.mkApply(RN.getLocalSize,[CL.mkInt 1])),CL.#+,CL.mkApply(RN.getLocalThreadId,[CL.mkInt 1])))
551                      else                      else
552                          [CL.PARAM([], CL.intTy, "width"),CL.PARAM([], CL.intTy, "height")]                            ( CL.mkBinOp(CL.mkBinOp(CL.mkBinOp(
553                                CL.mkBinOp(CL.mkApply(RN.getGroupId,[CL.mkInt 0]), CL.#*, CL.mkApply(RN.getNumGroups,[CL.mkInt 1])),CL.#*, CL.mkApply(RN.getLocalSize,[CL.mkInt 2])), CL.#+,
554                                CL.mkBinOp(CL.mkApply(RN.getGroupId,[CL.mkInt 1]),CL.#*,CL.mkApply(RN.getLocalSize,[CL.mkInt 1]))),CL.#+,CL.mkApply(RN.getGroupId,[CL.mkInt 2])),
555                               CL.mkBinOp(CL.mkBinOp(CL.mkBinOp(
556                                CL.mkBinOp(CL.mkApply(RN.getLocalThreadId,[CL.mkInt 0]), CL.#*, CL.mkApply(RN.getLocalSize,[CL.mkInt 1])),CL.#*, CL.mkApply(RN.getLocalSize,[CL.mkInt 2])), CL.#+,
557                                CL.mkBinOp(CL.mkApply(RN.getLocalThreadId,[CL.mkInt 1]),CL.#*,CL.mkApply(RN.getLocalSize,[CL.mkInt 1]))),CL.#+,CL.mkApply(RN.getLocalThreadId,[CL.mkInt 2])) )
558    
559                val params = [                val params = [
560                        globalParam(CL.T_Ptr(CL.T_Named tyName), "selfIn"),                        globalParam(CL.T_Ptr(CL.T_Named tyName), "strands"),
561                        globalParam(CL.T_Ptr(CL.T_Named tyName), "selfOut"),                        globalParam(CL.T_Ptr(CL.T_Num(RawTypes.RT_UInt8)), "strandStatus"),
562                        globalParam(CL.T_Ptr(CL.T_Num(RawTypes.RT_UInt8)), "strandStatus")] @                        globalParam(CL.T_Ptr(CL.intTy), "workerQueue"),
563                        sizeParams @                        globalParam(CL.T_Ptr(CL.intTy),"numAvail"),
564                       [ globalParam(globPtrTy, RN.globalsVarName)                        clParam("",CL.intTy,"numStrands"),
565                      ] @ genKeneralGlobalParams(!imgGlobals)                        clParam("",CL.intTy,"limit")] @
566                val thread_ids = if nDims = 1                        [globalParam(globPtrTy, RN.globalsVarName)] @
567                        then [                        genKeneralGlobalParams(!imgGlobals)
568                            CL.mkDecl(CL.intTy, "x",  
569                              SOME(CL.I_Exp(CL.mkApply(RN.getGlobalThreadId,[CL.mkInt 0]))))              val index_ids = [
570                          ]                            CL.mkDecl(CL.intTy, "workerIndex",
571                      else if nDims = 2                              SOME(CL.I_Exp(workerOffset))),
572                        then [                            CL.mkDecl(CL.intTy, "strandIndex",
573                            CL.mkDecl(CL.intTy, "x",                              SOME(CL.I_Exp(CL.mkBinOp(CL.mkBinOp(CL.mkSubscript(CL.mkVar "workQueue",CL.mkVar "workerIndex"),CL.#+,localOffset),CL.#*,CL.mkVar "limit"))))
                             SOME(CL.I_Exp(CL.mkApply(RN.getGlobalThreadId,[CL.mkInt 1])))),  
                           CL.mkDecl(CL.intTy, "y",  
                             SOME(CL.I_Exp(CL.mkApply(RN.getGlobalThreadId,[CL.mkInt 0]))))  
                         ]  
                     else  
                        [  
                           CL.mkDecl(CL.intTy, "x",  
                             SOME(CL.I_Exp(CL.mkApply(RN.getGlobalThreadId,[CL.mkInt 1])))),  
                           CL.mkDecl(CL.intTy, "y",  
                             SOME(CL.I_Exp(CL.mkApply(RN.getGlobalThreadId,[CL.mkInt 0])))),  
                           CL.mkDecl(CL.intTy, "z",  
                             SOME(CL.I_Exp(CL.mkApply(RN.getGlobalThreadId,[CL.mkInt 2]))))  
574                         ]                         ]
575    
   
576                val strandDecl = [                val strandDecl = [
577                        CL.mkAttrDecl(["__global"], CL.T_Ptr(CL.T_Named tyName), inState, NONE),                        CL.mkDecl(CL.T_Named tyName, "selfIn", NONE),
578                        CL.mkAttrDecl(["__global"], CL.T_Ptr(CL.T_Named tyName), outState, NONE),                        CL.mkDecl(CL.T_Named tyName, "selfOut", NONE)
                       CL.mkAttrDecl(["__global"], CL.T_Ptr(CL.T_Named tyName), tempVar, NONE)  
579                      ]                      ]
580                val imageDataDecl = CL.mkDecl(CL.T_Named(RN.imageDataType),RN.globalImageDataName,NONE)                val imageDataDecl = CL.mkDecl(CL.T_Named(RN.imageDataType),RN.globalImageDataName,NONE)
581                val imageDataStms = List.map (fn (x,_) =>                val imageDataStms = List.map (fn (x,_) =>
582                    CL.mkAssign(CL.mkSelect(CL.mkVar(RN.globalImageDataName),RN.imageDataName x),                    CL.mkAssign(CL.mkSelect(CL.mkVar(RN.globalImageDataName),RN.imageDataName x),
583                                CL.mkVar(RN.addBufferSuffixData x))) (!imgGlobals)                                CL.mkVar(RN.addBufferSuffixData x))) (!imgGlobals)
               val barrierCode = CL.mkIfThen(CL.mkBinOp(CL.E_Var "status",CL.#==,CL.E_Var "DIDEROT_ACTIVE"),  
                                  CL.mkBlock ([CL.mkAssign(CL.E_Var tempVar, CL.E_Var inState),  
                                  CL.mkAssign(CL.E_Var inState, CL.E_Var outState),  
                                  CL.mkAssign(CL.E_Var outState, CL.E_Var tempVar)]))  
               val barrierStm = CL.mkCall("barrier",[CL.E_Var "CLK_LOCAL_MEM_FENCE"])  
               val index = if nDims = 1 then  
                         CL.mkVar "x"  
                     else if nDims = 2 then  
                         CL.mkBinOp(  
                             CL.mkBinOp(CL.mkVar "y", CL.#*, CL.mkVar "width"), CL.#+, CL.mkVar "x")  
                     else  
                        CL.mkBinOp(CL.mkBinOp(CL.mkBinOp(  
                             CL.mkBinOp(CL.mkVar "z", CL.#*, CL.mkVar "width"),CL.#*, CL.mkVar "height"), CL.#+,  
                             CL.mkBinOp(CL.mkVar "y",CL.#*,CL.mkVar "height")),CL.#+,CL.mkVar "x")  
   
               val args = if nDims = 1 then  
                         [CL.mkVar "x"]  
                     else if nDims = 2 then  
                         [CL.mkVar "x", CL.mkVar "y"]  
                     else  
                         [CL.mkVar "x", CL.mkVar "y", CL.mkVar "z"]  
584    
585                val status = [CL.mkDecl(CL.intTy, "status", NONE)]
586    
               val strandObjects =  
                      [ CL.mkAssign(CL.mkVar inState,  CL.mkBinOp(CL.mkVar "selfIn",CL.#+,index)),  
                        CL.mkAssign(CL.mkVar outState, CL.mkBinOp(CL.mkVar "selfOut",CL.#+,index))  
                      ]  
587    
588                  val stabalizeStm = CL.mkAssign(CL.mkSubscript(CL.mkVar "strandStatus",index),         fun strandCopy(inStrand, outStrand) = CL.mkCall(RN.strandCopy name,[inStrand,outStrand])
589                                                                          CL.E_Var "status")         val updateStm =  CL.mkAssign(CL.mkVar "status",
               val status = CL.mkDecl(CL.intTy, "status", SOME(CL.I_Exp(CL.mkSubscript(CL.mkVar "strandStatus",index))))  
               val strandInitStm = CL.mkCall(RN.strandInit name, [  
                       CL.mkVar RN.globalsVarName,  
                       CL.mkVar inState] @ args)  
               val local_vars = thread_ids  
                     @ [imageDataDecl]  
                     @ imageDataStms  
                     @ strandDecl  
                     @ strandObjects  
                     @ [strandInitStm,status]  
               val while_exp = CL.mkBinOp(CL.mkVar "status",CL.#==, CL.mkVar RN.kActive)  
               val whileBody = CL.mkBlock ([  
                       CL.mkAssign(CL.mkVar "status",  
590                          CL.mkApply(RN.strandUpdate name,                          CL.mkApply(RN.strandUpdate name,
591                            [CL.mkVar inState,                            [CL.mkVar inState,
592                             CL.mkVar outState,                             CL.mkVar outState,
593                             CL.mkVar RN.globalsVarName,                             CL.mkVar RN.globalsVarName,
594                             CL.mkVar RN.globalImageDataName]))] @ [barrierCode,barrierStm] )                             CL.mkVar RN.globalImageDataName]))
595                val whileBlock = [CL.mkWhile(while_exp, whileBody)]  
596                val body = CL.mkBlock(local_vars @ whileBlock @ [stabalizeStm])                (*      CL.mkBlock([CL.mkAssign(CL.mkSubscript(CL.mkVar "strandStatus",CL.mkVar "strandIndex"),CL.mkVar RN.kStable),
597                                    strandCopy(CL.mkUnOp(CL.%&,CL.mkVar "selfOut"),CL.mkBinOp(CL.mkVar "strands", CL.#+, CL.mkVar "strandIndex")),
598                                    CL.mkCall(RN.atom_dec,[CL.mkUnOp(CL.%&,CL.mkSubcript(CL.mkVar "numAvail",CL.mkInt 0))])]),
599                        CL.mkBlock([CL.mkIfThen(CL.mkBinOp(CL.E_Var "status", CL.#==, CL.E_Var RN.kDie),
600                                    CL.mkBlock([CL.mkAssign(CL.mkSubscript(CL.mkVar "strandStatus",CL.mkVar "strandIndex"),CL.mkVar RN.kDie),
601                                    strandCopy(CL.mkUnOp(CL.%&,CL.mkVar "selfOut"),CL.mkBinOp(CL.mkVar "strands", CL.#+, CL.mkVar "strandIndex")),
602                                    CL.mkCall(RN.atom_dec,[CL.mkUnOp(CL.%&,CL.mkSubscript(CL.mkVar "numAvail",CL.mkInt 0))])])) *)
603    
604           val statusIf = CL.mkIfThenElse(CL.mkBinOp(CL.E_Var "status", CL.#==, CL.E_Var RN.kStabilize),
605                        CL.mkBlock([CL.mkAssign(CL.mkSubscript(CL.mkVar "strandStatus",CL.mkVar "strandIndex"),CL.mkVar RN.kStable),
606                                    strandCopy(CL.mkUnOp(CL.%&,CL.mkVar "selfOut"),CL.mkBinOp(CL.mkVar "strands", CL.#+, CL.mkVar "strandIndex")),
607                                    CL.mkCall(RN.atom_dec,[CL.mkUnOp(CL.%&,CL.mkSubscript(CL.mkVar "numAvail",CL.mkInt 0))])]),
608                        CL.mkBlock([CL.mkIfThen(CL.mkBinOp(CL.E_Var "status", CL.#==, CL.E_Var RN.kDie),
609                                    CL.mkBlock([CL.mkAssign(CL.mkSubscript(CL.mkVar "strandStatus",CL.mkVar "strandIndex"),CL.mkVar RN.kDie),
610                                    strandCopy(CL.mkUnOp(CL.%&,CL.mkVar "selfOut"),CL.mkBinOp(CL.mkVar "strands", CL.#+, CL.mkVar "strandIndex")),
611                                    CL.mkCall(RN.atom_dec,[CL.mkUnOp(CL.%&,CL.mkSubscript(CL.mkVar "numAvail",CL.mkInt 0))])]))]))
612    
613           val incStrand = CL.mkExpStm(CL.mkPostOp(CL.mkVar "strandIndex",CL.^++))
614    
615            val forStablize = CL.mkFor( [(CL.intTy,"idx",CL.mkInt 0)], CL.mkBinOp(CL.mkBinOp(CL.mkVar "idx", CL.#<, CL.mkVar "limit"),CL.#&&,
616                                                                         CL.mkBinOp(CL.mkVar "strandIndex", CL.#<, CL.mkVar "numStrands")),
617                                           [CL.mkPostOp(CL.mkVar "idx", CL.^++)], CL.mkBlock(
618                                           [
619                                             strandCopy(CL.mkUnOp(CL.%&,CL.mkVar "selfIn"),CL.mkBinOp(CL.mkVar "strands", CL.#+, CL.mkVar "strandIndex")),
620                                             updateStm,
621                                             statusIf,
622                                             incStrand
623                                           ]))
624    
625                  val local_vars = index_ids
626                        @ [imageDataDecl]
627                        @ imageDataStms
628                        @ strandDecl
629                        @ status
630    
631                  val body = CL.mkBlock(local_vars @ [forStablize])
632                in                in
633                  CL.D_Func(["__kernel"], CL.voidTy, fName, params, body)                  CL.D_Func(["__kernel"], CL.voidTy, fName, params, body)
634                end                end
# Line 653  Line 663 
663                      in                      in
664                        CL.I_Struct[                        CL.I_Struct[
665                            ("name", CL.I_Exp(CL.mkStr name)),                            ("name", CL.I_Exp(CL.mkStr name)),
666                            ("stateSzb", CL.I_Exp(CL.mkSizeof(CL.T_Named(N.strandTy name)))),                            ("stateSzb", CL.I_Exp(CL.mkSizeof(CL.T_Named(RN.strandTy name)))),
667  (*  (*
668                            ("outputSzb", CL.I_Exp(CL.mkSizeof(ToC.trTy outTy))),                            ("outputSzb", CL.I_Exp(CL.mkSizeof(ToC.trTy outTy))),
669  *)  *)
# Line 705  Line 715 
715                    ]));                    ]));
716                  clppDecl (genGlobalStruct (#gpuTy, !globals, RN.globalsTy));                  clppDecl (genGlobalStruct (#gpuTy, !globals, RN.globalsTy));
717                  clppDecl (genImageDataStruct(!imgGlobals,RN.imageDataType));                  clppDecl (genImageDataStruct(!imgGlobals,RN.imageDataType));
718                  clppDecl (genStrandTyDef(#gpuTy, strand));                  clppDecl (genStrandTyDef(#gpuTy, strand,tyName));
719                  clppDecl  (!init_code);                  clppDecl  (!init_code);
720                    clppDecl (genStrandCopy(strand));
721                  List.app clppDecl (!code);                  List.app clppDecl (!code);
722                  clppDecl (genKernelFun (strand, !numDims, globals, imgGlobals));                  clppDecl (genKernelFun (strand, !numDims, globals, imgGlobals));
723                (* Generate the Host C file *)                (* Generate the Host C file *)
# Line 723  Line 734 
734                  cppDecl (genGlobalStruct (#shadowTy, !globals, RN.shadowGlobalsTy));                  cppDecl (genGlobalStruct (#shadowTy, !globals, RN.shadowGlobalsTy));
735  (* FIXME: does this really need to be a global? *)  (* FIXME: does this really need to be a global? *)
736                  cppDecl (CL.D_Var(["static"], globPtrTy, RN.globalsVarName, NONE));                  cppDecl (CL.D_Var(["static"], globPtrTy, RN.globalsVarName, NONE));
737                  cppDecl (genStrandTyDef (#hostTy, strand));                  cppDecl (genStrandTyDef (#shadowTy, strand, tyName));
738                  cppDecl (genStrandPrint strand);                  cppDecl (genStrandPrint strand);
739                  List.app cppDecl (List.rev (!topDecls));                  List.app cppDecl (List.rev (!topDecls));
740                  cppDecl (genGlobalBuffersArgs (!globals,imgGlobals));                  cppDecl (genGlobalBuffersArgs (!globals,imgGlobals));
# Line 762  Line 773 
773                  RunCC.link (basename, ldOpts)                  RunCC.link (basename, ldOpts)
774                end                end
775    
776        end        end (* Program *)
777    
778    (* strands *)    (* strands *)
779      structure Strand =      structure Strand =
# Line 801  Line 812 
812    
813        (* register a strand method *)        (* register a strand method *)
814          fun method (Strand{name, tyName, code,...}, methName, body) = let          fun method (Strand{name, tyName, code,...}, methName, body) = let
815                val fName = concat[name, "_", methName]                val fName = concat[name, "_", MethodName.toString methName]
816                val params = [                val params = [
817                        globalParam (CL.T_Ptr(CL.T_Named tyName), "selfIn"),                        globalParam (CL.T_Ptr(CL.T_Named tyName), "selfIn"),
818                        globalParam (CL.T_Ptr(CL.T_Named tyName), "selfOut"),                        globalParam (CL.T_Ptr(CL.T_Named tyName), "selfOut"),
819                        globalParam (CL.T_Ptr(CL.T_Named (RN.globalsTy)), RN.globalsVarName),                        globalParam (CL.T_Ptr(CL.T_Named (RN.globalsTy)), RN.globalsVarName),
820                        CL.PARAM([],CL.T_Named(RN.imageDataType),RN.globalImageDataName)                        CL.PARAM([],CL.T_Named(RN.imageDataType),RN.globalImageDataName)
821                      ]                      ]
822                val methFn = CL.D_Func([], CL.int32, fName, params, body)                val resTy = (case methName
823                         of MethodName.Update => CL.T_Named "StrandStatus_t"
824                          | MethodName.Stabilize => CL.voidTy
825                        (* end case *))
826                  val methFn = CL.D_Func([], resTy, fName, params, body)
827                in                in
828                  code := methFn :: !code                  code := methFn :: !code
829                end                end

Legend:
Removed from v.1425  
changed lines
  Added in v.1458

root@smlnj-gforge.cs.uchicago.edu
ViewVC Help
Powered by ViewVC 1.0.0