Home My Page Projects Code Snippets Project Openings diderot
Summary Activity Tracker Tasks SCM

SCM Repository

[diderot] Diff of /branches/pure-cfg/src/compiler/cl-target/cl-target.sml
ViewVC logotype

Diff of /branches/pure-cfg/src/compiler/cl-target/cl-target.sml

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1382, Thu Jun 23 20:03:05 2011 UTC revision 1431, Tue Jul 5 16:22:30 2011 UTC
# Line 28  Line 28 
28              | _ => raise Fail(concat["TreeToC.trType(", Ty.toString ty, ")"])              | _ => raise Fail(concat["TreeToC.trType(", Ty.toString ty, ")"])
29            (* end case *))            (* end case *))
30    
31       (* translate TreeIL types to shadow types *)
32        fun convertToShadow (ty, name) = (case ty
33               of Ty.IVecTy 1 => CL.mkAssign(
34                    CL.mkSelect(CL.mkVar(RN.shadowGlaobalsName),name),
35                    CL.mkIndirect(CL.mkVar(RN.globalsVarName), name))
36                | Ty.TensorTy[n]=> CL.mkCall(RN.convertToShadowVec n, [
37                      CL.mkSelect(CL.mkVar(RN.shadowGlaobalsName),name),
38                      CL.mkIndirect(CL.mkVar(RN.globalsVarName), name)
39                    ])
40                | Ty.ImageTy(ImageInfo.ImgInfo{dim, ...}) => CL.mkCall(RN.shadowImageFunc dim, [
41                      CL.mkVar "context",
42                      CL.mkUnOp(CL.%&,CL.mkSelect(CL.mkVar(RN.shadowGlaobalsName),name)),
43                      CL.mkIndirect(CL.mkVar(RN.globalsVarName),name)
44                    ])
45                | Ty.TensorTy[n, m] => CL.mkCall(RN.convertToShadowMat(m,n), [
46                      CL.mkSelect(CL.mkVar(RN.shadowGlaobalsName),name),
47                      CL.mkIndirect(CL.mkVar(RN.globalsVarName), name)
48                    ])
49                | _ => CL.mkAssign(
50                    CL.mkSelect(CL.mkVar(RN.shadowGlaobalsName),name),
51                    CL.mkIndirect(CL.mkVar(RN.globalsVarName), name))
52              (* end case *))
53    
54    (* helper functions for specifying parameters in various address spaces *)    (* helper functions for specifying parameters in various address spaces *)
55      fun clParam (spc, ty, x) = CL.PARAM([spc], ty, x)      fun clParam (spc, ty, x) = CL.PARAM([spc], ty, x)
56      fun globalParam (ty, x) = CL.PARAM(["__global"], ty, x)      fun globalParam (ty, x) = CL.PARAM(["__global"], ty, x)
# Line 35  Line 58 
58      fun localParam (ty, x) = CL.PARAM(["__local"], ty, x)      fun localParam (ty, x) = CL.PARAM(["__local"], ty, x)
59      fun privateParam (ty, x) = CL.PARAM(["__private"], ty, x)      fun privateParam (ty, x) = CL.PARAM(["__private"], ty, x)
60    
61      (* OpenCL global pointer type *)
62        fun globalPtr ty = CL.T_Qual("__global", CL.T_Ptr ty)
63    
64    (* C variable translation *)    (* C variable translation *)
65      structure TrCVar =      structure TrCVar =
66        struct        struct
# Line 76  Line 102 
102    
103    (* variable or field that is mirrored between host and GPU *)    (* variable or field that is mirrored between host and GPU *)
104      type mirror_var = {      type mirror_var = {
105    (* FIXME: perhaps it would be cleaner to just track the TreeIL type of the variable? *)
106              hostTy : CL.ty,             (* variable type on Host (i.e., C type) *)              hostTy : CL.ty,             (* variable type on Host (i.e., C type) *)
107              shadowTy : CL.ty,           (* host-side shadow type of GPU type *)              shadowTy : CL.ty,           (* host-side shadow type of GPU type *)
108              gpuTy : CL.ty,              (* variable's type on GPU (i.e., OpenCL type) *)              gpuTy : CL.ty,              (* variable's type on GPU (i.e., OpenCL type) *)
109                hToS: stm,                  (* the statement that converts the variable to its *)
110                                            (* shadow representation *)
111              var : CL.var                (* variable name *)              var : CL.var                (* variable name *)
112            }            }
113    
# Line 173  Line 202 
202                  hostTy = ToC.trType ty,                  hostTy = ToC.trType ty,
203                  shadowTy = shadowTy ty,                  shadowTy = shadowTy ty,
204                  gpuTy = ToCL.trType ty,                  gpuTy = ToCL.trType ty,
205                    hToS = convertToShadow(ty,name),
206                  var = name                  var = name
207                }                }
208          fun name (ToCL.V(_, name)) = name          fun name (ToCL.V(_, name)) = name
# Line 309  Line 339 
339                              CL.E_Var "size"                              CL.E_Var "size"
340                            ]))))                            ]))))
341                      ]                      ]
             (* create the loop nest for the initially iterations  
               val indexVar = "ix"  
               val strandTy = CL.T_Ptr(CL.T_Named(N.strandTy name))  
               fun mkLoopNest [] = CL.mkBlock(createPrefix @ [  
                       CL.mkDecl(strandTy, "sp",  
                         SOME(CL.I_Exp(  
                           CL.E_Cast(strandTy,  
                           CL.E_Apply(N.inState, [CL.E_Var "wrld", CL.E_Var indexVar]))))),  
                       CL.mkCall(N.strandInit name,  
                         CL.E_Var RN.globalsVarName :: CL.E_Var "sp" :: args),  
                       CL.mkAssign(CL.E_Var indexVar, CL.mkBinOp(CL.E_Var indexVar, CL.#+, CL.E_Int(1, CL.uint32)))  
                     ])  
                 | mkLoopNest ((CL.V(ty, param), lo, hi)::iters) = let  
                     val body = mkLoopNest iters  
                     in  
                       CL.mkFor(  
                         [(ty, param, lo)],  
                         CL.mkBinOp(CL.E_Var param, CL.#<=, hi),  
                         [CL.mkPostOp(CL.E_Var param, CL.^++)],  
                         body)  
                     end  
               val iterCode = [  
                       CL.mkComment["initially"],  
                       CL.mkDecl(CL.uint32, indexVar, SOME(CL.I_Exp(CL.E_Int(0, CL.uint32)))),  
                       mkLoopNest iters  
                     ] *)  
342                val body = CL.mkBlock(                val body = CL.mkBlock(
343                      iterPrefix @                      iterPrefix @
344                      allocCode @                      allocCode @
# Line 346  Line 350 
350                end                end
351    
352        (***** OUTPUT *****)        (***** OUTPUT *****)
353    (* FIXME: I think that the iteration and test for stable strands can be moved into the runtime, which
354     * will make the print function compatible with the C target version.
355     *)
356          fun genStrandPrint (Strand{name, tyName, state, output, code,...}) = let          fun genStrandPrint (Strand{name, tyName, state, output, code,...}) = let
357              (* the print function *)              (* the print function *)
358                val prFnName = concat[name, "Print"]                val prFnName = concat[name, "Print"]
# Line 357  Line 364 
364                              CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "self")                              CL.PARAM([], CL.T_Ptr(CL.T_Named tyName), "self")
365                            ]                            ]
366                      val SOME(ty, x) = !output                      val SOME(ty, x) = !output
367                      val outState = CL.mkSelect(CL.mkSubscript(CL.mkVar "self", CL.E_Var "i"), x)                      val unshadowFields = (case ty
368                               of Ty.IVecTy d =>  [
369                                      CL.mkDecl(ToC.trType ty,x,NONE),
370                                      CL.mkCall(RN.unshadowVec d,[CL.mkVar(x),
371                                        CL.mkSelect(CL.mkSubscript(CL.mkVar "self", CL.E_Var "i"), x)])
372                                    ]
373                                | Ty.TensorTy[d] => [
374                                      CL.mkDecl(ToC.trType ty,x,NONE),
375                                      CL.mkCall(RN.unshadowVec d,[CL.mkVar(x),
376                                        CL.mkSelect(CL.mkSubscript(CL.mkVar "self", CL.E_Var "i"), x)])
377                                    ]
378                                | _ => []
379                              (* end case *))
380                        val outState =  (case ty
381                               of Ty.IVecTy 1 =>CL.mkSelect(CL.mkSubscript(CL.mkVar "self", CL.E_Var "i"), x)
382                                | Ty.TensorTy[] => CL.mkSelect(CL.mkSubscript(CL.mkVar "self", CL.E_Var "i"), x)
383                                | Ty.IVecTy d =>CL.mkVar(x)
384                                | Ty.TensorTy[d] =>CL.mkVar(x)
385                                | _ => raise Fail("genStrand: unsupported output type " ^ Ty.toString ty)
386                              (* end case *))
387                      val prArgs = (case ty                      val prArgs = (case ty
388                             of Ty.IVecTy 1 => [CL.E_Str(!N.gIntFormat ^ "\n"), outState]                             of Ty.IVecTy 1 => [CL.E_Str(!N.gIntFormat ^ "\n"), outState]
389                              | Ty.IVecTy d => let                              | Ty.IVecTy d => let
# Line 381  Line 407 
407                            (* end case *))                            (* end case *))
408                      val forBody = CL.mkIfThen(                      val forBody = CL.mkIfThen(
409                            CL.mkBinOp(CL.mkSubscript(CL.E_Var "status",CL.E_Var "i"), CL.#==, CL.E_Var "DIDEROT_STABILIZE"),                            CL.mkBinOp(CL.mkSubscript(CL.E_Var "status",CL.E_Var "i"), CL.#==, CL.E_Var "DIDEROT_STABILIZE"),
410                            CL.mkBlock([CL.mkCall("fprintf", CL.mkVar "outS" :: prArgs)]))                            CL.mkBlock(unshadowFields@[CL.mkCall("fprintf", CL.mkVar "outS" :: prArgs)]))
411                      val body =  CL.mkFor(                      val body =  CL.mkFor(
412                          [(CL.intTy, "i", CL.mkInt 0)],                          [(CL.intTy, "i", CL.mkInt 0)],
413                          CL.mkBinOp(CL.E_Var "i", CL.#<, CL.E_Var "numStrands"),                          CL.mkBinOp(CL.E_Var "i", CL.#<, CL.E_Var "numStrands"),
# Line 394  Line 420 
420                  prFn                  prFn
421                end                end
422    
423          fun genStrandTyDef (targetTy, Strand{tyName, state,...}) =          fun genStrandTyDef (targetTy, Strand{state,...},tyName) =
424              (* the type declaration for the strand's state struct *)              (* the type declaration for the strand's state struct *)
425                CL.D_StructDef(                CL.D_StructDef(
426                  List.rev (List.map (fn x => (targetTy x, #var x)) (!state)),                  List.rev (List.map (fn x => (targetTy x, #var x)) (!state)),
427                  tyName)                  tyName)
428    
         fun genStrandCopy(Strand{tyName,name,state,...}) = let  
               val params = [  
                     CL.PARAM(["__global"], CL.T_Ptr(CL.T_Named tyName), "selfIn"),  
                     CL.PARAM(["__global"], CL.T_Ptr(CL.T_Named tyName), "selfOut")  
                   ]  
               val assignStms = List.rev(List.map(fn x => CL.mkAssign(CL.mkIndirect(CL.E_Var "selfOut", #var x),                                                                                                                          CL.mkIndirect(CL.E_Var "selfIn", #var x))) (!state))  
               in  
                 CL.D_Func([""], CL.voidTy, RN.strandCopy name, params,CL.mkBlock(assignStms))  
               end  
   
429        (* generates the opencl buffers for the image data *)        (* generates the opencl buffers for the image data *)
430          fun getGlobalDataBuffers (globals, contextVar, errVar) = let          fun getGlobalDataBuffers (globals, imgGlobals, contextVar, errVar) = let
431                val globalBuffErr = "error creating OpenCL global buffer"                val globalBuffErr = "error creating OpenCL global buffer\n"
432                fun errorFn msg = CL.mkIfThen(CL.mkBinOp(CL.E_Var errVar, CL.#!=, CL.E_Var "CL_SUCCESS"),                fun errorFn msg = CL.mkIfThen(CL.mkBinOp(CL.E_Var errVar, CL.#!=, CL.E_Var "CL_SUCCESS"),
433                      CL.mkBlock([CL.mkCall("fprintf",[CL.E_Var "stderr", CL.E_Str msg]),                      CL.mkBlock([CL.mkCall("fprintf",[CL.E_Var "stderr", CL.E_Str msg]),
434                      CL.mkCall("exit",[CL.mkInt 1])]))                      CL.mkCall("exit",[CL.mkInt 1])]))
435                  val shadowTypeDecl =
436                        CL.mkDecl(CL.T_Named(RN.shadowGlobalsTy), RN.shadowGlaobalsName, NONE)
437                  val globalToShadowStms = List.map (fn (x:mirror_var) => #hToS x ) globals
438                val globalBufferDecl = CL.mkDecl(clMemoryTy,concat[RN.globalsVarName,"_cl"],NONE)                val globalBufferDecl = CL.mkDecl(clMemoryTy,concat[RN.globalsVarName,"_cl"],NONE)
439                val globalBuffer = CL.mkAssign(CL.mkVar(concat[RN.globalsVarName,"_cl"]),                val globalBuffer = CL.mkAssign(CL.mkVar(concat[RN.globalsVarName,"_cl"]),
440                      CL.mkApply("clCreateBuffer", [                      CL.mkApply("clCreateBuffer", [
441                          CL.mkVar contextVar,                          CL.mkVar contextVar,
442                          CL.mkVar "CL_MEM_READ_WRITE | CL_MEM_COPY_HOST_PTR",                          CL.mkBinOp(CL.mkVar "CL_MEM_READ_ONLY", CL.#|, CL.mkVar "CL_MEM_COPY_HOST_PTR"),
443                          CL.mkSizeof(CL.T_Named RN.globalsTy),                          CL.mkSizeof(CL.T_Named RN.shadowGlobalsTy),
444                          CL.mkVar RN.globalsVarName,                          CL.mkUnOp(CL.%&,CL.mkVar RN.shadowGlaobalsName),
445                          CL.mkUnOp(CL.%&,CL.mkVar errVar)                          CL.mkUnOp(CL.%&,CL.mkVar errVar)
446                        ]))                        ]))
447                fun genDataBuffers ([],_,_,_) = []                fun genDataBuffers ([],_,_,_) = []
448                  | genDataBuffers ((var,nDims)::globals, contextVar, errVar,errFn) = let                  | genDataBuffers ((var,nDims)::globals, contextVar, errVar,errFn) = let
449                      val hostVar = CL.mkIndirect(CL.mkVar RN.globalsVarName, var)                      val hostVar = CL.mkIndirect(CL.mkVar RN.globalsVarName, var)
450  (* FIXME: use CL constructors to build expressions (not strings) *)                      val size = CL.mkIndirect(hostVar, "dataSzb")
                     fun sizeExp i = CL.mkSubscript(CL.mkIndirect(hostVar, "size"), CL.mkInt i)  
 (* FIXME: there is no reason that images have to be restricted to float elements! *)  
                     val size = CL.mkBinOp(CL.mkSizeof(CL.float), CL.#*, sizeExp 0)  
                     val size = if (nDims > 1)  
                           then CL.mkBinOp(size, CL.#*, sizeExp 1)  
                           else size  
                     val size = if (nDims > 2)  
                           then CL.mkBinOp(size, CL.#*, sizeExp 2)  
                           else size  
451                      in                      in
                       CL.mkDecl(clMemoryTy, RN.addBufferSuffix var ,NONE)::  
452                        CL.mkDecl(clMemoryTy, RN.addBufferSuffixData var ,NONE)::                        CL.mkDecl(clMemoryTy, RN.addBufferSuffixData var ,NONE)::
                       CL.mkAssign(CL.mkVar(RN.addBufferSuffix var),  
                         CL.mkApply("clCreateBuffer", [  
                             CL.mkVar contextVar,  
                             CL.mkVar "CL_MEM_COPY_HOST_PTR",  
                             CL.mkSizeof(CL.T_Named(RN.imageTy nDims)),  
                             hostVar,  
                             CL.mkUnOp(CL.%&,CL.mkVar errVar)  
                           ])) ::  
                       errFn(concat["error in creating ",RN.addBufferSuffix var, " global buffer"]) ::  
453                        CL.mkAssign(CL.mkVar(RN.addBufferSuffixData var),                        CL.mkAssign(CL.mkVar(RN.addBufferSuffixData var),
454                          CL.mkApply("clCreateBuffer", [                          CL.mkApply("clCreateBuffer", [
455                              CL.mkVar contextVar,                              CL.mkVar contextVar,
456                              CL.mkVar "CL_MEM_COPY_HOST_PTR",                              CL.mkVar "CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR",
457                              size,                              size,
458                              CL.mkIndirect(hostVar, "data"),                              CL.mkIndirect(hostVar, "data"),
459                              CL.mkUnOp(CL.%&,CL.mkVar errVar)                              CL.mkUnOp(CL.%&,CL.mkVar errVar)
460                            ])) ::                            ])) ::
461                          errFn(concat["error in creating ",RN.addBufferSuffixData var, " global buffer"]) ::                          errFn(concat["error in creating ",RN.addBufferSuffixData var, " global buffer\n"]) ::
462                          genDataBuffers(globals,contextVar,errVar,errFn)                          genDataBuffers(globals,contextVar,errVar,errFn)
463                      end                      end
464                in                in
465                  globalBufferDecl                  [shadowTypeDecl] @ globalToShadowStms
466                  :: globalBuffer                  @ [globalBufferDecl, globalBuffer,errorFn(globalBuffErr)]
467                  :: errorFn(globalBuffErr)                  @ genDataBuffers(imgGlobals,contextVar,errVar,errorFn)
                 :: genDataBuffers(globals,contextVar,errVar,errorFn)  
468                end                end
469    
470        (* generates the kernel arguments for the image data *)        (* generates the kernel arguments for the image data *)
471          fun genGlobalArguments (globals, count, kernelVar, errVar) = let          fun genGlobalArguments (globals, count, kernelVar, errVar) = let
472                val globalArgErr = "error creating OpenCL global argument"                val globalArgErr = "error creating OpenCL global argument\n"
473                fun errorFn msg = CL.mkIfThen(CL.mkBinOp(CL.E_Var errVar, CL.#!=, CL.E_Var "CL_SUCCESS"),                fun errorFn msg = CL.mkIfThen(CL.mkBinOp(CL.E_Var errVar, CL.#!=, CL.E_Var "CL_SUCCESS"),
474                      CL.mkBlock([CL.mkCall("fprintf",[CL.E_Var "stderr", CL.E_Str msg]),                      CL.mkBlock([CL.mkCall("fprintf",[CL.E_Var "stderr", CL.E_Str msg]),
475                      CL.mkCall("exit",[CL.mkInt 1])]))                      CL.mkCall("exit",[CL.mkInt 1])]))
476                val globalArgument = CL.mkExpStm(CL.mkAssignOp(CL.mkVar errVar,CL.|=,                val globalArgument = CL.mkExpStm(CL.mkAssignOp(CL.mkVar errVar,CL.&=,
477                      CL.mkApply("clSetKernelArg",                      CL.mkApply("clSetKernelArg",
478                        [CL.mkVar kernelVar,                        [CL.mkVar kernelVar,
479                         CL.mkPostOp(CL.E_Var count, CL.^++),                         CL.mkPostOp(CL.E_Var count, CL.^++),
# Line 487  Line 486 
486                          [CL.mkVar kernelVar,                          [CL.mkVar kernelVar,
487                           CL.mkPostOp(CL.E_Var count, CL.^++),                           CL.mkPostOp(CL.E_Var count, CL.^++),
488                           CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),                           CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),
                          CL.mkUnOp(CL.%&,CL.mkVar(RN.addBufferSuffix var))]))) ::  
                          errFn(concat["error in creating ",RN.addBufferSuffix var, " argument"]) ::  
                     CL.mkExpStm(CL.mkAssignOp(CL.mkVar errVar,CL.$=,  
                       CL.mkApply("clSetKernelArg",  
                         [CL.mkVar kernelVar,  
                          CL.mkPostOp(CL.E_Var count, CL.^++),  
                          CL.mkApply("sizeof",[CL.mkVar "cl_mem"]),  
489                           CL.mkUnOp(CL.%&,CL.mkVar(RN.addBufferSuffixData var))]))) ::                           CL.mkUnOp(CL.%&,CL.mkVar(RN.addBufferSuffixData var))]))) ::
490                           errFn(concat["error in creating ",RN.addBufferSuffixData var, " argument"]) ::                           errFn(concat["error in creating ",RN.addBufferSuffixData var, " argument\n"]) ::
491                      genDataArguments (globals,count,kernelVar,errVar,errFn)                      genDataArguments (globals,count,kernelVar,errVar,errFn)
492                in                in
493                 [globalArgument,errorFn(globalArgErr)] @ genDataArguments(globals, count, kernelVar, errVar,errorFn)                  globalArgument :: errorFn globalArgErr ::
494                      genDataArguments(globals, count, kernelVar, errVar,errorFn)
495                end                end
496    
497        (* generates the globals buffers and arguments function *)        (* generates the globals buffers and arguments function *)
498          fun genGlobalBuffersArgs imgGlobals = let          fun genGlobalBuffersArgs (globals,imgGlobals) = let
499              (* Delcare opencl setup objects *)              (* Delcare opencl setup objects *)
500                val errVar = "err"                val errVar = "err"
501                val imgDataSizeVar = "image_dataSize"                val imgDataSizeVar = "image_dataSize"
# Line 512  Line 505 
505                        CL.PARAM([],CL.T_Named("cl_command_queue"), "cmdQ"),                        CL.PARAM([],CL.T_Named("cl_command_queue"), "cmdQ"),
506                        CL.PARAM([],CL.T_Named("int"), "argStart")                        CL.PARAM([],CL.T_Named("int"), "argStart")
507                      ]                      ]
508                val clGlobalBuffers = getGlobalDataBuffers(!imgGlobals, "context", errVar)                val clGlobalBuffers = getGlobalDataBuffers(globals,!imgGlobals, "context", errVar)
509                val clGlobalArguments = genGlobalArguments(!imgGlobals, "argStart", "kernel", errVar)                val clGlobalArguments = genGlobalArguments(!imgGlobals, "argStart", "kernel", errVar)
510              (* Body put all the statments together *)              (* Body put all the statments together *)
511                val body = CL.mkDecl(clIntTy, errVar, SOME(CL.I_Exp(CL.mkInt 0)))                val body = CL.mkDecl(clIntTy, errVar, SOME(CL.I_Exp(CL.mkInt 0)))
# Line 523  Line 516 
516    
517        (* generate the data and global parameters *)        (* generate the data and global parameters *)
518          fun genKeneralGlobalParams ((name,tyname)::rest) =          fun genKeneralGlobalParams ((name,tyname)::rest) =
               globalParam (CL.T_Ptr(CL.T_Named (RN.imageTy tyname)), RN.addBufferSuffix name) ::  
519                globalParam (CL.T_Ptr(CL.voidTy), RN.addBufferSuffixData name) ::                globalParam (CL.T_Ptr(CL.voidTy), RN.addBufferSuffixData name) ::
520                genKeneralGlobalParams rest                genKeneralGlobalParams rest
521            | genKeneralGlobalParams [] = []            | genKeneralGlobalParams [] = []
522    
       (*generate code for intilizing kernel global data *)  
 (* FIXME: should use List.map here *)  
         fun initGlobalImages ((name, tyname)::rest) =  
               CL.mkAssign(  
                 CL.mkIndirect(CL.E_Var RN.globalsVarName, name),  
                 CL.mkVar (RN.addBufferSuffix name)) ::  
               CL.mkAssign(  
                 CL.mkIndirect(CL.mkIndirect(CL.E_Var RN.globalsVarName, name), "data"),  
                 CL.mkVar (RN.addBufferSuffixData name)) ::  
               initGlobalImages rest  
           | initGlobalImages [] = []  
   
523        (* generate the main kernel function for the .cl file *)        (* generate the main kernel function for the .cl file *)
524          fun genKernelFun (strand, nDims, globals, imgGlobals) = let          fun genKernelFun (strand, nDims, globals, imgGlobals) = let
525                val Strand{name, tyName, state, output, code,...} = strand                val Strand{name, tyName, state, output, code,...} = strand
# Line 547  Line 527 
527                val inState = "strand_in"                val inState = "strand_in"
528                val outState = "strand_out"                val outState = "strand_out"
529                val tempVar = "tmp"                val tempVar = "tmp"
530                  val sizeParams = if nDims = 1 then
531                            []
532                        else if nDims = 2 then
533                            [CL.PARAM([], CL.intTy, "width")]
534                        else
535                            [CL.PARAM([], CL.intTy, "width"),CL.PARAM([], CL.intTy, "height")]
536                val params = [                val params = [
537                        CL.PARAM(["__global"], CL.T_Ptr(CL.T_Named tyName), "selfIn"),                        globalParam(CL.T_Ptr(CL.T_Named tyName), "selfIn"),
538                        CL.PARAM(["__global"], CL.T_Ptr(CL.T_Named tyName), "selfOut"),                        globalParam(CL.T_Ptr(CL.T_Named tyName), "selfOut"),
539                        CL.PARAM(["__global"], CL.T_Ptr(CL.T_Num(RawTypes.RT_UInt8)), "strandStatus"),                        globalParam(CL.T_Ptr(CL.T_Num(RawTypes.RT_UInt8)), "strandStatus")] @
540                        CL.PARAM(["__global"], CL.intTy, "width"),                        sizeParams @
541                        CL.PARAM(["__global"], globPtrTy, RN.globalsVarName)                        [globalParam(globPtrTy, RN.globalsVarName)] @
542                      ] @ genKeneralGlobalParams(!imgGlobals)                        genKeneralGlobalParams(!imgGlobals)
543                val thread_ids = if nDims = 1                val thread_ids = if nDims = 1
544                        then [                        then [
545                            CL.mkDecl(CL.intTy, "x",                            CL.mkDecl(CL.intTy, "x",
# Line 562  Line 548 
548                      else if nDims = 2                      else if nDims = 2
549                        then [                        then [
550                            CL.mkDecl(CL.intTy, "x",                            CL.mkDecl(CL.intTy, "x",
551                              SOME(CL.I_Exp(CL.mkApply(RN.getGlobalThreadId,[CL.mkInt 0])))),                              SOME(CL.I_Exp(CL.mkApply(RN.getGlobalThreadId,[CL.mkInt 1])))),
552                              CL.mkDecl(CL.intTy, "y",
553                                SOME(CL.I_Exp(CL.mkApply(RN.getGlobalThreadId,[CL.mkInt 0]))))
554                            ]
555                          else [
556                              CL.mkDecl(CL.intTy, "x",
557                                SOME(CL.I_Exp(CL.mkApply(RN.getGlobalThreadId,[CL.mkInt 1])))),
558                            CL.mkDecl(CL.intTy, "y",                            CL.mkDecl(CL.intTy, "y",
559                              SOME(CL.I_Exp(CL.mkApply(RN.getGlobalThreadId,[CL.mkInt 1]))))                              SOME(CL.I_Exp(CL.mkApply(RN.getGlobalThreadId,[CL.mkInt 0])))),
560                              CL.mkDecl(CL.intTy, "z",
561                                SOME(CL.I_Exp(CL.mkApply(RN.getGlobalThreadId,[CL.mkInt 2]))))
562                          ]                          ]
                     else raise Fail "nDims > 2"  
563                val strandDecl = [                val strandDecl = [
564                        CL.mkDecl(CL.T_Ptr(CL.T_Named (concat["__global ",tyName])), inState, NONE),                        CL.mkAttrDecl(["__global"], CL.T_Ptr(CL.T_Named tyName), inState, NONE),
565                        CL.mkDecl(CL.T_Ptr(CL.T_Named (concat["__global ",tyName])), outState, NONE),                        CL.mkAttrDecl(["__global"], CL.T_Ptr(CL.T_Named tyName), outState, NONE),
566                        CL.mkDecl(CL.T_Ptr(CL.T_Named (concat["__global ",tyName])), tempVar, NONE)                        CL.mkAttrDecl(["__global"], CL.T_Ptr(CL.T_Named tyName), tempVar, NONE)
567                      ]                      ]
568                val barrierCode = CL.mkCall(RN.strandCopy name, [CL.E_Var outState, CL.E_Var inState])                val imageDataDecl = CL.mkDecl(CL.T_Named(RN.imageDataType),RN.globalImageDataName,NONE)
569                  val imageDataStms = List.map (fn (x,_) =>
570                      CL.mkAssign(CL.mkSelect(CL.mkVar(RN.globalImageDataName),RN.imageDataName x),
571                                  CL.mkVar(RN.addBufferSuffixData x))) (!imgGlobals)
572                  val barrierCode = CL.mkIfThen(CL.mkBinOp(CL.E_Var "status",CL.#==,CL.E_Var "DIDEROT_ACTIVE"),
573                                     CL.mkBlock ([CL.mkAssign(CL.E_Var tempVar, CL.E_Var inState),
574                                     CL.mkAssign(CL.E_Var inState, CL.E_Var outState),
575                                     CL.mkAssign(CL.E_Var outState, CL.E_Var tempVar)]))
576                val barrierStm = CL.mkCall("barrier",[CL.E_Var "CLK_LOCAL_MEM_FENCE"])                val barrierStm = CL.mkCall("barrier",[CL.E_Var "CLK_LOCAL_MEM_FENCE"])
577                val index = if nDims = 1 then                val index = if nDims = 1 then
578                          CL.mkStr "x"                          CL.mkVar "x"
579                      else                      else if nDims = 2 then
580                          CL.mkBinOp(                          CL.mkBinOp(
581                              CL.mkBinOp(CL.mkVar "x", CL.#*, CL.mkVar "width"), CL.#+, CL.mkVar "y")                              CL.mkBinOp(CL.mkVar "y", CL.#*, CL.mkVar "width"), CL.#+, CL.mkVar "x")
582                        else
583                val strandObjects =                         CL.mkBinOp(CL.mkBinOp(CL.mkBinOp(
584                       [ CL.mkAssign(CL.mkVar inState,  CL.mkBinOp(CL.mkVar "selfIn",CL.#+,index)),                              CL.mkBinOp(CL.mkVar "z", CL.#*, CL.mkVar "width"),CL.#*, CL.mkVar "height"), CL.#+,
585                                CL.mkBinOp(CL.mkVar "y",CL.#*,CL.mkVar "height")),CL.#+,CL.mkVar "x")
586    
587                  val args = (case nDims
588                         of 1 => [CL.mkVar "x"]
589                          | 2 => [CL.mkVar "x", CL.mkVar "y"]
590                          | 3 => [CL.mkVar "x", CL.mkVar "y", CL.mkVar "z"]
591                        (* end case *))
592                  val strandObjects = [
593                          CL.mkAssign(CL.mkVar inState,  CL.mkBinOp(CL.mkVar "selfIn",CL.#+,index)),
594                         CL.mkAssign(CL.mkVar outState, CL.mkBinOp(CL.mkVar "selfOut",CL.#+,index))                         CL.mkAssign(CL.mkVar outState, CL.mkBinOp(CL.mkVar "selfOut",CL.#+,index))
595                       ]                       ]
596                  val stabalizeStm = CL.mkAssign(
597                  val stabalizeStm = CL.mkAssign(CL.mkSubscript(CL.mkVar "strandStatus",index),                      CL.mkSubscript(CL.mkVar "strandStatus",index),
598                                                                          CL.E_Var "status")                                                                          CL.E_Var "status")
599                val status = CL.mkDecl(CL.intTy, "status", SOME(CL.I_Exp(CL.mkSubscript(CL.mkVar "strandStatus",index))))                val status = CL.mkDecl(CL.intTy, "status", SOME(CL.I_Exp(CL.mkSubscript(CL.mkVar "strandStatus",index))))
600                val strandInitStm = CL.mkCall(RN.strandInit name, [                val strandInitStm = CL.mkCall(RN.strandInit name,
601                        CL.E_Var RN.globalsVarName,                        CL.mkVar RN.globalsVarName :: CL.mkVar inState :: args)
                       CL.E_Var outState,  
                       CL.E_Var "x",  
 (* FIXME: if nDims = 1, then "y" is not defined! the arguments to this call should really come from  
  * the initially code!  
  *)  
                       CL.E_Var "y"])  
602                val local_vars = thread_ids                val local_vars = thread_ids
603                      @ initGlobalImages(!imgGlobals)                      @ [imageDataDecl]
604                        @ imageDataStms
605                      @ strandDecl                      @ strandDecl
606                      @ strandObjects                      @ strandObjects
607                      @ [strandInitStm,status]                      @ [strandInitStm,status]
608                val while_exp = CL.mkBinOp(CL.mkVar "status",CL.#==, CL.mkVar RN.kActive)                val while_exp = CL.mkBinOp(CL.mkVar "status",CL.#==, CL.mkVar RN.kActive)
609                val whileBody = CL.mkBlock ([barrierCode,barrierStm] @ [                val whileBody = CL.mkBlock ([
610                        CL.mkAssign(CL.mkVar "status",                        CL.mkAssign(CL.mkVar "status",
611                          CL.mkApply(RN.strandUpdate name,                          CL.mkApply(RN.strandUpdate name,
612                            [CL.mkVar inState, CL.mkVar outState,CL.E_Var RN.globalsVarName]))] )                            [CL.mkVar inState,
613                               CL.mkVar outState,
614                               CL.mkVar RN.globalsVarName,
615                               CL.mkVar RN.globalImageDataName]))] @ [barrierCode,barrierStm] )
616                val whileBlock = [CL.mkWhile(while_exp, whileBody)]                val whileBlock = [CL.mkWhile(while_exp, whileBody)]
617                val body = CL.mkBlock(local_vars @ whileBlock @ [stabalizeStm])                val body = CL.mkBlock(local_vars @ whileBlock @ [stabalizeStm])
618                in                in
# Line 619  Line 626 
626                  CL.D_StructDef(globs, tyName)                  CL.D_StructDef(globs, tyName)
627                end                end
628    
629          (* generate a global structure type definition from the image data of the image globals *)
630            fun genImageDataStruct (imgGlobals, tyName) = let
631                  val globs = List.map
632                        (fn (x, _) => (globalPtr CL.voidTy, RN.imageDataName x))
633                          imgGlobals
634                  in
635                    CL.D_StructDef(globs, tyName)
636                  end
637    
638          fun genGlobals (declFn, targetTy, globals) = let          fun genGlobals (declFn, targetTy, globals) = let
639                fun doVar (x : mirror_var) = declFn (CL.D_Var([], targetTy x, #var x, NONE))                fun doVar (x : mirror_var) = declFn (CL.D_Var([], targetTy x, #var x, NONE))
640                in                in
# Line 633  Line 649 
649                      in                      in
650                        CL.I_Struct[                        CL.I_Struct[
651                            ("name", CL.I_Exp(CL.mkStr name)),                            ("name", CL.I_Exp(CL.mkStr name)),
652                            ("stateSzb", CL.I_Exp(CL.mkSizeof(CL.T_Named(N.strandTy name)))),                            ("stateSzb", CL.I_Exp(CL.mkSizeof(CL.T_Named(RN.strandTy name)))),
653  (*  (*
654                            ("outputSzb", CL.I_Exp(CL.mkSizeof(ToC.trTy outTy))),                            ("outputSzb", CL.I_Exp(CL.mkSizeof(ToC.trTy outTy))),
655  *)  *)
# Line 684  Line 700 
700                      "#include \"Diderot/cl-diderot.h\""                      "#include \"Diderot/cl-diderot.h\""
701                    ]));                    ]));
702                  clppDecl (genGlobalStruct (#gpuTy, !globals, RN.globalsTy));                  clppDecl (genGlobalStruct (#gpuTy, !globals, RN.globalsTy));
703                  clppDecl (genStrandTyDef(#gpuTy, strand));                  clppDecl (genImageDataStruct(!imgGlobals,RN.imageDataType));
704                    clppDecl (genStrandTyDef(#gpuTy, strand,tyName));
705                  clppDecl  (!init_code);                  clppDecl  (!init_code);
                 clppDecl  (genStrandCopy(strand));  
706                  List.app clppDecl (!code);                  List.app clppDecl (!code);
707                  clppDecl (genKernelFun (strand, !numDims, globals, imgGlobals));                  clppDecl (genKernelFun (strand, !numDims, globals, imgGlobals));
708                (* Generate the Host C file *)                (* Generate the Host C file *)
# Line 703  Line 719 
719                  cppDecl (genGlobalStruct (#shadowTy, !globals, RN.shadowGlobalsTy));                  cppDecl (genGlobalStruct (#shadowTy, !globals, RN.shadowGlobalsTy));
720  (* FIXME: does this really need to be a global? *)  (* FIXME: does this really need to be a global? *)
721                  cppDecl (CL.D_Var(["static"], globPtrTy, RN.globalsVarName, NONE));                  cppDecl (CL.D_Var(["static"], globPtrTy, RN.globalsVarName, NONE));
722                  cppDecl (genStrandTyDef (#hostTy, strand));                  cppDecl (genStrandTyDef (#shadowTy, strand, tyName));
723                  cppDecl (genStrandPrint strand);                  cppDecl (genStrandPrint strand);
724                  List.app cppDecl (List.rev (!topDecls));                  List.app cppDecl (List.rev (!topDecls));
725                  cppDecl (genGlobalBuffersArgs imgGlobals);                  cppDecl (genGlobalBuffersArgs (!globals,imgGlobals));
726                  List.app (fn strand => cppDecl (genStrandDesc strand)) strands;                  List.app (fn strand => cppDecl (genStrandDesc strand)) strands;
727                  genStrandTable (cppDecl, strands);                  genStrandTable (cppDecl, strands);
728                  cppDecl (!initially);                  cppDecl (!initially);
# Line 742  Line 758 
758                  RunCC.link (basename, ldOpts)                  RunCC.link (basename, ldOpts)
759                end                end
760    
761        end        end (* Program *)
762    
763    (* strands *)    (* strands *)
764      structure Strand =      structure Strand =
# Line 785  Line 801 
801                val params = [                val params = [
802                        globalParam (CL.T_Ptr(CL.T_Named tyName), "selfIn"),                        globalParam (CL.T_Ptr(CL.T_Named tyName), "selfIn"),
803                        globalParam (CL.T_Ptr(CL.T_Named tyName), "selfOut"),                        globalParam (CL.T_Ptr(CL.T_Named tyName), "selfOut"),
804                        globalParam (CL.T_Ptr(CL.T_Named (RN.globalsTy)), RN.globalsVarName)                        globalParam (CL.T_Ptr(CL.T_Named (RN.globalsTy)), RN.globalsVarName),
805                          CL.PARAM([],CL.T_Named(RN.imageDataType),RN.globalImageDataName)
806                      ]                      ]
807                val methFn = CL.D_Func([], CL.int32, fName, params, body)                val methFn = CL.D_Func([], CL.int32, fName, params, body)
808                in                in

Legend:
Removed from v.1382  
changed lines
  Added in v.1431

root@smlnj-gforge.cs.uchicago.edu
ViewVC Help
Powered by ViewVC 1.0.0