Home My Page Projects Code Snippets Project Openings SML/NJ
Summary Activity Forums Tracker Lists Tasks Docs Surveys News SCM Files

SCM Repository

[smlnj] Annotation of /sml/trunk/src/MLRISC/ppc/mltree/ppc.sml
ViewVC logotype

Annotation of /sml/trunk/src/MLRISC/ppc/mltree/ppc.sml

Parent Directory Parent Directory | Revision Log Revision Log


Revision 1347 - (view) (download)

1 : jhr 1117 (* ppc.sml
2 :     *
3 :     * COPYRIGHT (c) 2002 Bell Labs, Lucent Technologies
4 :     *
5 : monnier 411 * I've substantially modified this code generator to support the new MLTREE.
6 :     * Please see the file README.hppa for the ugly details.
7 :     *
8 :     * -- Allen
9 :     *)
10 :    
11 : monnier 247 functor PPC
12 :     (structure PPCInstr : PPCINSTR
13 :     structure PseudoInstrs : PPC_PSEUDO_INSTR
14 : george 933 where I = PPCInstr
15 :     structure ExtensionComp : MLTREE_EXTENSION_COMP
16 :     where I = PPCInstr and T = PPCInstr.T
17 : monnier 411
18 :     (*
19 :     * Support 64 bit mode?
20 :     * This should be set to false for SML/NJ
21 :     *)
22 :     val bit64mode : bool
23 :    
24 :     (*
25 :     * Cost of multiplication in cycles
26 :     *)
27 :     val multCost : int ref
28 : george 933 ) =
29 : monnier 247 struct
30 : monnier 411 structure I = PPCInstr
31 : leunga 775 structure T = I.T
32 : george 984 structure TS = ExtensionComp.TS
33 : monnier 411 structure C = PPCInstr.C
34 : george 889 structure CB = CellsBasis
35 : monnier 247 structure W32 = Word32
36 : leunga 744 structure A = MLRiscAnnotations
37 : george 909 structure CFG = ExtensionComp.CFG
38 : monnier 247
39 : monnier 411 fun error msg = MLRiscErrorMsg.error("PPC",msg)
40 : monnier 247
41 : george 984 type instrStream = (I.instruction, CB.CellSet.cellset, CFG.cfg) TS.stream
42 :     type mltreeStream = (T.stm, T.mlrisc list, CFG.cfg) TS.stream
43 : george 545
44 : george 761
45 : leunga 624 val (intTy,naturalWidths) = if bit64mode then (64,[32,64]) else (32,[32])
46 : monnier 411 structure Gen = MLTreeGen
47 :     (structure T = T
48 : jhr 1117 structure Cells = C
49 : leunga 624 val intTy = intTy
50 :     val naturalWidths = naturalWidths
51 : monnier 429 datatype rep = SE | ZE | NEITHER
52 :     val rep = NEITHER
53 : monnier 411 )
54 : monnier 247
55 : monnier 411 (*
56 :     * Special instructions
57 :     *)
58 :     fun MTLR r = I.MTSPR{rs=r, spr=C.lr}
59 :     fun MFLR r = I.MFSPR{rt=r, spr=C.lr}
60 : george 889 val CR0 = C.Reg CB.CC 0
61 : monnier 411 val RET = I.BCLR{bo=I.ALWAYS, bf=CR0, bit=I.LT, LK=false, labels=[]}
62 :     fun SLLI32{r,i,d} =
63 :     I.ROTATEI{oper=I.RLWINM,ra=d,rs=r,sh=I.ImmedOp i,mb=0,me=SOME(31-i)}
64 : george 1205 fun SRLI32{r,i,d} =
65 :     I.ROTATEI{oper=I.RLWINM,ra=d,rs=r,sh=I.ImmedOp(Int.mod(32-i,32)),mb=i,me=SOME(31)}
66 : george 1009 fun COPY{dst, src, tmp} =
67 :     I.COPY{k=CB.GP, sz=32, dst=dst, src=src, tmp=tmp}
68 :     fun FCOPY{dst, src, tmp} =
69 :     I.COPY{k=CB.FP, sz=64, dst=dst, src=src, tmp=tmp}
70 : monnier 247
71 : monnier 411 (*
72 :     * Integer multiplication
73 :     *)
74 :     functor Multiply32 = MLTreeMult
75 :     (structure I = I
76 :     structure T = T
77 : george 889 structure CB = CellsBasis
78 : monnier 411 val intTy = 32
79 : george 889 type arg = {r1:CB.cell,r2:CB.cell,d:CB.cell}
80 :     type argi = {r:CB.cell,i:int,d:CB.cell}
81 : monnier 247
82 : george 1009 fun mov{r,d} = COPY{dst=[d],src=[r],tmp=NONE}
83 : george 1003 fun add{r1,r2,d}= I.arith{oper=I.ADD,ra=r1,rb=r2,rt=d,Rc=false,OE=false}
84 :     fun slli{r,i,d} = [I.INSTR(SLLI32{r=r,i=i,d=d})]
85 :     fun srli{r,i,d} = [I.INSTR(SRLI32{r=r,i=i,d=d})]
86 :     fun srai{r,i,d} = [I.arithi{oper=I.SRAWI,rt=d,ra=r,im=I.ImmedOp i}]
87 : monnier 411 )
88 : monnier 247
89 : monnier 411 structure Mulu32 = Multiply32
90 :     (val trapping = false
91 :     val multCost = multCost
92 : george 1003 fun addv{r1,r2,d}=[I.arith{oper=I.ADD,ra=r1,rb=r2,rt=d,Rc=false,OE=false}]
93 :     fun subv{r1,r2,d}=[I.arith{oper=I.SUBF,ra=r2,rb=r1,rt=d,Rc=false,OE=false}]
94 : monnier 411 val sh1addv = NONE
95 :     val sh2addv = NONE
96 :     val sh3addv = NONE
97 :     )
98 : monnier 429 (val signed = false)
99 : monnier 247
100 : blume 1183 structure Muls32 = Multiply32
101 :     (val trapping = false
102 :     val multCost = multCost
103 :     fun addv{r1,r2,d}=[I.arith{oper=I.ADD,ra=r1,rb=r2,rt=d,Rc=false,OE=false}]
104 :     fun subv{r1,r2,d}=[I.arith{oper=I.SUBF,ra=r2,rb=r1,rt=d,Rc=false,OE=false}]
105 :     val sh1addv = NONE
106 :     val sh2addv = NONE
107 :     val sh3addv = NONE
108 :     )
109 :     (val signed = true)
110 :    
111 : monnier 411 structure Mult32 = Multiply32
112 :     (val trapping = true
113 :     val multCost = multCost
114 :     fun addv{r1,r2,d} = error "Mult32.addv"
115 :     fun subv{r1,r2,d} = error "Mult32.subv"
116 :     val sh1addv = NONE
117 :     val sh2addv = NONE
118 :     val sh3addv = NONE
119 :     )
120 : monnier 429 (val signed = true)
121 : monnier 247
122 : monnier 411 fun selectInstructions
123 : george 1003 (TS.S.STREAM{emit=emitInstruction,comment,getAnnotations,
124 : monnier 469 defineLabel,entryLabel,pseudoOp,annotation,
125 : george 1003 beginCluster,endCluster,exitBlock,...}) =
126 :     let
127 :     val emit = emitInstruction o I.INSTR
128 :    
129 :     (* mark an instruction with annotations *)
130 : george 1009 fun annotate(instr,[]) = instr
131 :     | annotate(instr,a::an) = annotate(I.ANNOTATION{i=instr,a=a},an)
132 :     fun mark'(instr, an) = emitInstruction(annotate(instr, an))
133 :     fun mark(instr,an) = emitInstruction(annotate(I.INSTR instr,an))
134 : monnier 247
135 : monnier 411 (* Label where trap is generated.
136 :     * For overflow trapping instructions, we generate a branch
137 :     * to this label.
138 :     *)
139 :     val trapLabel : Label.label option ref = ref NONE
140 : leunga 744 val zeroR = C.r0
141 : monnier 247
142 : monnier 411 val newReg = C.newReg
143 :     val newFreg = C.newFreg
144 : george 889 val newCCreg = C.newCell CB.CC
145 : monnier 247
146 : george 761
147 :     fun LT (x,y) = T.I.LT(32, x, y)
148 :     fun LE (x,y) = T.I.LE(32, x, y)
149 :     fun toInt mi = T.I.toInt(32, mi)
150 :     fun LI i = T.I.fromInt(32, i)
151 : monnier 247
152 : mblume 1347 fun signed16 mi = LE(~0x8000, mi) andalso LT(mi, 0x8000)
153 :     fun signed12 mi = LE(~0x800, mi) andalso LT(mi, 0x800)
154 :     fun unsigned16 mi = LE(0, mi) andalso LT(mi, 0x10000)
155 :     fun unsigned5 mi = LE(0, mi) andalso LT(mi, 32)
156 :     fun unsigned6 mi = LE(0, mi) andalso LT(mi, 64)
157 : george 761
158 : monnier 411 fun move(rs,rd,an) =
159 : george 889 if CB.sameColor(rs,rd) then ()
160 : george 1009 else mark'(COPY{dst=[rd],src=[rs],tmp=NONE},an)
161 : monnier 247
162 : monnier 411 fun fmove(fs,fd,an) =
163 : george 889 if CB.sameColor(fs,fd) then ()
164 : george 1009 else mark'(FCOPY{dst=[fd],src=[fs],tmp=NONE},an)
165 : monnier 247
166 : monnier 411 fun ccmove(ccs,ccd,an) =
167 : george 889 if CB.sameColor(ccd,ccs) then () else mark(I.MCRF{bf=ccd, bfa=ccs},an)
168 : monnier 247
169 : monnier 411 fun copy(dst, src, an) =
170 : george 1009 mark'(COPY{dst=dst, src=src,
171 :     tmp=case dst of [_] => NONE
172 : monnier 411 | _ => SOME(I.Direct(newReg()))},an)
173 :     fun fcopy(dst, src, an) =
174 : george 1009 mark'(FCOPY{dst=dst, src=src,
175 :     tmp=case dst of [_] => NONE
176 :     | _ => SOME(I.FDirect(newFreg()))},an)
177 : monnier 411
178 :     fun emitBranch{bo, bf, bit, addr, LK} =
179 : george 909 let val fallThrLab = Label.anon()
180 : leunga 775 val fallThrOpnd = I.LabelOp(T.LABEL fallThrLab)
181 : monnier 247 in
182 : monnier 411 emit(I.BC{bo=bo, bf=bf, bit=bit, addr=addr, LK=LK, fall=fallThrOpnd});
183 :     defineLabel fallThrLab
184 : monnier 247 end
185 :    
186 : george 761 fun split n = let
187 :     val wtoi = Word32.toIntX
188 :     val w = T.I.toWord32(32, n)
189 :     val hi = W32.~>>(w, 0w16)
190 :     val lo = W32.andb(w, 0w65535)
191 :     val (high, low) =
192 :     if W32.<(lo,0w32768) then (hi, lo) else (hi+0w1, lo-0w65536)
193 :     in
194 :     (wtoi high, wtoi low)
195 :     end
196 : monnier 247
197 : monnier 411 fun loadImmedHiLo(0, lo, rt, an) =
198 : leunga 744 mark(I.ARITHI{oper=I.ADDI, rt=rt, ra=zeroR, im=I.ImmedOp lo}, an)
199 : monnier 411 | loadImmedHiLo(hi, lo, rt, an) =
200 : leunga 744 (mark(I.ARITHI{oper=I.ADDIS, rt=rt, ra=zeroR, im=I.ImmedOp hi}, an);
201 : monnier 411 if lo = 0 then ()
202 :     else emit(I.ARITHI{oper=I.ADDI, rt=rt, ra=rt, im=I.ImmedOp lo}))
203 : monnier 247
204 : monnier 411 fun loadImmed(n, rt, an) =
205 :     if signed16 n then
206 : george 761 mark(I.ARITHI{oper=I.ADDI, rt=rt, ra=zeroR, im=I.ImmedOp(toInt(n))}, an)
207 : monnier 411 else let val (hi, lo) = split n
208 : george 761 in loadImmedHiLo(hi, lo, rt, an)
209 :     end
210 : monnier 247
211 : leunga 775 fun loadLabexp(lexp, rt, an) =
212 : leunga 744 mark(I.ARITHI{oper=I.ADDI, rt=rt, ra=zeroR, im=I.LabelOp lexp}, an)
213 : monnier 411
214 :     fun immedOpnd range (e1, e2 as T.LI i) =
215 : george 761 (expr e1, if range i then I.ImmedOp(toInt i) else I.RegOp(expr e2))
216 : leunga 775 | immedOpnd _ (e1, x as T.CONST _) = (expr e1, I.LabelOp x)
217 :     | immedOpnd _ (e1, x as T.LABEL _) = (expr e1, I.LabelOp x)
218 :     | immedOpnd _ (e1, T.LABEXP lexp) = (expr e1, I.LabelOp lexp)
219 : monnier 411 | immedOpnd _ (e1, e2) = (expr e1, I.RegOp(expr e2))
220 :    
221 :     and commImmedOpnd range (e1 as T.LI _, e2) =
222 :     immedOpnd range (e2, e1)
223 :     | commImmedOpnd range (e1 as T.CONST _, e2) =
224 :     immedOpnd range (e2, e1)
225 :     | commImmedOpnd range (e1 as T.LABEL _, e2) =
226 :     immedOpnd range (e2, e1)
227 : leunga 775 | commImmedOpnd range (e1 as T.LABEXP _, e2) =
228 :     immedOpnd range (e2, e1)
229 : monnier 411 | commImmedOpnd range arg = immedOpnd range arg
230 :    
231 :     and eCommImm range (oper, operi, e1, e2, rt, an) =
232 :     (case commImmedOpnd range (e1, e2)
233 :     of (ra, I.RegOp rb) =>
234 :     mark(I.ARITH{oper=oper, ra=ra, rb=rb, rt=rt, Rc=false, OE=false},an)
235 :     | (ra, opnd) =>
236 :     mark(I.ARITHI{oper=operi, ra=ra, im=opnd, rt=rt},an)
237 :     (*esac*))
238 :    
239 :     (*
240 :     * Compute a base/displacement effective address
241 :     *)
242 :     and addr(size,T.ADD(_, e, T.LI i)) =
243 :     let val ra = expr e
244 : george 761 in if size i then (ra, I.ImmedOp(toInt i)) else
245 : monnier 411 let val (hi, lo) = split i
246 :     val tmpR = newReg()
247 :     in emit(I.ARITHI{oper=I.ADDIS, rt=tmpR, ra=ra, im=I.ImmedOp hi});
248 :     (tmpR, I.ImmedOp lo)
249 :     end
250 :     end
251 :     | addr(size,T.ADD(ty, T.LI i, e)) = addr(size,T.ADD(ty, e, T.LI i))
252 :     | addr(size,exp as T.SUB(ty, e, T.LI i)) =
253 : george 761 (addr(size,T.ADD(ty, e, T.LI (T.I.NEGT(32, i))))
254 : monnier 411 handle Overflow => (expr exp, I.ImmedOp 0))
255 :     | addr(size,T.ADD(_, e1, e2)) = (expr e1, I.RegOp (expr e2))
256 :     | addr(size,e) = (expr e, I.ImmedOp 0)
257 :    
258 : george 545 (* convert mlrisc to cellset: *)
259 :     and cellset mlrisc =
260 : george 901 let val addCCReg = CB.CellSet.add
261 : george 545 fun g([],acc) = acc
262 :     | g(T.GPR(T.REG(_,r))::regs,acc) = g(regs,C.addReg(r,acc))
263 :     | g(T.FPR(T.FREG(_,f))::regs,acc) = g(regs,C.addFreg(f,acc))
264 :     | g(T.CCR(T.CC(_,cc))::regs,acc) = g(regs,addCCReg(cc,acc))
265 :     | g(T.CCR(T.FCC(_,cc))::regs,acc) = g(regs,addCCReg(cc,acc))
266 :     | g(_::regs, acc) = g(regs, acc)
267 :     in g(mlrisc, C.empty) end
268 :    
269 : monnier 411 (*
270 :     * Translate a statement, and annotate it
271 :     *)
272 :     and stmt(T.MV(_, rd, e),an) = doExpr(e, rd, an)
273 :     | stmt(T.FMV(_, fd, e),an) = doFexpr(e, fd, an)
274 :     | stmt(T.CCMV(ccd, ccexp), an) = doCCexpr(ccexp, ccd, an)
275 :     | stmt(T.COPY(_, dst, src), an) = copy(dst, src, an)
276 :     | stmt(T.FCOPY(_, dst, src), an) = fcopy(dst, src, an)
277 : leunga 775 | stmt(T.JMP(T.LABEXP lexp, labs),an) =
278 : monnier 411 mark(I.B{addr=I.LabelOp lexp, LK=false},an)
279 : leunga 775 | stmt(T.JMP(x as (T.LABEL _ | T.CONST _), labs),an) =
280 :     mark(I.B{addr=I.LabelOp x, LK=false},an)
281 : leunga 744 | stmt(T.JMP(rexp, labs),an) =
282 : monnier 411 let val rs = expr(rexp)
283 :     in emit(MTLR(rs));
284 :     mark(I.BCLR{bo=I.ALWAYS,bf=CR0,bit=I.LT,LK=false,labels=labs},an)
285 :     end
286 : blume 839 | stmt(T.CALL{funct, targets, defs, uses, region, pops, ...}, an) =
287 :     call(funct, targets, defs, uses, region, [], an, pops)
288 :     | stmt(T.FLOW_TO(T.CALL{funct, targets, defs, uses, region, pops,...},
289 : leunga 796 cutTo), an) =
290 : blume 839 call(funct, targets, defs, uses, region, cutTo, an, pops)
291 : george 545 | stmt(T.RET flow,an) = mark(RET,an)
292 :     | stmt(T.STORE(ty,ea,data,mem),an) = store(ty,ea,data,mem,an)
293 :     | stmt(T.FSTORE(ty,ea,data,mem),an) = fstore(ty,ea,data,mem,an)
294 : leunga 744 | stmt(T.BCC(cc, lab),an) = branch(cc,lab,an)
295 : george 545 | stmt(T.DEFINE l, _) = defineLabel l
296 :     | stmt(T.ANNOTATION(s,a),an) = stmt(s,a::an)
297 :     | stmt(s, _) = doStmts(Gen.compileStm s)
298 : monnier 411
299 : blume 839 and call(funct, targets, defs, uses, region, cutsTo, an, 0) =
300 : leunga 796 let val defs=cellset(defs)
301 :     val uses=cellset(uses)
302 :     in emit(MTLR(expr funct));
303 :     mark(I.CALL{def=defs, use=uses, cutsTo=cutsTo, mem=region}, an)
304 :     end
305 : blume 839 | call _ = error "pops<>0 not implemented"
306 : leunga 796
307 : george 545 and branch(T.CMP(_, _, T.LI _, T.LI _), _, _) = error "branch"
308 :     | branch(T.CMP(ty, cc, e1 as T.LI _, e2), lab, an) =
309 :     let val cc' = T.Basis.swapCond cc
310 :     in branch(T.CMP(ty, cc', e2, e1), lab, an)
311 :     end
312 : george 761 | branch(cmp as T.CMP(ty, cond, e1, e2), lab, an) = let
313 :     val (bo, cf) =
314 :     (case cond
315 :     of T.LT => (I.TRUE, I.LT)
316 :     | T.LE => (I.FALSE, I.GT)
317 :     | T.EQ => (I.TRUE, I.EQ)
318 :     | T.NE => (I.FALSE, I.EQ)
319 :     | T.GT => (I.TRUE, I.GT)
320 :     | T.GE => (I.FALSE, I.LT)
321 :     | T.LTU => (I.TRUE, I.LT)
322 :     | T.LEU => (I.FALSE, I.GT)
323 :     | T.GTU => (I.TRUE, I.GT)
324 :     | T.GEU => (I.FALSE, I.LT)
325 : mblume 1334 | (T.SETCC | T.MISC_COND _) => error "branch(CMP)"
326 : george 761 (*esac*))
327 :     val ccreg = if true then CR0 else newCCreg() (* XXX *)
328 : leunga 775 val addr = I.LabelOp(T.LABEL lab)
329 : george 761 fun default() =
330 :     (doCCexpr(cmp, ccreg, []);
331 :     emitBranch{bo=bo, bf=ccreg, bit=cf, addr=addr, LK=false})
332 :     in
333 :     case (e1, e2)
334 :     of (T.ANDB(_, a1, a2), T.LI z) =>
335 : mblume 1347 if z = 0 then
336 : george 761 (case commImmedOpnd unsigned16 (a1, a2)
337 :     of (ra, I.RegOp rb) =>
338 :     emit(I.ARITH{oper=I.AND, ra=ra, rb=rb, rt=newReg(), Rc=true, OE=false})
339 :     | (ra, opnd) =>
340 :     emit(I.ARITHI{oper=I.ANDI_Rc, ra=ra, im=opnd, rt=newReg()})
341 :     (*esac*);
342 :     branch(T.CC(cond, CR0), lab, an))
343 :     else
344 :     default()
345 :     | _ =>
346 :     default()
347 : george 545 end
348 :     | branch(T.CC(cc, cr), lab, an) =
349 : leunga 775 let val addr=I.LabelOp(T.LABEL lab)
350 : george 545 fun branch(bo, bit) =
351 :     emitBranch{bo=bo, bf=cr, bit=bit, addr=addr, LK=false}
352 :     in case cc of
353 :     T.EQ => branch(I.TRUE, I.EQ)
354 :     | T.NE => branch(I.FALSE, I.EQ)
355 :     | (T.LT | T.LTU) => branch(I.TRUE, I.LT)
356 :     | (T.LE | T.LEU) => branch(I.FALSE, I.GT)
357 :     | (T.GE | T.GEU) => branch(I.FALSE, I.LT)
358 :     | (T.GT | T.GTU) => branch(I.TRUE, I.GT)
359 : mblume 1334 | (T.SETCC | T.MISC_COND _) => error "branch(CC)"
360 : george 545 end
361 :     | branch(cmp as T.FCMP(fty, cond, _, _), lab, an) =
362 :     let val ccreg = if true then CR0 else newCCreg() (* XXX *)
363 : leunga 775 val labOp = I.LabelOp(T.LABEL lab)
364 : george 545 fun branch(bo, bf, bit) =
365 :     emitBranch{bo=bo, bf=bf, bit=bit, addr=labOp, LK=false}
366 :     fun test2bits(bit1, bit2) =
367 :     let val ba=(ccreg, bit1)
368 :     val bb=(ccreg, bit2)
369 :     val bt=(ccreg, I.FL)
370 :     in emit(I.CCARITH{oper=I.CROR, bt=bt, ba=ba, bb=bb});
371 :     branch(I.TRUE, ccreg, I.FL)
372 :     end
373 :     in doCCexpr(cmp, ccreg, []);
374 :     case cond of
375 :     T.== => branch(I.TRUE, ccreg, I.FE)
376 :     | T.?<> => branch(I.FALSE, ccreg, I.FE)
377 :     | T.? => branch(I.TRUE, ccreg, I.FU)
378 :     | T.<=> => branch(I.FALSE, ccreg, I.FU)
379 :     | T.> => branch(I.TRUE, ccreg, I.FG)
380 :     | T.>= => test2bits(I.FG, I.FE)
381 :     | T.?> => test2bits(I.FU, I.FG)
382 :     | T.?>= => branch(I.FALSE, ccreg, I.FL)
383 :     | T.< => branch(I.TRUE, ccreg, I.FL)
384 :     | T.<= => test2bits(I.FL, I.FE)
385 :     | T.?< => test2bits(I.FU, I.FL)
386 :     | T.?<= => branch(I.FALSE, ccreg, I.FG)
387 :     | T.<> => test2bits(I.FL, I.FG)
388 :     | T.?= => test2bits(I.FU, I.FE)
389 : mblume 1334 | (T.SETFCC | T.MISC_FCOND _) => error "branch(FCMP)"
390 : george 545 (*esac*)
391 :     end
392 :     | branch _ = error "branch"
393 :    
394 :     and doStmt s = stmt(s,[])
395 :    
396 :     and doStmts ss = app doStmt ss
397 : monnier 411
398 :     (* Emit an integer store *)
399 :     and store(ty, ea, data, mem, an) =
400 : leunga 624 let val (st,size) = case (ty,Gen.Size.size ea) of
401 : monnier 411 (8,32) => (I.STB,signed16)
402 :     | (8,64) => (I.STBE,signed12)
403 :     | (16,32) => (I.STH,signed16)
404 :     | (16,64) => (I.STHE,signed12)
405 :     | (32,32) => (I.STW,signed16)
406 :     | (32,64) => (I.STWE,signed12)
407 :     | (64,64) => (I.STDE,signed12)
408 :     | _ => error "store"
409 :     val (r, disp) = addr(size,ea)
410 :     in mark(I.ST{st=st, rs=expr data, ra=r, d=disp, mem=mem}, an) end
411 :    
412 :     (* Emit a floating point store *)
413 :     and fstore(ty, ea, data, mem, an) =
414 : leunga 624 let val (st,size) = case (ty,Gen.Size.size ea) of
415 : monnier 411 (32,32) => (I.STFS,signed16)
416 :     | (32,64) => (I.STFSE,signed12)
417 :     | (64,32) => (I.STFD,signed16)
418 :     | (64,64) => (I.STFDE,signed12)
419 :     | _ => error "fstore"
420 :     val (r, disp) = addr(size,ea)
421 :     in mark(I.STF{st=st,fs=fexpr data, ra=r, d=disp, mem=mem},an) end
422 : monnier 247
423 : monnier 411 and subfImmed(i, ra, rt, an) =
424 :     if signed16 i then
425 : george 761 mark(I.ARITHI{oper=I.SUBFIC, rt=rt, ra=ra, im=I.ImmedOp(toInt i)}, an)
426 : monnier 411 else
427 :     mark(I.ARITH{oper=I.SUBF, rt=rt, ra=ra, rb=expr(T.LI i),
428 :     Rc=false, OE=false}, an)
429 :    
430 :     (* Generate an arithmetic instruction *)
431 :     and arith(oper, e1, e2, rt, an) =
432 :     mark(I.ARITH{oper=oper,ra=expr e1,rb=expr e2,rt=rt,OE=false,Rc=false},
433 :     an)
434 :    
435 :     (* Generate a trapping instruction *)
436 :     and arithTrapping(oper, e1, e2, rt, an) =
437 :     let val ra = expr e1 val rb = expr e2
438 :     in mark(I.ARITH{oper=oper,ra=ra,rb=rb,rt=rt,OE=true,Rc=true},an);
439 :     overflowTrap()
440 :     end
441 : monnier 247
442 : monnier 411 (* Generate an overflow trap *)
443 :     and overflowTrap() =
444 :     let val label = case !trapLabel of
445 : george 909 NONE => let val l = Label.anon()
446 : monnier 411 in trapLabel := SOME l; l end
447 :     | SOME l => l
448 :     in emitBranch{bo=I.TRUE, bf=CR0, bit=I.SO, LK=false,
449 : leunga 775 addr=I.LabelOp(T.LABEL label)}
450 : monnier 411 end
451 :    
452 :     (* Generate a load and annotate the instruction *)
453 :     and load(ld32, ld64, ea, mem, rt, an) =
454 :     let val (ld,size) =
455 : leunga 624 if bit64mode andalso Gen.Size.size ea = 64
456 : monnier 411 then (ld64,signed12)
457 :     else (ld32,signed16)
458 :     val (r, disp) = addr(size,ea)
459 :     in mark(I.L{ld=ld, rt=rt, ra=r, d=disp, mem=mem},an)
460 :     end
461 :    
462 :     (* Generate a SRA shift operation and annotate the instruction *)
463 :     and sra(oper, operi, e1, e2, rt, an) =
464 :     case immedOpnd unsigned5 (e1, e2) of
465 :     (ra, I.RegOp rb) =>
466 :     mark(I.ARITH{oper=oper,rt=rt,ra=ra,rb=rb,Rc=false,OE=false},an)
467 :     | (ra, rb) =>
468 :     mark(I.ARITHI{oper=operi, rt=rt, ra=ra, im=rb},an)
469 :    
470 :     (* Generate a SRL shift operation and annotate the instruction *)
471 :     and srl32(e1, e2, rt, an) =
472 :     case immedOpnd unsigned5 (e1, e2) of
473 :     (ra, I.ImmedOp n) =>
474 :     mark(SRLI32{r=ra,i=n,d=rt},an)
475 :     | (ra, rb) =>
476 :     mark(I.ARITH{oper=I.SRW,rt=rt,ra=ra,rb=reduceOpn rb,
477 :     Rc=false,OE=false},an)
478 :    
479 :     and sll32(e1, e2, rt, an) =
480 :     case immedOpnd unsigned5 (e1, e2) of
481 :     (ra, rb as I.ImmedOp n) =>
482 :     mark(SLLI32{r=ra,i=n,d=rt},an)
483 :     | (ra, rb) =>
484 :     mark(I.ARITH{oper=I.SLW,rt=rt,ra=ra,rb=reduceOpn rb,
485 :     Rc=false,OE=false},an)
486 :    
487 :     (* Generate a subtract operation *)
488 :     and subtract(ty, e1, e2 as T.LI i, rt, an) =
489 : george 761 (doExpr(T.ADD(ty, e1, T.LI (T.I.NEGT(32, i))), rt, an)
490 : monnier 411 handle Overflow =>
491 :     mark(I.ARITH{oper=I.SUBF, rt=rt, ra=expr e2,
492 :     rb=expr e1, OE=false, Rc=false}, an)
493 :     )
494 :     | subtract(ty, T.LI i, e2, rt, an) = subfImmed(i, expr e2, rt, an)
495 : leunga 775 | subtract(ty, x as (T.CONST _ | T.LABEL _), e2, rt, an) =
496 : george 545 mark(I.ARITHI{oper=I.SUBFIC,rt=rt,ra=expr e2,
497 : leunga 775 im=I.LabelOp x},an)
498 : monnier 411 | subtract(ty, e1, e2, rt, an) =
499 :     let val rb = expr e1 val ra = expr e2
500 :     in mark(I.ARITH{oper=I.SUBF,rt=rt,ra=ra,rb=rb,Rc=false,OE=false},an)
501 :     end
502 :    
503 :     (* Generate optimized multiplication code *)
504 :     and multiply(ty,oper,operi,genMult,e1,e2,rt,an) =
505 :     let fun nonconst(e1,e2) =
506 : george 1009 [annotate(
507 : monnier 411 case commImmedOpnd signed16 (e1,e2) of
508 :     (ra,I.RegOp rb) =>
509 : george 1003 I.arith{oper=oper,ra=ra,rb=rb,rt=rt,OE=false,Rc=false}
510 :     | (ra,im) => I.arithi{oper=operi,ra=ra,im=im,rt=rt},
511 : monnier 411 an)]
512 :     fun const(e,i) =
513 :     let val r = expr e
514 : george 761 in genMult{r=r,i=toInt(i),d=rt}
515 : monnier 411 handle _ => nonconst(T.REG(ty,r),T.LI i)
516 :     end
517 :     val instrs =
518 :     case (e1,e2) of
519 :     (_,T.LI i) => const(e1,i)
520 :     | (T.LI i,_) => const(e2,i)
521 :     | _ => nonconst(e1,e2)
522 : george 1003 in app emitInstruction instrs end
523 : monnier 411
524 : george 545 and divu32 x = Mulu32.divide{mode=T.TO_ZERO,stm=doStmt} x
525 : monnier 411
526 : blume 1183 and divs32 x = Muls32.divide{mode=T.TO_ZERO,stm=doStmt} x
527 :    
528 : george 545 and divt32 x = Mult32.divide{mode=T.TO_ZERO,stm=doStmt} x
529 : monnier 411
530 :     (* Generate optimized division code *)
531 :     and divide(ty,oper,genDiv,e1,e2,rt,overflow,an) =
532 :     let fun nonconst(e1,e2) =
533 :     (mark(I.ARITH{oper=oper,ra=expr e1,rb=expr e2,rt=rt,
534 :     OE=overflow,Rc=overflow},an);
535 :     if overflow then overflowTrap() else ()
536 :     )
537 :     fun const(e,i) =
538 :     let val r = expr e
539 : george 1003 in app emitInstruction (genDiv{r=r,i=toInt(i),d=rt})
540 : monnier 411 handle _ => nonconst(T.REG(ty,r),T.LI i)
541 :     end
542 :     in case (e1,e2) of
543 :     (_,T.LI i) => const(e1,i)
544 :     | _ => nonconst(e1,e2)
545 :     end
546 : monnier 247
547 : monnier 411 (* Reduce an operand into a register *)
548 :     and reduceOpn(I.RegOp r) = r
549 :     | reduceOpn opn =
550 :     let val rt = newReg()
551 : leunga 744 in emit(I.ARITHI{oper=I.ADDI, rt=rt, ra=zeroR, im=opn});
552 : monnier 411 rt
553 : monnier 247 end
554 :    
555 : monnier 411 (* Reduce an expression, and returns the register that holds
556 :     * the value.
557 :     *)
558 : leunga 744 and expr(rexp as T.REG(_,r)) =
559 : george 889 if CB.sameColor(C.lr, r) then
560 : monnier 411 let val rt = newReg()
561 :     in doExpr(rexp, rt, []); rt end
562 : leunga 744 else r
563 : monnier 411 | expr(rexp) =
564 :     let val rt = newReg()
565 :     in doExpr(rexp, rt, []); rt end
566 :    
567 :     (* doExpr(e, rt, an) --
568 :     * reduce the expression e, assigns it to rd,
569 :     * and annotate the expression with an
570 :     *)
571 : leunga 744 and doExpr(e, rt, an) =
572 : george 889 if CB.sameColor(rt,C.lr) then
573 : monnier 411 let val rt = newReg() in doExpr(e,rt,[]); mark(MTLR rt,an) end
574 : leunga 744 else
575 : monnier 411 case e of
576 : george 889 T.REG(_,rs) => if CB.sameColor(rs,C.lr) then mark(MFLR rt,an)
577 : leunga 744 else move(rs,rt,an)
578 : leunga 775 | T.LI i => loadImmed(i, rt, an)
579 :     | T.LABEXP lexp => loadLabexp(lexp, rt, an)
580 :     | T.CONST _ => loadLabexp(e, rt, an)
581 :     | T.LABEL _ => loadLabexp(e, rt, an)
582 : monnier 247
583 : monnier 411 (* All data widths *)
584 :     | T.ADD(_, e1, e2) => eCommImm signed16 (I.ADD,I.ADDI,e1,e2,rt,an)
585 :     | T.SUB(ty, e1, e2) => subtract(ty, e1, e2, rt, an)
586 : monnier 247
587 : monnier 411 (* Special PPC bit operations *)
588 :     | T.ANDB(_,e1,T.NOTB(_,e2)) => arith(I.ANDC,e1,e2,rt,an)
589 :     | T.ORB(_,e1,T.NOTB(_,e2)) => arith(I.ORC,e1,e2,rt,an)
590 :     | T.XORB(_,e1,T.NOTB(_,e2)) => arith(I.EQV,e1,e2,rt,an)
591 : leunga 744 | T.EQVB(_,e1,e2) => arith(I.EQV,e1,e2,rt,an)
592 : monnier 411 | T.ANDB(_,T.NOTB(_,e1),e2) => arith(I.ANDC,e2,e1,rt,an)
593 :     | T.ORB(_,T.NOTB(_,e1),e2) => arith(I.ORC,e2,e1,rt,an)
594 :     | T.XORB(_,T.NOTB(_,e1),e2) => arith(I.EQV,e2,e1,rt,an)
595 :     | T.NOTB(_,T.ANDB(_,e1,e2)) => arith(I.NAND,e1,e2,rt,an)
596 :     | T.NOTB(_,T.ORB(_,e1,e2)) => arith(I.NOR,e1,e2,rt,an)
597 :     | T.NOTB(_,T.XORB(_,e1,e2)) => arith(I.EQV,e1,e2,rt,an)
598 : monnier 247
599 : monnier 411 | T.ANDB(_, e1, e2) =>
600 :     eCommImm unsigned16(I.AND,I.ANDI_Rc,e1,e2,rt,an)
601 :     | T.ORB(_, e1, e2) => eCommImm unsigned16(I.OR,I.ORI,e1,e2,rt,an)
602 :     | T.XORB(_, e1, e2) => eCommImm unsigned16(I.XOR,I.XORI,e1,e2,rt,an)
603 : monnier 247
604 : monnier 411 (* 32 bit support *)
605 :     | T.MULU(32, e1, e2) => multiply(32,I.MULLW,I.MULLI,
606 :     Mulu32.multiply,e1,e2,rt,an)
607 :     | T.DIVU(32, e1, e2) => divide(32,I.DIVWU,divu32,e1,e2,rt,false,an)
608 : blume 1183
609 :     | T.MULS(32, e1, e2) => multiply(32,I.MULLW,I.MULLI,
610 :     Muls32.multiply,e1,e2,rt,an)
611 :     | T.DIVS(T.DIV_TO_ZERO, 32, e1, e2) =>
612 : blume 1273 (* On the PPC we turn overflow checking on despite this
613 :     * being DIVS. That's because divide-by-zero is also
614 :     * indicated through "overflow" instead of causing a trap. *)
615 :     divide(32,I.DIVW,divs32,e1,e2,rt,
616 :     true (* !! *),
617 :     an)
618 : blume 1183
619 : monnier 411 | T.ADDT(32, e1, e2) => arithTrapping(I.ADD, e1, e2, rt, an)
620 :     | T.SUBT(32, e1, e2) => arithTrapping(I.SUBF, e2, e1, rt, an)
621 :     | T.MULT(32, e1, e2) => arithTrapping(I.MULLW, e1, e2, rt, an)
622 : blume 1181 | T.DIVT(T.DIV_TO_ZERO, 32, e1, e2) =>
623 :     divide(32,I.DIVW,divt32,e1,e2,rt,true,an)
624 : monnier 411
625 :     | T.SRA(32, e1, e2) => sra(I.SRAW, I.SRAWI, e1, e2, rt, an)
626 :     | T.SRL(32, e1, e2) => srl32(e1, e2, rt, an)
627 :     | T.SLL(32, e1, e2) => sll32(e1, e2, rt, an)
628 :    
629 :     (* 64 bit support *)
630 :     | T.SRA(64, e1, e2) => sra(I.SRAD, I.SRADI, e1, e2, rt, an)
631 :     (*| T.SRL(64, e1, e2) => srl(32, I.SRD, I.RLDINM, e1, e2, rt, an)
632 :     | T.SLL(64, e1, e2) => sll(32, I.SLD, I.RLDINM, e1, e2, rt, an)*)
633 : monnier 247
634 : monnier 411 (* loads *)
635 :     | T.LOAD(8,ea,mem) => load(I.LBZ,I.LBZE,ea,mem,rt,an)
636 :     | T.LOAD(16,ea, mem) => load(I.LHZ,I.LHZE,ea,mem,rt,an)
637 :     | T.LOAD(32,ea, mem) => load(I.LWZ,I.LWZE,ea,mem,rt,an)
638 :     | T.LOAD(64,ea, mem) => load(I.LDE,I.LDE,ea,mem,rt,an)
639 :    
640 :     (* Conditional expression *)
641 :     | T.COND exp =>
642 : george 545 doStmts(Gen.compileCond{exp=exp,an=an,rd=rt})
643 : monnier 247
644 : monnier 411 (* Misc *)
645 : george 545 | T.LET(s,e) => (doStmt s; doExpr(e, rt, an))
646 : leunga 744 | T.MARK(e, A.MARKREG f) => (f rt; doExpr(e,rt,an))
647 :     | T.MARK(e, a) => doExpr(e,rt,a::an)
648 : george 545 | e => doExpr(Gen.compileRexp e,rt,an)
649 : monnier 411
650 :     (* Generate a floating point load *)
651 :     and fload(ld32, ld64, ea, mem, ft, an) =
652 :     let val (ld,size) =
653 : leunga 624 if bit64mode andalso Gen.Size.size ea = 64 then (ld64,signed12)
654 : monnier 411 else (ld32,signed16)
655 :     val (r, disp) = addr(size,ea)
656 :     in mark(I.LF{ld=ld, ft=ft, ra=r, d=disp, mem=mem}, an) end
657 :    
658 :     (* Generate a floating-point binary operation *)
659 :     and fbinary(oper, e1, e2, ft, an) =
660 :     mark(I.FARITH{oper=oper,fa=fexpr e1,fb=fexpr e2,ft=ft,Rc=false}, an)
661 :    
662 :     (* Generate a floating-point 3-operand operation
663 :     * These are of the form
664 :     * +/- e1 * e3 +/- e2
665 :     *)
666 :     and f3(oper, e1, e2, e3, ft, an) =
667 :     mark(I.FARITH3{oper=oper,fa=fexpr e1,fb=fexpr e2,fc=fexpr e3,
668 :     ft=ft,Rc=false}, an)
669 :    
670 :     (* Generate a floating-point unary operation *)
671 :     and funary(oper, e, ft, an) =
672 :     mark(I.FUNARY{oper=oper, ft=ft, fb=fexpr e, Rc=false}, an)
673 :    
674 :     (* Reduce the expression fexp, return the register that holds
675 :     * the value.
676 :     *)
677 :     and fexpr(T.FREG(_,f)) = f
678 :     | fexpr(e) =
679 :     let val ft = newFreg()
680 :     in doFexpr(e, ft, []); ft end
681 :    
682 :     (* doExpr(fexp, ft, an) --
683 :     * reduce the expression fexp, and assigns
684 :     * it to ft. Also annotate fexp.
685 :     *)
686 :     and doFexpr(e, ft, an) =
687 :     case e of
688 :     T.FREG(_,fs) => fmove(fs,ft,an)
689 :    
690 :     (* Single precision support *)
691 :     | T.FLOAD(32, ea, mem) => fload(I.LFS,I.LFSE,ea,mem,ft,an)
692 :    
693 :     (* special 3 operand floating point arithmetic *)
694 :     | T.FADD(32,T.FMUL(32,a,c),b) => f3(I.FMADDS,a,b,c,ft,an)
695 :     | T.FADD(32,b,T.FMUL(32,a,c)) => f3(I.FMADDS,a,b,c,ft,an)
696 :     | T.FSUB(32,T.FMUL(32,a,c),b) => f3(I.FMSUBS,a,b,c,ft,an)
697 : george 827 | T.FSUB(32,b,T.FMUL(32,a,c)) => f3(I.FNMSUBS,a,b,c,ft,an)
698 :     | T.FNEG(32,T.FADD(32,T.FMUL(32,a,c),b)) => f3(I.FNMADDS,a,b,c,ft,an)
699 :     | T.FNEG(32,T.FADD(32,b,T.FMUL(32,a,c))) => f3(I.FNMADDS,a,b,c,ft,an)
700 :     | T.FSUB(32,T.FNEG(32,T.FMUL(32,a,c)),b) => f3(I.FNMADDS,a,b,c,ft,an)
701 : monnier 411
702 :     | T.FADD(32, e1, e2) => fbinary(I.FADDS, e1, e2, ft, an)
703 :     | T.FSUB(32, e1, e2) => fbinary(I.FSUBS, e1, e2, ft, an)
704 :     | T.FMUL(32, e1, e2) => fbinary(I.FMULS, e1, e2, ft, an)
705 :     | T.FDIV(32, e1, e2) => fbinary(I.FDIVS, e1, e2, ft, an)
706 :    
707 :     (* Double precision support *)
708 :     | T.FLOAD(64, ea, mem) => fload(I.LFD,I.LFDE,ea,mem,ft,an)
709 :    
710 :     (* special 3 operand floating point arithmetic *)
711 :     | T.FADD(64,T.FMUL(64,a,c),b) => f3(I.FMADD,a,b,c,ft,an)
712 :     | T.FADD(64,b,T.FMUL(64,a,c)) => f3(I.FMADD,a,b,c,ft,an)
713 :     | T.FSUB(64,T.FMUL(64,a,c),b) => f3(I.FMSUB,a,b,c,ft,an)
714 : george 827 | T.FSUB(64,b,T.FMUL(64,a,c)) => f3(I.FNMSUB,a,b,c,ft,an)
715 :     | T.FNEG(64,T.FADD(64,T.FMUL(64,a,c),b)) => f3(I.FNMADD,a,b,c,ft,an)
716 :     | T.FNEG(64,T.FADD(64,b,T.FMUL(64,a,c))) => f3(I.FNMADD,a,b,c,ft,an)
717 :     | T.FSUB(64,T.FNEG(64,T.FMUL(64,a,c)),b) => f3(I.FNMADD,a,b,c,ft,an)
718 : monnier 411
719 :     | T.FADD(64, e1, e2) => fbinary(I.FADD, e1, e2, ft, an)
720 :     | T.FSUB(64, e1, e2) => fbinary(I.FSUB, e1, e2, ft, an)
721 :     | T.FMUL(64, e1, e2) => fbinary(I.FMUL, e1, e2, ft, an)
722 :     | T.FDIV(64, e1, e2) => fbinary(I.FDIV, e1, e2, ft, an)
723 : george 545 | T.CVTI2F(64,_,e) =>
724 : george 1003 app emitInstruction (PseudoInstrs.cvti2d{reg=expr e,fd=ft})
725 : monnier 411
726 :     (* Single/double precision support *)
727 :     | T.FABS((32|64), e) => funary(I.FABS, e, ft, an)
728 :     | T.FNEG((32|64), e) => funary(I.FNEG, e, ft, an)
729 : george 717 | T.FSQRT(32, e) => funary(I.FSQRTS, e, ft, an)
730 :     | T.FSQRT(64, e) => funary(I.FSQRT, e, ft, an)
731 : monnier 411
732 :     (* Misc *)
733 : leunga 744 | T.FMARK(e, A.MARKREG f) => (f ft; doFexpr(e,ft,an))
734 :     | T.FMARK(e, a) => doFexpr(e,ft,a::an)
735 : monnier 411 | _ => error "doFexpr"
736 :    
737 : george 545 and ccExpr(T.CC(_,cc)) = cc
738 :     | ccExpr(T.FCC(_,cc)) = cc
739 : monnier 411 | ccExpr(ccexp) =
740 :     let val cc = newCCreg()
741 :     in doCCexpr(ccexp,cc,[]); cc end
742 :    
743 :     (* Reduce an condition expression, and assigns the result to ccd *)
744 :     and doCCexpr(ccexp, ccd, an) =
745 :     case ccexp of
746 :     T.CMP(ty, cc, e1, e2) =>
747 :     let val (opnds, cmp) =
748 :     case cc of
749 :     (T.LT | T.LE | T.EQ | T.NE | T.GT | T.GE) =>
750 :     (immedOpnd signed16, I.CMP)
751 :     | _ => (immedOpnd unsigned16, I.CMPL)
752 :     val (opndA, opndB) = opnds(e1, e2)
753 :     val l = case ty of
754 :     32 => false
755 :     | 64 => true
756 :     | _ => error "doCCexpr"
757 :     in mark(I.COMPARE{cmp=cmp, l=l, bf=ccd, ra=opndA, rb=opndB},an)
758 :     end
759 :     | T.FCMP(fty, fcc, e1, e2) =>
760 :     mark(I.FCOMPARE{cmp=I.FCMPU, bf=ccd, fa=fexpr e1, fb=fexpr e2},an)
761 : george 545 | T.CC(_,cc) => ccmove(cc,ccd,an)
762 : leunga 744 | T.CCMARK(cc,A.MARKREG f) => (f ccd; doCCexpr(cc,ccd,an))
763 :     | T.CCMARK(cc,a) => doCCexpr(cc,ccd,a::an)
764 : monnier 411 | _ => error "doCCexpr: Not implemented"
765 :    
766 : leunga 744 and emitTrap() = emit(I.TW{to=31,ra=zeroR,si=I.ImmedOp 0})
767 : monnier 411
768 : blume 986 val beginCluster = fn _ =>
769 :     (trapLabel := NONE; beginCluster 0)
770 : monnier 429 val endCluster = fn a =>
771 : monnier 411 (case !trapLabel of
772 :     SOME label =>
773 :     (defineLabel label; emitTrap(); trapLabel := NONE)
774 :     | NONE => ();
775 : monnier 429 endCluster a)
776 : george 545
777 : george 984 in TS.S.STREAM
778 : leunga 815 { beginCluster = beginCluster,
779 :     endCluster = endCluster,
780 :     emit = doStmt,
781 :     pseudoOp = pseudoOp,
782 :     defineLabel = defineLabel,
783 :     entryLabel = entryLabel,
784 :     comment = comment,
785 :     annotation = annotation,
786 :     getAnnotations=getAnnotations,
787 :     exitBlock = fn mlrisc => exitBlock(cellset mlrisc)
788 : monnier 411 }
789 :     end
790 :    
791 : monnier 247 end
792 :    

root@smlnj-gforge.cs.uchicago.edu
ViewVC Help
Powered by ViewVC 1.0.0