Home My Page Projects Code Snippets Project Openings diderot
Summary Activity Tracker Tasks SCM

SCM Repository

[diderot] Annotation of /branches/pure-cfg/src/include/Diderot/diderot.h
ViewVC logotype

Annotation of /branches/pure-cfg/src/include/Diderot/diderot.h

Parent Directory Parent Directory | Revision Log Revision Log


Revision 624 - (view) (download) (as text)

1 : jhr 438 /*! \file diderot.h
2 :     *
3 :     * \author John Reppy
4 : jhr 441 *
5 :     * This is the interface to the Diderot runtime for the C target. For now,
6 :     * we are targetting single-precision computations.
7 : jhr 438 */
8 :    
9 :     /*
10 :     * COPYRIGHT (c) 2010 The Diderot Project (http://diderot-language.cs.uchicago.edu)
11 :     * All rights reserved.
12 :     */
13 :    
14 :     #ifndef _DIDEROT_H_
15 :     #define _DIDEROT_H_
16 :    
17 : jhr 601 /* gcc has a bug that breaks code that uses 8-byte vectors (e.g., vec2f_t), but clang
18 :     * handles the code correctly.
19 :     */
20 :     #if defined(__clang__)
21 :     # define VEC2_OK
22 :     #endif
23 :    
24 : jhr 579 #ifdef NDEBUG
25 : jhr 440 #define STATIC_INLINE static inline
26 : jhr 579 #else
27 :     #define STATIC_INLINE static
28 :     #endif
29 : jhr 440
30 : jhr 438 #include <stdint.h>
31 :     #include <stdbool.h>
32 : jhr 558 #include <stdlib.h>
33 :     #include <math.h>
34 : jhr 438
35 :     /* library-call status */
36 :     typedef enum { DIDEROT_OK = 0, DIDEROT_FAIL = -1 } Status_t;
37 :    
38 : jhr 564 /* update method return type */
39 :     typedef enum { DIDEROT_DIE, DIDEROT_ACTIVE, DIDEROT_STABILIZE } StrandStatus_t;
40 :    
41 : jhr 438 /* SSE vector types */
42 : jhr 441 typedef float __m128 __attribute__ ((__vector_size__ (16), __may_alias__));
43 : jhr 601 #ifdef VEC2_OK
44 : jhr 561 typedef float vec2f_t __attribute__ ((vector_size (8)));
45 : jhr 601 #else
46 :     typedef float vec2f_t __attribute__ ((vector_size (16))); // pad so that gcc aligns correctly
47 :     #endif
48 : jhr 561 typedef float vec4f_t __attribute__ ((vector_size (16)));
49 :     typedef float vec8f_t __attribute__ ((vector_size (32)));
50 : jhr 438
51 : jhr 601 #ifdef VEC2_OK
52 : jhr 561 typedef int32_t vec2i_t __attribute__ ((vector_size (8)));
53 : jhr 601 #else
54 :     typedef int32_t vec2i_t __attribute__ ((vector_size (16))); // pad so that gcc aligns correctly
55 :     #endif
56 : jhr 561 typedef int32_t vec4i_t __attribute__ ((vector_size (16)));
57 :     typedef int32_t vec8i_t __attribute__ ((vector_size (32)));
58 : jhr 560
59 : jhr 561 typedef float vec2d_t __attribute__ ((vector_size (16)));
60 :     typedef float vec4d_t __attribute__ ((vector_size (32)));
61 :     typedef float vec8d_t __attribute__ ((vector_size (64)));
62 : jhr 438
63 : jhr 561 typedef int64_t vec2l_t __attribute__ ((vector_size (16)));
64 :     typedef int64_t vec4l_t __attribute__ ((vector_size (32)));
65 :     typedef int64_t vec8l_t __attribute__ ((vector_size (64)));
66 : jhr 560
67 : jhr 561 typedef union { float r[2]; vec2f_t v; } union2f_t;
68 :     typedef union { float r[4]; vec4f_t v; } union4f_t;
69 :     typedef union { float r[8]; vec8f_t v; } union8f_t;
70 : jhr 438
71 : jhr 561 typedef union { int32_t i[2]; vec2i_t v; } union2i_t;
72 :     typedef union { int32_t i[4]; vec4i_t v; } union4i_t;
73 :     typedef union { int32_t i[8]; vec8i_t v; } union8i_t;
74 : jhr 560
75 : jhr 561 typedef union { double r[2]; vec2d_t v; } union2d_t;
76 :     typedef union { double r[4]; vec4d_t v; } union4d_t;
77 :     typedef union { double r[8]; vec8d_t v; } union8d_t;
78 : jhr 545
79 : jhr 561 typedef union { int64_t r[2]; vec2l_t v; } union2l_t;
80 :     typedef union { int64_t r[4]; vec4l_t v; } union4l_t;
81 :     typedef union { int64_t r[8]; vec8l_t v; } union8l_t;
82 : jhr 558
83 : jhr 545 /* vector lengths must be power of 2, but vec3 is useful, so we pad to 4 */
84 : jhr 561 typedef vec4f_t vec3f_t;
85 :     typedef union4f_t union3f_t;
86 :     typedef vec4d_t vec3d_t;
87 :     typedef union4d_t union3d_t;
88 :     typedef vec4i_t vec3i_t;
89 :     typedef union4i_t union3i_t;
90 :     typedef vec4l_t vec3l_t;
91 :     typedef union4l_t union3l_t;
92 : jhr 545
93 : jhr 438 /* typedefs for Diderot types */
94 : jhr 560 #if defined(DIDEROT_SINGLE_PRECISION)
95 : jhr 438 typedef int32_t Diderot_int_t;
96 :     typedef float Diderot_real_t;
97 : jhr 561 typedef union4f_t Diderot_vec3_t; // padded to fit in SSE register
98 :     typedef union4f_t Diderot_vec4_t;
99 : jhr 560 #else
100 :     typedef int64_t Diderot_int_t;
101 :     typedef double Diderot_real_t;
102 : jhr 561 typedef union4d_t Diderot_vec3_t; // padded to fit in SSE register
103 :     typedef union4d_t Diderot_vec4_t;
104 : jhr 560 #endif
105 : jhr 438 typedef const char *Diderot_string_t;
106 :    
107 : jhr 557 typedef Diderot_real_t Diderot_Mat2x2_t[4];
108 :     typedef Diderot_real_t Diderot_Mat3x3_t[9];
109 : jhr 565 typedef union4f_t Diderot_Mat4x4_t[4]; // represented as row vectors
110 : jhr 579 //typedef struct {
111 :     // float m[16] __attribute__((aligned(16))); // individual elements
112 :     //} Diderot_Mat4x4_t;
113 : jhr 557
114 : jhr 438 typedef struct { // wrapper for 1D image data
115 :     uint32_t dim; // dimension (== 1)
116 :     uint32_t size[1];
117 :     void *data;
118 : jhr 444 Diderot_Mat2x2_t m; // image to world-space transform
119 :     Diderot_Mat2x2_t mInv; // world to image-space transform (m inverse)
120 : jhr 438 } Diderot_image1D_t;
121 :    
122 :     typedef struct { // wrapper for 2D image data
123 :     uint32_t dim; // dimension (== 2)
124 :     uint32_t size[2]; // sizes (fast to slow)
125 :     void *data;
126 : jhr 444 Diderot_Mat3x3_t m; // image to world-space transform
127 :     Diderot_Mat3x3_t mInv; // world to image-space transform (m inverse)
128 :     Diderot_Mat3x3_t mInvT; // image to world-space transform for gradients
129 :     // (m inverse transpose)
130 : jhr 438 } Diderot_image2D_t;
131 :    
132 :     typedef struct { // wrapper for 3D image data
133 :     uint32_t dim; // dimension (== 3)
134 :     uint32_t size[3]; // sizes (fast to slow)
135 :     void *data;
136 : jhr 444 Diderot_Mat4x4_t m; // image to world-space transform
137 :     Diderot_Mat4x4_t mInv; // world to image-space transform (m inverse)
138 :     Diderot_Mat4x4_t mInvT; // image to world-space transform for gradients
139 :     // (m inverse transpose)
140 : jhr 438 } Diderot_image3D_t;
141 :    
142 : jhr 571 typedef StrandStatus_t (*update_method_t)(void *, void *);
143 :    
144 : jhr 624 /* hooks generated by the compiler for the runtime */
145 : jhr 571 typedef struct {
146 :     char *name; // name of strand
147 :     size_t stateSzb; // sze of strand state
148 :     update_method_t update; // update method
149 :     } Strand_t;
150 :    
151 :     extern int Diderot_NumStrands; // the number of strands in the program
152 : jhr 624 extern Strand_t *Diderot_Strands[]; // array of NumStrands strand descriptors
153 : jhr 571
154 : jhr 622 typedef struct struct_world Diderot_World_t;
155 :    
156 : jhr 571 extern void Diderot_InitGlobals ();
157 : jhr 622 extern Diderot_World_t *Diderot_Initially ();
158 : jhr 571
159 : jhr 622
160 : jhr 438 /* Diderot library functions */
161 :    
162 : jhr 622 // block allocation of an initial collection of strands
163 : jhr 624 extern Diderot_World_t *Diderot_AllocInitially (
164 :     Strand_t *strand, // the type of strands being allocated
165 :     bool isArray, // is the initialization an array or collection?
166 :     uint32_t nDims, // depth of iteration nesting
167 :     int32_t *base, // nDims array of base indices
168 :     uint32_t *size); // nDims array of iteration sizes
169 : jhr 622
170 :     // get strand state pointers
171 :     extern void *Diderot_InState (Diderot_World_t *wrld, uint32_t i);
172 :     extern void *Diderot_OutState (Diderot_World_t *wrld, uint32_t i);
173 :     extern bool Diderot_IsActive (Diderot_World_t *wrld, uint32_t i);
174 :    
175 : jhr 571 // strand allocation (no initializtion)
176 : jhr 622 extern void *Diderot_AllocStrand (Strand_t *strand);
177 : jhr 571
178 : jhr 438 /* load image data from Nrrd files */
179 : jhr 561 extern Status_t Diderot_LoadImage1D (Diderot_string_t name, Diderot_image1D_t **img);
180 :     extern Status_t Diderot_LoadImage2D (Diderot_string_t name, Diderot_image2D_t **img);
181 :     extern Status_t Diderot_LoadImage3D (Diderot_string_t name, Diderot_image3D_t **img);
182 : jhr 438
183 : jhr 439 /* functions to get input-parameter values */
184 : jhr 438 extern Status_t Diderot_InputString (const char *, const char **, bool);
185 : jhr 561 extern Status_t Diderot_Inputf (const char *, float *, bool);
186 :     extern Status_t Diderot_InputVec3f (const char *, vec3f_t *, bool);
187 : jhr 438
188 : jhr 561 /********** scalar math functions **********/
189 :    
190 :     STATIC_INLINE float maxf (float a, float b)
191 :     {
192 :     return (a < b)? b : a;
193 :     }
194 :    
195 : jhr 588 /********** 2-element vector functions **********/
196 :    
197 :     STATIC_INLINE vec2f_t vec2f (float a, float b)
198 :     {
199 : jhr 601 #ifdef VEC2_OK
200 : jhr 588 return __extension__ (vec2f_t){ a, b };
201 : jhr 601 #else
202 :     return __extension__ (vec2f_t){ a, b, 0.0, 0.0 };
203 :     #endif
204 : jhr 588 }
205 :    
206 :     STATIC_INLINE float dot2f (vec2f_t u, vec2f_t v)
207 :     {
208 :     union2f_t uv = (union2f_t)(u*v);
209 :     return uv.r[0] + uv.r[1];
210 :     }
211 :    
212 : jhr 560 /********** 3-element vector functions **********/
213 :    
214 : jhr 588 STATIC_INLINE vec3i_t vec3ftoi (vec3f_t v)
215 :     {
216 :     union4f_t u;
217 :     u.v = v;
218 :     return __extension__ (vec3i_t){ (int32_t)u.r[0], (int32_t)u.r[1], (int32_t)u.r[2], 0 };
219 :     }
220 :    
221 :     STATIC_INLINE vec3f_t vec3itof (vec3i_t v)
222 :     {
223 :     union4i_t u;
224 :     u.v = v;
225 :     return __extension__ (vec3f_t){ (float)u.i[0], (float)u.i[1], (float)u.i[2], 0 };
226 :     }
227 :    
228 : jhr 561 STATIC_INLINE vec3f_t vec3f (float a, float b, float c)
229 : jhr 440 {
230 : jhr 561 return __extension__ (vec4f_t){ a, b, c, 0.0f };
231 : jhr 440 }
232 :    
233 : jhr 561 STATIC_INLINE vec3f_t scale3f (float s, vec3f_t v)
234 : jhr 440 {
235 : jhr 561 return vec3f(s, s, s) * v;
236 : jhr 440 }
237 :    
238 : jhr 561 STATIC_INLINE vec3f_t floor3f (vec3f_t v)
239 : jhr 440 {
240 : jhr 561 union4f_t u;
241 :     u.v = v;
242 :     return vec3f(floorf(u.r[0]), floorf(u.r[1]), floorf(u.r[2]));
243 :     }
244 :    
245 : jhr 565 STATIC_INLINE float dot3f (vec3f_t u, vec3f_t v)
246 :     {
247 :     union3f_t uv = (union3f_t)(u*v);
248 :     return uv.r[0] + uv.r[1] + uv.r[2];
249 :     }
250 :    
251 : jhr 561 STATIC_INLINE float length3f (vec3f_t v)
252 :     {
253 : jhr 565 return sqrtf(dot3f(v, v));
254 : jhr 561 }
255 :    
256 :     STATIC_INLINE vec3i_t truncToInt3f (vec3f_t v)
257 :     {
258 :     union4f_t t;
259 : jhr 560 t.v = v;
260 : jhr 561 return __extension__ (vec4i_t){
261 : jhr 560 (int32_t)truncf(t.r[0]),
262 :     (int32_t)truncf(t.r[1]),
263 :     (int32_t)truncf(t.r[2]),
264 :     0 };
265 : jhr 440 }
266 :    
267 : jhr 560
268 :     /********** 4-element vector functions **********/
269 :    
270 : jhr 561 STATIC_INLINE vec4f_t vec4f (float a, float b, float c, float d)
271 : jhr 560 {
272 : jhr 561 return __extension__ (vec4f_t){ a, b, c, d };
273 : jhr 560 }
274 :    
275 : jhr 561 STATIC_INLINE float dot4f (vec4f_t u, vec4f_t v)
276 :     {
277 : jhr 565 union4f_t uv = (union4f_t)(u*v);
278 :     return uv.r[0] + uv.r[1] + uv.r[2] + uv.r[3];
279 : jhr 561 }
280 : jhr 560
281 : jhr 561
282 : jhr 560 /********** other Diderot support functions **********/
283 :    
284 : jhr 441 // check if pos is inside the img, assuming that we have a border of width s.
285 :     //
286 : jhr 561 STATIC_INLINE bool Diderot_Inside3f (vec3f_t posArg, Diderot_image3D_t *img, int s)
287 : jhr 441 {
288 :     // NOTE: there might be a vectorized way to do this compare!
289 : jhr 449 // cvtps2pi -- converts vector of floats to vector of int32_t values
290 :    
291 : jhr 561 union4f_t pos;
292 :     pos.v = posArg;
293 : glk 611 return ((s-1 < pos.r[0]) && (pos.r[0] < (img->size[0] - s))
294 :     && (s-1 < pos.r[1]) && (pos.r[1] < (img->size[1] - s))
295 :     && (s-1 < pos.r[2]) && (pos.r[2] < (img->size[2] - s)));
296 : jhr 441 }
297 :    
298 : jhr 565 STATIC_INLINE vec3f_t Diderot_ToImageSpace3f (Diderot_image3D_t *img, vec3f_t posArg)
299 :     {
300 : jhr 579 Diderot_Mat4x4_t *m = &(img->mInv);
301 :    
302 : jhr 565 vec4f_t p = vec4f(
303 :     ((union3f_t)posArg).r[0],
304 : jhr 579 ((union3f_t)posArg).r[1],
305 :     ((union3f_t)posArg).r[2],
306 : jhr 565 1.0f);
307 : jhr 561
308 : jhr 579 // return vec3f(
309 :     // dot4f(vec4f(m->m[0], m->m[1], m->m[2], m->m[3]), p),
310 :     // dot4f(vec4f(m->m[4], m->m[5], m->m[6], m->m[7]), p),
311 :     // dot4f(vec4f(m->m[8], m->m[9], m->m[10], m->m[11]), p));
312 : jhr 565 return vec3f(
313 :     dot4f(img->mInv[0].v, p),
314 :     dot4f(img->mInv[1].v, p),
315 :     dot4f(img->mInv[2].v, p));
316 :     }
317 :    
318 : jhr 438 #endif /* !_DIDEROT_H_ */

root@smlnj-gforge.cs.uchicago.edu
ViewVC Help
Powered by ViewVC 1.0.0