Home My Page Projects Code Snippets Project Openings diderot
Summary Activity Tracker Tasks SCM

SCM Repository

[diderot] Annotation of /branches/pure-cfg/src/include/Diderot/diderot.h
ViewVC logotype

Annotation of /branches/pure-cfg/src/include/Diderot/diderot.h

Parent Directory Parent Directory | Revision Log Revision Log


Revision 611 - (view) (download) (as text)

1 : jhr 438 /*! \file diderot.h
2 :     *
3 :     * \author John Reppy
4 : jhr 441 *
5 :     * This is the interface to the Diderot runtime for the C target. For now,
6 :     * we are targetting single-precision computations.
7 : jhr 438 */
8 :    
9 :     /*
10 :     * COPYRIGHT (c) 2010 The Diderot Project (http://diderot-language.cs.uchicago.edu)
11 :     * All rights reserved.
12 :     */
13 :    
14 :     #ifndef _DIDEROT_H_
15 :     #define _DIDEROT_H_
16 :    
17 : jhr 601 /* gcc has a bug that breaks code that uses 8-byte vectors (e.g., vec2f_t), but clang
18 :     * handles the code correctly.
19 :     */
20 :     #if defined(__clang__)
21 :     # define VEC2_OK
22 :     #endif
23 :    
24 : jhr 579 #ifdef NDEBUG
25 : jhr 440 #define STATIC_INLINE static inline
26 : jhr 579 #else
27 :     #define STATIC_INLINE static
28 :     #endif
29 : jhr 440
30 : jhr 438 #include <stdint.h>
31 :     #include <stdbool.h>
32 : jhr 558 #include <stdlib.h>
33 :     #include <math.h>
34 : jhr 438
35 :     /* library-call status */
36 :     typedef enum { DIDEROT_OK = 0, DIDEROT_FAIL = -1 } Status_t;
37 :    
38 : jhr 564 /* update method return type */
39 :     typedef enum { DIDEROT_DIE, DIDEROT_ACTIVE, DIDEROT_STABILIZE } StrandStatus_t;
40 :    
41 : jhr 438 /* SSE vector types */
42 : jhr 441 typedef float __m128 __attribute__ ((__vector_size__ (16), __may_alias__));
43 : jhr 601 #ifdef VEC2_OK
44 : jhr 561 typedef float vec2f_t __attribute__ ((vector_size (8)));
45 : jhr 601 #else
46 :     typedef float vec2f_t __attribute__ ((vector_size (16))); // pad so that gcc aligns correctly
47 :     #endif
48 : jhr 561 typedef float vec4f_t __attribute__ ((vector_size (16)));
49 :     typedef float vec8f_t __attribute__ ((vector_size (32)));
50 : jhr 438
51 : jhr 601 #ifdef VEC2_OK
52 : jhr 561 typedef int32_t vec2i_t __attribute__ ((vector_size (8)));
53 : jhr 601 #else
54 :     typedef int32_t vec2i_t __attribute__ ((vector_size (16))); // pad so that gcc aligns correctly
55 :     #endif
56 : jhr 561 typedef int32_t vec4i_t __attribute__ ((vector_size (16)));
57 :     typedef int32_t vec8i_t __attribute__ ((vector_size (32)));
58 : jhr 560
59 : jhr 561 typedef float vec2d_t __attribute__ ((vector_size (16)));
60 :     typedef float vec4d_t __attribute__ ((vector_size (32)));
61 :     typedef float vec8d_t __attribute__ ((vector_size (64)));
62 : jhr 438
63 : jhr 561 typedef int64_t vec2l_t __attribute__ ((vector_size (16)));
64 :     typedef int64_t vec4l_t __attribute__ ((vector_size (32)));
65 :     typedef int64_t vec8l_t __attribute__ ((vector_size (64)));
66 : jhr 560
67 : jhr 561 typedef union { float r[2]; vec2f_t v; } union2f_t;
68 :     typedef union { float r[4]; vec4f_t v; } union4f_t;
69 :     typedef union { float r[8]; vec8f_t v; } union8f_t;
70 : jhr 438
71 : jhr 561 typedef union { int32_t i[2]; vec2i_t v; } union2i_t;
72 :     typedef union { int32_t i[4]; vec4i_t v; } union4i_t;
73 :     typedef union { int32_t i[8]; vec8i_t v; } union8i_t;
74 : jhr 560
75 : jhr 561 typedef union { double r[2]; vec2d_t v; } union2d_t;
76 :     typedef union { double r[4]; vec4d_t v; } union4d_t;
77 :     typedef union { double r[8]; vec8d_t v; } union8d_t;
78 : jhr 545
79 : jhr 561 typedef union { int64_t r[2]; vec2l_t v; } union2l_t;
80 :     typedef union { int64_t r[4]; vec4l_t v; } union4l_t;
81 :     typedef union { int64_t r[8]; vec8l_t v; } union8l_t;
82 : jhr 558
83 : jhr 545 /* vector lengths must be power of 2, but vec3 is useful, so we pad to 4 */
84 : jhr 561 typedef vec4f_t vec3f_t;
85 :     typedef union4f_t union3f_t;
86 :     typedef vec4d_t vec3d_t;
87 :     typedef union4d_t union3d_t;
88 :     typedef vec4i_t vec3i_t;
89 :     typedef union4i_t union3i_t;
90 :     typedef vec4l_t vec3l_t;
91 :     typedef union4l_t union3l_t;
92 : jhr 545
93 : jhr 438 /* typedefs for Diderot types */
94 : jhr 560 #if defined(DIDEROT_SINGLE_PRECISION)
95 : jhr 438 typedef int32_t Diderot_int_t;
96 :     typedef float Diderot_real_t;
97 : jhr 561 typedef union4f_t Diderot_vec3_t; // padded to fit in SSE register
98 :     typedef union4f_t Diderot_vec4_t;
99 : jhr 560 #else
100 :     typedef int64_t Diderot_int_t;
101 :     typedef double Diderot_real_t;
102 : jhr 561 typedef union4d_t Diderot_vec3_t; // padded to fit in SSE register
103 :     typedef union4d_t Diderot_vec4_t;
104 : jhr 560 #endif
105 : jhr 438 typedef const char *Diderot_string_t;
106 :    
107 : jhr 557 typedef Diderot_real_t Diderot_Mat2x2_t[4];
108 :     typedef Diderot_real_t Diderot_Mat3x3_t[9];
109 : jhr 565 typedef union4f_t Diderot_Mat4x4_t[4]; // represented as row vectors
110 : jhr 579 //typedef struct {
111 :     // float m[16] __attribute__((aligned(16))); // individual elements
112 :     //} Diderot_Mat4x4_t;
113 : jhr 557
114 : jhr 438 typedef struct { // wrapper for 1D image data
115 :     uint32_t dim; // dimension (== 1)
116 :     uint32_t size[1];
117 :     void *data;
118 : jhr 444 Diderot_Mat2x2_t m; // image to world-space transform
119 :     Diderot_Mat2x2_t mInv; // world to image-space transform (m inverse)
120 : jhr 438 } Diderot_image1D_t;
121 :    
122 :     typedef struct { // wrapper for 2D image data
123 :     uint32_t dim; // dimension (== 2)
124 :     uint32_t size[2]; // sizes (fast to slow)
125 :     void *data;
126 : jhr 444 Diderot_Mat3x3_t m; // image to world-space transform
127 :     Diderot_Mat3x3_t mInv; // world to image-space transform (m inverse)
128 :     Diderot_Mat3x3_t mInvT; // image to world-space transform for gradients
129 :     // (m inverse transpose)
130 : jhr 438 } Diderot_image2D_t;
131 :    
132 :     typedef struct { // wrapper for 3D image data
133 :     uint32_t dim; // dimension (== 3)
134 :     uint32_t size[3]; // sizes (fast to slow)
135 :     void *data;
136 : jhr 444 Diderot_Mat4x4_t m; // image to world-space transform
137 :     Diderot_Mat4x4_t mInv; // world to image-space transform (m inverse)
138 :     Diderot_Mat4x4_t mInvT; // image to world-space transform for gradients
139 :     // (m inverse transpose)
140 : jhr 438 } Diderot_image3D_t;
141 :    
142 : jhr 571 typedef StrandStatus_t (*strand_init_t)(void *, int, int);
143 :     typedef StrandStatus_t (*update_method_t)(void *, void *);
144 :    
145 :     /* hooks generated by compiler for runtime */
146 :     typedef struct {
147 :     char *name; // name of strand
148 :     size_t stateSzb; // sze of strand state
149 :     strand_init_t init; // initialization
150 :     update_method_t update; // update method
151 :     } Strand_t;
152 :    
153 :     extern int Diderot_NumStrands; // the number of strands in the program
154 :     extern Strand_t Diderot_Strands[]; // array of NumStrands strand descriptors
155 :    
156 :     extern void Diderot_InitGlobals ();
157 :    
158 : jhr 438 /* Diderot library functions */
159 :    
160 : jhr 571 // strand allocation (no initializtion)
161 :     void *Diderot_AllocStrand (Strand_t *strand);
162 :    
163 : jhr 438 /* load image data from Nrrd files */
164 : jhr 561 extern Status_t Diderot_LoadImage1D (Diderot_string_t name, Diderot_image1D_t **img);
165 :     extern Status_t Diderot_LoadImage2D (Diderot_string_t name, Diderot_image2D_t **img);
166 :     extern Status_t Diderot_LoadImage3D (Diderot_string_t name, Diderot_image3D_t **img);
167 : jhr 438
168 : jhr 439 /* functions to get input-parameter values */
169 : jhr 438 extern Status_t Diderot_InputString (const char *, const char **, bool);
170 : jhr 561 extern Status_t Diderot_Inputf (const char *, float *, bool);
171 :     extern Status_t Diderot_InputVec3f (const char *, vec3f_t *, bool);
172 : jhr 438
173 : jhr 561 /********** scalar math functions **********/
174 :    
175 :     STATIC_INLINE float maxf (float a, float b)
176 :     {
177 :     return (a < b)? b : a;
178 :     }
179 :    
180 : jhr 588 /********** 2-element vector functions **********/
181 :    
182 :     STATIC_INLINE vec2f_t vec2f (float a, float b)
183 :     {
184 : jhr 601 #ifdef VEC2_OK
185 : jhr 588 return __extension__ (vec2f_t){ a, b };
186 : jhr 601 #else
187 :     return __extension__ (vec2f_t){ a, b, 0.0, 0.0 };
188 :     #endif
189 : jhr 588 }
190 :    
191 :     STATIC_INLINE float dot2f (vec2f_t u, vec2f_t v)
192 :     {
193 :     union2f_t uv = (union2f_t)(u*v);
194 :     return uv.r[0] + uv.r[1];
195 :     }
196 :    
197 : jhr 560 /********** 3-element vector functions **********/
198 :    
199 : jhr 588 STATIC_INLINE vec3i_t vec3ftoi (vec3f_t v)
200 :     {
201 :     union4f_t u;
202 :     u.v = v;
203 :     return __extension__ (vec3i_t){ (int32_t)u.r[0], (int32_t)u.r[1], (int32_t)u.r[2], 0 };
204 :     }
205 :    
206 :     STATIC_INLINE vec3f_t vec3itof (vec3i_t v)
207 :     {
208 :     union4i_t u;
209 :     u.v = v;
210 :     return __extension__ (vec3f_t){ (float)u.i[0], (float)u.i[1], (float)u.i[2], 0 };
211 :     }
212 :    
213 : jhr 561 STATIC_INLINE vec3f_t vec3f (float a, float b, float c)
214 : jhr 440 {
215 : jhr 561 return __extension__ (vec4f_t){ a, b, c, 0.0f };
216 : jhr 440 }
217 :    
218 : jhr 561 STATIC_INLINE vec3f_t scale3f (float s, vec3f_t v)
219 : jhr 440 {
220 : jhr 561 return vec3f(s, s, s) * v;
221 : jhr 440 }
222 :    
223 : jhr 561 STATIC_INLINE vec3f_t floor3f (vec3f_t v)
224 : jhr 440 {
225 : jhr 561 union4f_t u;
226 :     u.v = v;
227 :     return vec3f(floorf(u.r[0]), floorf(u.r[1]), floorf(u.r[2]));
228 :     }
229 :    
230 : jhr 565 STATIC_INLINE float dot3f (vec3f_t u, vec3f_t v)
231 :     {
232 :     union3f_t uv = (union3f_t)(u*v);
233 :     return uv.r[0] + uv.r[1] + uv.r[2];
234 :     }
235 :    
236 : jhr 561 STATIC_INLINE float length3f (vec3f_t v)
237 :     {
238 : jhr 565 return sqrtf(dot3f(v, v));
239 : jhr 561 }
240 :    
241 :     STATIC_INLINE vec3i_t truncToInt3f (vec3f_t v)
242 :     {
243 :     union4f_t t;
244 : jhr 560 t.v = v;
245 : jhr 561 return __extension__ (vec4i_t){
246 : jhr 560 (int32_t)truncf(t.r[0]),
247 :     (int32_t)truncf(t.r[1]),
248 :     (int32_t)truncf(t.r[2]),
249 :     0 };
250 : jhr 440 }
251 :    
252 : jhr 560
253 :     /********** 4-element vector functions **********/
254 :    
255 : jhr 561 STATIC_INLINE vec4f_t vec4f (float a, float b, float c, float d)
256 : jhr 560 {
257 : jhr 561 return __extension__ (vec4f_t){ a, b, c, d };
258 : jhr 560 }
259 :    
260 : jhr 561 STATIC_INLINE float dot4f (vec4f_t u, vec4f_t v)
261 :     {
262 : jhr 565 union4f_t uv = (union4f_t)(u*v);
263 :     return uv.r[0] + uv.r[1] + uv.r[2] + uv.r[3];
264 : jhr 561 }
265 : jhr 560
266 : jhr 561
267 : jhr 560 /********** other Diderot support functions **********/
268 :    
269 : jhr 441 // check if pos is inside the img, assuming that we have a border of width s.
270 :     //
271 : jhr 561 STATIC_INLINE bool Diderot_Inside3f (vec3f_t posArg, Diderot_image3D_t *img, int s)
272 : jhr 441 {
273 :     // NOTE: there might be a vectorized way to do this compare!
274 : jhr 449 // cvtps2pi -- converts vector of floats to vector of int32_t values
275 :    
276 : jhr 561 union4f_t pos;
277 :     pos.v = posArg;
278 : glk 611 return ((s-1 < pos.r[0]) && (pos.r[0] < (img->size[0] - s))
279 :     && (s-1 < pos.r[1]) && (pos.r[1] < (img->size[1] - s))
280 :     && (s-1 < pos.r[2]) && (pos.r[2] < (img->size[2] - s)));
281 : jhr 441 }
282 :    
283 : jhr 565 STATIC_INLINE vec3f_t Diderot_ToImageSpace3f (Diderot_image3D_t *img, vec3f_t posArg)
284 :     {
285 : jhr 579 Diderot_Mat4x4_t *m = &(img->mInv);
286 :    
287 : jhr 565 vec4f_t p = vec4f(
288 :     ((union3f_t)posArg).r[0],
289 : jhr 579 ((union3f_t)posArg).r[1],
290 :     ((union3f_t)posArg).r[2],
291 : jhr 565 1.0f);
292 : jhr 561
293 : jhr 579 // return vec3f(
294 :     // dot4f(vec4f(m->m[0], m->m[1], m->m[2], m->m[3]), p),
295 :     // dot4f(vec4f(m->m[4], m->m[5], m->m[6], m->m[7]), p),
296 :     // dot4f(vec4f(m->m[8], m->m[9], m->m[10], m->m[11]), p));
297 : jhr 565 return vec3f(
298 :     dot4f(img->mInv[0].v, p),
299 :     dot4f(img->mInv[1].v, p),
300 :     dot4f(img->mInv[2].v, p));
301 :     }
302 :    
303 : jhr 438 #endif /* !_DIDEROT_H_ */

root@smlnj-gforge.cs.uchicago.edu
ViewVC Help
Powered by ViewVC 1.0.0