Home My Page Projects Code Snippets Project Openings diderot
Summary Activity Tracker Tasks SCM

SCM Repository

[diderot] Annotation of /branches/pure-cfg/src/include/Diderot/diderot.h
ViewVC logotype

Annotation of /branches/pure-cfg/src/include/Diderot/diderot.h

Parent Directory Parent Directory | Revision Log Revision Log


Revision 579 - (view) (download) (as text)

1 : jhr 438 /*! \file diderot.h
2 :     *
3 :     * \author John Reppy
4 : jhr 441 *
5 :     * This is the interface to the Diderot runtime for the C target. For now,
6 :     * we are targetting single-precision computations.
7 : jhr 438 */
8 :    
9 :     /*
10 :     * COPYRIGHT (c) 2010 The Diderot Project (http://diderot-language.cs.uchicago.edu)
11 :     * All rights reserved.
12 :     */
13 :    
14 :     #ifndef _DIDEROT_H_
15 :     #define _DIDEROT_H_
16 :    
17 : jhr 579 #ifdef NDEBUG
18 : jhr 440 #define STATIC_INLINE static inline
19 : jhr 579 #else
20 :     #define STATIC_INLINE static
21 :     #endif
22 : jhr 440
23 : jhr 438 #include <stdint.h>
24 :     #include <stdbool.h>
25 : jhr 558 #include <stdlib.h>
26 :     #include <math.h>
27 : jhr 438
28 :     /* library-call status */
29 :     typedef enum { DIDEROT_OK = 0, DIDEROT_FAIL = -1 } Status_t;
30 :    
31 : jhr 564 /* update method return type */
32 :     typedef enum { DIDEROT_DIE, DIDEROT_ACTIVE, DIDEROT_STABILIZE } StrandStatus_t;
33 :    
34 : jhr 438 /* SSE vector types */
35 : jhr 441 typedef float __m128 __attribute__ ((__vector_size__ (16), __may_alias__));
36 : jhr 561 typedef float vec2f_t __attribute__ ((vector_size (8)));
37 :     typedef float vec4f_t __attribute__ ((vector_size (16)));
38 :     typedef float vec8f_t __attribute__ ((vector_size (32)));
39 : jhr 438
40 : jhr 561 typedef int32_t vec2i_t __attribute__ ((vector_size (8)));
41 :     typedef int32_t vec4i_t __attribute__ ((vector_size (16)));
42 :     typedef int32_t vec8i_t __attribute__ ((vector_size (32)));
43 : jhr 560
44 : jhr 561 typedef float vec2d_t __attribute__ ((vector_size (16)));
45 :     typedef float vec4d_t __attribute__ ((vector_size (32)));
46 :     typedef float vec8d_t __attribute__ ((vector_size (64)));
47 : jhr 438
48 : jhr 561 typedef int64_t vec2l_t __attribute__ ((vector_size (16)));
49 :     typedef int64_t vec4l_t __attribute__ ((vector_size (32)));
50 :     typedef int64_t vec8l_t __attribute__ ((vector_size (64)));
51 : jhr 560
52 : jhr 561 typedef union { float r[2]; vec2f_t v; } union2f_t;
53 :     typedef union { float r[4]; vec4f_t v; } union4f_t;
54 :     typedef union { float r[8]; vec8f_t v; } union8f_t;
55 : jhr 438
56 : jhr 561 typedef union { int32_t i[2]; vec2i_t v; } union2i_t;
57 :     typedef union { int32_t i[4]; vec4i_t v; } union4i_t;
58 :     typedef union { int32_t i[8]; vec8i_t v; } union8i_t;
59 : jhr 560
60 : jhr 561 typedef union { double r[2]; vec2d_t v; } union2d_t;
61 :     typedef union { double r[4]; vec4d_t v; } union4d_t;
62 :     typedef union { double r[8]; vec8d_t v; } union8d_t;
63 : jhr 545
64 : jhr 561 typedef union { int64_t r[2]; vec2l_t v; } union2l_t;
65 :     typedef union { int64_t r[4]; vec4l_t v; } union4l_t;
66 :     typedef union { int64_t r[8]; vec8l_t v; } union8l_t;
67 : jhr 558
68 : jhr 545 /* vector lengths must be power of 2, but vec3 is useful, so we pad to 4 */
69 : jhr 561 typedef vec4f_t vec3f_t;
70 :     typedef union4f_t union3f_t;
71 :     typedef vec4d_t vec3d_t;
72 :     typedef union4d_t union3d_t;
73 :     typedef vec4i_t vec3i_t;
74 :     typedef union4i_t union3i_t;
75 :     typedef vec4l_t vec3l_t;
76 :     typedef union4l_t union3l_t;
77 : jhr 545
78 : jhr 438 /* typedefs for Diderot types */
79 : jhr 560 #if defined(DIDEROT_SINGLE_PRECISION)
80 : jhr 438 typedef int32_t Diderot_int_t;
81 :     typedef float Diderot_real_t;
82 : jhr 561 typedef union4f_t Diderot_vec3_t; // padded to fit in SSE register
83 :     typedef union4f_t Diderot_vec4_t;
84 : jhr 560 #else
85 :     typedef int64_t Diderot_int_t;
86 :     typedef double Diderot_real_t;
87 : jhr 561 typedef union4d_t Diderot_vec3_t; // padded to fit in SSE register
88 :     typedef union4d_t Diderot_vec4_t;
89 : jhr 560 #endif
90 : jhr 438 typedef const char *Diderot_string_t;
91 :    
92 : jhr 557 typedef Diderot_real_t Diderot_Mat2x2_t[4];
93 :     typedef Diderot_real_t Diderot_Mat3x3_t[9];
94 : jhr 565 typedef union4f_t Diderot_Mat4x4_t[4]; // represented as row vectors
95 : jhr 579 //typedef struct {
96 :     // float m[16] __attribute__((aligned(16))); // individual elements
97 :     //} Diderot_Mat4x4_t;
98 : jhr 557
99 : jhr 438 typedef struct { // wrapper for 1D image data
100 :     uint32_t dim; // dimension (== 1)
101 :     uint32_t size[1];
102 :     void *data;
103 : jhr 444 Diderot_Mat2x2_t m; // image to world-space transform
104 :     Diderot_Mat2x2_t mInv; // world to image-space transform (m inverse)
105 : jhr 438 } Diderot_image1D_t;
106 :    
107 :     typedef struct { // wrapper for 2D image data
108 :     uint32_t dim; // dimension (== 2)
109 :     uint32_t size[2]; // sizes (fast to slow)
110 :     void *data;
111 : jhr 444 Diderot_Mat3x3_t m; // image to world-space transform
112 :     Diderot_Mat3x3_t mInv; // world to image-space transform (m inverse)
113 :     Diderot_Mat3x3_t mInvT; // image to world-space transform for gradients
114 :     // (m inverse transpose)
115 : jhr 438 } Diderot_image2D_t;
116 :    
117 :     typedef struct { // wrapper for 3D image data
118 :     uint32_t dim; // dimension (== 3)
119 :     uint32_t size[3]; // sizes (fast to slow)
120 :     void *data;
121 : jhr 444 Diderot_Mat4x4_t m; // image to world-space transform
122 :     Diderot_Mat4x4_t mInv; // world to image-space transform (m inverse)
123 :     Diderot_Mat4x4_t mInvT; // image to world-space transform for gradients
124 :     // (m inverse transpose)
125 : jhr 438 } Diderot_image3D_t;
126 :    
127 : jhr 571 typedef StrandStatus_t (*strand_init_t)(void *, int, int);
128 :     typedef StrandStatus_t (*update_method_t)(void *, void *);
129 :    
130 :     /* hooks generated by compiler for runtime */
131 :     typedef struct {
132 :     char *name; // name of strand
133 :     size_t stateSzb; // sze of strand state
134 :     strand_init_t init; // initialization
135 :     update_method_t update; // update method
136 :     } Strand_t;
137 :    
138 :     extern int Diderot_NumStrands; // the number of strands in the program
139 :     extern Strand_t Diderot_Strands[]; // array of NumStrands strand descriptors
140 :    
141 :     extern void Diderot_InitGlobals ();
142 :    
143 : jhr 438 /* Diderot library functions */
144 :    
145 : jhr 571 // strand allocation (no initializtion)
146 :     void *Diderot_AllocStrand (Strand_t *strand);
147 :    
148 : jhr 438 /* load image data from Nrrd files */
149 : jhr 561 extern Status_t Diderot_LoadImage1D (Diderot_string_t name, Diderot_image1D_t **img);
150 :     extern Status_t Diderot_LoadImage2D (Diderot_string_t name, Diderot_image2D_t **img);
151 :     extern Status_t Diderot_LoadImage3D (Diderot_string_t name, Diderot_image3D_t **img);
152 : jhr 438
153 : jhr 439 /* functions to get input-parameter values */
154 : jhr 438 extern Status_t Diderot_InputString (const char *, const char **, bool);
155 : jhr 561 extern Status_t Diderot_Inputf (const char *, float *, bool);
156 :     extern Status_t Diderot_InputVec3f (const char *, vec3f_t *, bool);
157 : jhr 438
158 : jhr 561 /********** scalar math functions **********/
159 :    
160 :     STATIC_INLINE float maxf (float a, float b)
161 :     {
162 :     return (a < b)? b : a;
163 :     }
164 :    
165 : jhr 560 /********** 3-element vector functions **********/
166 :    
167 : jhr 561 STATIC_INLINE vec3f_t vec3f (float a, float b, float c)
168 : jhr 440 {
169 : jhr 561 return __extension__ (vec4f_t){ a, b, c, 0.0f };
170 : jhr 440 }
171 :    
172 : jhr 561 STATIC_INLINE vec3f_t scale3f (float s, vec3f_t v)
173 : jhr 440 {
174 : jhr 561 return vec3f(s, s, s) * v;
175 : jhr 440 }
176 :    
177 : jhr 561 STATIC_INLINE vec3f_t floor3f (vec3f_t v)
178 : jhr 440 {
179 : jhr 561 union4f_t u;
180 :     u.v = v;
181 :     return vec3f(floorf(u.r[0]), floorf(u.r[1]), floorf(u.r[2]));
182 :     }
183 :    
184 : jhr 565 STATIC_INLINE float dot3f (vec3f_t u, vec3f_t v)
185 :     {
186 :     union3f_t uv = (union3f_t)(u*v);
187 :     return uv.r[0] + uv.r[1] + uv.r[2];
188 :     }
189 :    
190 : jhr 561 STATIC_INLINE float length3f (vec3f_t v)
191 :     {
192 : jhr 565 return sqrtf(dot3f(v, v));
193 : jhr 561 }
194 :    
195 :     STATIC_INLINE vec3i_t truncToInt3f (vec3f_t v)
196 :     {
197 :     union4f_t t;
198 : jhr 560 t.v = v;
199 : jhr 561 return __extension__ (vec4i_t){
200 : jhr 560 (int32_t)truncf(t.r[0]),
201 :     (int32_t)truncf(t.r[1]),
202 :     (int32_t)truncf(t.r[2]),
203 :     0 };
204 : jhr 440 }
205 :    
206 : jhr 560
207 :     /********** 4-element vector functions **********/
208 :    
209 : jhr 561 STATIC_INLINE vec4f_t vec4f (float a, float b, float c, float d)
210 : jhr 560 {
211 : jhr 561 return __extension__ (vec4f_t){ a, b, c, d };
212 : jhr 560 }
213 :    
214 : jhr 561 STATIC_INLINE float dot4f (vec4f_t u, vec4f_t v)
215 :     {
216 : jhr 565 union4f_t uv = (union4f_t)(u*v);
217 :     return uv.r[0] + uv.r[1] + uv.r[2] + uv.r[3];
218 : jhr 561 }
219 : jhr 560
220 : jhr 561
221 : jhr 560 /********** other Diderot support functions **********/
222 :    
223 : jhr 441 // check if pos is inside the img, assuming that we have a border of width s.
224 :     //
225 : jhr 561 STATIC_INLINE bool Diderot_Inside3f (vec3f_t posArg, Diderot_image3D_t *img, int s)
226 : jhr 441 {
227 :     // NOTE: there might be a vectorized way to do this compare!
228 : jhr 449 // cvtps2pi -- converts vector of floats to vector of int32_t values
229 :    
230 : jhr 561 union4f_t pos;
231 :     pos.v = posArg;
232 : jhr 557 return ((s <= pos.r[0]) && (pos.r[0] < (img->size[0] - s))
233 :     && (s <= pos.r[1]) && (pos.r[1] < (img->size[1] - s))
234 :     && (s <= pos.r[2]) && (pos.r[2] < (img->size[2] - s)));
235 : jhr 441 }
236 :    
237 : jhr 565 STATIC_INLINE vec3f_t Diderot_ToImageSpace3f (Diderot_image3D_t *img, vec3f_t posArg)
238 :     {
239 : jhr 579 Diderot_Mat4x4_t *m = &(img->mInv);
240 :    
241 : jhr 565 vec4f_t p = vec4f(
242 :     ((union3f_t)posArg).r[0],
243 : jhr 579 ((union3f_t)posArg).r[1],
244 :     ((union3f_t)posArg).r[2],
245 : jhr 565 1.0f);
246 : jhr 561
247 : jhr 579 // return vec3f(
248 :     // dot4f(vec4f(m->m[0], m->m[1], m->m[2], m->m[3]), p),
249 :     // dot4f(vec4f(m->m[4], m->m[5], m->m[6], m->m[7]), p),
250 :     // dot4f(vec4f(m->m[8], m->m[9], m->m[10], m->m[11]), p));
251 : jhr 565 return vec3f(
252 :     dot4f(img->mInv[0].v, p),
253 :     dot4f(img->mInv[1].v, p),
254 :     dot4f(img->mInv[2].v, p));
255 :     }
256 :    
257 : jhr 438 #endif /* !_DIDEROT_H_ */

root@smlnj-gforge.cs.uchicago.edu
ViewVC Help
Powered by ViewVC 1.0.0