Add dprint() to io_u requeue
[fio.git] / crc / sha256.c
1 /*
2  * Cryptographic API.
3  *
4  * SHA-256, as specified in
5  * http://csrc.nist.gov/cryptval/shs/sha256-384-512.pdf
6  *
7  * SHA-256 code by Jean-Luc Cooke <jlcooke@certainkey.com>.
8  *
9  * Copyright (c) Jean-Luc Cooke <jlcooke@certainkey.com>
10  * Copyright (c) Andrew McDonald <andrew@mcdonald.org.uk>
11  * Copyright (c) 2002 James Morris <jmorris@intercode.com.au>
12  *
13  * This program is free software; you can redistribute it and/or modify it
14  * under the terms of the GNU General Public License as published by the Free
15  * Software Foundation; either version 2 of the License, or (at your option) 
16  * any later version.
17  *
18  */
19 #include <string.h>
20 #include <inttypes.h>
21
22 #include "sha256.h"
23
24 #if __BYTE_ORDER == __LITTLE_ENDIAN
25 static int __be32_to_cpu(uint32_t val)
26 {
27         uint32_t c1, c2, c3, c4;
28
29         c1 = (val >> 24) & 0xff;
30         c2 = (val >> 16) & 0xff;
31         c3 = (val >> 8) & 0xff;
32         c4 = val & 0xff;
33
34         return c1 | c2 << 8 | c3 << 16 | c4 << 24;
35 }
36 #else
37 #define __be32_to_cpu(x)        (x)
38 #endif
39
40 #define SHA256_DIGEST_SIZE      32
41 #define SHA256_HMAC_BLOCK_SIZE  64
42
43 static inline uint32_t Ch(uint32_t x, uint32_t y, uint32_t z)
44 {
45         return z ^ (x & (y ^ z));
46 }
47
48 static inline uint32_t Maj(uint32_t x, uint32_t y, uint32_t z)
49 {
50         return (x & y) | (z & (x | y));
51 }
52
53 #define e0(x)       (ror32(x, 2) ^ ror32(x,13) ^ ror32(x,22))
54 #define e1(x)       (ror32(x, 6) ^ ror32(x,11) ^ ror32(x,25))
55 #define s0(x)       (ror32(x, 7) ^ ror32(x,18) ^ (x >> 3))
56 #define s1(x)       (ror32(x,17) ^ ror32(x,19) ^ (x >> 10))
57
58 #define H0         0x6a09e667
59 #define H1         0xbb67ae85
60 #define H2         0x3c6ef372
61 #define H3         0xa54ff53a
62 #define H4         0x510e527f
63 #define H5         0x9b05688c
64 #define H6         0x1f83d9ab
65 #define H7         0x5be0cd19
66
67 static inline uint32_t ror32(uint32_t word, unsigned int shift)
68 {
69          return (word >> shift) | (word << (32 - shift));
70 }
71
72 static inline void LOAD_OP(int I, uint32_t *W, const uint8_t *input)
73 {
74         W[I] = __be32_to_cpu(((uint32_t *)(input))[I]);
75 }
76
77 static inline void BLEND_OP(int I, uint32_t *W)
78 {
79         W[I] = s1(W[I-2]) + W[I-7] + s0(W[I-15]) + W[I-16];
80 }
81
82 static void sha256_transform(uint32_t *state, const uint8_t *input)
83 {
84         uint32_t a, b, c, d, e, f, g, h, t1, t2;
85         uint32_t W[64];
86         int i;
87
88         /* load the input */
89         for (i = 0; i < 16; i++)
90                 LOAD_OP(i, W, input);
91
92         /* now blend */
93         for (i = 16; i < 64; i++)
94                 BLEND_OP(i, W);
95
96         /* load the state into our registers */
97         a=state[0];  b=state[1];  c=state[2];  d=state[3];
98         e=state[4];  f=state[5];  g=state[6];  h=state[7];
99
100         /* now iterate */
101         t1 = h + e1(e) + Ch(e,f,g) + 0x428a2f98 + W[ 0];
102         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
103         t1 = g + e1(d) + Ch(d,e,f) + 0x71374491 + W[ 1];
104         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
105         t1 = f + e1(c) + Ch(c,d,e) + 0xb5c0fbcf + W[ 2];
106         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
107         t1 = e + e1(b) + Ch(b,c,d) + 0xe9b5dba5 + W[ 3];
108         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
109         t1 = d + e1(a) + Ch(a,b,c) + 0x3956c25b + W[ 4];
110         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
111         t1 = c + e1(h) + Ch(h,a,b) + 0x59f111f1 + W[ 5];
112         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
113         t1 = b + e1(g) + Ch(g,h,a) + 0x923f82a4 + W[ 6];
114         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
115         t1 = a + e1(f) + Ch(f,g,h) + 0xab1c5ed5 + W[ 7];
116         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
117
118         t1 = h + e1(e) + Ch(e,f,g) + 0xd807aa98 + W[ 8];
119         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
120         t1 = g + e1(d) + Ch(d,e,f) + 0x12835b01 + W[ 9];
121         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
122         t1 = f + e1(c) + Ch(c,d,e) + 0x243185be + W[10];
123         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
124         t1 = e + e1(b) + Ch(b,c,d) + 0x550c7dc3 + W[11];
125         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
126         t1 = d + e1(a) + Ch(a,b,c) + 0x72be5d74 + W[12];
127         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
128         t1 = c + e1(h) + Ch(h,a,b) + 0x80deb1fe + W[13];
129         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
130         t1 = b + e1(g) + Ch(g,h,a) + 0x9bdc06a7 + W[14];
131         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
132         t1 = a + e1(f) + Ch(f,g,h) + 0xc19bf174 + W[15];
133         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
134
135         t1 = h + e1(e) + Ch(e,f,g) + 0xe49b69c1 + W[16];
136         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
137         t1 = g + e1(d) + Ch(d,e,f) + 0xefbe4786 + W[17];
138         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
139         t1 = f + e1(c) + Ch(c,d,e) + 0x0fc19dc6 + W[18];
140         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
141         t1 = e + e1(b) + Ch(b,c,d) + 0x240ca1cc + W[19];
142         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
143         t1 = d + e1(a) + Ch(a,b,c) + 0x2de92c6f + W[20];
144         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
145         t1 = c + e1(h) + Ch(h,a,b) + 0x4a7484aa + W[21];
146         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
147         t1 = b + e1(g) + Ch(g,h,a) + 0x5cb0a9dc + W[22];
148         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
149         t1 = a + e1(f) + Ch(f,g,h) + 0x76f988da + W[23];
150         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
151
152         t1 = h + e1(e) + Ch(e,f,g) + 0x983e5152 + W[24];
153         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
154         t1 = g + e1(d) + Ch(d,e,f) + 0xa831c66d + W[25];
155         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
156         t1 = f + e1(c) + Ch(c,d,e) + 0xb00327c8 + W[26];
157         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
158         t1 = e + e1(b) + Ch(b,c,d) + 0xbf597fc7 + W[27];
159         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
160         t1 = d + e1(a) + Ch(a,b,c) + 0xc6e00bf3 + W[28];
161         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
162         t1 = c + e1(h) + Ch(h,a,b) + 0xd5a79147 + W[29];
163         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
164         t1 = b + e1(g) + Ch(g,h,a) + 0x06ca6351 + W[30];
165         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
166         t1 = a + e1(f) + Ch(f,g,h) + 0x14292967 + W[31];
167         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
168
169         t1 = h + e1(e) + Ch(e,f,g) + 0x27b70a85 + W[32];
170         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
171         t1 = g + e1(d) + Ch(d,e,f) + 0x2e1b2138 + W[33];
172         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
173         t1 = f + e1(c) + Ch(c,d,e) + 0x4d2c6dfc + W[34];
174         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
175         t1 = e + e1(b) + Ch(b,c,d) + 0x53380d13 + W[35];
176         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
177         t1 = d + e1(a) + Ch(a,b,c) + 0x650a7354 + W[36];
178         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
179         t1 = c + e1(h) + Ch(h,a,b) + 0x766a0abb + W[37];
180         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
181         t1 = b + e1(g) + Ch(g,h,a) + 0x81c2c92e + W[38];
182         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
183         t1 = a + e1(f) + Ch(f,g,h) + 0x92722c85 + W[39];
184         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
185
186         t1 = h + e1(e) + Ch(e,f,g) + 0xa2bfe8a1 + W[40];
187         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
188         t1 = g + e1(d) + Ch(d,e,f) + 0xa81a664b + W[41];
189         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
190         t1 = f + e1(c) + Ch(c,d,e) + 0xc24b8b70 + W[42];
191         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
192         t1 = e + e1(b) + Ch(b,c,d) + 0xc76c51a3 + W[43];
193         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
194         t1 = d + e1(a) + Ch(a,b,c) + 0xd192e819 + W[44];
195         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
196         t1 = c + e1(h) + Ch(h,a,b) + 0xd6990624 + W[45];
197         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
198         t1 = b + e1(g) + Ch(g,h,a) + 0xf40e3585 + W[46];
199         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
200         t1 = a + e1(f) + Ch(f,g,h) + 0x106aa070 + W[47];
201         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
202
203         t1 = h + e1(e) + Ch(e,f,g) + 0x19a4c116 + W[48];
204         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
205         t1 = g + e1(d) + Ch(d,e,f) + 0x1e376c08 + W[49];
206         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
207         t1 = f + e1(c) + Ch(c,d,e) + 0x2748774c + W[50];
208         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
209         t1 = e + e1(b) + Ch(b,c,d) + 0x34b0bcb5 + W[51];
210         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
211         t1 = d + e1(a) + Ch(a,b,c) + 0x391c0cb3 + W[52];
212         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
213         t1 = c + e1(h) + Ch(h,a,b) + 0x4ed8aa4a + W[53];
214         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
215         t1 = b + e1(g) + Ch(g,h,a) + 0x5b9cca4f + W[54];
216         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
217         t1 = a + e1(f) + Ch(f,g,h) + 0x682e6ff3 + W[55];
218         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
219
220         t1 = h + e1(e) + Ch(e,f,g) + 0x748f82ee + W[56];
221         t2 = e0(a) + Maj(a,b,c);    d+=t1;    h=t1+t2;
222         t1 = g + e1(d) + Ch(d,e,f) + 0x78a5636f + W[57];
223         t2 = e0(h) + Maj(h,a,b);    c+=t1;    g=t1+t2;
224         t1 = f + e1(c) + Ch(c,d,e) + 0x84c87814 + W[58];
225         t2 = e0(g) + Maj(g,h,a);    b+=t1;    f=t1+t2;
226         t1 = e + e1(b) + Ch(b,c,d) + 0x8cc70208 + W[59];
227         t2 = e0(f) + Maj(f,g,h);    a+=t1;    e=t1+t2;
228         t1 = d + e1(a) + Ch(a,b,c) + 0x90befffa + W[60];
229         t2 = e0(e) + Maj(e,f,g);    h+=t1;    d=t1+t2;
230         t1 = c + e1(h) + Ch(h,a,b) + 0xa4506ceb + W[61];
231         t2 = e0(d) + Maj(d,e,f);    g+=t1;    c=t1+t2;
232         t1 = b + e1(g) + Ch(g,h,a) + 0xbef9a3f7 + W[62];
233         t2 = e0(c) + Maj(c,d,e);    f+=t1;    b=t1+t2;
234         t1 = a + e1(f) + Ch(f,g,h) + 0xc67178f2 + W[63];
235         t2 = e0(b) + Maj(b,c,d);    e+=t1;    a=t1+t2;
236
237         state[0] += a; state[1] += b; state[2] += c; state[3] += d;
238         state[4] += e; state[5] += f; state[6] += g; state[7] += h;
239
240         /* clear any sensitive info... */
241         a = b = c = d = e = f = g = h = t1 = t2 = 0;
242         memset(W, 0, 64 * sizeof(uint32_t));
243 }
244
245 void sha256_init(struct sha256_ctx *sctx)
246 {
247         sctx->state[0] = H0;
248         sctx->state[1] = H1;
249         sctx->state[2] = H2;
250         sctx->state[3] = H3;
251         sctx->state[4] = H4;
252         sctx->state[5] = H5;
253         sctx->state[6] = H6;
254         sctx->state[7] = H7;
255         sctx->count[0] = sctx->count[1] = 0;
256 }
257
258 void sha256_update(struct sha256_ctx *sctx, const uint8_t *data,
259                    unsigned int len)
260 {
261         unsigned int i, index, part_len;
262
263         /* Compute number of bytes mod 128 */
264         index = (unsigned int)((sctx->count[0] >> 3) & 0x3f);
265
266         /* Update number of bits */
267         if ((sctx->count[0] += (len << 3)) < (len << 3)) {
268                 sctx->count[1]++;
269                 sctx->count[1] += (len >> 29);
270         }
271
272         part_len = 64 - index;
273
274         /* Transform as many times as possible. */
275         if (len >= part_len) {
276                 memcpy(&sctx->buf[index], data, part_len);
277                 sha256_transform(sctx->state, sctx->buf);
278
279                 for (i = part_len; i + 63 < len; i += 64)
280                         sha256_transform(sctx->state, &data[i]);
281                 index = 0;
282         } else {
283                 i = 0;
284         }
285         
286         /* Buffer remaining input */
287         memcpy(&sctx->buf[index], &data[i], len-i);
288 }