[PATCH] Warn on conflicting read/write iolog
[fio.git] / fio.h
1 #ifndef FIO_H
2 #define FIO_H
3
4 #include <sched.h>
5 #include <limits.h>
6 #include <pthread.h>
7 #include <sys/time.h>
8 #include <sys/resource.h>
9 #include <errno.h>
10 #include <stdlib.h>
11 #include <stdio.h>
12 #include <unistd.h>
13
14 #include "list.h"
15 #include "md5.h"
16 #include "crc32.h"
17 #include "arch.h"
18 #include "os.h"
19
20 struct io_stat {
21         unsigned long val;
22         unsigned long val_sq;
23         unsigned long max_val;
24         unsigned long min_val;
25         unsigned long samples;
26 };
27
28 struct io_sample {
29         unsigned long time;
30         unsigned long val;
31         unsigned int ddir;
32 };
33
34 struct io_log {
35         unsigned long nr_samples;
36         unsigned long max_samples;
37         struct io_sample *log;
38 };
39
40 struct io_piece {
41         struct list_head list;
42         unsigned long long offset;
43         unsigned int len;
44         int ddir;
45 };
46
47 /*
48  * The io unit
49  */
50 struct io_u {
51         union {
52 #ifdef FIO_HAVE_LIBAIO
53                 struct iocb iocb;
54 #endif
55 #ifdef FIO_HAVE_POSIXAIO
56                 struct aiocb aiocb;
57 #endif
58 #ifdef FIO_HAVE_SGIO
59                 struct sg_io_hdr hdr;
60 #endif
61         };
62         struct timeval start_time;
63         struct timeval issue_time;
64
65         char *buf;
66         unsigned int buflen;
67         unsigned long long offset;
68         unsigned int index;
69
70         unsigned int resid;
71         unsigned int error;
72
73         unsigned char seen;
74         unsigned char ddir;
75
76         struct list_head list;
77 };
78
79 #define FIO_HDR_MAGIC   0xf00baaef
80
81 enum {
82         VERIFY_NONE = 0,
83         VERIFY_MD5,
84         VERIFY_CRC32,
85 };
86
87 struct verify_header {
88         unsigned int fio_magic;
89         unsigned int len;
90         unsigned int verify_type;
91         union {
92                 char md5_digest[MD5_HASH_WORDS * 4];
93                 unsigned long crc32;
94         };
95 };
96
97 struct group_run_stats {
98         unsigned long long max_run[2], min_run[2];
99         unsigned long long max_bw[2], min_bw[2];
100         unsigned long long io_kb[2];
101         unsigned long long agg[2];
102 };
103
104 enum fio_ddir {
105         DDIR_READ = 0,
106         DDIR_WRITE,
107 };
108
109 /*
110  * What type of allocation to use for io buffers
111  */
112 enum fio_memtype {
113         MEM_MALLOC = 0, /* ordinary malloc */
114         MEM_SHM,        /* use shared memory segments */
115         MEM_MMAP,       /* use anonynomous mmap */
116 };
117
118 /*
119  * The type of object we are working on
120  */
121 enum fio_filetype {
122         FIO_TYPE_FILE = 1,
123         FIO_TYPE_BD,
124         FIO_TYPE_CHAR,
125 };
126
127 enum fio_iotype {
128         FIO_SYNCIO      = 1 << 0,
129         FIO_MMAPIO      = 1 << 1 | FIO_SYNCIO,
130         FIO_LIBAIO      = 1 << 2,
131         FIO_POSIXAIO    = 1 << 3,
132         FIO_SGIO        = 1 << 4,
133         FIO_SPLICEIO    = 1 << 5 | FIO_SYNCIO,
134 };
135
136 /*
137  * This describes a single thread/process executing a fio job.
138  */
139 struct thread_data {
140         char name[32];
141         char *file_name;
142         char *directory;
143         char verror[80];
144         pthread_t thread;
145         int thread_number;
146         int groupid;
147         enum fio_filetype filetype;
148         int error;
149         int fd;
150         void *mmap;
151         pid_t pid;
152         char *orig_buffer;
153         size_t orig_buffer_size;
154         volatile int terminate;
155         volatile int runstate;
156         volatile int old_runstate;
157         enum fio_ddir ddir;
158         unsigned int iomix;
159         unsigned int ioprio;
160
161         unsigned char sequential;
162         unsigned char odirect;
163         unsigned char create_file;
164         unsigned char invalidate_cache;
165         unsigned char create_serialize;
166         unsigned char create_fsync;
167         unsigned char end_fsync;
168         unsigned char sync_io;
169         unsigned char verify;
170         unsigned char use_thread;
171         unsigned char do_disk_util;
172         unsigned char override_sync;
173
174         unsigned int bs;
175         unsigned int min_bs;
176         unsigned int max_bs;
177         unsigned int thinktime;
178         unsigned int fsync_blocks;
179         unsigned int start_delay;
180         unsigned int timeout;
181         enum fio_iotype io_engine;
182         unsigned int overwrite;
183         unsigned int bw_avg_time;
184         unsigned int loops;
185         unsigned long long file_size;
186         unsigned long long real_file_size;
187         unsigned long long file_offset;
188         unsigned long long zone_size;
189         unsigned long long zone_skip;
190         enum fio_memtype mem_type;
191         unsigned int stonewall;
192         unsigned int numjobs;
193         unsigned int iodepth;
194         os_cpu_mask_t cpumask;
195         unsigned int jobnum;
196         unsigned int iolog;
197         unsigned int read_iolog;
198         unsigned int write_iolog;
199         unsigned int rwmixcycle;
200         unsigned int rwmixread;
201         unsigned int nice;
202
203         char *iolog_file;
204         void *iolog_buf;
205         FILE *iolog_f;
206
207         char *sysfs_root;
208         char *ioscheduler;
209
210         os_random_state_t bsrange_state;
211         os_random_state_t verify_state;
212
213         int shm_id;
214
215         /*
216          * IO engine hooks, contains everything needed to submit an io_u
217          * to any of the available IO engines.
218          */
219         void *io_data;
220         char io_engine_name[16];
221         int (*io_prep)(struct thread_data *, struct io_u *);
222         int (*io_queue)(struct thread_data *, struct io_u *);
223         int (*io_getevents)(struct thread_data *, int, int, struct timespec *);
224         struct io_u *(*io_event)(struct thread_data *, int);
225         int (*io_cancel)(struct thread_data *, struct io_u *);
226         void (*io_cleanup)(struct thread_data *);
227         int (*io_sync)(struct thread_data *);
228
229         /*
230          * Current IO depth and list of free and busy io_u's.
231          */
232         unsigned int cur_depth;
233         struct list_head io_u_freelist;
234         struct list_head io_u_busylist;
235
236         /*
237          * Rate state
238          */
239         unsigned int rate;
240         unsigned int ratemin;
241         unsigned int ratecycle;
242         unsigned long rate_usec_cycle;
243         long rate_pending_usleep;
244         unsigned long rate_bytes;
245         struct timeval lastrate;
246
247         unsigned long runtime[2];               /* msec */
248         unsigned long long io_size;
249         unsigned long long total_io_size;
250
251         unsigned long long io_blocks[2];
252         unsigned long long io_bytes[2];
253         unsigned long long zone_bytes;
254         unsigned long long this_io_bytes[2];
255         unsigned long long last_pos;
256         volatile int mutex;
257
258         /*
259          * State for random io, a bitmap of blocks done vs not done
260          */
261         os_random_state_t random_state;
262         unsigned long *file_map;
263         unsigned int num_maps;
264
265         /*
266          * bandwidth and latency stats
267          */
268         struct io_stat clat_stat[2];            /* completion latency */
269         struct io_stat slat_stat[2];            /* submission latency */
270         struct io_stat bw_stat[2];              /* bandwidth stats */
271
272         unsigned long long stat_io_bytes[2];
273         struct timeval stat_sample_time[2];
274
275         struct io_log *slat_log;
276         struct io_log *clat_log;
277         struct io_log *bw_log;
278
279         struct timeval start;   /* start of this loop */
280         struct timeval epoch;   /* time job was started */
281
282         /*
283          * fio system usage accounting
284          */
285         struct rusage ru_start;
286         struct rusage ru_end;
287         unsigned long usr_time;
288         unsigned long sys_time;
289         unsigned long ctx;
290
291         /*
292          * read/write mixed workload state
293          */
294         os_random_state_t rwmix_state;
295         struct timeval rwmix_switch;
296         enum fio_ddir rwmix_ddir;
297
298         /*
299          * Pre-run and post-run shell
300          */
301         char *exec_prerun;
302         char *exec_postrun;
303
304         /*
305          * IO historic logs
306          */
307         struct list_head io_hist_list;
308         struct list_head io_log_list;
309 };
310
311 #define td_verror(td, err)                                              \
312         do {                                                            \
313                 int e = (err);                                          \
314                 (td)->error = e;                                        \
315                 snprintf(td->verror, sizeof(td->verror) - 1, "file:%s:%d, error=%s", __FILE__, __LINE__, strerror(e));  \
316         } while (0)
317
318 extern struct io_u *__get_io_u(struct thread_data *);
319 extern void put_io_u(struct thread_data *, struct io_u *);
320
321 extern int rate_quit;
322 extern int write_lat_log;
323 extern int write_bw_log;
324 extern int exitall_on_terminate;
325 extern int thread_number;
326 extern int shm_id;
327 extern int groupid;
328
329 extern struct thread_data *threads;
330
331 #define td_read(td)             ((td)->ddir == DDIR_READ)
332 #define td_write(td)            ((td)->ddir == DDIR_WRITE)
333 #define td_rw(td)               ((td)->iomix != 0)
334
335 #define BLOCKS_PER_MAP          (8 * sizeof(long))
336 #define TO_MAP_BLOCK(td, b)     ((b) - ((td)->file_offset / (td)->min_bs))
337 #define RAND_MAP_IDX(td, b)     (TO_MAP_BLOCK(td, b) / BLOCKS_PER_MAP)
338 #define RAND_MAP_BIT(td, b)     (TO_MAP_BLOCK(td, b) & (BLOCKS_PER_MAP - 1))
339
340 #define MAX_JOBS        (1024)
341
342 struct disk_util_stat {
343         unsigned ios[2];
344         unsigned merges[2];
345         unsigned long long sectors[2];
346         unsigned ticks[2];
347         unsigned io_ticks;
348         unsigned time_in_queue;
349 };
350
351 struct disk_util {
352         struct list_head list;
353
354         char *name;
355         char path[256];
356         dev_t dev;
357
358         struct disk_util_stat dus;
359         struct disk_util_stat last_dus;
360
361         unsigned long msec;
362         struct timeval time;
363 };
364
365 struct io_completion_data {
366         int nr;                         /* input */
367
368         int error;                      /* output */
369         unsigned long bytes_done[2];    /* output */
370 };
371
372 #define DISK_UTIL_MSEC  (250)
373
374 #ifndef min
375 #define min(a, b)       ((a) < (b) ? (a) : (b))
376 #endif
377
378 /*
379  * Log exports
380  */
381 extern int read_iolog_get(struct thread_data *, struct io_u *);
382 extern void write_iolog_put(struct thread_data *, struct io_u *);
383 extern int init_iolog(struct thread_data *td);
384 extern void log_io_piece(struct thread_data *, struct io_u *);
385 extern void prune_io_piece_log(struct thread_data *);
386 extern void write_iolog_close(struct thread_data *);
387
388 /*
389  * Logging
390  */
391 extern void add_clat_sample(struct thread_data *, int, unsigned long);
392 extern void add_slat_sample(struct thread_data *, int, unsigned long);
393 extern void add_bw_sample(struct thread_data *, int);
394 extern void show_run_stats(void);
395 extern void init_disk_util(struct thread_data *);
396 extern void update_rusage_stat(struct thread_data *);
397 extern void update_io_ticks(void);
398 extern void disk_util_timer_arm(void);
399 extern void setup_log(struct io_log **);
400 extern void finish_log(struct thread_data *, struct io_log *, const char *);
401 extern int setup_rate(struct thread_data *);
402
403 /*
404  * Time functions
405  */
406 extern unsigned long utime_since(struct timeval *, struct timeval *);
407 extern unsigned long mtime_since(struct timeval *, struct timeval *);
408 extern unsigned long mtime_since_now(struct timeval *);
409 extern unsigned long time_since_now(struct timeval *);
410 extern void usec_sleep(struct thread_data *, unsigned long);
411 extern void rate_throttle(struct thread_data *, unsigned long, unsigned int);
412
413 /*
414  * Init functions
415  */
416 extern int parse_options(int, char **);
417 extern int init_random_state(struct thread_data *);
418
419 /*
420  * This is a pretty crappy semaphore implementation, but with the use that fio
421  * has (just signalling start/go conditions), it doesn't have to be better.
422  * Naturally this would not work for any type of contended semaphore or
423  * for real locking.
424  */
425 static inline void fio_sem_init(volatile int volatile *sem, int val)
426 {
427         *sem = val;
428 }
429
430 static inline void fio_sem_down(volatile int volatile *sem)
431 {
432         while (*sem == 0)
433                 usleep(10000);
434
435         (*sem)--;
436 }
437
438 static inline void fio_sem_up(volatile int volatile *sem)
439 {
440         (*sem)++;
441 }
442
443 #endif