1bcd487941aee64e2e2107421968616e816e7436
[fio.git] / init.c
1 /*
2  * This file contains job initialization and setup functions.
3  */
4 #include <stdio.h>
5 #include <stdlib.h>
6 #include <unistd.h>
7 #include <fcntl.h>
8 #include <ctype.h>
9 #include <string.h>
10 #include <errno.h>
11 #include <getopt.h>
12 #include <assert.h>
13 #include <sys/ipc.h>
14 #include <sys/shm.h>
15 #include <sys/types.h>
16 #include <sys/stat.h>
17
18 #include "fio.h"
19 #include "parse.h"
20
21 /*
22  * The default options
23  */
24 #define DEF_BS                  (4096)
25 #define DEF_TIMEOUT             (0)
26 #define DEF_RATE_CYCLE          (1000)
27 #define DEF_ODIRECT             (1)
28 #define DEF_IO_ENGINE           (FIO_SYNCIO)
29 #define DEF_IO_ENGINE_NAME      "sync"
30 #define DEF_SEQUENTIAL          (1)
31 #define DEF_RAND_REPEAT         (1)
32 #define DEF_OVERWRITE           (1)
33 #define DEF_INVALIDATE          (1)
34 #define DEF_SYNCIO              (0)
35 #define DEF_RANDSEED            (0xb1899bedUL)
36 #define DEF_BWAVGTIME           (500)
37 #define DEF_CREATE_SER          (1)
38 #define DEF_CREATE_FSYNC        (1)
39 #define DEF_LOOPS               (1)
40 #define DEF_VERIFY              (0)
41 #define DEF_STONEWALL           (0)
42 #define DEF_NUMJOBS             (1)
43 #define DEF_USE_THREAD          (0)
44 #define DEF_FILE_SIZE           (1024 * 1024 * 1024UL)
45 #define DEF_ZONE_SIZE           (0)
46 #define DEF_ZONE_SKIP           (0)
47 #define DEF_RWMIX_CYCLE         (500)
48 #define DEF_RWMIX_READ          (50)
49 #define DEF_NICE                (0)
50 #define DEF_NR_FILES            (1)
51 #define DEF_UNLINK              (0)
52 #define DEF_WRITE_BW_LOG        (0)
53 #define DEF_WRITE_LAT_LOG       (0)
54
55 #define td_var_offset(var)      ((size_t) &((struct thread_data *)0)->var)
56
57 static int str_rw_cb(void *, const char *);
58 static int str_ioengine_cb(void *, const char *);
59 static int str_mem_cb(void *, const char *);
60 static int str_verify_cb(void *, const char *);
61 static int str_lockmem_cb(void *, unsigned long *);
62 static int str_prio_cb(void *, unsigned int *);
63 static int str_prioclass_cb(void *, unsigned int *);
64 static int str_exitall_cb(void);
65 static int str_cpumask_cb(void *, unsigned int *);
66
67 /*
68  * Map of job/command line options
69  */
70 static struct fio_option options[] = {
71         {
72                 .name   = "name",
73                 .type   = FIO_OPT_STR_STORE,
74                 .off1   = td_var_offset(name),
75         },
76         {
77                 .name   = "directory",
78                 .type   = FIO_OPT_STR_STORE,
79                 .off1   = td_var_offset(directory),
80         },
81         {
82                 .name   = "filename",
83                 .type   = FIO_OPT_STR_STORE,
84                 .off1   = td_var_offset(filename),
85         },
86         {
87                 .name   = "rw",
88                 .type   = FIO_OPT_STR,
89                 .cb     = str_rw_cb,
90         },
91         {
92                 .name   = "ioengine",
93                 .type   = FIO_OPT_STR,
94                 .cb     = str_ioengine_cb,
95         },
96         {
97                 .name   = "mem",
98                 .type   = FIO_OPT_STR,
99                 .cb     = str_mem_cb,
100         },
101         {
102                 .name   = "verify",
103                 .type   = FIO_OPT_STR,
104                 .cb     = str_verify_cb,
105         },
106         {
107                 .name   = "write_iolog",
108                 .type   = FIO_OPT_STR_STORE,
109                 .off1   = td_var_offset(write_iolog_file),
110         },
111         {
112                 .name   = "read_iolog",
113                 .type   = FIO_OPT_STR_STORE,
114                 .off1   = td_var_offset(read_iolog_file),
115         },
116         {
117                 .name   = "exec_prerun",
118                 .type   = FIO_OPT_STR_STORE,
119                 .off1   = td_var_offset(exec_prerun),
120         },
121         {
122                 .name   = "exec_postrun",
123                 .type   = FIO_OPT_STR_STORE,
124                 .off1   = td_var_offset(exec_postrun),
125         },
126 #ifdef FIO_HAVE_IOSCHED_SWITCH
127         {
128                 .name   = "ioscheduler",
129                 .type   = FIO_OPT_STR_STORE,
130                 .off1   = td_var_offset(ioscheduler),
131         },
132 #endif
133         {
134                 .name   = "size",
135                 .type   = FIO_OPT_STR_VAL,
136                 .off1   = td_var_offset(total_file_size),
137         },
138         {
139                 .name   = "bs",
140                 .type   = FIO_OPT_STR_VAL,
141                 .off1   = td_var_offset(bs),
142         },
143         {
144                 .name   = "offset",
145                 .type   = FIO_OPT_STR_VAL,
146                 .off1   = td_var_offset(start_offset),
147         },
148         {
149                 .name   = "zonesize",
150                 .type   = FIO_OPT_STR_VAL,
151                 .off1   = td_var_offset(zone_size),
152         },
153         {
154                 .name   = "zoneskip",
155                 .type   = FIO_OPT_STR_VAL,
156                 .off1   = td_var_offset(zone_skip),
157         },
158         {
159                 .name   = "lockmem",
160                 .type   = FIO_OPT_STR_VAL,
161                 .cb     = str_lockmem_cb,
162         },
163         {
164                 .name   = "bsrange",
165                 .type   = FIO_OPT_RANGE,
166                 .off1   = td_var_offset(min_bs),
167                 .off2   = td_var_offset(max_bs),
168         },
169         {
170                 .name   = "nrfiles",
171                 .type   = FIO_OPT_INT,
172                 .off1   = td_var_offset(nr_files),
173         },
174         {
175                 .name   = "iodepth",
176                 .type   = FIO_OPT_INT,
177                 .off1   = td_var_offset(iodepth),
178         },
179         {
180                 .name   = "fsync",
181                 .type   = FIO_OPT_INT,
182                 .off1   = td_var_offset(fsync_blocks),
183         },
184         {
185                 .name   = "rwmixcycle",
186                 .type   = FIO_OPT_INT,
187                 .off1   = td_var_offset(rwmixcycle),
188         },
189         {
190                 .name   = "rwmixread",
191                 .type   = FIO_OPT_INT,
192                 .off1   = td_var_offset(rwmixread),
193                 .max_val= 100,
194         },
195         {
196                 .name   = "rwmixwrite",
197                 .type   = FIO_OPT_INT,
198                 .off1   = td_var_offset(rwmixwrite),
199                 .max_val= 100,
200         },
201         {
202                 .name   = "nice",
203                 .type   = FIO_OPT_INT,
204                 .off1   = td_var_offset(nice),
205         },
206 #ifdef FIO_HAVE_IOPRIO
207         {
208                 .name   = "prio",
209                 .type   = FIO_OPT_INT,
210                 .cb     = str_prio_cb,
211         },
212         {
213                 .name   = "prioclass",
214                 .type   = FIO_OPT_INT,
215                 .cb     = str_prioclass_cb,
216         },
217 #endif
218         {
219                 .name   = "thinktime",
220                 .type   = FIO_OPT_INT,
221                 .off1   = td_var_offset(thinktime)
222         },
223         {
224                 .name   = "rate",
225                 .type   = FIO_OPT_INT,
226                 .off1   = td_var_offset(rate)
227         },
228         {
229                 .name   = "ratemin",
230                 .type   = FIO_OPT_INT,
231                 .off1   = td_var_offset(ratemin)
232         },
233         {
234                 .name   = "ratecycle",
235                 .type   = FIO_OPT_INT,
236                 .off1   = td_var_offset(ratecycle)
237         },
238         {
239                 .name   = "startdelay",
240                 .type   = FIO_OPT_INT,
241                 .off1   = td_var_offset(start_delay)
242         },
243         {
244                 .name   = "timeout",
245                 .type   = FIO_OPT_STR_VAL_TIME,
246                 .off1   = td_var_offset(timeout)
247         },
248         {
249                 .name   = "invalidate",
250                 .type   = FIO_OPT_INT,
251                 .off1   = td_var_offset(invalidate_cache)
252         },
253         {
254                 .name   = "sync",
255                 .type   = FIO_OPT_INT,
256                 .off1   = td_var_offset(sync_io)
257         },
258         {
259                 .name   = "bwavgtime",
260                 .type   = FIO_OPT_INT,
261                 .off1   = td_var_offset(bw_avg_time)
262         },
263         {
264                 .name   = "create_serialize",
265                 .type   = FIO_OPT_INT,
266                 .off1   = td_var_offset(create_serialize)
267         },
268         {
269                 .name   = "create_fsync",
270                 .type   = FIO_OPT_INT,
271                 .off1   = td_var_offset(create_fsync)
272         },
273         {
274                 .name   = "loops",
275                 .type   = FIO_OPT_INT,
276                 .off1   = td_var_offset(loops)
277         },
278         {
279                 .name   = "numjobs",
280                 .type   = FIO_OPT_INT,
281                 .off1   = td_var_offset(numjobs)
282         },
283         {
284                 .name   = "cpuload",
285                 .type   = FIO_OPT_INT,
286                 .off1   = td_var_offset(cpuload)
287         },
288         {
289                 .name   = "cpuchunks",
290                 .type   = FIO_OPT_INT,
291                 .off1   = td_var_offset(cpucycle)
292         },
293         {
294                 .name   = "direct",
295                 .type   = FIO_OPT_INT,
296                 .off1   = td_var_offset(odirect)
297         },
298         {
299                 .name   = "overwrite",
300                 .type   = FIO_OPT_INT,
301                 .off1   = td_var_offset(overwrite)
302         },
303 #ifdef FIO_HAVE_CPU_AFFINITY
304         {
305                 .name   = "cpumask",
306                 .type   = FIO_OPT_INT,
307                 .cb     = str_cpumask_cb,
308         },
309 #endif
310         {
311                 .name   = "end_fsync",
312                 .type   = FIO_OPT_INT,
313                 .off1   = td_var_offset(end_fsync)
314         },
315         {
316                 .name   = "unlink",
317                 .type   = FIO_OPT_STR_SET,
318                 .off1   = td_var_offset(unlink),
319         },
320         {
321                 .name   = "exitall",
322                 .type   = FIO_OPT_STR_SET,
323                 .cb     = str_exitall_cb,
324         },
325         {
326                 .name   = "stonewall",
327                 .type   = FIO_OPT_STR_SET,
328                 .off1   = td_var_offset(stonewall),
329         },
330         {
331                 .name   = "thread",
332                 .type   = FIO_OPT_STR_SET,
333                 .off1   = td_var_offset(thread),
334         },
335         {
336                 .name   = "write_bw_log",
337                 .type   = FIO_OPT_STR_SET,
338                 .off1   = td_var_offset(write_bw_log),
339         },
340         {
341                 .name   = "write_lat_log",
342                 .type   = FIO_OPT_STR_SET,
343                 .off1   = td_var_offset(write_lat_log),
344         },
345         {
346                 .name = NULL,
347         },
348 };
349
350 #define FIO_JOB_OPTS    (sizeof(options) / sizeof(struct fio_option))
351 #define FIO_CMD_OPTS    (16)
352 #define FIO_GETOPT_JOB  (0x89988998)
353
354 /*
355  * Command line options. These will contain the above, plus a few
356  * extra that only pertain to fio itself and not jobs.
357  */
358 static struct option long_options[FIO_JOB_OPTS + FIO_CMD_OPTS] = {
359         {
360                 .name           = "output",
361                 .has_arg        = required_argument,
362                 .val            = 'o',
363         },
364         {
365                 .name           = "timeout",
366                 .has_arg        = required_argument,
367                 .val            = 't',
368         },
369         {
370                 .name           = "latency-log",
371                 .has_arg        = required_argument,
372                 .val            = 'l',
373         },
374         {
375                 .name           = "bandwidth-log",
376                 .has_arg        = required_argument,
377                 .val            = 'b',
378         },
379         {
380                 .name           = "minimal",
381                 .has_arg        = optional_argument,
382                 .val            = 'm',
383         },
384         {
385                 .name           = "version",
386                 .has_arg        = no_argument,
387                 .val            = 'v',
388         },
389         {
390                 .name           = NULL,
391         },
392 };
393
394 static int def_timeout = DEF_TIMEOUT;
395
396 static char fio_version_string[] = "fio 1.7";
397
398 static char **ini_file;
399 static int max_jobs = MAX_JOBS;
400
401 struct thread_data def_thread;
402 struct thread_data *threads = NULL;
403
404 int rate_quit = 0;
405 int exitall_on_terminate = 0;
406 int terse_output = 0;
407 unsigned long long mlock_size = 0;
408 FILE *f_out = NULL;
409 FILE *f_err = NULL;
410
411 static int write_lat_log = DEF_WRITE_LAT_LOG;
412 static int write_bw_log = DEF_WRITE_BW_LOG;
413
414 /*
415  * Return a free job structure.
416  */
417 static struct thread_data *get_new_job(int global, struct thread_data *parent)
418 {
419         struct thread_data *td;
420
421         if (global)
422                 return &def_thread;
423         if (thread_number >= max_jobs)
424                 return NULL;
425
426         td = &threads[thread_number++];
427         *td = *parent;
428
429         td->thread_number = thread_number;
430         return td;
431 }
432
433 static void put_job(struct thread_data *td)
434 {
435         if (td == &def_thread)
436                 return;
437
438         memset(&threads[td->thread_number - 1], 0, sizeof(*td));
439         thread_number--;
440 }
441
442 /*
443  * Lazy way of fixing up options that depend on each other. We could also
444  * define option callback handlers, but this is easier.
445  */
446 static void fixup_options(struct thread_data *td)
447 {
448         if (!td->min_bs)
449                 td->min_bs = td->bs;
450         if (!td->max_bs)
451                 td->max_bs = td->bs;
452
453         if (!td->rwmixread && td->rwmixwrite)
454                 td->rwmixread = 100 - td->rwmixwrite;
455
456         if (td->write_iolog_file && td->read_iolog_file) {
457                 log_err("fio: read iolog overrides write_iolog\n");
458                 free(td->write_iolog_file);
459                 td->write_iolog_file = NULL;
460         }
461 }
462
463 /*
464  * Adds a job to the list of things todo. Sanitizes the various options
465  * to make sure we don't have conflicts, and initializes various
466  * members of td.
467  */
468 static int add_job(struct thread_data *td, const char *jobname, int job_add_num)
469 {
470         char *ddir_str[] = { "read", "write", "randread", "randwrite",
471                              "rw", NULL, "randrw" };
472         struct stat sb;
473         int numjobs, ddir, i;
474         struct fio_file *f;
475
476 #ifndef FIO_HAVE_LIBAIO
477         if (td->io_engine == FIO_LIBAIO) {
478                 log_err("Linux libaio not available\n");
479                 return 1;
480         }
481 #endif
482 #ifndef FIO_HAVE_POSIXAIO
483         if (td->io_engine == FIO_POSIXAIO) {
484                 log_err("posix aio not available\n");
485                 return 1;
486         }
487 #endif
488
489         fixup_options(td);
490
491         /*
492          * the def_thread is just for options, it's not a real job
493          */
494         if (td == &def_thread)
495                 return 0;
496
497         /*
498          * Set default io engine, if none set
499          */
500         if (!td->io_ops) {
501                 td->io_ops = load_ioengine(td, DEF_IO_ENGINE_NAME);
502                 if (!td->io_ops) {
503                         log_err("default engine %s not there?\n", DEF_IO_ENGINE_NAME);
504                         return 1;
505                 }
506         }
507
508         if (td->io_ops->flags & FIO_SYNCIO)
509                 td->iodepth = 1;
510         else {
511                 if (!td->iodepth)
512                         td->iodepth = td->nr_files;
513         }
514
515         /*
516          * only really works for sequential io for now, and with 1 file
517          */
518         if (td->zone_size && !td->sequential && td->nr_files == 1)
519                 td->zone_size = 0;
520
521         /*
522          * Reads can do overwrites, we always need to pre-create the file
523          */
524         if (td_read(td) || td_rw(td))
525                 td->overwrite = 1;
526
527         td->filetype = FIO_TYPE_FILE;
528         if (!stat(jobname, &sb)) {
529                 if (S_ISBLK(sb.st_mode))
530                         td->filetype = FIO_TYPE_BD;
531                 else if (S_ISCHR(sb.st_mode))
532                         td->filetype = FIO_TYPE_CHAR;
533         }
534
535         if (td->odirect)
536                 td->io_ops->flags |= FIO_RAWIO;
537
538         if (td->filename)
539                 td->nr_uniq_files = 1;
540         else
541                 td->nr_uniq_files = td->nr_files;
542
543         if (td->filetype == FIO_TYPE_FILE || td->filename) {
544                 char tmp[PATH_MAX];
545                 int len = 0;
546                 int i;
547
548                 if (td->directory && td->directory[0] != '\0')
549                         sprintf(tmp, "%s/", td->directory);
550
551                 td->files = malloc(sizeof(struct fio_file) * td->nr_files);
552
553                 for_each_file(td, f, i) {
554                         memset(f, 0, sizeof(*f));
555                         f->fd = -1;
556
557                         if (td->filename)
558                                 sprintf(tmp + len, "%s", td->filename);
559                         else
560                                 sprintf(tmp + len, "%s.%d.%d", jobname, td->thread_number, i);
561                         f->file_name = strdup(tmp);
562                 }
563         } else {
564                 td->nr_files = 1;
565                 td->files = malloc(sizeof(struct fio_file));
566                 f = &td->files[0];
567
568                 memset(f, 0, sizeof(*f));
569                 f->fd = -1;
570                 f->file_name = strdup(jobname);
571         }
572
573         for_each_file(td, f, i) {
574                 f->file_size = td->total_file_size / td->nr_files;
575                 f->file_offset = td->start_offset;
576         }
577                 
578         fio_sem_init(&td->mutex, 0);
579
580         td->clat_stat[0].min_val = td->clat_stat[1].min_val = ULONG_MAX;
581         td->slat_stat[0].min_val = td->slat_stat[1].min_val = ULONG_MAX;
582         td->bw_stat[0].min_val = td->bw_stat[1].min_val = ULONG_MAX;
583
584         if (td->min_bs == -1U)
585                 td->min_bs = td->bs;
586         if (td->max_bs == -1U)
587                 td->max_bs = td->bs;
588         if (td_read(td) && !td_rw(td))
589                 td->verify = 0;
590
591         if (td->stonewall && td->thread_number > 1)
592                 groupid++;
593
594         td->groupid = groupid;
595
596         if (setup_rate(td))
597                 goto err;
598
599         if (td->write_lat_log) {
600                 setup_log(&td->slat_log);
601                 setup_log(&td->clat_log);
602         }
603         if (td->write_bw_log)
604                 setup_log(&td->bw_log);
605
606         if (!td->name)
607                 td->name = strdup(jobname);
608
609         ddir = td->ddir + (!td->sequential << 1) + (td->iomix << 2);
610
611         if (!terse_output) {
612                 if (!job_add_num) {
613                         if (td->io_ops->flags & FIO_CPUIO)
614                                 fprintf(f_out, "%s: ioengine=cpu, cpuload=%u, cpucycle=%u\n", td->name, td->cpuload, td->cpucycle);
615                         else
616                                 fprintf(f_out, "%s: (g=%d): rw=%s, odir=%d, bs=%d-%d, rate=%d, ioengine=%s, iodepth=%d\n", td->name, td->groupid, ddir_str[ddir], td->odirect, td->min_bs, td->max_bs, td->rate, td->io_ops->name, td->iodepth);
617                 } else if (job_add_num == 1)
618                         fprintf(f_out, "...\n");
619         }
620
621         /*
622          * recurse add identical jobs, clear numjobs and stonewall options
623          * as they don't apply to sub-jobs
624          */
625         numjobs = td->numjobs;
626         while (--numjobs) {
627                 struct thread_data *td_new = get_new_job(0, td);
628
629                 if (!td_new)
630                         goto err;
631
632                 td_new->numjobs = 1;
633                 td_new->stonewall = 0;
634                 job_add_num = numjobs - 1;
635
636                 if (add_job(td_new, jobname, job_add_num))
637                         goto err;
638         }
639         return 0;
640 err:
641         put_job(td);
642         return -1;
643 }
644
645 /*
646  * Initialize the various random states we need (random io, block size ranges,
647  * read/write mix, etc).
648  */
649 int init_random_state(struct thread_data *td)
650 {
651         unsigned long seeds[4];
652         int fd, num_maps, blocks, i;
653         struct fio_file *f;
654
655         if (td->io_ops->flags & FIO_CPUIO)
656                 return 0;
657
658         fd = open("/dev/urandom", O_RDONLY);
659         if (fd == -1) {
660                 td_verror(td, errno);
661                 return 1;
662         }
663
664         if (read(fd, seeds, sizeof(seeds)) < (int) sizeof(seeds)) {
665                 td_verror(td, EIO);
666                 close(fd);
667                 return 1;
668         }
669
670         close(fd);
671
672         os_random_seed(seeds[0], &td->bsrange_state);
673         os_random_seed(seeds[1], &td->verify_state);
674         os_random_seed(seeds[2], &td->rwmix_state);
675
676         if (td->sequential)
677                 return 0;
678
679         if (td->rand_repeatable)
680                 seeds[3] = DEF_RANDSEED;
681
682         for_each_file(td, f, i) {
683                 blocks = (f->file_size + td->min_bs - 1) / td->min_bs;
684                 num_maps = blocks / BLOCKS_PER_MAP;
685                 f->file_map = malloc(num_maps * sizeof(long));
686                 f->num_maps = num_maps;
687                 memset(f->file_map, 0, num_maps * sizeof(long));
688         }
689
690         os_random_seed(seeds[3], &td->random_state);
691         return 0;
692 }
693
694 static void fill_cpu_mask(os_cpu_mask_t cpumask, int cpu)
695 {
696 #ifdef FIO_HAVE_CPU_AFFINITY
697         unsigned int i;
698
699         CPU_ZERO(&cpumask);
700
701         for (i = 0; i < sizeof(int) * 8; i++) {
702                 if ((1 << i) & cpu)
703                         CPU_SET(i, &cpumask);
704         }
705 #endif
706 }
707
708 static int is_empty_or_comment(char *line)
709 {
710         unsigned int i;
711
712         for (i = 0; i < strlen(line); i++) {
713                 if (line[i] == ';')
714                         return 1;
715                 if (!isspace(line[i]) && !iscntrl(line[i]))
716                         return 0;
717         }
718
719         return 1;
720 }
721
722 static int str_rw_cb(void *data, const char *mem)
723 {
724         struct thread_data *td = data;
725
726         if (!strncmp(mem, "read", 4) || !strncmp(mem, "0", 1)) {
727                 td->ddir = DDIR_READ;
728                 td->sequential = 1;
729                 return 0;
730         } else if (!strncmp(mem, "randread", 8)) {
731                 td->ddir = DDIR_READ;
732                 td->sequential = 0;
733                 return 0;
734         } else if (!strncmp(mem, "write", 5) || !strncmp(mem, "1", 1)) {
735                 td->ddir = DDIR_WRITE;
736                 td->sequential = 1;
737                 return 0;
738         } else if (!strncmp(mem, "randwrite", 9)) {
739                 td->ddir = DDIR_WRITE;
740                 td->sequential = 0;
741                 return 0;
742         } else if (!strncmp(mem, "rw", 2)) {
743                 td->ddir = 0;
744                 td->iomix = 1;
745                 td->sequential = 1;
746                 return 0;
747         } else if (!strncmp(mem, "randrw", 6)) {
748                 td->ddir = 0;
749                 td->iomix = 1;
750                 td->sequential = 0;
751                 return 0;
752         }
753
754         log_err("fio: data direction: read, write, randread, randwrite, rw, randrw\n");
755         return 1;
756 }
757
758 static int str_verify_cb(void *data, const char *mem)
759 {
760         struct thread_data *td = data;
761
762         if (!strncmp(mem, "0", 1)) {
763                 td->verify = VERIFY_NONE;
764                 return 0;
765         } else if (!strncmp(mem, "md5", 3) || !strncmp(mem, "1", 1)) {
766                 td->verify = VERIFY_MD5;
767                 return 0;
768         } else if (!strncmp(mem, "crc32", 5)) {
769                 td->verify = VERIFY_CRC32;
770                 return 0;
771         }
772
773         log_err("fio: verify types: md5, crc32\n");
774         return 1;
775 }
776
777 static int str_mem_cb(void *data, const char *mem)
778 {
779         struct thread_data *td = data;
780
781         if (!strncmp(mem, "malloc", 6)) {
782                 td->mem_type = MEM_MALLOC;
783                 return 0;
784         } else if (!strncmp(mem, "shm", 3)) {
785                 td->mem_type = MEM_SHM;
786                 return 0;
787         } else if (!strncmp(mem, "mmap", 4)) {
788                 td->mem_type = MEM_MMAP;
789                 return 0;
790         }
791
792         log_err("fio: mem type: malloc, shm, mmap\n");
793         return 1;
794 }
795
796 static int str_ioengine_cb(void *data, const char *str)
797 {
798         struct thread_data *td = data;
799
800         td->io_ops = load_ioengine(td, str);
801         if (td->io_ops)
802                 return 0;
803
804         log_err("fio: ioengine: { linuxaio, aio, libaio }, posixaio, sync, mmap, sgio, splice, cpu\n");
805         return 1;
806 }
807
808 static int str_lockmem_cb(void fio_unused *data, unsigned long *val)
809 {
810         mlock_size = *val;
811         return 0;
812 }
813
814 static int str_prioclass_cb(void *data, unsigned int *val)
815 {
816         struct thread_data *td = data;
817
818         td->ioprio |= *val << IOPRIO_CLASS_SHIFT;
819         return 0;
820 }
821
822 static int str_prio_cb(void *data, unsigned int *val)
823 {
824         struct thread_data *td = data;
825
826         td->ioprio |= *val;
827         return 0;
828 }
829
830 static int str_exitall_cb(void)
831 {
832         exitall_on_terminate = 1;
833         return 0;
834 }
835
836 static int str_cpumask_cb(void *data, unsigned int *val)
837 {
838         struct thread_data *td = data;
839
840         fill_cpu_mask(td->cpumask, *val);
841         return 0;
842 }
843
844 /*
845  * This is our [ini] type file parser.
846  */
847 int parse_jobs_ini(char *file, int stonewall_flag)
848 {
849         unsigned int global;
850         struct thread_data *td;
851         char *string, *name, *tmpbuf;
852         fpos_t off;
853         FILE *f;
854         char *p;
855         int ret = 0, stonewall;
856
857         f = fopen(file, "r");
858         if (!f) {
859                 perror("fopen job file");
860                 return 1;
861         }
862
863         string = malloc(4096);
864         name = malloc(256);
865         tmpbuf = malloc(4096);
866
867         stonewall = stonewall_flag;
868         while ((p = fgets(string, 4096, f)) != NULL) {
869                 if (ret)
870                         break;
871                 if (is_empty_or_comment(p))
872                         continue;
873                 if (sscanf(p, "[%s]", name) != 1)
874                         continue;
875
876                 global = !strncmp(name, "global", 6);
877
878                 name[strlen(name) - 1] = '\0';
879
880                 td = get_new_job(global, &def_thread);
881                 if (!td) {
882                         ret = 1;
883                         break;
884                 }
885
886                 /*
887                  * Seperate multiple job files by a stonewall
888                  */
889                 if (!global && stonewall) {
890                         td->stonewall = stonewall;
891                         stonewall = 0;
892                 }
893
894                 fgetpos(f, &off);
895                 while ((p = fgets(string, 4096, f)) != NULL) {
896                         if (is_empty_or_comment(p))
897                                 continue;
898                         if (strstr(p, "["))
899                                 break;
900
901                         strip_blank_front(&p);
902                         strip_blank_end(p);
903
904                         fgetpos(f, &off);
905
906                         /*
907                          * Don't break here, continue parsing options so we
908                          * dump all the bad ones. Makes trial/error fixups
909                          * easier on the user.
910                          */
911                         ret = parse_option(p, options, td);
912                 }
913
914                 if (!ret) {
915                         fsetpos(f, &off);
916                         ret = add_job(td, name, 0);
917                 }
918                 if (ret)
919                         break;
920         }
921
922         free(string);
923         free(name);
924         free(tmpbuf);
925         fclose(f);
926         return ret;
927 }
928
929 static int fill_def_thread(void)
930 {
931         memset(&def_thread, 0, sizeof(def_thread));
932
933         if (fio_getaffinity(getpid(), &def_thread.cpumask) == -1) {
934                 perror("sched_getaffinity");
935                 return 1;
936         }
937
938         /*
939          * fill globals
940          */
941         def_thread.ddir = DDIR_READ;
942         def_thread.iomix = 0;
943         def_thread.bs = DEF_BS;
944         def_thread.min_bs = -1;
945         def_thread.max_bs = -1;
946         def_thread.odirect = DEF_ODIRECT;
947         def_thread.ratecycle = DEF_RATE_CYCLE;
948         def_thread.sequential = DEF_SEQUENTIAL;
949         def_thread.timeout = def_timeout;
950         def_thread.overwrite = DEF_OVERWRITE;
951         def_thread.invalidate_cache = DEF_INVALIDATE;
952         def_thread.sync_io = DEF_SYNCIO;
953         def_thread.mem_type = MEM_MALLOC;
954         def_thread.bw_avg_time = DEF_BWAVGTIME;
955         def_thread.create_serialize = DEF_CREATE_SER;
956         def_thread.create_fsync = DEF_CREATE_FSYNC;
957         def_thread.loops = DEF_LOOPS;
958         def_thread.verify = DEF_VERIFY;
959         def_thread.stonewall = DEF_STONEWALL;
960         def_thread.numjobs = DEF_NUMJOBS;
961         def_thread.use_thread = DEF_USE_THREAD;
962         def_thread.rwmixcycle = DEF_RWMIX_CYCLE;
963         def_thread.rwmixread = DEF_RWMIX_READ;
964         def_thread.nice = DEF_NICE;
965         def_thread.rand_repeatable = DEF_RAND_REPEAT;
966         def_thread.nr_files = DEF_NR_FILES;
967         def_thread.unlink = DEF_UNLINK;
968         def_thread.write_bw_log = write_bw_log;
969         def_thread.write_lat_log = write_lat_log;
970 #ifdef FIO_HAVE_DISK_UTIL
971         def_thread.do_disk_util = 1;
972 #endif
973
974         return 0;
975 }
976
977 static void usage(void)
978 {
979         printf("%s\n", fio_version_string);
980         printf("\t--output\tWrite output to file\n");
981         printf("\t--timeout\tRuntime in seconds\n");
982         printf("\t--latency-log\tGenerate per-job latency logs\n");
983         printf("\t--bandwidth-log\tGenerate per-job bandwidth logs\n");
984         printf("\t--minimal\tMinimal (terse) output\n");
985         printf("\t--version\tPrint version info and exit\n");
986 }
987
988 static int parse_cmd_line(int argc, char *argv[])
989 {
990         struct thread_data *td = NULL;
991         int c, ini_idx = 0, lidx, ret;
992
993         while ((c = getopt_long(argc, argv, "", long_options, &lidx)) != -1) {
994                 switch (c) {
995                 case 't':
996                         def_timeout = atoi(optarg);
997                         break;
998                 case 'l':
999                         write_lat_log = 1;
1000                         break;
1001                 case 'w':
1002                         write_bw_log = 1;
1003                         break;
1004                 case 'o':
1005                         f_out = fopen(optarg, "w+");
1006                         if (!f_out) {
1007                                 perror("fopen output");
1008                                 exit(1);
1009                         }
1010                         f_err = f_out;
1011                         break;
1012                 case 'm':
1013                         terse_output = 1;
1014                         break;
1015                 case 'h':
1016                         usage();
1017                         exit(0);
1018                 case 'v':
1019                         printf("%s\n", fio_version_string);
1020                         exit(0);
1021                 case FIO_GETOPT_JOB: {
1022                         const char *opt = long_options[lidx].name;
1023                         char *val = optarg;
1024
1025                         if (!strncmp(opt, "name", 4) && td) {
1026                                 ret = add_job(td, td->name ?: "fio", 0);
1027                                 if (ret) {
1028                                         put_job(td);
1029                                         return 0;
1030                                 }
1031                                 td = NULL;
1032                         }
1033                         if (!td) {
1034                                 int global = !strncmp(val, "global", 6);
1035
1036                                 td = get_new_job(global, &def_thread);
1037                                 if (!td)
1038                                         return 0;
1039                         }
1040
1041                         parse_cmd_option(opt, val, options, td);
1042                         break;
1043                 }
1044                 default:
1045                         printf("optarg <<%s>>\n", argv[optind]);
1046                         break;
1047                 }
1048         }
1049
1050         if (td) {
1051                 ret = add_job(td, td->name ?: "fio", 0);
1052                 if (ret)
1053                         put_job(td);
1054         }
1055
1056         while (optind < argc) {
1057                 ini_idx++;
1058                 ini_file = realloc(ini_file, ini_idx * sizeof(char *));
1059                 ini_file[ini_idx - 1] = strdup(argv[optind]);
1060                 optind++;
1061         }
1062
1063         return ini_idx;
1064 }
1065
1066 static void free_shm(void)
1067 {
1068         struct shmid_ds sbuf;
1069
1070         if (threads) {
1071                 shmdt((void *) threads);
1072                 threads = NULL;
1073                 shmctl(shm_id, IPC_RMID, &sbuf);
1074         }
1075 }
1076
1077 /*
1078  * The thread area is shared between the main process and the job
1079  * threads/processes. So setup a shared memory segment that will hold
1080  * all the job info.
1081  */
1082 static int setup_thread_area(void)
1083 {
1084         /*
1085          * 1024 is too much on some machines, scale max_jobs if
1086          * we get a failure that looks like too large a shm segment
1087          */
1088         do {
1089                 size_t size = max_jobs * sizeof(struct thread_data);
1090
1091                 shm_id = shmget(0, size, IPC_CREAT | 0600);
1092                 if (shm_id != -1)
1093                         break;
1094                 if (errno != EINVAL) {
1095                         perror("shmget");
1096                         break;
1097                 }
1098
1099                 max_jobs >>= 1;
1100         } while (max_jobs);
1101
1102         if (shm_id == -1)
1103                 return 1;
1104
1105         threads = shmat(shm_id, NULL, 0);
1106         if (threads == (void *) -1) {
1107                 perror("shmat");
1108                 return 1;
1109         }
1110
1111         atexit(free_shm);
1112         return 0;
1113 }
1114
1115 /*
1116  * Copy the fio options into the long options map, so we mirror
1117  * job and cmd line options.
1118  */
1119 static void dupe_job_options(void)
1120 {
1121         struct fio_option *o;
1122         unsigned int i;
1123
1124         i = 0;
1125         while (long_options[i].name)
1126                 i++;
1127
1128         o = &options[0];
1129         while (o->name) {
1130                 long_options[i].name = o->name;
1131                 long_options[i].val = FIO_GETOPT_JOB;
1132                 if (o->type == FIO_OPT_STR_SET)
1133                         long_options[i].has_arg = no_argument;
1134                 else
1135                         long_options[i].has_arg = required_argument;
1136
1137                 i++;
1138                 o++;
1139                 assert(i < FIO_JOB_OPTS + FIO_CMD_OPTS);
1140         }
1141 }
1142
1143 int parse_options(int argc, char *argv[])
1144 {
1145         int job_files, i;
1146
1147         f_out = stdout;
1148         f_err = stderr;
1149
1150         dupe_job_options();
1151
1152         if (setup_thread_area())
1153                 return 1;
1154         if (fill_def_thread())
1155                 return 1;
1156
1157         job_files = parse_cmd_line(argc, argv);
1158
1159         for (i = 0; i < job_files; i++) {
1160                 if (fill_def_thread())
1161                         return 1;
1162                 if (parse_jobs_ini(ini_file[i], i))
1163                         return 1;
1164                 free(ini_file[i]);
1165         }
1166
1167         free(ini_file);
1168
1169         if (!thread_number) {
1170                 log_err("No jobs defined(s)\n");
1171                 usage();
1172                 return 1;
1173         }
1174
1175         return 0;
1176 }