Fixup and improve per-thread data
[fio.git] / server.c
1 #include <stdio.h>
2 #include <stdlib.h>
3 #include <stdarg.h>
4 #include <unistd.h>
5 #include <limits.h>
6 #include <errno.h>
7 #include <sys/poll.h>
8 #include <sys/types.h>
9 #include <sys/wait.h>
10 #include <sys/socket.h>
11 #include <sys/stat.h>
12 #include <sys/un.h>
13 #include <sys/uio.h>
14 #include <netinet/in.h>
15 #include <arpa/inet.h>
16 #include <netdb.h>
17 #include <syslog.h>
18 #include <signal.h>
19 #ifdef CONFIG_ZLIB
20 #include <zlib.h>
21 #endif
22
23 #include "fio.h"
24 #include "options.h"
25 #include "server.h"
26 #include "crc/crc16.h"
27 #include "lib/ieee754.h"
28 #include "verify.h"
29 #include "smalloc.h"
30
31 int fio_net_port = FIO_NET_PORT;
32
33 int exit_backend = 0;
34
35 enum {
36         SK_F_FREE       = 1,
37         SK_F_COPY       = 2,
38         SK_F_SIMPLE     = 4,
39         SK_F_VEC        = 8,
40 };
41
42 struct sk_entry {
43         struct flist_head list;
44         int opcode;
45         void *buf;
46         off_t size;
47         uint64_t *tagptr;
48         int flags;
49         struct flist_head next;
50 };
51
52 struct sk_out {
53         unsigned int refs;
54
55         int sk;
56         struct fio_mutex *lock;
57         struct flist_head list;
58         struct fio_mutex *wait;
59 };
60
61 static char *fio_server_arg;
62 static char *bind_sock;
63 static struct sockaddr_in saddr_in;
64 static struct sockaddr_in6 saddr_in6;
65 static int use_ipv6;
66 #ifdef CONFIG_ZLIB
67 static unsigned int has_zlib = 1;
68 #else
69 static unsigned int has_zlib = 0;
70 #endif
71 static unsigned int use_zlib;
72 static char me[128];
73
74 static pthread_key_t sk_out_key;
75
76 struct fio_fork_item {
77         struct flist_head list;
78         int exitval;
79         int signal;
80         int exited;
81         pid_t pid;
82 };
83
84 struct cmd_reply {
85         struct fio_mutex lock;
86         void *data;
87         size_t size;
88         int error;
89 };
90
91 static const char *fio_server_ops[FIO_NET_CMD_NR] = {
92         "",
93         "QUIT",
94         "EXIT",
95         "JOB",
96         "JOBLINE",
97         "TEXT",
98         "TS",
99         "GS",
100         "SEND_ETA",
101         "ETA",
102         "PROBE",
103         "START",
104         "STOP",
105         "DISK_UTIL",
106         "SERVER_START",
107         "ADD_JOB",
108         "RUN",
109         "IOLOG",
110         "UPDATE_JOB",
111         "LOAD_FILE",
112         "VTRIGGER",
113         "SENDFILE",
114 };
115
116 static void sk_lock(struct sk_out *sk_out)
117 {
118         fio_mutex_down(sk_out->lock);
119 }
120
121 static void sk_unlock(struct sk_out *sk_out)
122 {
123         fio_mutex_up(sk_out->lock);
124 }
125
126 void sk_out_assign(struct sk_out *sk_out)
127 {
128         if (!sk_out)
129                 return;
130
131         sk_lock(sk_out);
132         sk_out->refs++;
133         sk_unlock(sk_out);
134         pthread_setspecific(sk_out_key, sk_out);
135 }
136
137 static void __sk_out_drop(struct sk_out *sk_out)
138 {
139         fio_mutex_remove(sk_out->lock);
140         fio_mutex_remove(sk_out->wait);
141         sfree(sk_out);
142 }
143
144 void sk_out_drop(void)
145 {
146         struct sk_out *sk_out = pthread_getspecific(sk_out_key);
147
148         if (sk_out) {
149                 int refs;
150
151                 sk_lock(sk_out);
152                 refs = --sk_out->refs;
153                 sk_unlock(sk_out);
154
155                 if (!refs)
156                         __sk_out_drop(sk_out);
157
158                 pthread_setspecific(sk_out_key, NULL);
159         }
160 }
161
162 const char *fio_server_op(unsigned int op)
163 {
164         static char buf[32];
165
166         if (op < FIO_NET_CMD_NR)
167                 return fio_server_ops[op];
168
169         sprintf(buf, "UNKNOWN/%d", op);
170         return buf;
171 }
172
173 static ssize_t iov_total_len(const struct iovec *iov, int count)
174 {
175         ssize_t ret = 0;
176
177         while (count--) {
178                 ret += iov->iov_len;
179                 iov++;
180         }
181
182         return ret;
183 }
184
185 static int fio_sendv_data(int sk, struct iovec *iov, int count)
186 {
187         ssize_t total_len = iov_total_len(iov, count);
188         ssize_t ret;
189
190         do {
191                 ret = writev(sk, iov, count);
192                 if (ret > 0) {
193                         total_len -= ret;
194                         if (!total_len)
195                                 break;
196
197                         while (ret) {
198                                 if (ret >= iov->iov_len) {
199                                         ret -= iov->iov_len;
200                                         iov++;
201                                         continue;
202                                 }
203                                 iov->iov_base += ret;
204                                 iov->iov_len -= ret;
205                                 ret = 0;
206                         }
207                 } else if (!ret)
208                         break;
209                 else if (errno == EAGAIN || errno == EINTR)
210                         continue;
211                 else
212                         break;
213         } while (!exit_backend);
214
215         if (!total_len)
216                 return 0;
217
218         return 1;
219 }
220
221 int fio_send_data(int sk, const void *p, unsigned int len)
222 {
223         struct iovec iov = { .iov_base = (void *) p, .iov_len = len };
224
225         assert(len <= sizeof(struct fio_net_cmd) + FIO_SERVER_MAX_FRAGMENT_PDU);
226
227         return fio_sendv_data(sk, &iov, 1);
228 }
229
230 int fio_recv_data(int sk, void *p, unsigned int len)
231 {
232         do {
233                 int ret = recv(sk, p, len, MSG_WAITALL);
234
235                 if (ret > 0) {
236                         len -= ret;
237                         if (!len)
238                                 break;
239                         p += ret;
240                         continue;
241                 } else if (!ret)
242                         break;
243                 else if (errno == EAGAIN || errno == EINTR)
244                         continue;
245                 else
246                         break;
247         } while (!exit_backend);
248
249         if (!len)
250                 return 0;
251
252         return -1;
253 }
254
255 static int verify_convert_cmd(struct fio_net_cmd *cmd)
256 {
257         uint16_t crc;
258
259         cmd->cmd_crc16 = le16_to_cpu(cmd->cmd_crc16);
260         cmd->pdu_crc16 = le16_to_cpu(cmd->pdu_crc16);
261
262         crc = fio_crc16(cmd, FIO_NET_CMD_CRC_SZ);
263         if (crc != cmd->cmd_crc16) {
264                 log_err("fio: server bad crc on command (got %x, wanted %x)\n",
265                                 cmd->cmd_crc16, crc);
266                 return 1;
267         }
268
269         cmd->version    = le16_to_cpu(cmd->version);
270         cmd->opcode     = le16_to_cpu(cmd->opcode);
271         cmd->flags      = le32_to_cpu(cmd->flags);
272         cmd->tag        = le64_to_cpu(cmd->tag);
273         cmd->pdu_len    = le32_to_cpu(cmd->pdu_len);
274
275         switch (cmd->version) {
276         case FIO_SERVER_VER:
277                 break;
278         default:
279                 log_err("fio: bad server cmd version %d\n", cmd->version);
280                 return 1;
281         }
282
283         if (cmd->pdu_len > FIO_SERVER_MAX_FRAGMENT_PDU) {
284                 log_err("fio: command payload too large: %u\n", cmd->pdu_len);
285                 return 1;
286         }
287
288         return 0;
289 }
290
291 /*
292  * Read (and defragment, if necessary) incoming commands
293  */
294 struct fio_net_cmd *fio_net_recv_cmd(int sk)
295 {
296         struct fio_net_cmd cmd, *tmp, *cmdret = NULL;
297         size_t cmd_size = 0, pdu_offset = 0;
298         uint16_t crc;
299         int ret, first = 1;
300         void *pdu = NULL;
301
302         do {
303                 ret = fio_recv_data(sk, &cmd, sizeof(cmd));
304                 if (ret)
305                         break;
306
307                 /* We have a command, verify it and swap if need be */
308                 ret = verify_convert_cmd(&cmd);
309                 if (ret)
310                         break;
311
312                 if (first) {
313                         /* if this is text, add room for \0 at the end */
314                         cmd_size = sizeof(cmd) + cmd.pdu_len + 1;
315                         assert(!cmdret);
316                 } else
317                         cmd_size += cmd.pdu_len;
318
319                 if (cmd_size / 1024 > FIO_SERVER_MAX_CMD_MB * 1024) {
320                         log_err("fio: cmd+pdu too large (%llu)\n", (unsigned long long) cmd_size);
321                         ret = 1;
322                         break;
323                 }
324
325                 tmp = realloc(cmdret, cmd_size);
326                 if (!tmp) {
327                         log_err("fio: server failed allocating cmd\n");
328                         ret = 1;
329                         break;
330                 }
331                 cmdret = tmp;
332
333                 if (first)
334                         memcpy(cmdret, &cmd, sizeof(cmd));
335                 else if (cmdret->opcode != cmd.opcode) {
336                         log_err("fio: fragment opcode mismatch (%d != %d)\n",
337                                         cmdret->opcode, cmd.opcode);
338                         ret = 1;
339                         break;
340                 }
341
342                 if (!cmd.pdu_len)
343                         break;
344
345                 /* There's payload, get it */
346                 pdu = (void *) cmdret->payload + pdu_offset;
347                 ret = fio_recv_data(sk, pdu, cmd.pdu_len);
348                 if (ret)
349                         break;
350
351                 /* Verify payload crc */
352                 crc = fio_crc16(pdu, cmd.pdu_len);
353                 if (crc != cmd.pdu_crc16) {
354                         log_err("fio: server bad crc on payload ");
355                         log_err("(got %x, wanted %x)\n", cmd.pdu_crc16, crc);
356                         ret = 1;
357                         break;
358                 }
359
360                 pdu_offset += cmd.pdu_len;
361                 if (!first)
362                         cmdret->pdu_len += cmd.pdu_len;
363                 first = 0;
364         } while (cmd.flags & FIO_NET_CMD_F_MORE);
365
366         if (ret) {
367                 free(cmdret);
368                 cmdret = NULL;
369         } else if (cmdret) {
370                 /* zero-terminate text input */
371                 if (cmdret->pdu_len) {
372                         if (cmdret->opcode == FIO_NET_CMD_TEXT) {
373                                 struct cmd_text_pdu *__pdu = (struct cmd_text_pdu *) cmdret->payload;
374                                 char *buf = (char *) __pdu->buf;
375
376                                 buf[__pdu->buf_len] = '\0';
377                         } else if (cmdret->opcode == FIO_NET_CMD_JOB) {
378                                 struct cmd_job_pdu *__pdu = (struct cmd_job_pdu *) cmdret->payload;
379                                 char *buf = (char *) __pdu->buf;
380                                 int len = le32_to_cpu(__pdu->buf_len);
381
382                                 buf[len] = '\0';
383                         }
384                 }
385
386                 /* frag flag is internal */
387                 cmdret->flags &= ~FIO_NET_CMD_F_MORE;
388         }
389
390         return cmdret;
391 }
392
393 static void add_reply(uint64_t tag, struct flist_head *list)
394 {
395         struct fio_net_cmd_reply *reply;
396
397         reply = (struct fio_net_cmd_reply *) (uintptr_t) tag;
398         flist_add_tail(&reply->list, list);
399 }
400
401 static uint64_t alloc_reply(uint64_t tag, uint16_t opcode)
402 {
403         struct fio_net_cmd_reply *reply;
404
405         reply = calloc(1, sizeof(*reply));
406         INIT_FLIST_HEAD(&reply->list);
407         fio_gettime(&reply->tv, NULL);
408         reply->saved_tag = tag;
409         reply->opcode = opcode;
410
411         return (uintptr_t) reply;
412 }
413
414 static void free_reply(uint64_t tag)
415 {
416         struct fio_net_cmd_reply *reply;
417
418         reply = (struct fio_net_cmd_reply *) (uintptr_t) tag;
419         free(reply);
420 }
421
422 void fio_net_cmd_crc_pdu(struct fio_net_cmd *cmd, const void *pdu)
423 {
424         uint32_t pdu_len;
425
426         cmd->cmd_crc16 = __cpu_to_le16(fio_crc16(cmd, FIO_NET_CMD_CRC_SZ));
427
428         pdu_len = le32_to_cpu(cmd->pdu_len);
429         cmd->pdu_crc16 = __cpu_to_le16(fio_crc16(pdu, pdu_len));
430 }
431
432 void fio_net_cmd_crc(struct fio_net_cmd *cmd)
433 {
434         fio_net_cmd_crc_pdu(cmd, cmd->payload);
435 }
436
437 int fio_net_send_cmd(int fd, uint16_t opcode, const void *buf, off_t size,
438                      uint64_t *tagptr, struct flist_head *list)
439 {
440         struct fio_net_cmd *cmd = NULL;
441         size_t this_len, cur_len = 0;
442         uint64_t tag;
443         int ret;
444
445         if (list) {
446                 assert(tagptr);
447                 tag = *tagptr = alloc_reply(*tagptr, opcode);
448         } else
449                 tag = tagptr ? *tagptr : 0;
450
451         do {
452                 this_len = size;
453                 if (this_len > FIO_SERVER_MAX_FRAGMENT_PDU)
454                         this_len = FIO_SERVER_MAX_FRAGMENT_PDU;
455
456                 if (!cmd || cur_len < sizeof(*cmd) + this_len) {
457                         if (cmd)
458                                 free(cmd);
459
460                         cur_len = sizeof(*cmd) + this_len;
461                         cmd = malloc(cur_len);
462                 }
463
464                 fio_init_net_cmd(cmd, opcode, buf, this_len, tag);
465
466                 if (this_len < size)
467                         cmd->flags = __cpu_to_le32(FIO_NET_CMD_F_MORE);
468
469                 fio_net_cmd_crc(cmd);
470
471                 ret = fio_send_data(fd, cmd, sizeof(*cmd) + this_len);
472                 size -= this_len;
473                 buf += this_len;
474         } while (!ret && size);
475
476         if (list) {
477                 if (ret)
478                         free_reply(tag);
479                 else
480                         add_reply(tag, list);
481         }
482
483         if (cmd)
484                 free(cmd);
485
486         return ret;
487 }
488
489 struct sk_entry *fio_net_prep_cmd(uint16_t opcode, void *buf, off_t size,
490                                   uint64_t *tagptr, int flags)
491 {
492         struct sk_entry *entry;
493
494         entry = smalloc(sizeof(*entry));
495         INIT_FLIST_HEAD(&entry->next);
496         entry->opcode = opcode;
497         if (flags & SK_F_COPY) {
498                 entry->buf = smalloc(size);
499                 memcpy(entry->buf, buf, size);
500         } else
501                 entry->buf = buf;
502         entry->size = size;
503         entry->tagptr = tagptr;
504         entry->flags = flags;
505
506         return entry;
507 }
508
509 static void fio_net_queue_entry(struct sk_entry *entry)
510 {
511         struct sk_out *sk_out = pthread_getspecific(sk_out_key);
512
513         sk_lock(sk_out);
514         flist_add_tail(&entry->list, &sk_out->list);
515         sk_unlock(sk_out);
516
517         fio_mutex_up(sk_out->wait);
518 }
519
520 static int fio_net_queue_cmd(uint16_t opcode, void *buf, off_t size,
521                              uint64_t *tagptr, int flags)
522 {
523         struct sk_entry *entry;
524
525         entry = fio_net_prep_cmd(opcode, buf, size, tagptr, flags);
526         fio_net_queue_entry(entry);
527         return 0;
528 }
529
530 static int fio_net_send_simple_stack_cmd(int sk, uint16_t opcode, uint64_t tag)
531 {
532         struct fio_net_cmd cmd;
533
534         fio_init_net_cmd(&cmd, opcode, NULL, 0, tag);
535         fio_net_cmd_crc(&cmd);
536
537         return fio_send_data(sk, &cmd, sizeof(cmd));
538 }
539
540 /*
541  * If 'list' is non-NULL, then allocate and store the sent command for
542  * later verification.
543  */
544 int fio_net_send_simple_cmd(int sk, uint16_t opcode, uint64_t tag,
545                             struct flist_head *list)
546 {
547         int ret;
548
549         if (list)
550                 tag = alloc_reply(tag, opcode);
551
552         ret = fio_net_send_simple_stack_cmd(sk, opcode, tag);
553         if (ret) {
554                 if (list)
555                         free_reply(tag);
556
557                 return ret;
558         }
559
560         if (list)
561                 add_reply(tag, list);
562
563         return 0;
564 }
565
566 static int fio_net_queue_quit(void)
567 {
568         dprint(FD_NET, "server: sending quit\n");
569
570         return fio_net_queue_cmd(FIO_NET_CMD_QUIT, NULL, 0, 0, SK_F_SIMPLE);
571 }
572
573 int fio_net_send_quit(int sk)
574 {
575         dprint(FD_NET, "server: sending quit\n");
576
577         return fio_net_send_simple_cmd(sk, FIO_NET_CMD_QUIT, 0, NULL);
578 }
579
580 static int fio_net_send_ack(struct fio_net_cmd *cmd, int error, int signal)
581 {
582         struct cmd_end_pdu epdu;
583         uint64_t tag = 0;
584
585         if (cmd)
586                 tag = cmd->tag;
587
588         epdu.error = __cpu_to_le32(error);
589         epdu.signal = __cpu_to_le32(signal);
590         return fio_net_queue_cmd(FIO_NET_CMD_STOP, &epdu, sizeof(epdu), &tag, SK_F_COPY);
591 }
592
593 static int fio_net_queue_stop(int error, int signal)
594 {
595         dprint(FD_NET, "server: sending stop (%d, %d)\n", error, signal);
596         return fio_net_send_ack(NULL, error, signal);
597 }
598
599 static void fio_server_add_fork_item(pid_t pid, struct flist_head *list)
600 {
601         struct fio_fork_item *ffi;
602
603         ffi = malloc(sizeof(*ffi));
604         ffi->exitval = 0;
605         ffi->signal = 0;
606         ffi->exited = 0;
607         ffi->pid = pid;
608         flist_add_tail(&ffi->list, list);
609 }
610
611 static void fio_server_add_conn_pid(struct flist_head *conn_list, pid_t pid)
612 {
613         dprint(FD_NET, "server: forked off connection job (pid=%u)\n", (int) pid);
614         fio_server_add_fork_item(pid, conn_list);
615 }
616
617 static void fio_server_add_job_pid(struct flist_head *job_list, pid_t pid)
618 {
619         dprint(FD_NET, "server: forked off job job (pid=%u)\n", (int) pid);
620         fio_server_add_fork_item(pid, job_list);
621 }
622
623 static void fio_server_check_fork_item(struct fio_fork_item *ffi)
624 {
625         int ret, status;
626
627         ret = waitpid(ffi->pid, &status, WNOHANG);
628         if (ret < 0) {
629                 if (errno == ECHILD) {
630                         log_err("fio: connection pid %u disappeared\n", (int) ffi->pid);
631                         ffi->exited = 1;
632                 } else
633                         log_err("fio: waitpid: %s\n", strerror(errno));
634         } else if (ret == ffi->pid) {
635                 if (WIFSIGNALED(status)) {
636                         ffi->signal = WTERMSIG(status);
637                         ffi->exited = 1;
638                 }
639                 if (WIFEXITED(status)) {
640                         if (WEXITSTATUS(status))
641                                 ffi->exitval = WEXITSTATUS(status);
642                         ffi->exited = 1;
643                 }
644         }
645 }
646
647 static void fio_server_fork_item_done(struct fio_fork_item *ffi, bool stop)
648 {
649         dprint(FD_NET, "pid %u exited, sig=%u, exitval=%d\n", (int) ffi->pid, ffi->signal, ffi->exitval);
650
651         /*
652          * Fold STOP and QUIT...
653          */
654         if (stop) {
655                 fio_net_queue_stop(ffi->exitval, ffi->signal);
656                 fio_net_queue_quit();
657         }
658
659         flist_del(&ffi->list);
660         free(ffi);
661 }
662
663 static void fio_server_check_fork_items(struct flist_head *list, bool stop)
664 {
665         struct flist_head *entry, *tmp;
666         struct fio_fork_item *ffi;
667
668         flist_for_each_safe(entry, tmp, list) {
669                 ffi = flist_entry(entry, struct fio_fork_item, list);
670
671                 fio_server_check_fork_item(ffi);
672
673                 if (ffi->exited)
674                         fio_server_fork_item_done(ffi, stop);
675         }
676 }
677
678 static void fio_server_check_jobs(struct flist_head *job_list)
679 {
680         fio_server_check_fork_items(job_list, true);
681 }
682
683 static void fio_server_check_conns(struct flist_head *conn_list)
684 {
685         fio_server_check_fork_items(conn_list, false);
686 }
687
688 static int handle_load_file_cmd(struct fio_net_cmd *cmd)
689 {
690         struct cmd_load_file_pdu *pdu = (struct cmd_load_file_pdu *) cmd->payload;
691         void *file_name = pdu->file;
692         struct cmd_start_pdu spdu;
693
694         dprint(FD_NET, "server: loading local file %s\n", (char *) file_name);
695
696         pdu->name_len = le16_to_cpu(pdu->name_len);
697         pdu->client_type = le16_to_cpu(pdu->client_type);
698
699         if (parse_jobs_ini(file_name, 0, 0, pdu->client_type)) {
700                 fio_net_queue_quit();
701                 return -1;
702         }
703
704         spdu.jobs = cpu_to_le32(thread_number);
705         spdu.stat_outputs = cpu_to_le32(stat_number);
706         fio_net_queue_cmd(FIO_NET_CMD_START, &spdu, sizeof(spdu), NULL, SK_F_COPY);
707         return 0;
708 }
709
710 static int handle_run_cmd(struct sk_out *sk_out, struct flist_head *job_list,
711                           struct fio_net_cmd *cmd)
712 {
713         pid_t pid;
714         int ret;
715
716         fio_time_init();
717         set_genesis_time();
718
719         pid = fork();
720         if (pid) {
721                 fio_server_add_job_pid(job_list, pid);
722                 return 0;
723         }
724
725         ret = fio_backend(sk_out);
726         free_threads_shm();
727         _exit(ret);
728 }
729
730 static int handle_job_cmd(struct fio_net_cmd *cmd)
731 {
732         struct cmd_job_pdu *pdu = (struct cmd_job_pdu *) cmd->payload;
733         void *buf = pdu->buf;
734         struct cmd_start_pdu spdu;
735
736         pdu->buf_len = le32_to_cpu(pdu->buf_len);
737         pdu->client_type = le32_to_cpu(pdu->client_type);
738
739         if (parse_jobs_ini(buf, 1, 0, pdu->client_type)) {
740                 fio_net_queue_quit();
741                 return -1;
742         }
743
744         spdu.jobs = cpu_to_le32(thread_number);
745         spdu.stat_outputs = cpu_to_le32(stat_number);
746
747         fio_net_queue_cmd(FIO_NET_CMD_START, &spdu, sizeof(spdu), NULL, SK_F_COPY);
748         return 0;
749 }
750
751 static int handle_jobline_cmd(struct fio_net_cmd *cmd)
752 {
753         void *pdu = cmd->payload;
754         struct cmd_single_line_pdu *cslp;
755         struct cmd_line_pdu *clp;
756         unsigned long offset;
757         struct cmd_start_pdu spdu;
758         char **argv;
759         int i;
760
761         clp = pdu;
762         clp->lines = le16_to_cpu(clp->lines);
763         clp->client_type = le16_to_cpu(clp->client_type);
764         argv = malloc(clp->lines * sizeof(char *));
765         offset = sizeof(*clp);
766
767         dprint(FD_NET, "server: %d command line args\n", clp->lines);
768
769         for (i = 0; i < clp->lines; i++) {
770                 cslp = pdu + offset;
771                 argv[i] = (char *) cslp->text;
772
773                 offset += sizeof(*cslp) + le16_to_cpu(cslp->len);
774                 dprint(FD_NET, "server: %d: %s\n", i, argv[i]);
775         }
776
777         if (parse_cmd_line(clp->lines, argv, clp->client_type)) {
778                 fio_net_queue_quit();
779                 free(argv);
780                 return -1;
781         }
782
783         free(argv);
784
785         spdu.jobs = cpu_to_le32(thread_number);
786         spdu.stat_outputs = cpu_to_le32(stat_number);
787
788         fio_net_queue_cmd(FIO_NET_CMD_START, &spdu, sizeof(spdu), NULL, SK_F_COPY);
789         return 0;
790 }
791
792 static int handle_probe_cmd(struct fio_net_cmd *cmd)
793 {
794         struct cmd_client_probe_pdu *pdu = (struct cmd_client_probe_pdu *) cmd->payload;
795         struct cmd_probe_reply_pdu probe;
796         uint64_t tag = cmd->tag;
797
798         dprint(FD_NET, "server: sending probe reply\n");
799
800         strcpy(me, (char *) pdu->server);
801
802         memset(&probe, 0, sizeof(probe));
803         gethostname((char *) probe.hostname, sizeof(probe.hostname));
804 #ifdef CONFIG_BIG_ENDIAN
805         probe.bigendian = 1;
806 #endif
807         strncpy((char *) probe.fio_version, fio_version_string, sizeof(probe.fio_version));
808
809         probe.os        = FIO_OS;
810         probe.arch      = FIO_ARCH;
811         probe.bpp       = sizeof(void *);
812         probe.cpus      = __cpu_to_le32(cpus_online());
813
814         /*
815          * If the client supports compression and we do too, then enable it
816          */
817         if (has_zlib && le64_to_cpu(pdu->flags) & FIO_PROBE_FLAG_ZLIB) {
818                 probe.flags = __cpu_to_le64(FIO_PROBE_FLAG_ZLIB);
819                 use_zlib = 1;
820         } else {
821                 probe.flags = 0;
822                 use_zlib = 0;
823         }
824
825         return fio_net_queue_cmd(FIO_NET_CMD_PROBE, &probe, sizeof(probe), &tag, SK_F_COPY);
826 }
827
828 static int handle_send_eta_cmd(struct fio_net_cmd *cmd)
829 {
830         struct jobs_eta *je;
831         uint64_t tag = cmd->tag;
832         size_t size;
833         int i;
834
835         dprint(FD_NET, "server sending status\n");
836
837         /*
838          * Fake ETA return if we don't have a local one, otherwise the client
839          * will end up timing out waiting for a response to the ETA request
840          */
841         je = get_jobs_eta(true, &size);
842         if (!je) {
843                 size = sizeof(*je);
844                 je = calloc(1, size);
845         } else {
846                 je->nr_running          = cpu_to_le32(je->nr_running);
847                 je->nr_ramp             = cpu_to_le32(je->nr_ramp);
848                 je->nr_pending          = cpu_to_le32(je->nr_pending);
849                 je->nr_setting_up       = cpu_to_le32(je->nr_setting_up);
850                 je->files_open          = cpu_to_le32(je->files_open);
851
852                 for (i = 0; i < DDIR_RWDIR_CNT; i++) {
853                         je->m_rate[i]   = cpu_to_le32(je->m_rate[i]);
854                         je->t_rate[i]   = cpu_to_le32(je->t_rate[i]);
855                         je->m_iops[i]   = cpu_to_le32(je->m_iops[i]);
856                         je->t_iops[i]   = cpu_to_le32(je->t_iops[i]);
857                         je->rate[i]     = cpu_to_le32(je->rate[i]);
858                         je->iops[i]     = cpu_to_le32(je->iops[i]);
859                 }
860
861                 je->elapsed_sec         = cpu_to_le64(je->elapsed_sec);
862                 je->eta_sec             = cpu_to_le64(je->eta_sec);
863                 je->nr_threads          = cpu_to_le32(je->nr_threads);
864                 je->is_pow2             = cpu_to_le32(je->is_pow2);
865                 je->unit_base           = cpu_to_le32(je->unit_base);
866         }
867
868         fio_net_queue_cmd(FIO_NET_CMD_ETA, je, size, &tag, SK_F_FREE);
869         return 0;
870 }
871
872 static int send_update_job_reply(uint64_t __tag, int error)
873 {
874         uint64_t tag = __tag;
875         uint32_t pdu_error;
876
877         pdu_error = __cpu_to_le32(error);
878         return fio_net_queue_cmd(FIO_NET_CMD_UPDATE_JOB, &pdu_error, sizeof(pdu_error), &tag, SK_F_COPY);
879 }
880
881 static int handle_update_job_cmd(struct fio_net_cmd *cmd)
882 {
883         struct cmd_add_job_pdu *pdu = (struct cmd_add_job_pdu *) cmd->payload;
884         struct thread_data *td;
885         uint32_t tnumber;
886
887         tnumber = le32_to_cpu(pdu->thread_number);
888
889         dprint(FD_NET, "server: updating options for job %u\n", tnumber);
890
891         if (!tnumber || tnumber > thread_number) {
892                 send_update_job_reply(cmd->tag, ENODEV);
893                 return 0;
894         }
895
896         td = &threads[tnumber - 1];
897         convert_thread_options_to_cpu(&td->o, &pdu->top);
898         send_update_job_reply(cmd->tag, 0);
899         return 0;
900 }
901
902 static int handle_trigger_cmd(struct fio_net_cmd *cmd)
903 {
904         struct cmd_vtrigger_pdu *pdu = (struct cmd_vtrigger_pdu *) cmd->payload;
905         char *buf = (char *) pdu->cmd;
906         struct all_io_list *rep;
907         size_t sz;
908
909         pdu->len = le16_to_cpu(pdu->len);
910         buf[pdu->len] = '\0';
911
912         rep = get_all_io_list(IO_LIST_ALL, &sz);
913         if (!rep) {
914                 struct all_io_list state;
915
916                 state.threads = cpu_to_le64((uint64_t) 0);
917                 fio_net_queue_cmd(FIO_NET_CMD_VTRIGGER, &state, sizeof(state), NULL, SK_F_COPY);
918         } else
919                 fio_net_queue_cmd(FIO_NET_CMD_VTRIGGER, rep, sz, NULL, SK_F_FREE);
920
921         exec_trigger(buf);
922         return 0;
923 }
924
925 static int handle_command(struct sk_out *sk_out, struct flist_head *job_list,
926                           struct fio_net_cmd *cmd)
927 {
928         int ret;
929
930         dprint(FD_NET, "server: got op [%s], pdu=%u, tag=%llx\n",
931                         fio_server_op(cmd->opcode), cmd->pdu_len,
932                         (unsigned long long) cmd->tag);
933
934         switch (cmd->opcode) {
935         case FIO_NET_CMD_QUIT:
936                 fio_terminate_threads(TERMINATE_ALL);
937                 ret = 0;
938                 break;
939         case FIO_NET_CMD_EXIT:
940                 exit_backend = 1;
941                 return -1;
942         case FIO_NET_CMD_LOAD_FILE:
943                 ret = handle_load_file_cmd(cmd);
944                 break;
945         case FIO_NET_CMD_JOB:
946                 ret = handle_job_cmd(cmd);
947                 break;
948         case FIO_NET_CMD_JOBLINE:
949                 ret = handle_jobline_cmd(cmd);
950                 break;
951         case FIO_NET_CMD_PROBE:
952                 ret = handle_probe_cmd(cmd);
953                 break;
954         case FIO_NET_CMD_SEND_ETA:
955                 ret = handle_send_eta_cmd(cmd);
956                 break;
957         case FIO_NET_CMD_RUN:
958                 ret = handle_run_cmd(sk_out, job_list, cmd);
959                 break;
960         case FIO_NET_CMD_UPDATE_JOB:
961                 ret = handle_update_job_cmd(cmd);
962                 break;
963         case FIO_NET_CMD_VTRIGGER:
964                 ret = handle_trigger_cmd(cmd);
965                 break;
966         case FIO_NET_CMD_SENDFILE: {
967                 struct cmd_sendfile_reply *in;
968                 struct cmd_reply *rep;
969
970                 rep = (struct cmd_reply *) (uintptr_t) cmd->tag;
971
972                 in = (struct cmd_sendfile_reply *) cmd->payload;
973                 in->size = le32_to_cpu(in->size);
974                 in->error = le32_to_cpu(in->error);
975                 if (in->error) {
976                         ret = 1;
977                         rep->error = in->error;
978                 } else {
979                         ret = 0;
980                         rep->data = smalloc(in->size);
981                         if (!rep->data) {
982                                 ret = 1;
983                                 rep->error = ENOMEM;
984                         } else {
985                                 rep->size = in->size;
986                                 memcpy(rep->data, in->data, in->size);
987                         }
988                 }
989                 fio_mutex_up(&rep->lock);
990                 break;
991                 }
992         default:
993                 log_err("fio: unknown opcode: %s\n", fio_server_op(cmd->opcode));
994                 ret = 1;
995         }
996
997         return ret;
998 }
999
1000 /*
1001  * Send a command with a separate PDU, not inlined in the command
1002  */
1003 static int fio_send_cmd_ext_pdu(int sk, uint16_t opcode, const void *buf,
1004                                 off_t size, uint64_t tag, uint32_t flags)
1005 {
1006         struct fio_net_cmd cmd;
1007         struct iovec iov[2];
1008
1009         iov[0].iov_base = (void *) &cmd;
1010         iov[0].iov_len = sizeof(cmd);
1011         iov[1].iov_base = (void *) buf;
1012         iov[1].iov_len = size;
1013
1014         __fio_init_net_cmd(&cmd, opcode, size, tag);
1015         cmd.flags = __cpu_to_le32(flags);
1016         fio_net_cmd_crc_pdu(&cmd, buf);
1017
1018         return fio_sendv_data(sk, iov, 2);
1019 }
1020
1021 static void finish_entry(struct sk_entry *entry)
1022 {
1023         if (entry->flags & SK_F_FREE)
1024                 free(entry->buf);
1025         else if (entry->flags & SK_F_COPY)
1026                 sfree(entry->buf);
1027
1028         sfree(entry);
1029 }
1030
1031 static void entry_set_flags_tag(struct sk_entry *entry, struct flist_head *list,
1032                                 unsigned int *flags, uint64_t *tag)
1033 {
1034         if (!flist_empty(list))
1035                 *flags = FIO_NET_CMD_F_MORE;
1036         else
1037                 *flags = 0;
1038
1039         if (entry->tagptr)
1040                 *tag = *entry->tagptr;
1041         else
1042                 *tag = 0;
1043 }
1044
1045 static int send_vec_entry(struct sk_out *sk_out, struct sk_entry *first)
1046 {
1047         unsigned int flags;
1048         uint64_t tag;
1049         int ret;
1050
1051         entry_set_flags_tag(first, &first->next, &flags, &tag);
1052
1053         ret = fio_send_cmd_ext_pdu(sk_out->sk, first->opcode, first->buf, first->size, tag, flags);
1054
1055         while (!flist_empty(&first->next)) {
1056                 struct sk_entry *next;
1057
1058                 next = flist_first_entry(&first->next, struct sk_entry, list);
1059                 flist_del_init(&next->list);
1060
1061                 entry_set_flags_tag(next, &first->next, &flags, &tag);
1062
1063                 ret += fio_send_cmd_ext_pdu(sk_out->sk, next->opcode, next->buf, next->size, tag, flags);
1064                 finish_entry(next);
1065         }
1066
1067         return ret;
1068 }
1069
1070 static int handle_sk_entry(struct sk_out *sk_out, struct sk_entry *entry)
1071 {
1072         int ret;
1073
1074         if (entry->flags & SK_F_VEC)
1075                 ret = send_vec_entry(sk_out, entry);
1076         if (entry->flags & SK_F_SIMPLE) {
1077                 uint64_t tag = 0;
1078
1079                 if (entry->tagptr)
1080                         tag = *entry->tagptr;
1081
1082                 ret = fio_net_send_simple_cmd(sk_out->sk, entry->opcode, tag, NULL);
1083         } else
1084                 ret = fio_net_send_cmd(sk_out->sk, entry->opcode, entry->buf, entry->size, entry->tagptr, NULL);
1085
1086         if (ret)
1087                 log_err("fio: failed handling cmd %s\n", fio_server_op(entry->opcode));
1088
1089         finish_entry(entry);
1090         return ret;
1091 }
1092
1093 static int handle_xmits(struct sk_out *sk_out)
1094 {
1095         struct sk_entry *entry;
1096         FLIST_HEAD(list);
1097         int ret = 0;
1098
1099         sk_lock(sk_out);
1100         if (flist_empty(&sk_out->list)) {
1101                 sk_unlock(sk_out);
1102                 return 0;
1103         }
1104
1105         flist_splice_init(&sk_out->list, &list);
1106         sk_unlock(sk_out);
1107
1108         while (!flist_empty(&list)) {
1109                 entry = flist_entry(list.next, struct sk_entry, list);
1110                 flist_del(&entry->list);
1111                 ret += handle_sk_entry(sk_out, entry);
1112         }
1113
1114         return ret;
1115 }
1116
1117 static int handle_connection(struct sk_out *sk_out)
1118 {
1119         struct fio_net_cmd *cmd = NULL;
1120         FLIST_HEAD(job_list);
1121         int ret = 0;
1122
1123         reset_fio_state();
1124
1125         /* read forever */
1126         while (!exit_backend) {
1127                 struct pollfd pfd = {
1128                         .fd     = sk_out->sk,
1129                         .events = POLLIN,
1130                 };
1131
1132                 ret = 0;
1133                 do {
1134                         int timeout = 1000;
1135
1136                         if (!flist_empty(&job_list))
1137                                 timeout = 100;
1138
1139                         handle_xmits(sk_out);
1140
1141                         ret = poll(&pfd, 1, 0);
1142                         if (ret < 0) {
1143                                 if (errno == EINTR)
1144                                         break;
1145                                 log_err("fio: poll: %s\n", strerror(errno));
1146                                 break;
1147                         } else if (!ret) {
1148                                 fio_server_check_jobs(&job_list);
1149                                 fio_mutex_down_timeout(sk_out->wait, timeout);
1150                                 continue;
1151                         }
1152
1153                         if (pfd.revents & POLLIN)
1154                                 break;
1155                         if (pfd.revents & (POLLERR|POLLHUP)) {
1156                                 ret = 1;
1157                                 break;
1158                         }
1159                 } while (!exit_backend);
1160
1161                 fio_server_check_jobs(&job_list);
1162
1163                 if (ret < 0)
1164                         break;
1165
1166                 cmd = fio_net_recv_cmd(sk_out->sk);
1167                 if (!cmd) {
1168                         ret = -1;
1169                         break;
1170                 }
1171
1172                 ret = handle_command(sk_out, &job_list, cmd);
1173                 if (ret)
1174                         break;
1175
1176                 free(cmd);
1177                 cmd = NULL;
1178         }
1179
1180         if (cmd)
1181                 free(cmd);
1182
1183         handle_xmits(sk_out);
1184
1185         close(sk_out->sk);
1186         _exit(ret);
1187 }
1188
1189 /* get the address on this host bound by the input socket, 
1190  * whether it is ipv6 or ipv4 */
1191
1192 int get_my_addr_str(int sk)
1193 {
1194         struct sockaddr_in6 myaddr6 = { 0, };
1195         struct sockaddr_in myaddr4 = { 0, };
1196         struct sockaddr *sockaddr_p;
1197         char *net_addr;
1198         socklen_t len;
1199         int ret;
1200
1201         if (use_ipv6) {
1202                 len = sizeof(myaddr6);
1203                 sockaddr_p = (struct sockaddr * )&myaddr6;
1204                 net_addr = (char * )&myaddr6.sin6_addr;
1205         } else {
1206                 len = sizeof(myaddr4);
1207                 sockaddr_p = (struct sockaddr * )&myaddr4;
1208                 net_addr = (char * )&myaddr4.sin_addr;
1209         }
1210
1211         ret = getsockname(sk, sockaddr_p, &len);
1212         if (ret) {
1213                 log_err("fio: getsockaddr: %s\n", strerror(errno));
1214                 return -1;
1215         }
1216
1217         if (!inet_ntop(use_ipv6?AF_INET6:AF_INET, net_addr, client_sockaddr_str, INET6_ADDRSTRLEN - 1)) {
1218                 log_err("inet_ntop: failed to convert addr to string\n");
1219                 return -1;
1220         }
1221
1222         dprint(FD_NET, "fio server bound to addr %s\n", client_sockaddr_str);
1223         return 0;
1224 }
1225
1226 static int accept_loop(struct sk_out *sk_out, int listen_sk)
1227 {
1228         struct sockaddr_in addr;
1229         struct sockaddr_in6 addr6;
1230         socklen_t len = use_ipv6 ? sizeof(addr6) : sizeof(addr);
1231         struct pollfd pfd;
1232         int ret = 0, sk, exitval = 0;
1233         FLIST_HEAD(conn_list);
1234
1235         dprint(FD_NET, "server enter accept loop\n");
1236
1237         fio_set_fd_nonblocking(listen_sk, "server");
1238
1239         while (!exit_backend) {
1240                 const char *from;
1241                 char buf[64];
1242                 pid_t pid;
1243
1244                 pfd.fd = listen_sk;
1245                 pfd.events = POLLIN;
1246                 do {
1247                         int timeout = 1000;
1248
1249                         if (!flist_empty(&conn_list))
1250                                 timeout = 100;
1251
1252                         ret = poll(&pfd, 1, timeout);
1253                         if (ret < 0) {
1254                                 if (errno == EINTR)
1255                                         break;
1256                                 log_err("fio: poll: %s\n", strerror(errno));
1257                                 break;
1258                         } else if (!ret) {
1259                                 fio_server_check_conns(&conn_list);
1260                                 continue;
1261                         }
1262
1263                         if (pfd.revents & POLLIN)
1264                                 break;
1265                 } while (!exit_backend);
1266
1267                 fio_server_check_conns(&conn_list);
1268
1269                 if (exit_backend || ret < 0)
1270                         break;
1271
1272                 if (use_ipv6)
1273                         sk = accept(listen_sk, (struct sockaddr *) &addr6, &len);
1274                 else
1275                         sk = accept(listen_sk, (struct sockaddr *) &addr, &len);
1276
1277                 if (sk < 0) {
1278                         log_err("fio: accept: %s\n", strerror(errno));
1279                         return -1;
1280                 }
1281
1282                 if (use_ipv6)
1283                         from = inet_ntop(AF_INET6, (struct sockaddr *) &addr6.sin6_addr, buf, sizeof(buf));
1284                 else
1285                         from = inet_ntop(AF_INET, (struct sockaddr *) &addr.sin_addr, buf, sizeof(buf));
1286
1287                 dprint(FD_NET, "server: connect from %s\n", from);
1288
1289                 sk_out->sk = sk;
1290
1291                 pid = fork();
1292                 if (pid) {
1293                         close(sk);
1294                         fio_server_add_conn_pid(&conn_list, pid);
1295                         pthread_setspecific(sk_out_key, sk_out);
1296                         continue;
1297                 }
1298
1299                 /* exits */
1300                 get_my_addr_str(sk); /* if error, it's already logged, non-fatal */
1301                 handle_connection(sk_out);
1302         }
1303
1304         return exitval;
1305 }
1306
1307 int fio_server_text_output(int level, const char *buf, size_t len)
1308 {
1309         struct sk_out *sk_out = pthread_getspecific(sk_out_key);
1310         struct cmd_text_pdu *pdu;
1311         unsigned int tlen;
1312         struct timeval tv;
1313
1314         if (!sk_out || sk_out->sk == -1)
1315                 return -1;
1316
1317         tlen = sizeof(*pdu) + len;
1318         pdu = malloc(tlen);
1319
1320         pdu->level      = __cpu_to_le32(level);
1321         pdu->buf_len    = __cpu_to_le32(len);
1322
1323         gettimeofday(&tv, NULL);
1324         pdu->log_sec    = __cpu_to_le64(tv.tv_sec);
1325         pdu->log_usec   = __cpu_to_le64(tv.tv_usec);
1326
1327         memcpy(pdu->buf, buf, len);
1328
1329         fio_net_queue_cmd(FIO_NET_CMD_TEXT, pdu, tlen, NULL, SK_F_COPY);
1330         free(pdu);
1331         return len;
1332 }
1333
1334 static void convert_io_stat(struct io_stat *dst, struct io_stat *src)
1335 {
1336         dst->max_val    = cpu_to_le64(src->max_val);
1337         dst->min_val    = cpu_to_le64(src->min_val);
1338         dst->samples    = cpu_to_le64(src->samples);
1339
1340         /*
1341          * Encode to IEEE 754 for network transfer
1342          */
1343         dst->mean.u.i   = cpu_to_le64(fio_double_to_uint64(src->mean.u.f));
1344         dst->S.u.i      = cpu_to_le64(fio_double_to_uint64(src->S.u.f));
1345 }
1346
1347 static void convert_gs(struct group_run_stats *dst, struct group_run_stats *src)
1348 {
1349         int i;
1350
1351         for (i = 0; i < DDIR_RWDIR_CNT; i++) {
1352                 dst->max_run[i]         = cpu_to_le64(src->max_run[i]);
1353                 dst->min_run[i]         = cpu_to_le64(src->min_run[i]);
1354                 dst->max_bw[i]          = cpu_to_le64(src->max_bw[i]);
1355                 dst->min_bw[i]          = cpu_to_le64(src->min_bw[i]);
1356                 dst->io_kb[i]           = cpu_to_le64(src->io_kb[i]);
1357                 dst->agg[i]             = cpu_to_le64(src->agg[i]);
1358         }
1359
1360         dst->kb_base    = cpu_to_le32(src->kb_base);
1361         dst->unit_base  = cpu_to_le32(src->unit_base);
1362         dst->groupid    = cpu_to_le32(src->groupid);
1363         dst->unified_rw_rep     = cpu_to_le32(src->unified_rw_rep);
1364 }
1365
1366 /*
1367  * Send a CMD_TS, which packs struct thread_stat and group_run_stats
1368  * into a single payload.
1369  */
1370 void fio_server_send_ts(struct thread_stat *ts, struct group_run_stats *rs)
1371 {
1372         struct cmd_ts_pdu p;
1373         int i, j;
1374
1375         dprint(FD_NET, "server sending end stats\n");
1376
1377         memset(&p, 0, sizeof(p));
1378
1379         strncpy(p.ts.name, ts->name, FIO_JOBNAME_SIZE - 1);
1380         strncpy(p.ts.verror, ts->verror, FIO_VERROR_SIZE - 1);
1381         strncpy(p.ts.description, ts->description, FIO_JOBDESC_SIZE - 1);
1382
1383         p.ts.error              = cpu_to_le32(ts->error);
1384         p.ts.thread_number      = cpu_to_le32(ts->thread_number);
1385         p.ts.groupid            = cpu_to_le32(ts->groupid);
1386         p.ts.pid                = cpu_to_le32(ts->pid);
1387         p.ts.members            = cpu_to_le32(ts->members);
1388         p.ts.unified_rw_rep     = cpu_to_le32(ts->unified_rw_rep);
1389
1390         for (i = 0; i < DDIR_RWDIR_CNT; i++) {
1391                 convert_io_stat(&p.ts.clat_stat[i], &ts->clat_stat[i]);
1392                 convert_io_stat(&p.ts.slat_stat[i], &ts->slat_stat[i]);
1393                 convert_io_stat(&p.ts.lat_stat[i], &ts->lat_stat[i]);
1394                 convert_io_stat(&p.ts.bw_stat[i], &ts->bw_stat[i]);
1395         }
1396
1397         p.ts.usr_time           = cpu_to_le64(ts->usr_time);
1398         p.ts.sys_time           = cpu_to_le64(ts->sys_time);
1399         p.ts.ctx                = cpu_to_le64(ts->ctx);
1400         p.ts.minf               = cpu_to_le64(ts->minf);
1401         p.ts.majf               = cpu_to_le64(ts->majf);
1402         p.ts.clat_percentiles   = cpu_to_le64(ts->clat_percentiles);
1403         p.ts.percentile_precision = cpu_to_le64(ts->percentile_precision);
1404
1405         for (i = 0; i < FIO_IO_U_LIST_MAX_LEN; i++) {
1406                 fio_fp64_t *src = &ts->percentile_list[i];
1407                 fio_fp64_t *dst = &p.ts.percentile_list[i];
1408
1409                 dst->u.i = cpu_to_le64(fio_double_to_uint64(src->u.f));
1410         }
1411
1412         for (i = 0; i < FIO_IO_U_MAP_NR; i++) {
1413                 p.ts.io_u_map[i]        = cpu_to_le32(ts->io_u_map[i]);
1414                 p.ts.io_u_submit[i]     = cpu_to_le32(ts->io_u_submit[i]);
1415                 p.ts.io_u_complete[i]   = cpu_to_le32(ts->io_u_complete[i]);
1416         }
1417
1418         for (i = 0; i < FIO_IO_U_LAT_U_NR; i++) {
1419                 p.ts.io_u_lat_u[i]      = cpu_to_le32(ts->io_u_lat_u[i]);
1420                 p.ts.io_u_lat_m[i]      = cpu_to_le32(ts->io_u_lat_m[i]);
1421         }
1422
1423         for (i = 0; i < DDIR_RWDIR_CNT; i++)
1424                 for (j = 0; j < FIO_IO_U_PLAT_NR; j++)
1425                         p.ts.io_u_plat[i][j] = cpu_to_le32(ts->io_u_plat[i][j]);
1426
1427         for (i = 0; i < DDIR_RWDIR_CNT; i++) {
1428                 p.ts.total_io_u[i]      = cpu_to_le64(ts->total_io_u[i]);
1429                 p.ts.short_io_u[i]      = cpu_to_le64(ts->short_io_u[i]);
1430                 p.ts.drop_io_u[i]       = cpu_to_le64(ts->drop_io_u[i]);
1431         }
1432
1433         p.ts.total_submit       = cpu_to_le64(ts->total_submit);
1434         p.ts.total_complete     = cpu_to_le64(ts->total_complete);
1435
1436         for (i = 0; i < DDIR_RWDIR_CNT; i++) {
1437                 p.ts.io_bytes[i]        = cpu_to_le64(ts->io_bytes[i]);
1438                 p.ts.runtime[i]         = cpu_to_le64(ts->runtime[i]);
1439         }
1440
1441         p.ts.total_run_time     = cpu_to_le64(ts->total_run_time);
1442         p.ts.continue_on_error  = cpu_to_le16(ts->continue_on_error);
1443         p.ts.total_err_count    = cpu_to_le64(ts->total_err_count);
1444         p.ts.first_error        = cpu_to_le32(ts->first_error);
1445         p.ts.kb_base            = cpu_to_le32(ts->kb_base);
1446         p.ts.unit_base          = cpu_to_le32(ts->unit_base);
1447
1448         p.ts.latency_depth      = cpu_to_le32(ts->latency_depth);
1449         p.ts.latency_target     = cpu_to_le64(ts->latency_target);
1450         p.ts.latency_window     = cpu_to_le64(ts->latency_window);
1451         p.ts.latency_percentile.u.i = cpu_to_le64(fio_double_to_uint64(ts->latency_percentile.u.f));
1452
1453         p.ts.nr_block_infos     = le64_to_cpu(ts->nr_block_infos);
1454         for (i = 0; i < p.ts.nr_block_infos; i++)
1455                 p.ts.block_infos[i] = le32_to_cpu(ts->block_infos[i]);
1456
1457         convert_gs(&p.rs, rs);
1458
1459         fio_net_queue_cmd(FIO_NET_CMD_TS, &p, sizeof(p), NULL, SK_F_COPY);
1460 }
1461
1462 void fio_server_send_gs(struct group_run_stats *rs)
1463 {
1464         struct group_run_stats gs;
1465
1466         dprint(FD_NET, "server sending group run stats\n");
1467
1468         convert_gs(&gs, rs);
1469         fio_net_queue_cmd(FIO_NET_CMD_GS, &gs, sizeof(gs), NULL, SK_F_COPY);
1470 }
1471
1472 static void convert_agg(struct disk_util_agg *dst, struct disk_util_agg *src)
1473 {
1474         int i;
1475
1476         for (i = 0; i < 2; i++) {
1477                 dst->ios[i]     = cpu_to_le64(src->ios[i]);
1478                 dst->merges[i]  = cpu_to_le64(src->merges[i]);
1479                 dst->sectors[i] = cpu_to_le64(src->sectors[i]);
1480                 dst->ticks[i]   = cpu_to_le64(src->ticks[i]);
1481         }
1482
1483         dst->io_ticks           = cpu_to_le64(src->io_ticks);
1484         dst->time_in_queue      = cpu_to_le64(src->time_in_queue);
1485         dst->slavecount         = cpu_to_le32(src->slavecount);
1486         dst->max_util.u.i       = cpu_to_le64(fio_double_to_uint64(src->max_util.u.f));
1487 }
1488
1489 static void convert_dus(struct disk_util_stat *dst, struct disk_util_stat *src)
1490 {
1491         int i;
1492
1493         dst->name[FIO_DU_NAME_SZ - 1] = '\0';
1494         strncpy((char *) dst->name, (char *) src->name, FIO_DU_NAME_SZ - 1);
1495
1496         for (i = 0; i < 2; i++) {
1497                 dst->s.ios[i]           = cpu_to_le64(src->s.ios[i]);
1498                 dst->s.merges[i]        = cpu_to_le64(src->s.merges[i]);
1499                 dst->s.sectors[i]       = cpu_to_le64(src->s.sectors[i]);
1500                 dst->s.ticks[i]         = cpu_to_le64(src->s.ticks[i]);
1501         }
1502
1503         dst->s.io_ticks         = cpu_to_le64(src->s.io_ticks);
1504         dst->s.time_in_queue    = cpu_to_le64(src->s.time_in_queue);
1505         dst->s.msec             = cpu_to_le64(src->s.msec);
1506 }
1507
1508 void fio_server_send_du(void)
1509 {
1510         struct disk_util *du;
1511         struct flist_head *entry;
1512         struct cmd_du_pdu pdu;
1513
1514         dprint(FD_NET, "server: sending disk_util %d\n", !flist_empty(&disk_list));
1515
1516         memset(&pdu, 0, sizeof(pdu));
1517
1518         flist_for_each(entry, &disk_list) {
1519                 du = flist_entry(entry, struct disk_util, list);
1520
1521                 convert_dus(&pdu.dus, &du->dus);
1522                 convert_agg(&pdu.agg, &du->agg);
1523
1524                 fio_net_queue_cmd(FIO_NET_CMD_DU, &pdu, sizeof(pdu), NULL, SK_F_COPY);
1525         }
1526 }
1527
1528 static int fio_send_iolog_gz(struct sk_entry *first, struct io_log *log)
1529 {
1530         int ret = 0;
1531 #ifdef CONFIG_ZLIB
1532         struct sk_entry *entry;
1533         z_stream stream;
1534         void *out_pdu;
1535
1536         /*
1537          * Dirty - since the log is potentially huge, compress it into
1538          * FIO_SERVER_MAX_FRAGMENT_PDU chunks and let the receiving
1539          * side defragment it.
1540          */
1541         out_pdu = malloc(FIO_SERVER_MAX_FRAGMENT_PDU);
1542
1543         stream.zalloc = Z_NULL;
1544         stream.zfree = Z_NULL;
1545         stream.opaque = Z_NULL;
1546
1547         if (deflateInit(&stream, Z_DEFAULT_COMPRESSION) != Z_OK) {
1548                 ret = 1;
1549                 goto err;
1550         }
1551
1552         stream.next_in = (void *) log->log;
1553         stream.avail_in = log->nr_samples * log_entry_sz(log);
1554
1555         do {
1556                 unsigned int this_len;
1557
1558                 stream.avail_out = FIO_SERVER_MAX_FRAGMENT_PDU;
1559                 stream.next_out = out_pdu;
1560                 ret = deflate(&stream, Z_FINISH);
1561                 /* may be Z_OK, or Z_STREAM_END */
1562                 if (ret < 0)
1563                         goto err_zlib;
1564
1565                 this_len = FIO_SERVER_MAX_FRAGMENT_PDU - stream.avail_out;
1566
1567                 entry = fio_net_prep_cmd(FIO_NET_CMD_IOLOG, out_pdu, this_len,
1568                                                 NULL, SK_F_FREE | SK_F_VEC);
1569                 flist_add_tail(&entry->list, &first->next);
1570         } while (stream.avail_in);
1571
1572 err_zlib:
1573         deflateEnd(&stream);
1574 err:
1575         free(out_pdu);
1576 #endif
1577         return ret;
1578 }
1579
1580 int fio_send_iolog(struct thread_data *td, struct io_log *log, const char *name)
1581 {
1582         struct cmd_iolog_pdu pdu;
1583         struct sk_entry *first;
1584         int i, ret = 0;
1585
1586         pdu.nr_samples = cpu_to_le64(log->nr_samples);
1587         pdu.thread_number = cpu_to_le32(td->thread_number);
1588         pdu.log_type = cpu_to_le32(log->log_type);
1589         pdu.compressed = cpu_to_le32(use_zlib);
1590
1591         strncpy((char *) pdu.name, name, FIO_NET_NAME_MAX);
1592         pdu.name[FIO_NET_NAME_MAX - 1] = '\0';
1593
1594         for (i = 0; i < log->nr_samples; i++) {
1595                 struct io_sample *s = get_sample(log, i);
1596
1597                 s->time         = cpu_to_le64(s->time);
1598                 s->val          = cpu_to_le64(s->val);
1599                 s->__ddir       = cpu_to_le32(s->__ddir);
1600                 s->bs           = cpu_to_le32(s->bs);
1601
1602                 if (log->log_offset) {
1603                         struct io_sample_offset *so = (void *) s;
1604
1605                         so->offset = cpu_to_le64(so->offset);
1606                 }
1607         }
1608
1609         /*
1610          * Assemble header entry first
1611          */
1612         first = fio_net_prep_cmd(FIO_NET_CMD_IOLOG, &pdu, sizeof(pdu), NULL, SK_F_COPY | SK_F_VEC);
1613
1614         /*
1615          * Now append actual log entries. Compress if we can, otherwise just
1616          * plain text output.
1617          */
1618         if (use_zlib)
1619                 ret = fio_send_iolog_gz(first, log);
1620         else {
1621                 struct sk_entry *entry;
1622
1623                 entry = fio_net_prep_cmd(FIO_NET_CMD_IOLOG, log->log,
1624                                         log->nr_samples * log_entry_sz(log),
1625                                         NULL, SK_F_FREE | SK_F_VEC);
1626                 flist_add_tail(&entry->list, &first->next);
1627         }
1628
1629         return ret;
1630 }
1631
1632 void fio_server_send_add_job(struct thread_data *td)
1633 {
1634         struct cmd_add_job_pdu pdu;
1635
1636         memset(&pdu, 0, sizeof(pdu));
1637         pdu.thread_number = cpu_to_le32(td->thread_number);
1638         pdu.groupid = cpu_to_le32(td->groupid);
1639         convert_thread_options_to_net(&pdu.top, &td->o);
1640
1641         fio_net_queue_cmd(FIO_NET_CMD_ADD_JOB, &pdu, sizeof(pdu), NULL, SK_F_COPY);
1642 }
1643
1644 void fio_server_send_start(struct thread_data *td)
1645 {
1646         struct sk_out *sk_out = pthread_getspecific(sk_out_key);
1647
1648         assert(sk_out->sk != -1);
1649
1650         fio_net_queue_cmd(FIO_NET_CMD_SERVER_START, NULL, 0, 0, SK_F_SIMPLE);
1651 }
1652
1653 int fio_server_get_verify_state(const char *name, int threadnumber,
1654                                 void **datap, int *version)
1655 {
1656         struct thread_io_list *s;
1657         struct cmd_sendfile out;
1658         struct cmd_reply *rep;
1659         uint64_t tag;
1660         void *data;
1661
1662         dprint(FD_NET, "server: request verify state\n");
1663
1664         rep = smalloc(sizeof(*rep));
1665         if (!rep) {
1666                 log_err("fio: smalloc pool too small\n");
1667                 return 1;
1668         }
1669
1670         __fio_mutex_init(&rep->lock, FIO_MUTEX_LOCKED);
1671         rep->data = NULL;
1672         rep->error = 0;
1673
1674         verify_state_gen_name((char *) out.path, sizeof(out.path), name, me,
1675                                 threadnumber);
1676         tag = (uint64_t) (uintptr_t) rep;
1677         fio_net_queue_cmd(FIO_NET_CMD_SENDFILE, &out, sizeof(out), &tag, SK_F_COPY);
1678
1679         /*
1680          * Wait for the backend to receive the reply
1681          */
1682         if (fio_mutex_down_timeout(&rep->lock, 10000)) {
1683                 log_err("fio: timed out waiting for reply\n");
1684                 goto fail;
1685         }
1686
1687         if (rep->error) {
1688                 log_err("fio: failure on receiving state file: %s\n", strerror(rep->error));
1689 fail:
1690                 *datap = NULL;
1691                 sfree(rep);
1692                 fio_net_queue_quit();
1693                 return 1;
1694         }
1695
1696         /*
1697          * The format is verify_state_hdr, then thread_io_list. Verify
1698          * the header, and the thread_io_list checksum
1699          */
1700         s = rep->data + sizeof(struct verify_state_hdr);
1701         if (verify_state_hdr(rep->data, s, version))
1702                 goto fail;
1703
1704         /*
1705          * Don't need the header from now, copy just the thread_io_list
1706          */
1707         rep->size -= sizeof(struct verify_state_hdr);
1708         data = malloc(rep->size);
1709         memcpy(data, s, rep->size);
1710         *datap = data;
1711
1712         sfree(rep->data);
1713         __fio_mutex_remove(&rep->lock);
1714         sfree(rep);
1715         return 0;
1716 }
1717
1718 static int fio_init_server_ip(void)
1719 {
1720         struct sockaddr *addr;
1721         socklen_t socklen;
1722         char buf[80];
1723         const char *str;
1724         int sk, opt;
1725
1726         if (use_ipv6)
1727                 sk = socket(AF_INET6, SOCK_STREAM, 0);
1728         else
1729                 sk = socket(AF_INET, SOCK_STREAM, 0);
1730
1731         if (sk < 0) {
1732                 log_err("fio: socket: %s\n", strerror(errno));
1733                 return -1;
1734         }
1735
1736         opt = 1;
1737         if (setsockopt(sk, SOL_SOCKET, SO_REUSEADDR, (void *)&opt, sizeof(opt)) < 0) {
1738                 log_err("fio: setsockopt(REUSEADDR): %s\n", strerror(errno));
1739                 close(sk);
1740                 return -1;
1741         }
1742 #ifdef SO_REUSEPORT
1743         if (setsockopt(sk, SOL_SOCKET, SO_REUSEPORT, &opt, sizeof(opt)) < 0) {
1744                 log_err("fio: setsockopt(REUSEPORT): %s\n", strerror(errno));
1745                 close(sk);
1746                 return -1;
1747         }
1748 #endif
1749
1750         if (use_ipv6) {
1751                 const void *src = &saddr_in6.sin6_addr;
1752
1753                 addr = (struct sockaddr *) &saddr_in6;
1754                 socklen = sizeof(saddr_in6);
1755                 saddr_in6.sin6_family = AF_INET6;
1756                 str = inet_ntop(AF_INET6, src, buf, sizeof(buf));
1757         } else {
1758                 const void *src = &saddr_in.sin_addr;
1759
1760                 addr = (struct sockaddr *) &saddr_in;
1761                 socklen = sizeof(saddr_in);
1762                 saddr_in.sin_family = AF_INET;
1763                 str = inet_ntop(AF_INET, src, buf, sizeof(buf));
1764         }
1765
1766         if (bind(sk, addr, socklen) < 0) {
1767                 log_err("fio: bind: %s\n", strerror(errno));
1768                 log_info("fio: failed with IPv%c %s\n", use_ipv6 ? '6' : '4', str);
1769                 close(sk);
1770                 return -1;
1771         }
1772
1773         return sk;
1774 }
1775
1776 static int fio_init_server_sock(void)
1777 {
1778         struct sockaddr_un addr;
1779         socklen_t len;
1780         mode_t mode;
1781         int sk;
1782
1783         sk = socket(AF_UNIX, SOCK_STREAM, 0);
1784         if (sk < 0) {
1785                 log_err("fio: socket: %s\n", strerror(errno));
1786                 return -1;
1787         }
1788
1789         mode = umask(000);
1790
1791         memset(&addr, 0, sizeof(addr));
1792         addr.sun_family = AF_UNIX;
1793         strncpy(addr.sun_path, bind_sock, sizeof(addr.sun_path) - 1);
1794
1795         len = sizeof(addr.sun_family) + strlen(bind_sock) + 1;
1796
1797         if (bind(sk, (struct sockaddr *) &addr, len) < 0) {
1798                 log_err("fio: bind: %s\n", strerror(errno));
1799                 close(sk);
1800                 return -1;
1801         }
1802
1803         umask(mode);
1804         return sk;
1805 }
1806
1807 static int fio_init_server_connection(void)
1808 {
1809         char bind_str[128];
1810         int sk;
1811
1812         dprint(FD_NET, "starting server\n");
1813
1814         if (!bind_sock)
1815                 sk = fio_init_server_ip();
1816         else
1817                 sk = fio_init_server_sock();
1818
1819         if (sk < 0)
1820                 return sk;
1821
1822         memset(bind_str, 0, sizeof(bind_str));
1823
1824         if (!bind_sock) {
1825                 char *p, port[16];
1826                 const void *src;
1827                 int af;
1828
1829                 if (use_ipv6) {
1830                         af = AF_INET6;
1831                         src = &saddr_in6.sin6_addr;
1832                 } else {
1833                         af = AF_INET;
1834                         src = &saddr_in.sin_addr;
1835                 }
1836
1837                 p = (char *) inet_ntop(af, src, bind_str, sizeof(bind_str));
1838
1839                 sprintf(port, ",%u", fio_net_port);
1840                 if (p)
1841                         strcat(p, port);
1842                 else
1843                         strncpy(bind_str, port, sizeof(bind_str) - 1);
1844         } else
1845                 strncpy(bind_str, bind_sock, sizeof(bind_str) - 1);
1846
1847         log_info("fio: server listening on %s\n", bind_str);
1848
1849         if (listen(sk, 0) < 0) {
1850                 log_err("fio: listen: %s\n", strerror(errno));
1851                 close(sk);
1852                 return -1;
1853         }
1854
1855         return sk;
1856 }
1857
1858 int fio_server_parse_host(const char *host, int ipv6, struct in_addr *inp,
1859                           struct in6_addr *inp6)
1860
1861 {
1862         int ret = 0;
1863
1864         if (ipv6)
1865                 ret = inet_pton(AF_INET6, host, inp6);
1866         else
1867                 ret = inet_pton(AF_INET, host, inp);
1868
1869         if (ret != 1) {
1870                 struct addrinfo hints, *res;
1871
1872                 memset(&hints, 0, sizeof(hints));
1873                 hints.ai_family = ipv6 ? AF_INET6 : AF_INET;
1874                 hints.ai_socktype = SOCK_STREAM;
1875
1876                 ret = getaddrinfo(host, NULL, &hints, &res);
1877                 if (ret) {
1878                         log_err("fio: failed to resolve <%s> (%s)\n", host,
1879                                         gai_strerror(ret));
1880                         return 1;
1881                 }
1882
1883                 if (ipv6)
1884                         memcpy(inp6, &((struct sockaddr_in6 *) res->ai_addr)->sin6_addr, sizeof(*inp6));
1885                 else
1886                         memcpy(inp, &((struct sockaddr_in *) res->ai_addr)->sin_addr, sizeof(*inp));
1887
1888                 ret = 1;
1889                 freeaddrinfo(res);
1890         }
1891
1892         return !(ret == 1);
1893 }
1894
1895 /*
1896  * Parse a host/ip/port string. Reads from 'str'.
1897  *
1898  * Outputs:
1899  *
1900  * For IPv4:
1901  *      *ptr is the host, *port is the port, inp is the destination.
1902  * For IPv6:
1903  *      *ptr is the host, *port is the port, inp6 is the dest, and *ipv6 is 1.
1904  * For local domain sockets:
1905  *      *ptr is the filename, *is_sock is 1.
1906  */
1907 int fio_server_parse_string(const char *str, char **ptr, int *is_sock,
1908                             int *port, struct in_addr *inp,
1909                             struct in6_addr *inp6, int *ipv6)
1910 {
1911         const char *host = str;
1912         char *portp;
1913         int lport = 0;
1914
1915         *ptr = NULL;
1916         *is_sock = 0;
1917         *port = fio_net_port;
1918         *ipv6 = 0;
1919
1920         if (!strncmp(str, "sock:", 5)) {
1921                 *ptr = strdup(str + 5);
1922                 *is_sock = 1;
1923
1924                 return 0;
1925         }
1926
1927         /*
1928          * Is it ip:<ip or host>:port
1929          */
1930         if (!strncmp(host, "ip:", 3))
1931                 host += 3;
1932         else if (!strncmp(host, "ip4:", 4))
1933                 host += 4;
1934         else if (!strncmp(host, "ip6:", 4)) {
1935                 host += 4;
1936                 *ipv6 = 1;
1937         } else if (host[0] == ':') {
1938                 /* String is :port */
1939                 host++;
1940                 lport = atoi(host);
1941                 if (!lport || lport > 65535) {
1942                         log_err("fio: bad server port %u\n", lport);
1943                         return 1;
1944                 }
1945                 /* no hostname given, we are done */
1946                 *port = lport;
1947                 return 0;
1948         }
1949
1950         /*
1951          * If no port seen yet, check if there's a last ',' at the end
1952          */
1953         if (!lport) {
1954                 portp = strchr(host, ',');
1955                 if (portp) {
1956                         *portp = '\0';
1957                         portp++;
1958                         lport = atoi(portp);
1959                         if (!lport || lport > 65535) {
1960                                 log_err("fio: bad server port %u\n", lport);
1961                                 return 1;
1962                         }
1963                 }
1964         }
1965
1966         if (lport)
1967                 *port = lport;
1968
1969         if (!strlen(host))
1970                 return 0;
1971
1972         *ptr = strdup(host);
1973
1974         if (fio_server_parse_host(*ptr, *ipv6, inp, inp6)) {
1975                 free(*ptr);
1976                 *ptr = NULL;
1977                 return 1;
1978         }
1979
1980         if (*port == 0)
1981                 *port = fio_net_port;
1982
1983         return 0;
1984 }
1985
1986 /*
1987  * Server arg should be one of:
1988  *
1989  * sock:/path/to/socket
1990  *   ip:1.2.3.4
1991  *      1.2.3.4
1992  *
1993  * Where sock uses unix domain sockets, and ip binds the server to
1994  * a specific interface. If no arguments are given to the server, it
1995  * uses IP and binds to 0.0.0.0.
1996  *
1997  */
1998 static int fio_handle_server_arg(void)
1999 {
2000         int port = fio_net_port;
2001         int is_sock, ret = 0;
2002
2003         saddr_in.sin_addr.s_addr = htonl(INADDR_ANY);
2004
2005         if (!fio_server_arg)
2006                 goto out;
2007
2008         ret = fio_server_parse_string(fio_server_arg, &bind_sock, &is_sock,
2009                                         &port, &saddr_in.sin_addr,
2010                                         &saddr_in6.sin6_addr, &use_ipv6);
2011
2012         if (!is_sock && bind_sock) {
2013                 free(bind_sock);
2014                 bind_sock = NULL;
2015         }
2016
2017 out:
2018         fio_net_port = port;
2019         saddr_in.sin_port = htons(port);
2020         saddr_in6.sin6_port = htons(port);
2021         return ret;
2022 }
2023
2024 static void sig_int(int sig)
2025 {
2026         if (bind_sock)
2027                 unlink(bind_sock);
2028 }
2029
2030 static void set_sig_handlers(void)
2031 {
2032         struct sigaction act;
2033
2034         memset(&act, 0, sizeof(act));
2035         act.sa_handler = sig_int;
2036         act.sa_flags = SA_RESTART;
2037         sigaction(SIGINT, &act, NULL);
2038 }
2039
2040 static int fio_server(void)
2041 {
2042         struct sk_out *sk_out;
2043         int sk, ret;
2044
2045         dprint(FD_NET, "starting server\n");
2046
2047         if (fio_handle_server_arg())
2048                 return -1;
2049
2050         sk = fio_init_server_connection();
2051         if (sk < 0)
2052                 return -1;
2053
2054         set_sig_handlers();
2055
2056         if (pthread_key_create(&sk_out_key, NULL))
2057                 log_err("fio: can't create sk_out backend key\n");
2058
2059         sk_out = smalloc(sizeof(*sk_out));
2060         INIT_FLIST_HEAD(&sk_out->list);
2061         sk_out->lock = fio_mutex_init(FIO_MUTEX_UNLOCKED);
2062         sk_out->wait = fio_mutex_init(FIO_MUTEX_LOCKED);
2063
2064         sk_out_assign(sk_out);
2065
2066         ret = accept_loop(sk_out, sk);
2067
2068         close(sk);
2069
2070         if (fio_server_arg) {
2071                 free(fio_server_arg);
2072                 fio_server_arg = NULL;
2073         }
2074         if (bind_sock)
2075                 free(bind_sock);
2076
2077         sk_out_drop();
2078
2079         return ret;
2080 }
2081
2082 void fio_server_got_signal(int signal)
2083 {
2084         struct sk_out *sk_out = pthread_getspecific(sk_out_key);
2085
2086         assert(sk_out);
2087
2088         if (signal == SIGPIPE)
2089                 sk_out->sk = -1;
2090         else {
2091                 log_info("\nfio: terminating on signal %d\n", signal);
2092                 exit_backend = 1;
2093         }
2094 }
2095
2096 static int check_existing_pidfile(const char *pidfile)
2097 {
2098         struct stat sb;
2099         char buf[16];
2100         pid_t pid;
2101         FILE *f;
2102
2103         if (stat(pidfile, &sb))
2104                 return 0;
2105
2106         f = fopen(pidfile, "r");
2107         if (!f)
2108                 return 0;
2109
2110         if (fread(buf, sb.st_size, 1, f) <= 0) {
2111                 fclose(f);
2112                 return 1;
2113         }
2114         fclose(f);
2115
2116         pid = atoi(buf);
2117         if (kill(pid, SIGCONT) < 0)
2118                 return errno != ESRCH;
2119
2120         return 1;
2121 }
2122
2123 static int write_pid(pid_t pid, const char *pidfile)
2124 {
2125         FILE *fpid;
2126
2127         fpid = fopen(pidfile, "w");
2128         if (!fpid) {
2129                 log_err("fio: failed opening pid file %s\n", pidfile);
2130                 return 1;
2131         }
2132
2133         fprintf(fpid, "%u\n", (unsigned int) pid);
2134         fclose(fpid);
2135         return 0;
2136 }
2137
2138 /*
2139  * If pidfile is specified, background us.
2140  */
2141 int fio_start_server(char *pidfile)
2142 {
2143         pid_t pid;
2144         int ret;
2145
2146 #if defined(WIN32)
2147         WSADATA wsd;
2148         WSAStartup(MAKEWORD(2, 2), &wsd);
2149 #endif
2150
2151         if (!pidfile)
2152                 return fio_server();
2153
2154         if (check_existing_pidfile(pidfile)) {
2155                 log_err("fio: pidfile %s exists and server appears alive\n",
2156                                                                 pidfile);
2157                 free(pidfile);
2158                 return -1;
2159         }
2160
2161         pid = fork();
2162         if (pid < 0) {
2163                 log_err("fio: failed server fork: %s", strerror(errno));
2164                 free(pidfile);
2165                 return -1;
2166         } else if (pid) {
2167                 ret = write_pid(pid, pidfile);
2168                 free(pidfile);
2169                 _exit(ret);
2170         }
2171
2172         setsid();
2173         openlog("fio", LOG_NDELAY|LOG_NOWAIT|LOG_PID, LOG_USER);
2174         log_syslog = 1;
2175         close(STDIN_FILENO);
2176         close(STDOUT_FILENO);
2177         close(STDERR_FILENO);
2178         f_out = NULL;
2179         f_err = NULL;
2180
2181         ret = fio_server();
2182
2183         closelog();
2184         unlink(pidfile);
2185         free(pidfile);
2186         return ret;
2187 }
2188
2189 void fio_server_set_arg(const char *arg)
2190 {
2191         fio_server_arg = strdup(arg);
2192 }