server: convert iolog in place instead of copy allocating it
[fio.git] / server.c
1 #include <stdio.h>
2 #include <stdlib.h>
3 #include <stdarg.h>
4 #include <unistd.h>
5 #include <limits.h>
6 #include <errno.h>
7 #include <fcntl.h>
8 #include <sys/poll.h>
9 #include <sys/types.h>
10 #include <sys/wait.h>
11 #include <sys/socket.h>
12 #include <sys/stat.h>
13 #include <sys/un.h>
14 #include <netinet/in.h>
15 #include <arpa/inet.h>
16 #include <netdb.h>
17 #include <syslog.h>
18 #include <signal.h>
19 #include <zlib.h>
20
21 #include "fio.h"
22 #include "server.h"
23 #include "crc/crc16.h"
24 #include "lib/ieee754.h"
25
26 #include "fio_version.h"
27
28 int fio_net_port = FIO_NET_PORT;
29
30 int exit_backend = 0;
31
32 static int server_fd = -1;
33 static char *fio_server_arg;
34 static char *bind_sock;
35 static struct sockaddr_in saddr_in;
36 static struct sockaddr_in6 saddr_in6;
37 static int first_cmd_check;
38 static int use_ipv6;
39
40 static const char *fio_server_ops[FIO_NET_CMD_NR] = {
41         "",
42         "QUIT",
43         "EXIT",
44         "JOB",
45         "JOBLINE",
46         "TEXT",
47         "TS",
48         "GS",
49         "SEND_ETA",
50         "ETA",
51         "PROBE",
52         "START",
53         "STOP",
54         "DISK_UTIL",
55         "SERVER_START",
56         "ADD_JOB",
57         "CMD_RUN"
58 };
59
60 const char *fio_server_op(unsigned int op)
61 {
62         static char buf[32];
63
64         if (op < FIO_NET_CMD_NR)
65                 return fio_server_ops[op];
66
67         sprintf(buf, "UNKNOWN/%d", op);
68         return buf;
69 }
70
71 int fio_send_data(int sk, const void *p, unsigned int len)
72 {
73         assert(len <= sizeof(struct fio_net_cmd) + FIO_SERVER_MAX_FRAGMENT_PDU);
74
75         do {
76                 int ret = send(sk, p, len, 0);
77
78                 if (ret > 0) {
79                         len -= ret;
80                         if (!len)
81                                 break;
82                         p += ret;
83                         continue;
84                 } else if (!ret)
85                         break;
86                 else if (errno == EAGAIN || errno == EINTR)
87                         continue;
88                 else
89                         break;
90         } while (!exit_backend);
91
92         if (!len)
93                 return 0;
94
95         if (errno)
96                 return -errno;
97
98         return 1;
99 }
100
101 int fio_recv_data(int sk, void *p, unsigned int len)
102 {
103         do {
104                 int ret = recv(sk, p, len, MSG_WAITALL);
105
106                 if (ret > 0) {
107                         len -= ret;
108                         if (!len)
109                                 break;
110                         p += ret;
111                         continue;
112                 } else if (!ret)
113                         break;
114                 else if (errno == EAGAIN || errno == EINTR)
115                         continue;
116                 else
117                         break;
118         } while (!exit_backend);
119
120         if (!len)
121                 return 0;
122
123         return -1;
124 }
125
126 static int verify_convert_cmd(struct fio_net_cmd *cmd)
127 {
128         uint16_t crc;
129
130         cmd->cmd_crc16 = le16_to_cpu(cmd->cmd_crc16);
131         cmd->pdu_crc16 = le16_to_cpu(cmd->pdu_crc16);
132
133         crc = fio_crc16(cmd, FIO_NET_CMD_CRC_SZ);
134         if (crc != cmd->cmd_crc16) {
135                 log_err("fio: server bad crc on command (got %x, wanted %x)\n",
136                                 cmd->cmd_crc16, crc);
137                 return 1;
138         }
139
140         cmd->version    = le16_to_cpu(cmd->version);
141         cmd->opcode     = le16_to_cpu(cmd->opcode);
142         cmd->flags      = le32_to_cpu(cmd->flags);
143         cmd->tag        = le64_to_cpu(cmd->tag);
144         cmd->pdu_len    = le32_to_cpu(cmd->pdu_len);
145
146         switch (cmd->version) {
147         case FIO_SERVER_VER:
148                 break;
149         default:
150                 log_err("fio: bad server cmd version %d\n", cmd->version);
151                 return 1;
152         }
153
154         if (cmd->pdu_len > FIO_SERVER_MAX_FRAGMENT_PDU) {
155                 log_err("fio: command payload too large: %u\n", cmd->pdu_len);
156                 return 1;
157         }
158
159         return 0;
160 }
161
162 /*
163  * Read (and defragment, if necessary) incoming commands
164  */
165 struct fio_net_cmd *fio_net_recv_cmd(int sk)
166 {
167         struct fio_net_cmd cmd, *cmdret = NULL;
168         size_t cmd_size = 0, pdu_offset = 0;
169         uint16_t crc;
170         int ret, first = 1;
171         void *pdu = NULL;
172
173         do {
174                 ret = fio_recv_data(sk, &cmd, sizeof(cmd));
175                 if (ret)
176                         break;
177
178                 /* We have a command, verify it and swap if need be */
179                 ret = verify_convert_cmd(&cmd);
180                 if (ret)
181                         break;
182
183                 if (first) {
184                         /* if this is text, add room for \0 at the end */
185                         cmd_size = sizeof(cmd) + cmd.pdu_len + 1;
186                         assert(!cmdret);
187                 } else
188                         cmd_size += cmd.pdu_len;
189
190                 cmdret = realloc(cmdret, cmd_size);
191
192                 if (first)
193                         memcpy(cmdret, &cmd, sizeof(cmd));
194                 else if (cmdret->opcode != cmd.opcode) {
195                         log_err("fio: fragment opcode mismatch (%d != %d)\n",
196                                         cmdret->opcode, cmd.opcode);
197                         ret = 1;
198                         break;
199                 }
200
201                 if (!cmd.pdu_len)
202                         break;
203
204                 /* There's payload, get it */
205                 pdu = (void *) cmdret->payload + pdu_offset;
206                 ret = fio_recv_data(sk, pdu, cmd.pdu_len);
207                 if (ret)
208                         break;
209
210                 /* Verify payload crc */
211                 crc = fio_crc16(pdu, cmd.pdu_len);
212                 if (crc != cmd.pdu_crc16) {
213                         log_err("fio: server bad crc on payload ");
214                         log_err("(got %x, wanted %x)\n", cmd.pdu_crc16, crc);
215                         ret = 1;
216                         break;
217                 }
218
219                 pdu_offset += cmd.pdu_len;
220                 if (!first)
221                         cmdret->pdu_len += cmd.pdu_len;
222                 first = 0;
223         } while (cmd.flags & FIO_NET_CMD_F_MORE);
224
225         if (ret) {
226                 free(cmdret);
227                 cmdret = NULL;
228         } else if (cmdret) {
229                 /* zero-terminate text input */
230                 if (cmdret->pdu_len) {
231                         if (cmdret->opcode == FIO_NET_CMD_TEXT) {
232                                 struct cmd_text_pdu *pdu = (struct cmd_text_pdu *) cmdret->payload;
233                                 char *buf = (char *) pdu->buf;
234
235                                 buf[pdu->buf_len ] = '\0';
236                         } else if (cmdret->opcode == FIO_NET_CMD_JOB) {
237                                 struct cmd_job_pdu *pdu = (struct cmd_job_pdu *) cmdret->payload;
238                                 char *buf = (char *) pdu->buf;
239                                 int len = le32_to_cpu(pdu->buf_len);
240
241                                 buf[len] = '\0';
242                         }
243                 }
244
245                 /* frag flag is internal */
246                 cmdret->flags &= ~FIO_NET_CMD_F_MORE;
247         }
248
249         return cmdret;
250 }
251
252 void fio_net_cmd_crc_pdu(struct fio_net_cmd *cmd, void *pdu)
253 {
254         uint32_t pdu_len;
255
256         cmd->cmd_crc16 = __cpu_to_le16(fio_crc16(cmd, FIO_NET_CMD_CRC_SZ));
257
258         pdu_len = le32_to_cpu(cmd->pdu_len);
259         cmd->pdu_crc16 = __cpu_to_le16(fio_crc16(pdu, pdu_len));
260 }
261
262 void fio_net_cmd_crc(struct fio_net_cmd *cmd)
263 {
264         fio_net_cmd_crc_pdu(cmd, cmd->payload);
265 }
266
267 int fio_net_send_cmd(int fd, uint16_t opcode, const void *buf, off_t size,
268                      uint64_t tag)
269 {
270         struct fio_net_cmd *cmd = NULL;
271         size_t this_len, cur_len = 0;
272         int ret;
273
274         do {
275                 this_len = size;
276                 if (this_len > FIO_SERVER_MAX_FRAGMENT_PDU)
277                         this_len = FIO_SERVER_MAX_FRAGMENT_PDU;
278
279                 if (!cmd || cur_len < sizeof(*cmd) + this_len) {
280                         if (cmd)
281                                 free(cmd);
282
283                         cur_len = sizeof(*cmd) + this_len;
284                         cmd = malloc(cur_len);
285                 }
286
287                 fio_init_net_cmd(cmd, opcode, buf, this_len, tag);
288
289                 if (this_len < size)
290                         cmd->flags = __cpu_to_le32(FIO_NET_CMD_F_MORE);
291
292                 fio_net_cmd_crc(cmd);
293
294                 ret = fio_send_data(fd, cmd, sizeof(*cmd) + this_len);
295                 size -= this_len;
296                 buf += this_len;
297         } while (!ret && size);
298
299         if (cmd)
300                 free(cmd);
301
302         return ret;
303 }
304
305 static int fio_net_send_simple_stack_cmd(int sk, uint16_t opcode, uint64_t tag)
306 {
307         struct fio_net_cmd cmd;
308
309         fio_init_net_cmd(&cmd, opcode, NULL, 0, tag);
310         fio_net_cmd_crc(&cmd);
311
312         return fio_send_data(sk, &cmd, sizeof(cmd));
313 }
314
315 /*
316  * If 'list' is non-NULL, then allocate and store the sent command for
317  * later verification.
318  */
319 int fio_net_send_simple_cmd(int sk, uint16_t opcode, uint64_t tag,
320                             struct flist_head *list)
321 {
322         struct fio_net_int_cmd *cmd;
323         int ret;
324
325         if (!list)
326                 return fio_net_send_simple_stack_cmd(sk, opcode, tag);
327
328         cmd = malloc(sizeof(*cmd));
329
330         fio_init_net_cmd(&cmd->cmd, opcode, NULL, 0, (uintptr_t) cmd);
331         fio_net_cmd_crc(&cmd->cmd);
332
333         INIT_FLIST_HEAD(&cmd->list);
334         gettimeofday(&cmd->tv, NULL);
335         cmd->saved_tag = tag;
336
337         ret = fio_send_data(sk, &cmd->cmd, sizeof(cmd->cmd));
338         if (ret) {
339                 free(cmd);
340                 return ret;
341         }
342
343         flist_add_tail(&cmd->list, list);
344         return 0;
345 }
346
347 static int fio_server_send_quit_cmd(void)
348 {
349         dprint(FD_NET, "server: sending quit\n");
350         return fio_net_send_simple_cmd(server_fd, FIO_NET_CMD_QUIT, 0, NULL);
351 }
352
353 static int handle_run_cmd(struct fio_net_cmd *cmd)
354 {
355         struct cmd_end_pdu epdu;
356         int ret;
357
358         ret = fio_backend();
359
360         epdu.error = ret;
361         fio_net_send_cmd(server_fd, FIO_NET_CMD_STOP, &epdu, sizeof(epdu), 0);
362
363         fio_server_send_quit_cmd();
364         reset_fio_state();
365         first_cmd_check = 0;
366         return ret;
367 }
368
369 static int handle_job_cmd(struct fio_net_cmd *cmd)
370 {
371         struct cmd_job_pdu *pdu = (struct cmd_job_pdu *) cmd->payload;
372         void *buf = pdu->buf;
373         struct cmd_start_pdu spdu;
374
375         pdu->buf_len = le32_to_cpu(pdu->buf_len);
376         pdu->client_type = le32_to_cpu(pdu->client_type);
377
378         if (parse_jobs_ini(buf, 1, 0, pdu->client_type)) {
379                 fio_server_send_quit_cmd();
380                 return -1;
381         }
382
383         spdu.jobs = cpu_to_le32(thread_number);
384         fio_net_send_cmd(server_fd, FIO_NET_CMD_START, &spdu, sizeof(spdu), 0);
385         return 0;
386 }
387
388 static int handle_jobline_cmd(struct fio_net_cmd *cmd)
389 {
390         void *pdu = cmd->payload;
391         struct cmd_single_line_pdu *cslp;
392         struct cmd_line_pdu *clp;
393         unsigned long offset;
394         struct cmd_start_pdu spdu;
395         char **argv;
396         int i;
397
398         clp = pdu;
399         clp->lines = le16_to_cpu(clp->lines);
400         clp->client_type = le16_to_cpu(clp->client_type);
401         argv = malloc(clp->lines * sizeof(char *));
402         offset = sizeof(*clp);
403
404         dprint(FD_NET, "server: %d command line args\n", clp->lines);
405
406         for (i = 0; i < clp->lines; i++) {
407                 cslp = pdu + offset;
408                 argv[i] = (char *) cslp->text;
409
410                 offset += sizeof(*cslp) + le16_to_cpu(cslp->len);
411                 dprint(FD_NET, "server: %d: %s\n", i, argv[i]);
412         }
413
414         if (parse_cmd_line(clp->lines, argv, clp->client_type)) {
415                 fio_server_send_quit_cmd();
416                 free(argv);
417                 return -1;
418         }
419
420         free(argv);
421
422         spdu.jobs = cpu_to_le32(thread_number);
423         fio_net_send_cmd(server_fd, FIO_NET_CMD_START, &spdu, sizeof(spdu), 0);
424         return 0;
425 }
426
427 static int handle_probe_cmd(struct fio_net_cmd *cmd)
428 {
429         struct cmd_probe_pdu probe;
430
431         dprint(FD_NET, "server: sending probe reply\n");
432
433         memset(&probe, 0, sizeof(probe));
434         gethostname((char *) probe.hostname, sizeof(probe.hostname));
435 #ifdef FIO_BIG_ENDIAN
436         probe.bigendian = 1;
437 #endif
438         probe.fio_major = FIO_MAJOR;
439         probe.fio_minor = FIO_MINOR;
440         probe.fio_patch = FIO_PATCH;
441
442         probe.os        = FIO_OS;
443         probe.arch      = FIO_ARCH;
444
445         probe.bpp       = sizeof(void *);
446
447         return fio_net_send_cmd(server_fd, FIO_NET_CMD_PROBE, &probe, sizeof(probe), cmd->tag);
448 }
449
450 static int handle_send_eta_cmd(struct fio_net_cmd *cmd)
451 {
452         struct jobs_eta *je;
453         size_t size;
454         int i;
455
456         if (!thread_number)
457                 return 0;
458
459         size = sizeof(*je) + thread_number * sizeof(char) + 1;
460         je = malloc(size);
461         memset(je, 0, size);
462
463         if (!calc_thread_status(je, 1)) {
464                 free(je);
465                 return 0;
466         }
467
468         dprint(FD_NET, "server sending status\n");
469
470         je->nr_running          = cpu_to_le32(je->nr_running);
471         je->nr_ramp             = cpu_to_le32(je->nr_ramp);
472         je->nr_pending          = cpu_to_le32(je->nr_pending);
473         je->files_open          = cpu_to_le32(je->files_open);
474
475         for (i = 0; i < 2; i++) {
476                 je->m_rate[i]   = cpu_to_le32(je->m_rate[i]);
477                 je->t_rate[i]   = cpu_to_le32(je->t_rate[i]);
478                 je->m_iops[i]   = cpu_to_le32(je->m_iops[i]);
479                 je->t_iops[i]   = cpu_to_le32(je->t_iops[i]);
480                 je->rate[i]     = cpu_to_le32(je->rate[i]);
481                 je->iops[i]     = cpu_to_le32(je->iops[i]);
482         }
483
484         je->elapsed_sec         = cpu_to_le64(je->elapsed_sec);
485         je->eta_sec             = cpu_to_le64(je->eta_sec);
486         je->nr_threads          = cpu_to_le32(je->nr_threads);
487
488         fio_net_send_cmd(server_fd, FIO_NET_CMD_ETA, je, size, cmd->tag);
489         free(je);
490         return 0;
491 }
492
493 static int handle_command(struct fio_net_cmd *cmd)
494 {
495         int ret;
496
497         dprint(FD_NET, "server: got op [%s], pdu=%u, tag=%lx\n",
498                         fio_server_op(cmd->opcode), cmd->pdu_len, cmd->tag);
499
500         switch (cmd->opcode) {
501         case FIO_NET_CMD_QUIT:
502                 fio_terminate_threads(TERMINATE_ALL);
503                 return -1;
504         case FIO_NET_CMD_EXIT:
505                 exit_backend = 1;
506                 return -1;
507         case FIO_NET_CMD_JOB:
508                 ret = handle_job_cmd(cmd);
509                 break;
510         case FIO_NET_CMD_JOBLINE:
511                 ret = handle_jobline_cmd(cmd);
512                 break;
513         case FIO_NET_CMD_PROBE:
514                 ret = handle_probe_cmd(cmd);
515                 break;
516         case FIO_NET_CMD_SEND_ETA:
517                 ret = handle_send_eta_cmd(cmd);
518                 break;
519         case FIO_NET_CMD_RUN:
520                 ret = handle_run_cmd(cmd);
521                 break;
522         default:
523                 log_err("fio: unknown opcode: %s\n",fio_server_op(cmd->opcode));
524                 ret = 1;
525         }
526
527         return ret;
528 }
529
530 static int handle_connection(int sk, int block)
531 {
532         struct fio_net_cmd *cmd = NULL;
533         int ret = 0;
534
535         /* read forever */
536         while (!exit_backend) {
537                 struct pollfd pfd = {
538                         .fd     = sk,
539                         .events = POLLIN,
540                 };
541
542                 ret = 0;
543                 do {
544                         ret = poll(&pfd, 1, 100);
545                         if (ret < 0) {
546                                 if (errno == EINTR)
547                                         break;
548                                 log_err("fio: poll: %s\n", strerror(errno));
549                                 break;
550                         } else if (!ret) {
551                                 if (!block)
552                                         return 0;
553                                 continue;
554                         }
555
556                         if (pfd.revents & POLLIN)
557                                 break;
558                         if (pfd.revents & (POLLERR|POLLHUP)) {
559                                 ret = 1;
560                                 break;
561                         }
562                 } while (!exit_backend);
563
564                 if (ret < 0)
565                         break;
566
567                 cmd = fio_net_recv_cmd(sk);
568                 if (!cmd) {
569                         ret = -1;
570                         break;
571                 }
572
573                 ret = handle_command(cmd);
574                 if (ret)
575                         break;
576
577                 free(cmd);
578                 cmd = NULL;
579         }
580
581         if (cmd)
582                 free(cmd);
583
584         return ret;
585 }
586
587 void fio_server_idle_loop(void)
588 {
589         if (!first_cmd_check) {
590                 fio_net_send_simple_cmd(server_fd, FIO_NET_CMD_SERVER_START, 0, NULL);
591                 first_cmd_check = 1;
592         }
593         if (server_fd != -1)
594                 handle_connection(server_fd, 0);
595 }
596
597 static int accept_loop(int listen_sk)
598 {
599         struct sockaddr_in addr;
600         fio_socklen_t len = sizeof(addr);
601         struct pollfd pfd;
602         int ret, sk, flags, exitval = 0;
603
604         dprint(FD_NET, "server enter accept loop\n");
605
606         flags = fcntl(listen_sk, F_GETFL);
607         flags |= O_NONBLOCK;
608         fcntl(listen_sk, F_SETFL, flags);
609 again:
610         pfd.fd = listen_sk;
611         pfd.events = POLLIN;
612         do {
613                 ret = poll(&pfd, 1, 100);
614                 if (ret < 0) {
615                         if (errno == EINTR)
616                                 break;
617                         log_err("fio: poll: %s\n", strerror(errno));
618                         goto out;
619                 } else if (!ret)
620                         continue;
621
622                 if (pfd.revents & POLLIN)
623                         break;
624         } while (!exit_backend);
625
626         if (exit_backend)
627                 goto out;
628
629         sk = accept(listen_sk, (struct sockaddr *) &addr, &len);
630         if (sk < 0) {
631                 log_err("fio: accept: %s\n", strerror(errno));
632                 return -1;
633         }
634
635         dprint(FD_NET, "server: connect from %s\n", inet_ntoa(addr.sin_addr));
636
637         server_fd = sk;
638
639         exitval = handle_connection(sk, 1);
640
641         server_fd = -1;
642         close(sk);
643
644         if (!exit_backend)
645                 goto again;
646
647 out:
648         return exitval;
649 }
650
651 int fio_server_text_output(int level, const char *buf, size_t len)
652 {
653         struct cmd_text_pdu *pdu;
654         unsigned int tlen;
655         struct timeval tv;
656
657         if (server_fd == -1)
658                 return log_local_buf(buf, len);
659
660         tlen = sizeof(*pdu) + len;
661         pdu = malloc(tlen);
662
663         pdu->level      = __cpu_to_le32(level);
664         pdu->buf_len    = __cpu_to_le32(len);
665
666         gettimeofday(&tv, NULL);
667         pdu->log_sec    = __cpu_to_le64(tv.tv_sec);
668         pdu->log_usec   = __cpu_to_le64(tv.tv_usec);
669
670         memcpy(pdu->buf, buf, len);
671
672         fio_net_send_cmd(server_fd, FIO_NET_CMD_TEXT, pdu, tlen, 0);
673         free(pdu);
674         return len;
675 }
676
677 static void convert_io_stat(struct io_stat *dst, struct io_stat *src)
678 {
679         dst->max_val    = cpu_to_le64(src->max_val);
680         dst->min_val    = cpu_to_le64(src->min_val);
681         dst->samples    = cpu_to_le64(src->samples);
682
683         /*
684          * Encode to IEEE 754 for network transfer
685          */
686         dst->mean.u.i   = __cpu_to_le64(fio_double_to_uint64(src->mean.u.f));
687         dst->S.u.i      = __cpu_to_le64(fio_double_to_uint64(src->S.u.f));
688 }
689
690 static void convert_gs(struct group_run_stats *dst, struct group_run_stats *src)
691 {
692         int i;
693
694         for (i = 0; i < 2; i++) {
695                 dst->max_run[i]         = cpu_to_le64(src->max_run[i]);
696                 dst->min_run[i]         = cpu_to_le64(src->min_run[i]);
697                 dst->max_bw[i]          = cpu_to_le64(src->max_bw[i]);
698                 dst->min_bw[i]          = cpu_to_le64(src->min_bw[i]);
699                 dst->io_kb[i]           = cpu_to_le64(src->io_kb[i]);
700                 dst->agg[i]             = cpu_to_le64(src->agg[i]);
701         }
702
703         dst->kb_base    = cpu_to_le32(src->kb_base);
704         dst->groupid    = cpu_to_le32(src->groupid);
705 }
706
707 /*
708  * Send a CMD_TS, which packs struct thread_stat and group_run_stats
709  * into a single payload.
710  */
711 void fio_server_send_ts(struct thread_stat *ts, struct group_run_stats *rs)
712 {
713         struct cmd_ts_pdu p;
714         int i, j;
715
716         dprint(FD_NET, "server sending end stats\n");
717
718         memset(&p, 0, sizeof(p));
719
720         strcpy(p.ts.name, ts->name);
721         strcpy(p.ts.verror, ts->verror);
722         strcpy(p.ts.description, ts->description);
723
724         p.ts.error      = cpu_to_le32(ts->error);
725         p.ts.groupid    = cpu_to_le32(ts->groupid);
726         p.ts.pid        = cpu_to_le32(ts->pid);
727         p.ts.members    = cpu_to_le32(ts->members);
728
729         for (i = 0; i < 2; i++) {
730                 convert_io_stat(&p.ts.clat_stat[i], &ts->clat_stat[i]);
731                 convert_io_stat(&p.ts.slat_stat[i], &ts->slat_stat[i]);
732                 convert_io_stat(&p.ts.lat_stat[i], &ts->lat_stat[i]);
733                 convert_io_stat(&p.ts.bw_stat[i], &ts->bw_stat[i]);
734         }
735
736         p.ts.usr_time           = cpu_to_le64(ts->usr_time);
737         p.ts.sys_time           = cpu_to_le64(ts->sys_time);
738         p.ts.ctx                = cpu_to_le64(ts->ctx);
739         p.ts.minf               = cpu_to_le64(ts->minf);
740         p.ts.majf               = cpu_to_le64(ts->majf);
741         p.ts.clat_percentiles   = cpu_to_le64(ts->clat_percentiles);
742
743         for (i = 0; i < FIO_IO_U_LIST_MAX_LEN; i++) {
744                 fio_fp64_t *src = &ts->percentile_list[i];
745                 fio_fp64_t *dst = &p.ts.percentile_list[i];
746
747                 dst->u.i = __cpu_to_le64(fio_double_to_uint64(src->u.f));
748         }
749
750         for (i = 0; i < FIO_IO_U_MAP_NR; i++) {
751                 p.ts.io_u_map[i]        = cpu_to_le32(ts->io_u_map[i]);
752                 p.ts.io_u_submit[i]     = cpu_to_le32(ts->io_u_submit[i]);
753                 p.ts.io_u_complete[i]   = cpu_to_le32(ts->io_u_complete[i]);
754         }
755
756         for (i = 0; i < FIO_IO_U_LAT_U_NR; i++) {
757                 p.ts.io_u_lat_u[i]      = cpu_to_le32(ts->io_u_lat_u[i]);
758                 p.ts.io_u_lat_m[i]      = cpu_to_le32(ts->io_u_lat_m[i]);
759         }
760
761         for (i = 0; i < 2; i++)
762                 for (j = 0; j < FIO_IO_U_PLAT_NR; j++)
763                         p.ts.io_u_plat[i][j] = cpu_to_le32(ts->io_u_plat[i][j]);
764
765         for (i = 0; i < 3; i++) {
766                 p.ts.total_io_u[i]      = cpu_to_le64(ts->total_io_u[i]);
767                 p.ts.short_io_u[i]      = cpu_to_le64(ts->short_io_u[i]);
768         }
769
770         p.ts.total_submit       = cpu_to_le64(ts->total_submit);
771         p.ts.total_complete     = cpu_to_le64(ts->total_complete);
772
773         for (i = 0; i < 2; i++) {
774                 p.ts.io_bytes[i]        = cpu_to_le64(ts->io_bytes[i]);
775                 p.ts.runtime[i]         = cpu_to_le64(ts->runtime[i]);
776         }
777
778         p.ts.total_run_time     = cpu_to_le64(ts->total_run_time);
779         p.ts.continue_on_error  = cpu_to_le16(ts->continue_on_error);
780         p.ts.total_err_count    = cpu_to_le64(ts->total_err_count);
781         p.ts.first_error        = cpu_to_le32(ts->first_error);
782         p.ts.kb_base            = cpu_to_le32(ts->kb_base);
783
784         convert_gs(&p.rs, rs);
785
786         fio_net_send_cmd(server_fd, FIO_NET_CMD_TS, &p, sizeof(p), 0);
787 }
788
789 void fio_server_send_gs(struct group_run_stats *rs)
790 {
791         struct group_run_stats gs;
792
793         dprint(FD_NET, "server sending group run stats\n");
794
795         convert_gs(&gs, rs);
796         fio_net_send_cmd(server_fd, FIO_NET_CMD_GS, &gs, sizeof(gs), 0);
797 }
798
799 static void convert_agg(struct disk_util_agg *dst, struct disk_util_agg *src)
800 {
801         int i;
802
803         for (i = 0; i < 2; i++) {
804                 dst->ios[i]     = cpu_to_le32(src->ios[i]);
805                 dst->merges[i]  = cpu_to_le32(src->merges[i]);
806                 dst->sectors[i] = cpu_to_le64(src->sectors[i]);
807                 dst->ticks[i]   = cpu_to_le32(src->ticks[i]);
808         }
809
810         dst->io_ticks           = cpu_to_le32(src->io_ticks);
811         dst->time_in_queue      = cpu_to_le32(src->time_in_queue);
812         dst->slavecount         = cpu_to_le32(src->slavecount);
813         dst->max_util.u.i       = __cpu_to_le64(fio_double_to_uint64(src->max_util.u.f));
814 }
815
816 static void convert_dus(struct disk_util_stat *dst, struct disk_util_stat *src)
817 {
818         int i;
819
820         strcpy((char *) dst->name, (char *) src->name);
821
822         for (i = 0; i < 2; i++) {
823                 dst->ios[i]     = cpu_to_le32(src->ios[i]);
824                 dst->merges[i]  = cpu_to_le32(src->merges[i]);
825                 dst->sectors[i] = cpu_to_le64(src->sectors[i]);
826                 dst->ticks[i]   = cpu_to_le32(src->ticks[i]);
827         }
828
829         dst->io_ticks           = cpu_to_le32(src->io_ticks);
830         dst->time_in_queue      = cpu_to_le32(src->time_in_queue);
831         dst->msec               = cpu_to_le64(src->msec);
832 }
833
834 void fio_server_send_du(void)
835 {
836         struct disk_util *du;
837         struct flist_head *entry;
838         struct cmd_du_pdu pdu;
839
840         dprint(FD_NET, "server: sending disk_util %d\n", !flist_empty(&disk_list));
841
842         memset(&pdu, 0, sizeof(pdu));
843
844         flist_for_each(entry, &disk_list) {
845                 du = flist_entry(entry, struct disk_util, list);
846
847                 convert_dus(&pdu.dus, &du->dus);
848                 convert_agg(&pdu.agg, &du->agg);
849
850                 fio_net_send_cmd(server_fd, FIO_NET_CMD_DU, &pdu, sizeof(pdu), 0);
851         }
852 }
853
854 int fio_send_iolog(struct thread_data *td, struct io_log *log, const char *name)
855 {
856         struct cmd_iolog_pdu pdu;
857         struct fio_net_cmd cmd;
858         z_stream stream;
859         void *out_pdu;
860         int i;
861
862         pdu.nr_samples = __cpu_to_le32(log->nr_samples);
863         pdu.log_type = cpu_to_le32(log->log_type);
864         strcpy((char *) pdu.name, name);
865
866         for (i = 0; i < log->nr_samples; i++) {
867                 struct io_sample *s = &log->log[i];
868
869                 s->time = cpu_to_le64(s->time);
870                 s->val  = cpu_to_le64(s->val);
871                 s->ddir = cpu_to_le32(s->ddir);
872                 s->bs   = cpu_to_le32(s->bs);
873         }
874
875         /*
876          * Dirty - since the log is potentially huge, compress it into
877          * FIO_SERVER_MAX_FRAGMENT_PDU chunks and let the receiving
878          * side defragment it.
879          */
880         out_pdu = malloc(FIO_SERVER_MAX_FRAGMENT_PDU);
881
882         stream.zalloc = Z_NULL;
883         stream.zfree = Z_NULL;
884         stream.opaque = Z_NULL;
885
886         if (deflateInit(&stream, Z_DEFAULT_COMPRESSION) != Z_OK) {
887                 free(out_pdu);
888                 return 1;
889         }
890
891         /*
892          * Send header first, it's not compressed.
893          */
894         __fio_init_net_cmd(&cmd, FIO_NET_CMD_IOLOG, sizeof(pdu), 0);
895         cmd.flags = __cpu_to_le32(FIO_NET_CMD_F_MORE);
896         fio_net_cmd_crc_pdu(&cmd, &pdu);
897         fio_send_data(server_fd, &cmd, sizeof(cmd));
898         fio_send_data(server_fd, &pdu, sizeof(pdu));
899
900         stream.next_in = (void *) log->log;
901         stream.avail_in = log->nr_samples * sizeof(struct io_sample);
902
903         do {
904                 unsigned int this_len;
905
906                 stream.avail_out = FIO_SERVER_MAX_FRAGMENT_PDU;
907                 stream.next_out = out_pdu;
908                 assert(deflate(&stream, Z_FINISH) == Z_OK);
909
910                 this_len = FIO_SERVER_MAX_FRAGMENT_PDU - stream.avail_out;
911
912                 __fio_init_net_cmd(&cmd, FIO_NET_CMD_IOLOG, this_len, 0);
913
914                 if (stream.avail_in)
915                         cmd.flags = __cpu_to_le32(FIO_NET_CMD_F_MORE);
916
917                 fio_net_cmd_crc_pdu(&cmd, out_pdu);
918
919                 fio_send_data(server_fd, &cmd, sizeof(cmd));
920                 fio_send_data(server_fd, out_pdu, this_len);
921         } while (stream.avail_in);
922
923         free(out_pdu);
924         deflateEnd(&stream);
925         return 0;
926 }
927
928 void fio_server_send_add_job(struct thread_options *o, const char *ioengine)
929 {
930         struct cmd_add_job_pdu pdu;
931
932         convert_thread_options_to_net(&pdu.top, o);
933
934         fio_net_send_cmd(server_fd, FIO_NET_CMD_ADD_JOB, &pdu, sizeof(pdu), 0);
935 }
936
937 static int fio_init_server_ip(void)
938 {
939         struct sockaddr *addr;
940         fio_socklen_t socklen;
941         int sk, opt;
942
943         if (use_ipv6)
944                 sk = socket(AF_INET6, SOCK_STREAM, 0);
945         else
946                 sk = socket(AF_INET, SOCK_STREAM, 0);
947
948         if (sk < 0) {
949                 log_err("fio: socket: %s\n", strerror(errno));
950                 return -1;
951         }
952
953         opt = 1;
954         if (setsockopt(sk, SOL_SOCKET, SO_REUSEADDR, &opt, sizeof(opt)) < 0) {
955                 log_err("fio: setsockopt: %s\n", strerror(errno));
956                 close(sk);
957                 return -1;
958         }
959 #ifdef SO_REUSEPORT
960         if (setsockopt(sk, SOL_SOCKET, SO_REUSEPORT, &opt, sizeof(opt)) < 0) {
961                 log_err("fio: setsockopt: %s\n", strerror(errno));
962                 close(sk);
963                 return -1;
964         }
965 #endif
966
967         if (use_ipv6) {
968                 addr = (struct sockaddr *) &saddr_in6;
969                 socklen = sizeof(saddr_in6);
970                 saddr_in6.sin6_family = AF_INET6;
971         } else {
972                 addr = (struct sockaddr *) &saddr_in;
973                 socklen = sizeof(saddr_in);
974                 saddr_in.sin_family = AF_INET;
975         }
976
977         if (bind(sk, addr, socklen) < 0) {
978                 log_err("fio: bind: %s\n", strerror(errno));
979                 close(sk);
980                 return -1;
981         }
982
983         return sk;
984 }
985
986 static int fio_init_server_sock(void)
987 {
988         struct sockaddr_un addr;
989         fio_socklen_t len;
990         mode_t mode;
991         int sk;
992
993         sk = socket(AF_UNIX, SOCK_STREAM, 0);
994         if (sk < 0) {
995                 log_err("fio: socket: %s\n", strerror(errno));
996                 return -1;
997         }
998
999         mode = umask(000);
1000
1001         memset(&addr, 0, sizeof(addr));
1002         addr.sun_family = AF_UNIX;
1003         strcpy(addr.sun_path, bind_sock);
1004         unlink(bind_sock);
1005
1006         len = sizeof(addr.sun_family) + strlen(bind_sock) + 1;
1007
1008         if (bind(sk, (struct sockaddr *) &addr, len) < 0) {
1009                 log_err("fio: bind: %s\n", strerror(errno));
1010                 close(sk);
1011                 return -1;
1012         }
1013
1014         umask(mode);
1015         return sk;
1016 }
1017
1018 static int fio_init_server_connection(void)
1019 {
1020         char bind_str[128];
1021         int sk;
1022
1023         dprint(FD_NET, "starting server\n");
1024
1025         if (!bind_sock)
1026                 sk = fio_init_server_ip();
1027         else
1028                 sk = fio_init_server_sock();
1029
1030         if (sk < 0)
1031                 return sk;
1032
1033         if (!bind_sock) {
1034                 char *p, port[16];
1035                 const void *src;
1036                 int af;
1037
1038                 if (use_ipv6) {
1039                         af = AF_INET6;
1040                         src = &saddr_in6.sin6_addr;
1041                 } else {
1042                         af = AF_INET;
1043                         src = &saddr_in.sin_addr;
1044                 }
1045
1046                 p = (char *) inet_ntop(af, src, bind_str, sizeof(bind_str));
1047
1048                 sprintf(port, ",%u", fio_net_port);
1049                 if (p)
1050                         strcat(p, port);
1051                 else
1052                         strcpy(bind_str, port);
1053         } else
1054                 strcpy(bind_str, bind_sock);
1055
1056         log_info("fio: server listening on %s\n", bind_str);
1057
1058         if (listen(sk, 0) < 0) {
1059                 log_err("fio: listen: %s\n", strerror(errno));
1060                 return -1;
1061         }
1062
1063         return sk;
1064 }
1065
1066 int fio_server_parse_host(const char *host, int *ipv6, struct in_addr *inp,
1067                           struct in6_addr *inp6)
1068
1069 {
1070         int ret = 0;
1071
1072         if (*ipv6)
1073                 ret = inet_pton(AF_INET6, host, inp6);
1074         else
1075                 ret = inet_pton(AF_INET, host, inp);
1076
1077         if (ret != 1) {
1078                 struct hostent *hent;
1079
1080                 hent = gethostbyname(host);
1081                 if (!hent) {
1082                         log_err("fio: failed to resolve <%s>\n", host);
1083                         return 0;
1084                 }
1085
1086                 if (*ipv6) {
1087                         if (hent->h_addrtype != AF_INET6) {
1088                                 log_info("fio: falling back to IPv4\n");
1089                                 *ipv6 = 0;
1090                         } else
1091                                 memcpy(inp6, hent->h_addr_list[0], 16);
1092                 }
1093                 if (!*ipv6) {
1094                         if (hent->h_addrtype != AF_INET) {
1095                                 log_err("fio: lookup type mismatch\n");
1096                                 return 0;
1097                         }
1098                         memcpy(inp, hent->h_addr_list[0], 4);
1099                 }
1100                 ret = 1;
1101         }
1102
1103         return !(ret == 1);
1104 }
1105
1106 /*
1107  * Parse a host/ip/port string. Reads from 'str'.
1108  *
1109  * Outputs:
1110  *
1111  * For IPv4:
1112  *      *ptr is the host, *port is the port, inp is the destination.
1113  * For IPv6:
1114  *      *ptr is the host, *port is the port, inp6 is the dest, and *ipv6 is 1.
1115  * For local domain sockets:
1116  *      *ptr is the filename, *is_sock is 1.
1117  */
1118 int fio_server_parse_string(const char *str, char **ptr, int *is_sock,
1119                             int *port, struct in_addr *inp,
1120                             struct in6_addr *inp6, int *ipv6)
1121 {
1122         const char *host = str;
1123         char *portp;
1124         int lport = 0;
1125
1126         *ptr = NULL;
1127         *is_sock = 0;
1128         *port = fio_net_port;
1129         *ipv6 = 0;
1130
1131         if (!strncmp(str, "sock:", 5)) {
1132                 *ptr = strdup(str + 5);
1133                 *is_sock = 1;
1134
1135                 return 0;
1136         }
1137
1138         /*
1139          * Is it ip:<ip or host>:port
1140          */
1141         if (!strncmp(host, "ip:", 3))
1142                 host += 3;
1143         else if (!strncmp(host, "ip4:", 4))
1144                 host += 4;
1145         else if (!strncmp(host, "ip6:", 4)) {
1146                 host += 4;
1147                 *ipv6 = 1;
1148         } else if (host[0] == ':') {
1149                 /* String is :port */
1150                 host++;
1151                 lport = atoi(host);
1152                 if (!lport || lport > 65535) {
1153                         log_err("fio: bad server port %u\n", port);
1154                         return 1;
1155                 }
1156                 /* no hostname given, we are done */
1157                 *port = lport;
1158                 return 0;
1159         }
1160
1161         /*
1162          * If no port seen yet, check if there's a last ':' at the end
1163          */
1164         if (!lport) {
1165                 portp = strchr(host, ',');
1166                 if (portp) {
1167                         *portp = '\0';
1168                         portp++;
1169                         lport = atoi(portp);
1170                         if (!lport || lport > 65535) {
1171                                 log_err("fio: bad server port %u\n", port);
1172                                 return 1;
1173                         }
1174                 }
1175         }
1176
1177         if (lport)
1178                 *port = lport;
1179
1180         if (!strlen(host))
1181                 return 0;
1182
1183         *ptr = strdup(host);
1184
1185         if (fio_server_parse_host(*ptr, ipv6, inp, inp6)) {
1186                 free(*ptr);
1187                 *ptr = NULL;
1188                 return 1;
1189         }
1190
1191         if (*port == 0)
1192                 *port = fio_net_port;
1193
1194         return 0;
1195 }
1196
1197 /*
1198  * Server arg should be one of:
1199  *
1200  * sock:/path/to/socket
1201  *   ip:1.2.3.4
1202  *      1.2.3.4
1203  *
1204  * Where sock uses unix domain sockets, and ip binds the server to
1205  * a specific interface. If no arguments are given to the server, it
1206  * uses IP and binds to 0.0.0.0.
1207  *
1208  */
1209 static int fio_handle_server_arg(void)
1210 {
1211         int port = fio_net_port;
1212         int is_sock, ret = 0;
1213
1214         saddr_in.sin_addr.s_addr = htonl(INADDR_ANY);
1215
1216         if (!fio_server_arg)
1217                 goto out;
1218
1219         ret = fio_server_parse_string(fio_server_arg, &bind_sock, &is_sock,
1220                                         &port, &saddr_in.sin_addr,
1221                                         &saddr_in6.sin6_addr, &use_ipv6);
1222
1223         if (!is_sock && bind_sock) {
1224                 free(bind_sock);
1225                 bind_sock = NULL;
1226         }
1227
1228 out:
1229         fio_net_port = port;
1230         saddr_in.sin_port = htons(port);
1231         saddr_in6.sin6_port = htons(port);
1232         return ret;
1233 }
1234
1235 static int fio_server(void)
1236 {
1237         int sk, ret;
1238
1239         dprint(FD_NET, "starting server\n");
1240
1241         if (fio_handle_server_arg())
1242                 return -1;
1243
1244         sk = fio_init_server_connection();
1245         if (sk < 0)
1246                 return -1;
1247
1248         ret = accept_loop(sk);
1249
1250         close(sk);
1251
1252         if (fio_server_arg) {
1253                 free(fio_server_arg);
1254                 fio_server_arg = NULL;
1255         }
1256         if (bind_sock)
1257                 free(bind_sock);
1258
1259         return ret;
1260 }
1261
1262 void fio_server_got_signal(int signal)
1263 {
1264         if (signal == SIGPIPE)
1265                 server_fd = -1;
1266         else {
1267                 log_info("\nfio: terminating on signal %d\n", signal);
1268                 exit_backend = 1;
1269         }
1270 }
1271
1272 static int check_existing_pidfile(const char *pidfile)
1273 {
1274         struct stat sb;
1275         char buf[16];
1276         pid_t pid;
1277         FILE *f;
1278
1279         if (stat(pidfile, &sb))
1280                 return 0;
1281
1282         f = fopen(pidfile, "r");
1283         if (!f)
1284                 return 0;
1285
1286         if (fread(buf, sb.st_size, 1, f) <= 0) {
1287                 fclose(f);
1288                 return 1;
1289         }
1290         fclose(f);
1291
1292         pid = atoi(buf);
1293         if (kill(pid, SIGCONT) < 0)
1294                 return errno != ESRCH;
1295
1296         return 1;
1297 }
1298
1299 static int write_pid(pid_t pid, const char *pidfile)
1300 {
1301         FILE *fpid;
1302
1303         fpid = fopen(pidfile, "w");
1304         if (!fpid) {
1305                 log_err("fio: failed opening pid file %s\n", pidfile);
1306                 return 1;
1307         }
1308
1309         fprintf(fpid, "%u\n", (unsigned int) pid);
1310         fclose(fpid);
1311         return 0;
1312 }
1313
1314 /*
1315  * If pidfile is specified, background us.
1316  */
1317 int fio_start_server(char *pidfile)
1318 {
1319         pid_t pid;
1320         int ret;
1321
1322 #if defined(WIN32)
1323         WSADATA wsd;
1324         WSAStartup(MAKEWORD(2,2), &wsd);
1325 #endif
1326
1327         if (!pidfile)
1328                 return fio_server();
1329
1330         if (check_existing_pidfile(pidfile)) {
1331                 log_err("fio: pidfile %s exists and server appears alive\n",
1332                                                                 pidfile);
1333                 return -1;
1334         }
1335
1336         pid = fork();
1337         if (pid < 0) {
1338                 log_err("fio: failed server fork: %s", strerror(errno));
1339                 free(pidfile);
1340                 return -1;
1341         } else if (pid) {
1342                 int ret = write_pid(pid, pidfile);
1343
1344                 exit(ret);
1345         }
1346
1347         setsid();
1348         openlog("fio", LOG_NDELAY|LOG_NOWAIT|LOG_PID, LOG_USER);
1349         log_syslog = 1;
1350         close(STDIN_FILENO);
1351         close(STDOUT_FILENO);
1352         close(STDERR_FILENO);
1353         f_out = NULL;
1354         f_err = NULL;
1355
1356         ret = fio_server();
1357
1358         closelog();
1359         unlink(pidfile);
1360         free(pidfile);
1361         return ret;
1362 }
1363
1364 void fio_server_set_arg(const char *arg)
1365 {
1366         fio_server_arg = strdup(arg);
1367 }