client/server: fixup "All clients" reporting
[fio.git] / server.c
1 #include <stdio.h>
2 #include <stdlib.h>
3 #include <stdarg.h>
4 #include <unistd.h>
5 #include <limits.h>
6 #include <errno.h>
7 #include <fcntl.h>
8 #include <sys/poll.h>
9 #include <sys/types.h>
10 #include <sys/wait.h>
11 #include <sys/socket.h>
12 #include <sys/stat.h>
13 #include <sys/un.h>
14 #include <netinet/in.h>
15 #include <arpa/inet.h>
16 #include <netdb.h>
17 #include <syslog.h>
18 #include <signal.h>
19
20 #include "fio.h"
21 #include "server.h"
22 #include "crc/crc16.h"
23 #include "lib/ieee754.h"
24
25 int fio_net_port = 8765;
26
27 int exit_backend = 0;
28
29 static int server_fd = -1;
30 static char *fio_server_arg;
31 static char *bind_sock;
32 static struct sockaddr_in saddr_in;
33 static struct sockaddr_in6 saddr_in6;
34 static int first_cmd_check;
35 static int use_ipv6;
36
37 static const char *fio_server_ops[FIO_NET_CMD_NR] = {
38         "",
39         "QUIT",
40         "EXIT",
41         "JOB",
42         "JOBLINE",
43         "TEXT",
44         "TS",
45         "GS",
46         "SEND_ETA",
47         "ETA",
48         "PROBE",
49         "START",
50         "STOP",
51         "DISK_UTIL",
52         "RUN",
53 };
54
55 const char *fio_server_op(unsigned int op)
56 {
57         static char buf[32];
58
59         if (op < FIO_NET_CMD_NR)
60                 return fio_server_ops[op];
61
62         sprintf(buf, "UNKNOWN/%d", op);
63         return buf;
64 }
65
66 int fio_send_data(int sk, const void *p, unsigned int len)
67 {
68         assert(len <= sizeof(struct fio_net_cmd) + FIO_SERVER_MAX_PDU);
69
70         do {
71                 int ret = send(sk, p, len, 0);
72
73                 if (ret > 0) {
74                         len -= ret;
75                         if (!len)
76                                 break;
77                         p += ret;
78                         continue;
79                 } else if (!ret)
80                         break;
81                 else if (errno == EAGAIN || errno == EINTR)
82                         continue;
83                 else
84                         break;
85         } while (!exit_backend);
86
87         if (!len)
88                 return 0;
89
90         return 1;
91 }
92
93 int fio_recv_data(int sk, void *p, unsigned int len)
94 {
95         do {
96                 int ret = recv(sk, p, len, MSG_WAITALL);
97
98                 if (ret > 0) {
99                         len -= ret;
100                         if (!len)
101                                 break;
102                         p += ret;
103                         continue;
104                 } else if (!ret)
105                         break;
106                 else if (errno == EAGAIN || errno == EINTR)
107                         continue;
108                 else
109                         break;
110         } while (!exit_backend);
111
112         if (!len)
113                 return 0;
114
115         return -1;
116 }
117
118 static int verify_convert_cmd(struct fio_net_cmd *cmd)
119 {
120         uint16_t crc;
121
122         cmd->cmd_crc16 = le16_to_cpu(cmd->cmd_crc16);
123         cmd->pdu_crc16 = le16_to_cpu(cmd->pdu_crc16);
124
125         crc = fio_crc16(cmd, FIO_NET_CMD_CRC_SZ);
126         if (crc != cmd->cmd_crc16) {
127                 log_err("fio: server bad crc on command (got %x, wanted %x)\n",
128                                 cmd->cmd_crc16, crc);
129                 return 1;
130         }
131
132         cmd->version    = le16_to_cpu(cmd->version);
133         cmd->opcode     = le16_to_cpu(cmd->opcode);
134         cmd->flags      = le32_to_cpu(cmd->flags);
135         cmd->tag        = le64_to_cpu(cmd->tag);
136         cmd->pdu_len    = le32_to_cpu(cmd->pdu_len);
137
138         switch (cmd->version) {
139         case FIO_SERVER_VER:
140                 break;
141         default:
142                 log_err("fio: bad server cmd version %d\n", cmd->version);
143                 return 1;
144         }
145
146         if (cmd->pdu_len > FIO_SERVER_MAX_PDU) {
147                 log_err("fio: command payload too large: %u\n", cmd->pdu_len);
148                 return 1;
149         }
150
151         return 0;
152 }
153
154 /*
155  * Read (and defragment, if necessary) incoming commands
156  */
157 struct fio_net_cmd *fio_net_recv_cmd(int sk)
158 {
159         struct fio_net_cmd cmd, *cmdret = NULL;
160         size_t cmd_size = 0, pdu_offset = 0;
161         uint16_t crc;
162         int ret, first = 1;
163         void *pdu = NULL;
164
165         do {
166                 ret = fio_recv_data(sk, &cmd, sizeof(cmd));
167                 if (ret)
168                         break;
169
170                 /* We have a command, verify it and swap if need be */
171                 ret = verify_convert_cmd(&cmd);
172                 if (ret)
173                         break;
174
175                 if (first) {
176                         /* if this is text, add room for \0 at the end */
177                         cmd_size = sizeof(cmd) + cmd.pdu_len + 1;
178                         assert(!cmdret);
179                 } else
180                         cmd_size += cmd.pdu_len;
181
182                 cmdret = realloc(cmdret, cmd_size);
183
184                 if (first)
185                         memcpy(cmdret, &cmd, sizeof(cmd));
186                 else if (cmdret->opcode != cmd.opcode) {
187                         log_err("fio: fragment opcode mismatch (%d != %d)\n",
188                                         cmdret->opcode, cmd.opcode);
189                         ret = 1;
190                         break;
191                 }
192
193                 if (!cmd.pdu_len)
194                         break;
195
196                 /* There's payload, get it */
197                 pdu = (void *) cmdret->payload + pdu_offset;
198                 ret = fio_recv_data(sk, pdu, cmd.pdu_len);
199                 if (ret)
200                         break;
201
202                 /* Verify payload crc */
203                 crc = fio_crc16(pdu, cmd.pdu_len);
204                 if (crc != cmd.pdu_crc16) {
205                         log_err("fio: server bad crc on payload ");
206                         log_err("(got %x, wanted %x)\n", cmd.pdu_crc16, crc);
207                         ret = 1;
208                         break;
209                 }
210
211                 pdu_offset += cmd.pdu_len;
212                 if (!first)
213                         cmdret->pdu_len += cmd.pdu_len;
214                 first = 0;
215         } while (cmd.flags & FIO_NET_CMD_F_MORE);
216
217         if (ret) {
218                 free(cmdret);
219                 cmdret = NULL;
220         } else if (cmdret) {
221                 /* zero-terminate text input */
222                 if (cmdret->pdu_len && (cmdret->opcode == FIO_NET_CMD_TEXT ||
223                     cmdret->opcode == FIO_NET_CMD_JOB)) {
224                         char *buf = (char *) cmdret->payload;
225
226                         buf[cmdret->pdu_len ] = '\0';
227                 }
228                 /* frag flag is internal */
229                 cmdret->flags &= ~FIO_NET_CMD_F_MORE;
230         }
231
232         return cmdret;
233 }
234
235 void fio_net_cmd_crc(struct fio_net_cmd *cmd)
236 {
237         uint32_t pdu_len;
238
239         cmd->cmd_crc16 = __cpu_to_le16(fio_crc16(cmd, FIO_NET_CMD_CRC_SZ));
240
241         pdu_len = le32_to_cpu(cmd->pdu_len);
242         if (pdu_len)
243                 cmd->pdu_crc16 = __cpu_to_le16(fio_crc16(cmd->payload, pdu_len));
244 }
245
246 int fio_net_send_cmd(int fd, uint16_t opcode, const void *buf, off_t size,
247                      uint64_t tag)
248 {
249         struct fio_net_cmd *cmd = NULL;
250         size_t this_len, cur_len = 0;
251         int ret;
252
253         do {
254                 this_len = size;
255                 if (this_len > FIO_SERVER_MAX_PDU)
256                         this_len = FIO_SERVER_MAX_PDU;
257
258                 if (!cmd || cur_len < sizeof(*cmd) + this_len) {
259                         if (cmd)
260                                 free(cmd);
261
262                         cur_len = sizeof(*cmd) + this_len;
263                         cmd = malloc(cur_len);
264                 }
265
266                 fio_init_net_cmd(cmd, opcode, buf, this_len, tag);
267
268                 if (this_len < size)
269                         cmd->flags = __cpu_to_le32(FIO_NET_CMD_F_MORE);
270
271                 fio_net_cmd_crc(cmd);
272
273                 ret = fio_send_data(fd, cmd, sizeof(*cmd) + this_len);
274                 size -= this_len;
275                 buf += this_len;
276         } while (!ret && size);
277
278         if (cmd)
279                 free(cmd);
280
281         return ret;
282 }
283
284 static int fio_net_send_simple_stack_cmd(int sk, uint16_t opcode, uint64_t tag)
285 {
286         struct fio_net_cmd cmd;
287
288         fio_init_net_cmd(&cmd, opcode, NULL, 0, tag);
289         fio_net_cmd_crc(&cmd);
290
291         return fio_send_data(sk, &cmd, sizeof(cmd));
292 }
293
294 /*
295  * If 'list' is non-NULL, then allocate and store the sent command for
296  * later verification.
297  */
298 int fio_net_send_simple_cmd(int sk, uint16_t opcode, uint64_t tag,
299                             struct flist_head *list)
300 {
301         struct fio_net_int_cmd *cmd;
302         int ret;
303
304         if (!list)
305                 return fio_net_send_simple_stack_cmd(sk, opcode, tag);
306
307         cmd = malloc(sizeof(*cmd));
308
309         fio_init_net_cmd(&cmd->cmd, opcode, NULL, 0, (uintptr_t) cmd);
310         fio_net_cmd_crc(&cmd->cmd);
311
312         INIT_FLIST_HEAD(&cmd->list);
313         gettimeofday(&cmd->tv, NULL);
314         cmd->saved_tag = tag;
315
316         ret = fio_send_data(sk, &cmd->cmd, sizeof(cmd->cmd));
317         if (ret) {
318                 free(cmd);
319                 return ret;
320         }
321
322         flist_add_tail(&cmd->list, list);
323         return 0;
324 }
325
326 static int fio_server_send_quit_cmd(void)
327 {
328         dprint(FD_NET, "server: sending quit\n");
329         return fio_net_send_simple_cmd(server_fd, FIO_NET_CMD_QUIT, 0, NULL);
330 }
331
332 static int handle_job_cmd(struct fio_net_cmd *cmd)
333 {
334         char *buf = (char *) cmd->payload;
335         struct cmd_start_pdu spdu;
336         struct cmd_end_pdu epdu;
337         int ret;
338
339         stat_number = 0;
340
341         if (parse_jobs_ini(buf, 1, 0)) {
342                 fio_server_send_quit_cmd();
343                 return -1;
344         }
345
346         spdu.jobs = cpu_to_le32(thread_number);
347         spdu.stat_outputs = cpu_to_le32(stat_number);
348         fio_net_send_cmd(server_fd, FIO_NET_CMD_START, &spdu, sizeof(spdu), 0);
349
350         ret = fio_backend();
351
352         epdu.error = ret;
353         fio_net_send_cmd(server_fd, FIO_NET_CMD_STOP, &epdu, sizeof(epdu), 0);
354
355         fio_server_send_quit_cmd();
356         reset_fio_state();
357         return ret;
358 }
359
360 static int handle_jobline_cmd(struct fio_net_cmd *cmd)
361 {
362         void *pdu = cmd->payload;
363         struct cmd_single_line_pdu *cslp;
364         struct cmd_line_pdu *clp;
365         unsigned long offset;
366         char **argv;
367         int ret, i;
368
369         clp = pdu;
370         clp->lines = le16_to_cpu(clp->lines);
371         argv = malloc(clp->lines * sizeof(char *));
372         offset = sizeof(*clp);
373
374         dprint(FD_NET, "server: %d command line args\n", clp->lines);
375
376         for (i = 0; i < clp->lines; i++) {
377                 cslp = pdu + offset;
378                 argv[i] = (char *) cslp->text;
379
380                 offset += sizeof(*cslp) + le16_to_cpu(cslp->len);
381                 dprint(FD_NET, "server: %d: %s\n", i, argv[i]);
382         }
383
384         if (parse_cmd_line(clp->lines, argv)) {
385                 fio_server_send_quit_cmd();
386                 free(argv);
387                 return -1;
388         }
389
390         free(argv);
391
392         fio_net_send_simple_cmd(server_fd, FIO_NET_CMD_START, 0, NULL);
393
394         ret = fio_backend();
395         fio_server_send_quit_cmd();
396         reset_fio_state();
397         return ret;
398 }
399
400 static int handle_probe_cmd(struct fio_net_cmd *cmd)
401 {
402         struct cmd_probe_pdu probe;
403
404         dprint(FD_NET, "server: sending probe reply\n");
405
406         memset(&probe, 0, sizeof(probe));
407         gethostname((char *) probe.hostname, sizeof(probe.hostname));
408 #ifdef FIO_BIG_ENDIAN
409         probe.bigendian = 1;
410 #endif
411         strncpy((char *) probe.fio_version, fio_version_string, sizeof(probe.fio_version));
412
413         probe.os        = FIO_OS;
414         probe.arch      = FIO_ARCH;
415
416         probe.bpp       = sizeof(void *);
417
418         return fio_net_send_cmd(server_fd, FIO_NET_CMD_PROBE, &probe, sizeof(probe), cmd->tag);
419 }
420
421 static int handle_send_eta_cmd(struct fio_net_cmd *cmd)
422 {
423         struct jobs_eta *je;
424         size_t size;
425         int i;
426
427         if (!thread_number)
428                 return 0;
429
430         size = sizeof(*je) + thread_number * sizeof(char) + 1;
431         je = malloc(size);
432         memset(je, 0, size);
433
434         if (!calc_thread_status(je, 1)) {
435                 free(je);
436                 return 0;
437         }
438
439         dprint(FD_NET, "server sending status\n");
440
441         je->nr_running          = cpu_to_le32(je->nr_running);
442         je->nr_ramp             = cpu_to_le32(je->nr_ramp);
443         je->nr_pending          = cpu_to_le32(je->nr_pending);
444         je->files_open          = cpu_to_le32(je->files_open);
445         je->m_rate              = cpu_to_le32(je->m_rate);
446         je->t_rate              = cpu_to_le32(je->t_rate);
447         je->m_iops              = cpu_to_le32(je->m_iops);
448         je->t_iops              = cpu_to_le32(je->t_iops);
449
450         for (i = 0; i < 2; i++) {
451                 je->rate[i]     = cpu_to_le32(je->rate[i]);
452                 je->iops[i]     = cpu_to_le32(je->iops[i]);
453         }
454
455         je->elapsed_sec         = cpu_to_le64(je->elapsed_sec);
456         je->eta_sec             = cpu_to_le64(je->eta_sec);
457         je->is_pow2             = cpu_to_le32(je->is_pow2);
458
459         fio_net_send_cmd(server_fd, FIO_NET_CMD_ETA, je, size, cmd->tag);
460         free(je);
461         return 0;
462 }
463
464 static int handle_command(struct fio_net_cmd *cmd)
465 {
466         int ret;
467
468         dprint(FD_NET, "server: got op [%s], pdu=%u, tag=%lx\n",
469                         fio_server_op(cmd->opcode), cmd->pdu_len, cmd->tag);
470
471         switch (cmd->opcode) {
472         case FIO_NET_CMD_QUIT:
473                 fio_terminate_threads(TERMINATE_ALL);
474                 return -1;
475         case FIO_NET_CMD_EXIT:
476                 exit_backend = 1;
477                 return -1;
478         case FIO_NET_CMD_JOB:
479                 ret = handle_job_cmd(cmd);
480                 break;
481         case FIO_NET_CMD_JOBLINE:
482                 ret = handle_jobline_cmd(cmd);
483                 break;
484         case FIO_NET_CMD_PROBE:
485                 ret = handle_probe_cmd(cmd);
486                 break;
487         case FIO_NET_CMD_SEND_ETA:
488                 ret = handle_send_eta_cmd(cmd);
489                 break;
490         default:
491                 log_err("fio: unknown opcode: %s\n",fio_server_op(cmd->opcode));
492                 ret = 1;
493         }
494
495         return ret;
496 }
497
498 static int handle_connection(int sk, int block)
499 {
500         struct fio_net_cmd *cmd = NULL;
501         int ret = 0;
502
503         /* read forever */
504         while (!exit_backend) {
505                 struct pollfd pfd = {
506                         .fd     = sk,
507                         .events = POLLIN,
508                 };
509
510                 ret = 0;
511                 do {
512                         ret = poll(&pfd, 1, 100);
513                         if (ret < 0) {
514                                 if (errno == EINTR)
515                                         break;
516                                 log_err("fio: poll: %s\n", strerror(errno));
517                                 break;
518                         } else if (!ret) {
519                                 if (!block)
520                                         return 0;
521                                 continue;
522                         }
523
524                         if (pfd.revents & POLLIN)
525                                 break;
526                         if (pfd.revents & (POLLERR|POLLHUP)) {
527                                 ret = 1;
528                                 break;
529                         }
530                 } while (!exit_backend);
531
532                 if (ret < 0)
533                         break;
534
535                 cmd = fio_net_recv_cmd(sk);
536                 if (!cmd) {
537                         ret = -1;
538                         break;
539                 }
540
541                 ret = handle_command(cmd);
542                 if (ret)
543                         break;
544
545                 free(cmd);
546                 cmd = NULL;
547         }
548
549         if (cmd)
550                 free(cmd);
551
552         return ret;
553 }
554
555 void fio_server_idle_loop(void)
556 {
557         if (!first_cmd_check)
558                 fio_net_send_simple_cmd(server_fd, FIO_NET_CMD_RUN, 0, NULL);
559         if (server_fd != -1)
560                 handle_connection(server_fd, 0);
561 }
562
563 static int accept_loop(int listen_sk)
564 {
565         struct sockaddr_in addr;
566         fio_socklen_t len = sizeof(addr);
567         struct pollfd pfd;
568         int ret, sk, flags, exitval = 0;
569
570         dprint(FD_NET, "server enter accept loop\n");
571
572         flags = fcntl(listen_sk, F_GETFL);
573         flags |= O_NONBLOCK;
574         fcntl(listen_sk, F_SETFL, flags);
575 again:
576         pfd.fd = listen_sk;
577         pfd.events = POLLIN;
578         do {
579                 ret = poll(&pfd, 1, 100);
580                 if (ret < 0) {
581                         if (errno == EINTR)
582                                 break;
583                         log_err("fio: poll: %s\n", strerror(errno));
584                         goto out;
585                 } else if (!ret)
586                         continue;
587
588                 if (pfd.revents & POLLIN)
589                         break;
590         } while (!exit_backend);
591
592         if (exit_backend)
593                 goto out;
594
595         sk = accept(listen_sk, (struct sockaddr *) &addr, &len);
596         if (sk < 0) {
597                 log_err("fio: accept: %s\n", strerror(errno));
598                 return -1;
599         }
600
601         dprint(FD_NET, "server: connect from %s\n", inet_ntoa(addr.sin_addr));
602
603         server_fd = sk;
604
605         exitval = handle_connection(sk, 1);
606
607         server_fd = -1;
608         close(sk);
609
610         if (!exit_backend)
611                 goto again;
612
613 out:
614         return exitval;
615 }
616
617 int fio_server_text_output(const char *buf, size_t len)
618 {
619         if (server_fd != -1)
620                 return fio_net_send_cmd(server_fd, FIO_NET_CMD_TEXT, buf, len, 0);
621
622         return log_local_buf(buf, len);
623 }
624
625 static void convert_io_stat(struct io_stat *dst, struct io_stat *src)
626 {
627         dst->max_val    = cpu_to_le64(src->max_val);
628         dst->min_val    = cpu_to_le64(src->min_val);
629         dst->samples    = cpu_to_le64(src->samples);
630
631         /*
632          * Encode to IEEE 754 for network transfer
633          */
634         dst->mean.u.i   = __cpu_to_le64(fio_double_to_uint64(src->mean.u.f));
635         dst->S.u.i      = __cpu_to_le64(fio_double_to_uint64(src->S.u.f));
636 }
637
638 static void convert_gs(struct group_run_stats *dst, struct group_run_stats *src)
639 {
640         int i;
641
642         for (i = 0; i < 2; i++) {
643                 dst->max_run[i]         = cpu_to_le64(src->max_run[i]);
644                 dst->min_run[i]         = cpu_to_le64(src->min_run[i]);
645                 dst->max_bw[i]          = cpu_to_le64(src->max_bw[i]);
646                 dst->min_bw[i]          = cpu_to_le64(src->min_bw[i]);
647                 dst->io_kb[i]           = cpu_to_le64(src->io_kb[i]);
648                 dst->agg[i]             = cpu_to_le64(src->agg[i]);
649         }
650
651         dst->kb_base    = cpu_to_le32(src->kb_base);
652         dst->groupid    = cpu_to_le32(src->groupid);
653 }
654
655 /*
656  * Send a CMD_TS, which packs struct thread_stat and group_run_stats
657  * into a single payload.
658  */
659 void fio_server_send_ts(struct thread_stat *ts, struct group_run_stats *rs)
660 {
661         struct cmd_ts_pdu p;
662         int i, j;
663
664         dprint(FD_NET, "server sending end stats\n");
665
666         memset(&p, 0, sizeof(p));
667
668         strcpy(p.ts.name, ts->name);
669         strcpy(p.ts.verror, ts->verror);
670         strcpy(p.ts.description, ts->description);
671
672         p.ts.error      = cpu_to_le32(ts->error);
673         p.ts.groupid    = cpu_to_le32(ts->groupid);
674         p.ts.pid        = cpu_to_le32(ts->pid);
675         p.ts.members    = cpu_to_le32(ts->members);
676
677         for (i = 0; i < 2; i++) {
678                 convert_io_stat(&p.ts.clat_stat[i], &ts->clat_stat[i]);
679                 convert_io_stat(&p.ts.slat_stat[i], &ts->slat_stat[i]);
680                 convert_io_stat(&p.ts.lat_stat[i], &ts->lat_stat[i]);
681                 convert_io_stat(&p.ts.bw_stat[i], &ts->bw_stat[i]);
682         }
683
684         p.ts.usr_time           = cpu_to_le64(ts->usr_time);
685         p.ts.sys_time           = cpu_to_le64(ts->sys_time);
686         p.ts.ctx                = cpu_to_le64(ts->ctx);
687         p.ts.minf               = cpu_to_le64(ts->minf);
688         p.ts.majf               = cpu_to_le64(ts->majf);
689         p.ts.clat_percentiles   = cpu_to_le64(ts->clat_percentiles);
690
691         for (i = 0; i < FIO_IO_U_LIST_MAX_LEN; i++) {
692                 fio_fp64_t *src = &ts->percentile_list[i];
693                 fio_fp64_t *dst = &p.ts.percentile_list[i];
694
695                 dst->u.i = __cpu_to_le64(fio_double_to_uint64(src->u.f));
696         }
697
698         for (i = 0; i < FIO_IO_U_MAP_NR; i++) {
699                 p.ts.io_u_map[i]        = cpu_to_le32(ts->io_u_map[i]);
700                 p.ts.io_u_submit[i]     = cpu_to_le32(ts->io_u_submit[i]);
701                 p.ts.io_u_complete[i]   = cpu_to_le32(ts->io_u_complete[i]);
702         }
703
704         for (i = 0; i < FIO_IO_U_LAT_U_NR; i++) {
705                 p.ts.io_u_lat_u[i]      = cpu_to_le32(ts->io_u_lat_u[i]);
706                 p.ts.io_u_lat_m[i]      = cpu_to_le32(ts->io_u_lat_m[i]);
707         }
708
709         for (i = 0; i < 2; i++)
710                 for (j = 0; j < FIO_IO_U_PLAT_NR; j++)
711                         p.ts.io_u_plat[i][j] = cpu_to_le32(ts->io_u_plat[i][j]);
712
713         for (i = 0; i < 3; i++) {
714                 p.ts.total_io_u[i]      = cpu_to_le64(ts->total_io_u[i]);
715                 p.ts.short_io_u[i]      = cpu_to_le64(ts->short_io_u[i]);
716         }
717
718         p.ts.total_submit       = cpu_to_le64(ts->total_submit);
719         p.ts.total_complete     = cpu_to_le64(ts->total_complete);
720
721         for (i = 0; i < 2; i++) {
722                 p.ts.io_bytes[i]        = cpu_to_le64(ts->io_bytes[i]);
723                 p.ts.runtime[i]         = cpu_to_le64(ts->runtime[i]);
724         }
725
726         p.ts.total_run_time     = cpu_to_le64(ts->total_run_time);
727         p.ts.continue_on_error  = cpu_to_le16(ts->continue_on_error);
728         p.ts.total_err_count    = cpu_to_le64(ts->total_err_count);
729         p.ts.first_error        = cpu_to_le32(ts->first_error);
730         p.ts.kb_base            = cpu_to_le32(ts->kb_base);
731
732         convert_gs(&p.rs, rs);
733
734         fio_net_send_cmd(server_fd, FIO_NET_CMD_TS, &p, sizeof(p), 0);
735 }
736
737 void fio_server_send_gs(struct group_run_stats *rs)
738 {
739         struct group_run_stats gs;
740
741         dprint(FD_NET, "server sending group run stats\n");
742
743         convert_gs(&gs, rs);
744         fio_net_send_cmd(server_fd, FIO_NET_CMD_GS, &gs, sizeof(gs), 0);
745 }
746
747 static void convert_agg(struct disk_util_agg *dst, struct disk_util_agg *src)
748 {
749         int i;
750
751         for (i = 0; i < 2; i++) {
752                 dst->ios[i]     = cpu_to_le32(src->ios[i]);
753                 dst->merges[i]  = cpu_to_le32(src->merges[i]);
754                 dst->sectors[i] = cpu_to_le64(src->sectors[i]);
755                 dst->ticks[i]   = cpu_to_le32(src->ticks[i]);
756         }
757
758         dst->io_ticks           = cpu_to_le32(src->io_ticks);
759         dst->time_in_queue      = cpu_to_le32(src->time_in_queue);
760         dst->slavecount         = cpu_to_le32(src->slavecount);
761         dst->max_util.u.i       = __cpu_to_le64(fio_double_to_uint64(src->max_util.u.f));
762 }
763
764 static void convert_dus(struct disk_util_stat *dst, struct disk_util_stat *src)
765 {
766         int i;
767
768         strcpy((char *) dst->name, (char *) src->name);
769
770         for (i = 0; i < 2; i++) {
771                 dst->ios[i]     = cpu_to_le32(src->ios[i]);
772                 dst->merges[i]  = cpu_to_le32(src->merges[i]);
773                 dst->sectors[i] = cpu_to_le64(src->sectors[i]);
774                 dst->ticks[i]   = cpu_to_le32(src->ticks[i]);
775         }
776
777         dst->io_ticks           = cpu_to_le32(src->io_ticks);
778         dst->time_in_queue      = cpu_to_le32(src->time_in_queue);
779         dst->msec               = cpu_to_le64(src->msec);
780 }
781
782 void fio_server_send_du(void)
783 {
784         struct disk_util *du;
785         struct flist_head *entry;
786         struct cmd_du_pdu pdu;
787
788         dprint(FD_NET, "server: sending disk_util %d\n", !flist_empty(&disk_list));
789
790         memset(&pdu, 0, sizeof(pdu));
791
792         flist_for_each(entry, &disk_list) {
793                 du = flist_entry(entry, struct disk_util, list);
794
795                 convert_dus(&pdu.dus, &du->dus);
796                 convert_agg(&pdu.agg, &du->agg);
797
798                 fio_net_send_cmd(server_fd, FIO_NET_CMD_DU, &pdu, sizeof(pdu), 0);
799         }
800 }
801
802 int fio_server_log(const char *format, ...)
803 {
804         char buffer[1024];
805         va_list args;
806         size_t len;
807
808         dprint(FD_NET, "server log\n");
809
810         va_start(args, format);
811         len = vsnprintf(buffer, sizeof(buffer), format, args);
812         va_end(args);
813
814         return fio_server_text_output(buffer, len);
815 }
816
817 static int fio_init_server_ip(void)
818 {
819         struct sockaddr *addr;
820         fio_socklen_t socklen;
821         int sk, opt;
822
823         if (use_ipv6)
824                 sk = socket(AF_INET6, SOCK_STREAM, 0);
825         else
826                 sk = socket(AF_INET, SOCK_STREAM, 0);
827
828         if (sk < 0) {
829                 log_err("fio: socket: %s\n", strerror(errno));
830                 return -1;
831         }
832
833         opt = 1;
834         if (setsockopt(sk, SOL_SOCKET, SO_REUSEADDR, &opt, sizeof(opt)) < 0) {
835                 log_err("fio: setsockopt: %s\n", strerror(errno));
836                 close(sk);
837                 return -1;
838         }
839 #ifdef SO_REUSEPORT
840         if (setsockopt(sk, SOL_SOCKET, SO_REUSEPORT, &opt, sizeof(opt)) < 0) {
841                 log_err("fio: setsockopt: %s\n", strerror(errno));
842                 close(sk);
843                 return -1;
844         }
845 #endif
846
847         if (use_ipv6) {
848                 addr = (struct sockaddr *) &saddr_in6;
849                 socklen = sizeof(saddr_in6);
850                 saddr_in6.sin6_family = AF_INET6;
851         } else {
852                 addr = (struct sockaddr *) &saddr_in;
853                 socklen = sizeof(saddr_in);
854                 saddr_in.sin_family = AF_INET;
855         }
856
857         if (bind(sk, addr, socklen) < 0) {
858                 log_err("fio: bind: %s\n", strerror(errno));
859                 close(sk);
860                 return -1;
861         }
862
863         return sk;
864 }
865
866 static int fio_init_server_sock(void)
867 {
868         struct sockaddr_un addr;
869         fio_socklen_t len;
870         mode_t mode;
871         int sk;
872
873         sk = socket(AF_UNIX, SOCK_STREAM, 0);
874         if (sk < 0) {
875                 log_err("fio: socket: %s\n", strerror(errno));
876                 return -1;
877         }
878
879         mode = umask(000);
880
881         memset(&addr, 0, sizeof(addr));
882         addr.sun_family = AF_UNIX;
883         strcpy(addr.sun_path, bind_sock);
884         unlink(bind_sock);
885
886         len = sizeof(addr.sun_family) + strlen(bind_sock) + 1;
887
888         if (bind(sk, (struct sockaddr *) &addr, len) < 0) {
889                 log_err("fio: bind: %s\n", strerror(errno));
890                 close(sk);
891                 return -1;
892         }
893
894         umask(mode);
895         return sk;
896 }
897
898 static int fio_init_server_connection(void)
899 {
900         char bind_str[128];
901         int sk;
902
903         dprint(FD_NET, "starting server\n");
904
905         if (!bind_sock)
906                 sk = fio_init_server_ip();
907         else
908                 sk = fio_init_server_sock();
909
910         if (sk < 0)
911                 return sk;
912
913         if (!bind_sock) {
914                 char *p, port[16];
915                 const void *src;
916                 int af;
917
918                 if (use_ipv6) {
919                         af = AF_INET6;
920                         src = &saddr_in6.sin6_addr;
921                 } else {
922                         af = AF_INET;
923                         src = &saddr_in.sin_addr;
924                 }
925
926                 p = (char *) inet_ntop(af, src, bind_str, sizeof(bind_str));
927
928                 sprintf(port, ",%u", fio_net_port);
929                 if (p)
930                         strcat(p, port);
931                 else
932                         strcpy(bind_str, port);
933         } else
934                 strcpy(bind_str, bind_sock);
935
936         log_info("fio: server listening on %s\n", bind_str);
937
938         if (listen(sk, 0) < 0) {
939                 log_err("fio: listen: %s\n", strerror(errno));
940                 return -1;
941         }
942
943         return sk;
944 }
945
946 /*
947  * Parse a host/ip/port string. Reads from 'str'.
948  *
949  * Outputs:
950  *
951  * For IPv4:
952  *      *ptr is the host, *port is the port, inp is the destination.
953  * For IPv6:
954  *      *ptr is the host, *port is the port, inp6 is the dest, and *ipv6 is 1.
955  * For local domain sockets:
956  *      *ptr is the filename, *is_sock is 1.
957  */
958 int fio_server_parse_string(const char *str, char **ptr, int *is_sock,
959                             int *port, struct in_addr *inp,
960                             struct in6_addr *inp6, int *ipv6)
961 {
962         const char *host = str;
963         char *portp;
964         int ret, lport = 0;
965
966         *ptr = NULL;
967         *is_sock = 0;
968         *port = fio_net_port;
969         *ipv6 = 0;
970
971         if (!strncmp(str, "sock:", 5)) {
972                 *ptr = strdup(str + 5);
973                 *is_sock = 1;
974
975                 return 0;
976         }
977
978         /*
979          * Is it ip:<ip or host>:port
980          */
981         if (!strncmp(host, "ip:", 3))
982                 host += 3;
983         else if (!strncmp(host, "ip4:", 4))
984                 host += 4;
985         else if (!strncmp(host, "ip6:", 4)) {
986                 host += 4;
987                 *ipv6 = 1;
988         } else if (host[0] == ':') {
989                 /* String is :port */
990                 host++;
991                 lport = atoi(host);
992                 if (!lport || lport > 65535) {
993                         log_err("fio: bad server port %u\n", port);
994                         return 1;
995                 }
996                 /* no hostname given, we are done */
997                 *port = lport;
998                 return 0;
999         }
1000
1001         /*
1002          * If no port seen yet, check if there's a last ':' at the end
1003          */
1004         if (!lport) {
1005                 portp = strchr(host, ',');
1006                 if (portp) {
1007                         *portp = '\0';
1008                         portp++;
1009                         lport = atoi(portp);
1010                         if (!lport || lport > 65535) {
1011                                 log_err("fio: bad server port %u\n", port);
1012                                 return 1;
1013                         }
1014                 }
1015         }
1016
1017         if (lport)
1018                 *port = lport;
1019
1020         if (!strlen(host))
1021                 return 0;
1022
1023         *ptr = strdup(host);
1024
1025         if (*ipv6)
1026                 ret = inet_pton(AF_INET6, host, inp6);
1027         else
1028                 ret = inet_pton(AF_INET, host, inp);
1029
1030         if (ret != 1) {
1031                 struct hostent *hent;
1032
1033                 hent = gethostbyname(host);
1034                 if (!hent) {
1035                         log_err("fio: failed to resolve <%s>\n", host);
1036                         free(*ptr);
1037                         *ptr = NULL;
1038                         return 1;
1039                 }
1040
1041                 if (*ipv6) {
1042                         if (hent->h_addrtype != AF_INET6) {
1043                                 log_info("fio: falling back to IPv4\n");
1044                                 *ipv6 = 0;
1045                         } else
1046                                 memcpy(inp6, hent->h_addr_list[0], 16);
1047                 }
1048                 if (!*ipv6) {
1049                         if (hent->h_addrtype != AF_INET) {
1050                                 log_err("fio: lookup type mismatch\n");
1051                                 free(*ptr);
1052                                 *ptr = NULL;
1053                                 return 1;
1054                         }
1055                         memcpy(inp, hent->h_addr_list[0], 4);
1056                 }
1057         }
1058
1059         if (*port == 0)
1060                 *port = fio_net_port;
1061
1062         return 0;
1063 }
1064
1065 /*
1066  * Server arg should be one of:
1067  *
1068  * sock:/path/to/socket
1069  *   ip:1.2.3.4
1070  *      1.2.3.4
1071  *
1072  * Where sock uses unix domain sockets, and ip binds the server to
1073  * a specific interface. If no arguments are given to the server, it
1074  * uses IP and binds to 0.0.0.0.
1075  *
1076  */
1077 static int fio_handle_server_arg(void)
1078 {
1079         int port = fio_net_port;
1080         int is_sock, ret = 0;
1081
1082         saddr_in.sin_addr.s_addr = htonl(INADDR_ANY);
1083
1084         if (!fio_server_arg)
1085                 goto out;
1086
1087         ret = fio_server_parse_string(fio_server_arg, &bind_sock, &is_sock,
1088                                         &port, &saddr_in.sin_addr,
1089                                         &saddr_in6.sin6_addr, &use_ipv6);
1090
1091         if (!is_sock && bind_sock) {
1092                 free(bind_sock);
1093                 bind_sock = NULL;
1094         }
1095
1096 out:
1097         fio_net_port = port;
1098         saddr_in.sin_port = htons(port);
1099         saddr_in6.sin6_port = htons(port);
1100         return ret;
1101 }
1102
1103 static int fio_server(void)
1104 {
1105         int sk, ret;
1106
1107         dprint(FD_NET, "starting server\n");
1108
1109         if (fio_handle_server_arg())
1110                 return -1;
1111
1112         sk = fio_init_server_connection();
1113         if (sk < 0)
1114                 return -1;
1115
1116         ret = accept_loop(sk);
1117
1118         close(sk);
1119
1120         if (fio_server_arg) {
1121                 free(fio_server_arg);
1122                 fio_server_arg = NULL;
1123         }
1124         if (bind_sock)
1125                 free(bind_sock);
1126
1127         return ret;
1128 }
1129
1130 void fio_server_got_signal(int signal)
1131 {
1132         if (signal == SIGPIPE)
1133                 server_fd = -1;
1134         else {
1135                 log_info("\nfio: terminating on signal %d\n", signal);
1136                 exit_backend = 1;
1137         }
1138 }
1139
1140 static int check_existing_pidfile(const char *pidfile)
1141 {
1142         struct stat sb;
1143         char buf[16];
1144         pid_t pid;
1145         FILE *f;
1146
1147         if (stat(pidfile, &sb))
1148                 return 0;
1149
1150         f = fopen(pidfile, "r");
1151         if (!f)
1152                 return 0;
1153
1154         if (fread(buf, sb.st_size, 1, f) <= 0) {
1155                 fclose(f);
1156                 return 1;
1157         }
1158         fclose(f);
1159
1160         pid = atoi(buf);
1161         if (kill(pid, SIGCONT) < 0)
1162                 return errno != ESRCH;
1163
1164         return 1;
1165 }
1166
1167 static int write_pid(pid_t pid, const char *pidfile)
1168 {
1169         FILE *fpid;
1170
1171         fpid = fopen(pidfile, "w");
1172         if (!fpid) {
1173                 log_err("fio: failed opening pid file %s\n", pidfile);
1174                 return 1;
1175         }
1176
1177         fprintf(fpid, "%u\n", (unsigned int) pid);
1178         fclose(fpid);
1179         return 0;
1180 }
1181
1182 /*
1183  * If pidfile is specified, background us.
1184  */
1185 int fio_start_server(char *pidfile)
1186 {
1187         pid_t pid;
1188         int ret;
1189
1190 #if defined(WIN32)
1191         WSADATA wsd;
1192         WSAStartup(MAKEWORD(2,2), &wsd);
1193 #endif
1194
1195         if (!pidfile)
1196                 return fio_server();
1197
1198         if (check_existing_pidfile(pidfile)) {
1199                 log_err("fio: pidfile %s exists and server appears alive\n",
1200                                                                 pidfile);
1201                 return -1;
1202         }
1203
1204         pid = fork();
1205         if (pid < 0) {
1206                 log_err("fio: failed server fork: %s", strerror(errno));
1207                 free(pidfile);
1208                 return -1;
1209         } else if (pid) {
1210                 int ret = write_pid(pid, pidfile);
1211
1212                 exit(ret);
1213         }
1214
1215         setsid();
1216         openlog("fio", LOG_NDELAY|LOG_NOWAIT|LOG_PID, LOG_USER);
1217         log_syslog = 1;
1218         close(STDIN_FILENO);
1219         close(STDOUT_FILENO);
1220         close(STDERR_FILENO);
1221         f_out = NULL;
1222         f_err = NULL;
1223
1224         ret = fio_server();
1225
1226         closelog();
1227         unlink(pidfile);
1228         free(pidfile);
1229         return ret;
1230 }
1231
1232 void fio_server_set_arg(const char *arg)
1233 {
1234         fio_server_arg = strdup(arg);
1235 }