1d1d389baf093efb1fe1fa4c867d4f01a607c25d
[fio.git] / t / zbd / test-zbd-support
1 #!/bin/bash
2 #
3 # Copyright (C) 2018 Western Digital Corporation or its affiliates.
4 #
5 # This file is released under the GPL.
6
7 usage() {
8         echo "Usage: $(basename "$0") [OPTIONS] <test target device file>"
9         echo "Options:"
10         echo -e "\t-d Run fio with valgrind using DRD tool"
11         echo -e "\t-e Run fio with valgrind using helgrind tool"
12         echo -e "\t-v Run fio with valgrind --read-var-info option"
13         echo -e "\t-l Test with libzbc ioengine"
14         echo -e "\t-r Reset all zones before test start"
15         echo -e "\t-w Reset all zones before executing each write test case"
16         echo -e "\t-o <max_open_zones> Run fio with max_open_zones limit"
17         echo -e "\t-t <test #> Run only a single test case with specified number"
18         echo -e "\t-q Quit the test run after any failed test"
19         echo -e "\t-z Run fio with debug=zbd option"
20         echo -e "\t-u Use io_uring ioengine in place of libaio"
21 }
22
23 max() {
24     if [ "$1" -gt "$2" ]; then
25         echo "$1"
26     else
27         echo "$2"
28     fi
29 }
30
31 min() {
32     if [ "$1" -lt "$2" ]; then
33         echo "$1"
34     else
35         echo "$2"
36     fi
37 }
38
39 ioengine() {
40         if [ -n "$use_libzbc" ]; then
41                 echo -n "--ioengine=libzbc"
42         elif [ "$1" = "libaio" -a -n "$force_io_uring" ]; then
43                 echo -n "--ioengine=io_uring"
44         else
45                 echo -n "--ioengine=$1"
46         fi
47 }
48
49 set_io_scheduler() {
50     local dev=$1 sched=$2
51
52     [ -e "/sys/block/$dev" ] || return $?
53     if [ -e "/sys/block/$dev/mq" ]; then
54         case "$sched" in
55             noop)        sched=none;;
56             deadline)    sched=mq-deadline;;
57         esac
58     else
59         case "$sched" in
60             none)        sched=noop;;
61             mq-deadline) sched=deadline;;
62         esac
63     fi
64
65     echo "$sched" >"/sys/block/$dev/queue/scheduler"
66 }
67
68 check_read() {
69     local read
70
71     read=$(fio_read <"${logfile}.${test_number}")
72     echo "read: $read <> $1" >> "${logfile}.${test_number}"
73     [ "$read" = "$1" ]
74 }
75
76 check_written() {
77     local written
78
79     written=$(fio_written <"${logfile}.${test_number}")
80     echo "written: $written <> $1" >> "${logfile}.${test_number}"
81     [ "$written" = "$1" ]
82 }
83
84 # Compare the reset count from the log file with reset count $2 using operator
85 # $1 (=, -ge, -gt, -le, -lt).
86 check_reset_count() {
87     local reset_count
88
89     reset_count=$(fio_reset_count <"${logfile}.${test_number}")
90     echo "reset_count: test $reset_count $1 $2" >> "${logfile}.${test_number}"
91     eval "[ '$reset_count' '$1' '$2' ]"
92 }
93
94 # Check log for failed assertions and crashes. Without these checks,
95 # a test can succeed even when these events happen, but it must fail.
96 check_log() {
97      [ ! -f "${logfile}.${1}" ] && return 0
98      ! grep -q -e "Assertion " -e "Aborted " "${logfile}.${1}"
99 }
100
101 # Whether or not $1 (/dev/...) is a SCSI device.
102 is_scsi_device() {
103     local d f
104
105     d=$(basename "$dev")
106     for f in /sys/class/scsi_device/*/device/block/"$d"; do
107         [ -e "$f" ] && return 0
108     done
109     return 1
110 }
111
112 job_var_opts_exclude() {
113         local o
114         local ex_key="${1}"
115
116         for o in "${job_var_opts[@]}"; do
117                 if [[ ${o} =~ "${ex_key}" ]]; then
118                         continue
119                 fi
120                 echo -n "${o}"
121         done
122 }
123
124 has_max_open_zones() {
125         while (($# > 1)); do
126                 if [[ ${1} =~ "--max_open_zones" ]]; then
127                         return 0
128                 fi
129                 shift
130         done
131         return 1
132 }
133
134 run_fio() {
135     local fio opts
136
137     fio=$(dirname "$0")/../../fio
138
139     opts=(${global_var_opts[@]})
140     opts+=("--max-jobs=16" "--aux-path=/tmp" "--allow_file_create=0" \
141                            "--significant_figures=10" "$@")
142     # When max_open_zones option is specified to this test script, add
143     # max_open_zones option to fio command unless the test case already add it.
144     if [[ -n ${max_open_zones_opt} ]] && ! has_max_open_zones "${opts[@]}"; then
145             opts+=("--max_open_zones=${max_open_zones_opt}")
146     fi
147     { echo; echo "fio ${opts[*]}"; echo; } >>"${logfile}.${test_number}"
148
149     "${dynamic_analyzer[@]}" "$fio" "${opts[@]}"
150 }
151
152 run_one_fio_job() {
153     local r
154
155     r=$(((RANDOM << 16) | RANDOM))
156     run_fio --name="$dev" --filename="$dev" "$@" --randseed="$r"        \
157             --thread=1 --direct=1
158 }
159
160 write_and_run_one_fio_job() {
161     local r
162     local write_offset="${1}"
163     local write_size="${2}"
164     local -a write_opts
165
166     shift 2
167     r=$(((RANDOM << 16) | RANDOM))
168     write_opts=(--name="write_job" --rw=write "$(ioengine "psync")" \
169                       --bs="${min_seq_write_size}" --zonemode=zbd \
170                       --zonesize="${zone_size}" --thread=1 --direct=1 \
171                       --offset="${write_offset}" --size="${write_size}")
172     write_opts+=("${job_var_opts[@]}")
173     run_fio --filename="$dev" --randseed="$r" "${write_opts[@]}" \
174             --name="$dev" --wait_for="write_job" "$@" --thread=1 --direct=1
175 }
176
177 # Run fio on the first four sequential zones of the disk.
178 run_fio_on_seq() {
179     local opts=()
180
181     opts+=("--offset=$((first_sequential_zone_sector * 512))")
182     opts+=("--size=$((4 * zone_size))" "--zonemode=zbd")
183     if [ -z "$is_zbd" ]; then
184         opts+=("--zonesize=${zone_size}")
185     fi
186     run_one_fio_job "${opts[@]}" "$@"
187 }
188
189 # Prepare for write test by resetting zones. When reset_before_write or
190 # max_open_zones option is specified, reset all zones of the test target to
191 # ensure that zones out of the test target range do not have open zones. This
192 # allows the write test to the target range to be able to open zones up to
193 # max_open_zones limit specified as the option or obtained from sysfs.
194 prep_write() {
195         [[ -n "${reset_before_write}" || -n "${max_open_zones_opt}" ]] &&
196                 [[ -n "${is_zbd}" ]] && reset_zone "${dev}" -1
197 }
198
199 SKIP_TESTCASE=255
200
201 require_scsi_dev() {
202         if ! is_scsi_device "$dev"; then
203                 SKIP_REASON="$dev is not a SCSI device"
204                 return 1
205         fi
206         return 0
207 }
208
209 require_conv_zone_bytes() {
210         local req_bytes=${1}
211
212         if ((req_bytes > first_sequential_zone_sector * 512)); then
213                 SKIP_REASON="$dev does not have enough conventional zones"
214                 return 1
215         fi
216         return 0
217 }
218
219 require_zbd() {
220         if [[ -z ${is_zbd} ]]; then
221                 SKIP_REASON="$dev is not a zoned block device"
222                 return 1
223         fi
224         return 0
225 }
226
227 require_regular_block_dev() {
228         if [[ -n ${is_zbd} ]]; then
229                 SKIP_REASON="$dev is not a regular block device"
230                 return 1
231         fi
232         return 0
233 }
234
235 require_block_dev() {
236         if [[ -b "$realdev" ]]; then
237                 return 0
238         fi
239         SKIP_REASON="$dev is not a block device"
240         return 1
241 }
242
243 require_seq_zones() {
244         local req_seq_zones=${1}
245         local seq_bytes=$((disk_size - first_sequential_zone_sector * 512))
246
247         if ((req_seq_zones > seq_bytes / zone_size)); then
248                 SKIP_REASON="$dev does not have $req_seq_zones sequential zones"
249                 return 1
250         fi
251         return 0
252 }
253
254 require_conv_zones() {
255         local req_c_zones=${1}
256         local conv_bytes=$((first_sequential_zone_sector * 512))
257
258         if ((req_c_zones > conv_bytes / zone_size)); then
259                 SKIP_REASON="$dev does not have $req_c_zones conventional zones"
260                 return 1
261         fi
262         return 0
263 }
264
265 require_max_open_zones() {
266         local min=${1}
267
268         if ((max_open_zones !=0 && max_open_zones < min)); then
269                 SKIP_REASON="max_open_zones of $dev is smaller than $min"
270                 return 1
271         fi
272         return 0
273 }
274
275 require_max_active_zones() {
276         local min=${1}
277
278         if ((max_active_zones == 0)); then
279                 SKIP_REASON="$dev does not have max_active_zones limit"
280                 return 1
281         fi
282         if ((max_active_zones < min)); then
283                 SKIP_REASON="max_active_zones of $dev is smaller than $min"
284                 return 1
285         fi
286         return 0
287 }
288
289 # Check whether buffered writes are refused for block devices.
290 test1() {
291     require_block_dev || return $SKIP_TESTCASE
292     run_fio --name=job1 --filename="$dev" --rw=write --direct=0 --bs=4K \
293             "$(ioengine "psync")" --size="${zone_size}" --thread=1      \
294             --zonemode=zbd --zonesize="${zone_size}" 2>&1 |
295         tee -a "${logfile}.${test_number}" |
296         grep -q 'Using direct I/O is mandatory for writing to ZBD drives'
297     local fio_rc=${PIPESTATUS[0]} grep_rc=${PIPESTATUS[2]}
298     case "$fio_rc" in
299         0|1) ;;
300         *)   return "$fio_rc"
301     esac
302     if [ -n "$is_zbd" ]; then
303         [ "$grep_rc" = 0 ]
304     else
305         [ "$grep_rc" != 0 ]
306     fi
307 }
308
309 # Block size exceeds zone size.
310 test2() {
311     local bs off opts=() rc
312
313     off=$(((first_sequential_zone_sector + 2 * sectors_per_zone) * 512))
314     bs=$((2 * zone_size))
315     opts+=("$(ioengine "psync")")
316     opts+=("--name=job1" "--filename=$dev" "--rw=write" "--direct=1")
317     opts+=("--zonemode=zbd" "--offset=$off" "--bs=$bs" "--size=$bs")
318     if [ -z "$is_zbd" ]; then
319         opts+=("--zonesize=${zone_size}")
320     fi
321     run_fio "${opts[@]}" >> "${logfile}.${test_number}" 2>&1 && return 1
322     grep -q 'buflen exceeds zone size' "${logfile}.${test_number}"
323 }
324
325 # Run fio against an empty zone. This causes fio to report "No I/O performed".
326 test3() {
327     local off opts=() rc
328
329     require_seq_zones 129 || return $SKIP_TESTCASE
330     off=$((first_sequential_zone_sector * 512 + 128 * zone_size))
331     size=$((zone_size))
332     [ -n "$is_zbd" ] && reset_zone "$dev" $((off / 512))
333     opts+=("--name=$dev" "--filename=$dev" "--offset=$off" "--bs=4K")
334     opts+=("--size=$size" "--zonemode=zbd")
335     opts+=("$(ioengine "psync")" "--rw=read" "--direct=1" "--thread=1")
336     if [ -z "$is_zbd" ]; then
337         opts+=("--zonesize=${zone_size}")
338     fi
339     run_fio "${opts[@]}" >> "${logfile}.${test_number}" 2>&1 || return $?
340     ! grep -q 'READ:' "${logfile}.${test_number}"
341 }
342
343 # Run fio with --read_beyond_wp=1 against an empty zone.
344 test4() {
345     local off opts=()
346
347     require_seq_zones 130 || return $SKIP_TESTCASE
348     off=$((first_sequential_zone_sector * 512 + 129 * zone_size))
349     size=$((zone_size))
350     [ -n "$is_zbd" ] && reset_zone "$dev" $((off / 512))
351     opts+=("--name=$dev" "--filename=$dev" "--offset=$off")
352     opts+=(--bs="$(min $((min_seq_write_size * 256)) $size)")
353     opts+=("--size=$size" "--thread=1" "--read_beyond_wp=1")
354     opts+=("$(ioengine "psync")" "--rw=read" "--direct=1" "--disable_lat=1")
355     opts+=("--zonemode=zbd" "--zonesize=${zone_size}")
356     run_fio "${opts[@]}" >> "${logfile}.${test_number}" 2>&1 || return $?
357     check_read $size || return $?
358 }
359
360 # Sequential write to sequential zones.
361 test5() {
362     local size off capacity bs
363
364     prep_write
365     off=$((first_sequential_zone_sector * 512))
366     capacity=$(total_zone_capacity 4 $off $dev)
367     size=$((4 * zone_size))
368     bs=$(min "$(max $((zone_size / 64)) "$min_seq_write_size")" "$zone_cap_bs")
369     run_fio_on_seq "$(ioengine "psync")" --iodepth=1 --rw=write \
370                    --bs="$bs" --do_verify=1 --verify=md5 \
371                    >>"${logfile}.${test_number}" 2>&1 || return $?
372     check_written $capacity || return $?
373     check_read $capacity || return $?
374 }
375
376 # Sequential read from sequential zones.
377 test6() {
378     local size off capacity bs
379
380     prep_write
381     off=$((first_sequential_zone_sector * 512))
382     capacity=$(total_zone_capacity 4 $off $dev)
383     size=$((4 * zone_size))
384     bs=$(min "$(max $((zone_size / 64)) "$min_seq_write_size")" "$zone_cap_bs")
385     write_and_run_one_fio_job \
386             $((first_sequential_zone_sector * 512)) "${size}" \
387             --offset="${off}" \
388             --size="${size}" --zonemode=zbd --zonesize="${zone_size}" \
389             "$(ioengine "psync")" --iodepth=1 --rw=read --bs="$bs" \
390             >>"${logfile}.${test_number}" 2>&1 || return $?
391     check_read $capacity || return $?
392 }
393
394 # Random write to sequential zones, libaio, queue depth 1.
395 test7() {
396     local size=$((zone_size))
397     local off capacity
398
399     prep_write
400     off=$((first_sequential_zone_sector * 512))
401     capacity=$(total_zone_capacity 1 $off $dev)
402     run_fio_on_seq "$(ioengine "libaio")" --iodepth=1 --rw=randwrite    \
403                    --bs="$(min 16384 "${zone_size}")"                   \
404                    --do_verify=1 --verify=md5 --size="$size"            \
405                    >>"${logfile}.${test_number}" 2>&1 || return $?
406     check_written $capacity || return $?
407     check_read $capacity || return $?
408 }
409
410 # Random write to sequential zones, libaio, queue depth 64.
411 test8() {
412     local size off capacity
413
414     prep_write
415     size=$((4 * zone_size))
416     off=$((first_sequential_zone_sector * 512))
417     capacity=$(total_zone_capacity 4 $off $dev)
418     run_fio_on_seq "$(ioengine "libaio")" --iodepth=64 --rw=randwrite   \
419                    --bs="$(min 16384 "${zone_size}")"                   \
420                    --do_verify=1 --verify=md5                           \
421                    >>"${logfile}.${test_number}" 2>&1 || return $?
422     check_written $capacity || return $?
423     check_read $capacity || return $?
424 }
425
426 # Random write to sequential zones, sg, queue depth 1.
427 test9() {
428     local size
429
430     require_scsi_dev || return $SKIP_TESTCASE
431
432     prep_write
433     size=$((4 * zone_size))
434     run_fio_on_seq --ioengine=sg                                        \
435                    --iodepth=1 --rw=randwrite --bs=16K                  \
436                    --do_verify=1 --verify=md5                           \
437                    >>"${logfile}.${test_number}" 2>&1 || return $?
438     check_written $size || return $?
439     check_read $size || return $?
440 }
441
442 # Random write to sequential zones, sg, queue depth 64.
443 test10() {
444     local size
445
446     require_scsi_dev || return $SKIP_TESTCASE
447
448     prep_write
449     size=$((4 * zone_size))
450     run_fio_on_seq --ioengine=sg                                        \
451                    --iodepth=64 --rw=randwrite --bs=16K                 \
452                    --do_verify=1 --verify=md5                           \
453                    >>"${logfile}.${test_number}" 2>&1 || return $?
454     check_written $size || return $?
455     check_read $size || return $?
456 }
457
458 # Random write to sequential zones, libaio, queue depth 64, random block size.
459 test11() {
460     local size off capacity
461
462     prep_write
463     size=$((4 * zone_size))
464     off=$((first_sequential_zone_sector * 512))
465     capacity=$(total_zone_capacity 4 $off $dev)
466     run_fio_on_seq "$(ioengine "libaio")" --iodepth=64 --rw=randwrite   \
467                    --bsrange=4K-64K --do_verify=1 --verify=md5          \
468                    --debug=zbd >>"${logfile}.${test_number}" 2>&1 || return $?
469     check_written $capacity || return $?
470     check_read $capacity || return $?
471 }
472
473 # Random write to sequential zones, libaio, queue depth 64, max 1 open zone.
474 test12() {
475     local size off capacity
476
477     [ -n "$is_zbd" ] && reset_zone "$dev" -1
478
479     size=$((8 * zone_size))
480     off=$((first_sequential_zone_sector * 512))
481     capacity=$(total_zone_capacity 8 $off $dev)
482     run_fio_on_seq "$(ioengine "libaio")" --iodepth=64 --rw=randwrite --bs=16K \
483                    --max_open_zones=1 --size=$size --do_verify=1 --verify=md5 \
484                    --debug=zbd >>"${logfile}.${test_number}" 2>&1 || return $?
485     check_written $capacity || return $?
486     check_read $capacity || return $?
487 }
488
489 # Random write to sequential zones, libaio, queue depth 64, max 4 open zones.
490 test13() {
491     local size off capacity
492
493     require_max_open_zones 4 || return $SKIP_TESTCASE
494
495     [ -n "$is_zbd" ] && reset_zone "$dev" -1
496
497     size=$((8 * zone_size))
498     off=$((first_sequential_zone_sector * 512))
499     capacity=$(total_zone_capacity 8 $off $dev)
500     run_fio_on_seq "$(ioengine "libaio")" --iodepth=64 --rw=randwrite --bs=16K \
501                    --max_open_zones=4 --size=$size --do_verify=1 --verify=md5 \
502                    --debug=zbd                                                \
503                    >>"${logfile}.${test_number}" 2>&1 || return $?
504     check_written $capacity || return $?
505     check_read $capacity || return $?
506 }
507
508 # Random write to conventional zones.
509 test14() {
510     local off size
511
512     if ! result=($(first_online_zone "$dev")); then
513         echo "Failed to determine first online zone"
514         exit 1
515     fi
516     off=${result[0]}
517     prep_write
518     size=$((16 * 2**20)) # 20 MB
519     require_conv_zone_bytes "${size}" || return $SKIP_TESTCASE
520
521     run_one_fio_job "$(ioengine "libaio")" --iodepth=64 --rw=randwrite --bs=16K \
522                     --zonemode=zbd --zonesize="${zone_size}" --do_verify=1 \
523                     --verify=md5 --offset=$off --size=$size\
524                     >>"${logfile}.${test_number}" 2>&1 || return $?
525     check_written $((size)) || return $?
526     check_read $((size)) || return $?
527 }
528
529 # Sequential read on a mix of empty and full zones.
530 test15() {
531     local i off size bs
532     local w_off w_size w_capacity
533
534     for ((i=0;i<4;i++)); do
535         [ -n "$is_zbd" ] &&
536             reset_zone "$dev" $((first_sequential_zone_sector +
537                                  i*sectors_per_zone))
538     done
539     prep_write
540     w_off=$(((first_sequential_zone_sector + 2 * sectors_per_zone) * 512))
541     w_size=$((2 * zone_size))
542     w_capacity=$(total_zone_capacity 2 $w_off $dev)
543     off=$((first_sequential_zone_sector * 512))
544     size=$((4 * zone_size))
545     bs=$(min $((zone_size / 16)) "$zone_cap_bs")
546     write_and_run_one_fio_job "${w_off}" "${w_size}" \
547                     "$(ioengine "psync")" --rw=read --bs="$bs" \
548                     --zonemode=zbd --zonesize="${zone_size}" --offset=$off \
549                     --size=$((size)) >>"${logfile}.${test_number}" 2>&1 ||
550         return $?
551     check_written $((w_capacity)) || return $?
552     check_read $((w_capacity))
553 }
554
555 # Random read on a mix of empty and full zones.
556 test16() {
557     local off size
558     local i w_off w_size w_capacity
559
560     for ((i=0;i<4;i++)); do
561         [ -n "$is_zbd" ] &&
562             reset_zone "$dev" $((first_sequential_zone_sector +
563                                  i*sectors_per_zone))
564     done
565     prep_write
566     w_off=$(((first_sequential_zone_sector + 2 * sectors_per_zone) * 512))
567     w_size=$((2 * zone_size))
568     w_capacity=$(total_zone_capacity 2 $w_off $dev)
569     off=$((first_sequential_zone_sector * 512))
570     size=$((4 * zone_size))
571     write_and_run_one_fio_job "${w_off}" "${w_size}" \
572                     "$(ioengine "libaio")" --iodepth=64 --rw=randread --bs=16K \
573                     --zonemode=zbd --zonesize="${zone_size}" --offset=$off \
574                     --size=$size >>"${logfile}.${test_number}" 2>&1 || return $?
575     check_written $w_capacity || return $?
576     check_read $size || return $?
577 }
578
579 # Random reads and writes in the last zone.
580 test17() {
581     local io off last read size written
582
583     off=$(((disk_size / zone_size - 1) * zone_size))
584     size=$((disk_size - off))
585     if ! last=($(last_online_zone "$dev")); then
586         echo "Failed to determine last online zone"
587         exit 1
588     fi
589     if [[ "$((last * 512))" -lt "$off" ]]; then
590         off=$((last * 512))
591         size=$zone_size
592     fi
593     if [ -n "$is_zbd" ]; then
594         reset_zone "$dev" $((off / 512)) || return $?
595     fi
596     prep_write
597     run_one_fio_job "$(ioengine "libaio")" --iodepth=8 --rw=randrw --bs=4K \
598                     --zonemode=zbd --zonesize="${zone_size}"            \
599                     --offset=$off --loops=2 --norandommap=1 \
600                     --size="$size"\
601                     >>"${logfile}.${test_number}" 2>&1 || return $?
602     written=$(fio_written <"${logfile}.${test_number}")
603     read=$(fio_read <"${logfile}.${test_number}")
604     io=$((written + read))
605     echo "Total number of bytes read and written: $io <> $size" \
606          >>"${logfile}.${test_number}"
607     [ $io = $((size * 2)) ];
608 }
609
610 # Out-of-range zone reset threshold and frequency parameters.
611 test18() {
612     run_fio_on_seq --zone_reset_threshold=-1 |&
613         tee -a "${logfile}.${test_number}"   |
614             grep -q 'value out of range' || return $?
615 }
616
617 test19() {
618     run_fio_on_seq --zone_reset_threshold=2  |&
619         tee -a "${logfile}.${test_number}"   |
620         grep -q 'value out of range' || return $?
621 }
622
623 test20() {
624     run_fio_on_seq --zone_reset_threshold=.4:.6 |&
625         tee -a "${logfile}.${test_number}"   |
626         grep -q 'the list exceeding max length' || return $?
627 }
628
629 test21() {
630     run_fio_on_seq --zone_reset_frequency=-1 |&
631         tee -a "${logfile}.${test_number}"   |
632         grep -q 'value out of range' || return $?
633 }
634
635 test22() {
636     run_fio_on_seq --zone_reset_frequency=2  |&
637         tee -a "${logfile}.${test_number}"   |
638         grep -q 'value out of range' || return $?
639 }
640
641 test23() {
642     run_fio_on_seq --zone_reset_frequency=.4:.6  |&
643         tee -a "${logfile}.${test_number}"   |
644         grep -q 'the list exceeding max length' || return $?
645 }
646
647 test24() {
648     local bs loops=9 size=$((zone_size))
649     local off capacity
650
651     prep_write
652     off=$((first_sequential_zone_sector * 512))
653     capacity=$(total_zone_capacity 1 $off $dev)
654
655     bs=$(min $((256*1024)) "$zone_size")
656     run_fio_on_seq "$(ioengine "psync")" --rw=write --bs="$bs"          \
657                    --size=$size --loops=$loops                          \
658                    --zone_reset_frequency=.01 --zone_reset_threshold=.90 \
659                    >> "${logfile}.${test_number}" 2>&1 || return $?
660     check_written $((capacity * loops)) || return $?
661     check_reset_count -eq 8 ||
662         check_reset_count -eq 9 ||
663         check_reset_count -eq 10 || return $?
664 }
665
666 # Multiple non-overlapping sequential write jobs for the same drive.
667 test25() {
668     local i opts=()
669
670     for ((i=0;i<16;i++)); do
671         [ -n "$is_zbd" ] &&
672             reset_zone "$dev" $((first_sequential_zone_sector + i*sectors_per_zone))
673     done
674     prep_write
675     for ((i=0;i<16;i++)); do
676         opts+=("--name=job$i" "--filename=$dev" "--thread=1" "--direct=1")
677         opts+=("--offset=$((first_sequential_zone_sector*512 + zone_size*i))")
678         opts+=("--size=$zone_size" "$(ioengine "psync")" "--rw=write" "--bs=16K")
679         opts+=("--zonemode=zbd" "--zonesize=${zone_size}" "--group_reporting=1")
680         opts+=(${job_var_opts[@]})
681     done
682     run_fio "${opts[@]}" >> "${logfile}.${test_number}" 2>&1 || return $?
683 }
684
685 write_to_first_seq_zone() {
686     local loops=4 r
687     local off capacity
688
689     prep_write
690     off=$((first_sequential_zone_sector * 512))
691     capacity=$(total_zone_capacity 1 $off $dev)
692
693     r=$(((RANDOM << 16) | RANDOM))
694     run_fio --name="$dev" --filename="$dev" "$(ioengine "psync")" --rw="$1" \
695             --thread=1 --do_verify=1 --verify=md5 --direct=1 --bs=4K    \
696             --offset=$off                                               \
697             --size=$zone_size --loops=$loops --randseed="$r"            \
698             --zonemode=zbd --zonesize="${zone_size}" --group_reporting=1        \
699             --gtod_reduce=1 >> "${logfile}.${test_number}" 2>&1 || return $?
700     check_written $((loops * capacity)) || return $?
701 }
702
703 # Overwrite the first sequential zone four times sequentially.
704 test26() {
705     write_to_first_seq_zone write
706 }
707
708 # Overwrite the first sequential zone four times using random writes.
709 test27() {
710     write_to_first_seq_zone randwrite
711 }
712
713 # Multiple overlapping random write jobs for the same drive.
714 test28() {
715     local i jobs=16 off opts
716
717     require_seq_zones 65 || return $SKIP_TESTCASE
718     off=$((first_sequential_zone_sector * 512 + 64 * zone_size))
719     [ -n "$is_zbd" ] && reset_zone "$dev" $((off / 512))
720     prep_write
721     opts=("--debug=zbd")
722     capacity=$(total_zone_capacity 1 $off $dev)
723     for ((i=0;i<jobs;i++)); do
724         opts+=("--name=job$i" "--filename=$dev" "--offset=$off" "--bs=16K")
725         opts+=("--size=$zone_size" "--io_size=$capacity" "$(ioengine "psync")" "--rw=randwrite")
726         opts+=("--thread=1" "--direct=1" "--zonemode=zbd")
727         opts+=("--zonesize=${zone_size}" "--group_reporting=1")
728         opts+=(${job_var_opts[@]})
729     done
730     run_fio "${opts[@]}" >> "${logfile}.${test_number}" 2>&1 || return $?
731     check_written $((jobs * $capacity)) || return $?
732     check_reset_count -eq $jobs ||
733         check_reset_count -eq $((jobs - 1)) ||
734         return $?
735 }
736
737 # Multiple overlapping random write jobs for the same drive and with a limited
738 # number of open zones.
739 test29() {
740     local i jobs=16 off opts=()
741
742     require_seq_zones 80 || return $SKIP_TESTCASE
743     off=$((first_sequential_zone_sector * 512 + 64 * zone_size))
744     size=$((16*zone_size))
745
746     [ -n "$is_zbd" ] && reset_zone "$dev" -1
747
748     opts=("--debug=zbd")
749     for ((i=0;i<jobs;i++)); do
750         opts+=("--name=job$i" "--filename=$dev" "--offset=$off" "--bs=16K")
751         opts+=("--size=$size" "--io_size=$zone_size" "--thread=1")
752         opts+=("$(ioengine "psync")" "--rw=randwrite" "--direct=1")
753         opts+=("--max_open_zones=4" "--group_reporting=1")
754         opts+=("--zonemode=zbd" "--zonesize=${zone_size}")
755         # max_open_zones is already specified
756         opts+=($(job_var_opts_exclude "--max_open_zones"))
757     done
758     run_fio "${opts[@]}" >> "${logfile}.${test_number}" 2>&1 || return $?
759     check_written $((jobs * zone_size)) || return $?
760 }
761
762 # Random reads and writes across the entire disk for 30s.
763 test30() {
764     local off
765
766     prep_write
767     off=$((first_sequential_zone_sector * 512))
768     run_one_fio_job "$(ioengine "libaio")" --iodepth=8 --rw=randrw      \
769                     --bs="$(max $((zone_size / 128)) "$min_seq_write_size")"\
770                     --zonemode=zbd --zonesize="${zone_size}" --offset=$off\
771                     --loops=2 --time_based --runtime=30s --norandommap=1\
772                     >>"${logfile}.${test_number}" 2>&1
773 }
774
775 # Random reads across all sequential zones for 30s. This is not only a fio
776 # test but also allows to verify the performance of a drive.
777 test31() {
778     local bs inc nz off opts size
779
780     [ -n "$is_zbd" ] && reset_zone "$dev" -1
781
782     # As preparation, write 128 KB to sequential write required zones. Limit
783     # write target zones up to max_open_zones to keep test time reasonable.
784     # To distribute the write target zones evenly, skip certain zones for every
785     # write. Utilize zonemode strided for such write patterns.
786     bs=$((128 * 1024))
787     nz=$((max_open_zones))
788     if [[ $nz -eq 0 ]]; then
789         nz=128
790     fi
791     off=$((first_sequential_zone_sector * 512))
792     size=$((disk_size - off))
793     inc=$(((size / nz / zone_size) * zone_size))
794     opts=("--name=$dev" "--filename=$dev" "--rw=write" "--bs=${bs}")
795     opts+=("--offset=$off" "--size=$((inc * nz))" "--io_size=$((bs * nz))")
796     opts+=("--zonemode=strided" "--zonesize=${bs}" "--zonerange=${inc}")
797     opts+=("--direct=1")
798     echo "fio ${opts[@]}" >> "${logfile}.${test_number}"
799     "$(dirname "$0")/../../fio" "${opts[@]}" >> "${logfile}.${test_number}" 2>&1
800
801     # Next, run the test.
802     opts=("--name=$dev" "--filename=$dev" "--offset=$off" "--size=$size")
803     opts+=("--bs=$bs" "$(ioengine "psync")" "--rw=randread" "--direct=1")
804     opts+=("--thread=1" "--time_based" "--runtime=30" "--zonemode=zbd")
805     opts+=("--zonesize=${zone_size}")
806     opts+=(${job_var_opts[@]})
807     run_fio "${opts[@]}" >> "${logfile}.${test_number}" 2>&1 || return $?
808 }
809
810 # Random writes across all sequential zones. This is not only a fio test but
811 # also allows to verify the performance of a drive.
812 test32() {
813     local off opts=() size
814
815     require_zbd || return $SKIP_TESTCASE
816
817     [ -n "$is_zbd" ] && reset_zone "$dev" -1
818
819     off=$((first_sequential_zone_sector * 512))
820     size=$((disk_size - off))
821     opts+=("--name=$dev" "--filename=$dev" "--offset=$off" "--size=$size")
822     opts+=("--bs=128K" "$(ioengine "psync")" "--rw=randwrite" "--direct=1")
823     opts+=("--thread=1" "--time_based" "--runtime=30")
824     opts+=("--max_open_zones=$max_open_zones" "--zonemode=zbd")
825     opts+=("--zonesize=${zone_size}")
826     run_fio "${opts[@]}" >> "${logfile}.${test_number}" 2>&1 || return $?
827 }
828
829 # Write to sequential zones with a block size that is not a divisor of the
830 # zone size.
831 test33() {
832     local bs io_size size
833     local off capacity=0;
834
835     [ -n "$is_zbd" ] && reset_zone "$dev" -1
836
837     off=$((first_sequential_zone_sector * 512))
838     capacity=$(total_zone_capacity 1 $off $dev)
839     size=$((2 * zone_size))
840     io_size=$((5 * capacity))
841     bs=$((3 * capacity / 4))
842     run_fio_on_seq "$(ioengine "psync")" --iodepth=1 --rw=write \
843                    --size=$size --io_size=$io_size --bs=$bs     \
844                    >> "${logfile}.${test_number}" 2>&1 || return $?
845     check_written $((io_size / bs * bs)) || return $?
846 }
847
848 # Test repeated async write job with verify using two unaligned block sizes.
849 test34() {
850         local bs off zone_capacity
851         local -a block_sizes
852
853         require_zbd || return $SKIP_TESTCASE
854         prep_write
855
856         off=$((first_sequential_zone_sector * 512))
857         zone_capacity=$(total_zone_capacity 1 $off $dev)
858         block_sizes=($((4096 * 7)) $(($(min ${zone_capacity} 4194304) - 4096)))
859
860         for bs in ${block_sizes[@]}; do
861                 run_fio --name=job --filename="${dev}" --rw=randwrite \
862                         --bs="${bs}" --offset="${off}" \
863                         --size=$((4 * zone_size)) --iodepth=256 \
864                         "$(ioengine "libaio")" --time_based=1 --runtime=15s \
865                         --zonemode=zbd --direct=1 --zonesize="${zone_size}" \
866                         --verify=crc32c --do_verify=1 ${job_var_opts[@]} \
867                         >> "${logfile}.${test_number}" 2>&1 || return $?
868         done
869 }
870
871 # Test 1/4 for the I/O boundary rounding code: $size < $zone_size.
872 test35() {
873     local bs off io_size size
874
875     prep_write
876     off=$(((first_sequential_zone_sector + 1) * 512))
877     size=$((zone_size - 2 * 512))
878     bs=$((zone_size / 4))
879     run_one_fio_job --offset=$off --size=$size "$(ioengine "psync")"    \
880                     --iodepth=1 --rw=write --do_verify=1 --verify=md5   \
881                     --bs=$bs --zonemode=zbd --zonesize="${zone_size}"   \
882                     >> "${logfile}.${test_number}" 2>&1 && return 1
883     grep -q 'io_size must be at least one zone' "${logfile}.${test_number}"
884 }
885
886 # Test 2/4 for the I/O boundary rounding code: $size < $zone_size.
887 test36() {
888     local bs off io_size size
889
890     prep_write
891     off=$(((first_sequential_zone_sector) * 512))
892     size=$((zone_size - 512))
893     bs=$((zone_size / 4))
894     run_one_fio_job --offset=$off --size=$size "$(ioengine "psync")"    \
895                     --iodepth=1 --rw=write --do_verify=1 --verify=md5   \
896                     --bs=$bs --zonemode=zbd --zonesize="${zone_size}"   \
897                     >> "${logfile}.${test_number}" 2>&1 && return 1
898     grep -q 'io_size must be at least one zone' "${logfile}.${test_number}"
899 }
900
901 # Test 3/4 for the I/O boundary rounding code: $size > $zone_size.
902 test37() {
903     local bs off size capacity
904
905     prep_write
906     capacity=$(total_zone_capacity 1 $((first_sequential_zone_sector*512)) $dev)
907     if [ "$first_sequential_zone_sector" = 0 ]; then
908         off=0
909     else
910         off=$(((first_sequential_zone_sector - 1) * 512))
911     fi
912     size=$((zone_size + 2 * 512))
913     bs=$(min $((zone_size / 4)) "$zone_cap_bs")
914     run_one_fio_job --offset=$off --size=$size "$(ioengine "psync")"    \
915                     --iodepth=1 --rw=write --do_verify=1 --verify=md5   \
916                     --bs=$bs --zonemode=zbd --zonesize="${zone_size}"   \
917                     >> "${logfile}.${test_number}" 2>&1
918     check_written $capacity || return $?
919 }
920
921 # Test 4/4 for the I/O boundary rounding code: $offset > $disk_size - $zone_size
922 test38() {
923     local bs off size
924
925     prep_write
926     size=$((min_seq_write_size))
927     off=$((disk_size - min_seq_write_size))
928     bs=$((min_seq_write_size))
929     run_one_fio_job --offset=$off --size=$size "$(ioengine "psync")"    \
930                     --iodepth=1 --rw=write --do_verify=1 --verify=md5   \
931                     --bs=$bs --zonemode=zbd --zonesize="${zone_size}"   \
932                     >> "${logfile}.${test_number}" 2>&1 && return 1
933     grep -q 'io_size must be at least one zone' "${logfile}.${test_number}"
934 }
935
936 # Read one block from a block device.
937 read_one_block() {
938     local off
939     local bs
940
941     if ! result=($(first_online_zone "$dev")); then
942         echo "Failed to determine first online zone"
943         exit 1
944     fi
945     off=${result[0]}
946     bs=$((min_seq_write_size))
947     run_one_fio_job --rw=read "$(ioengine "psync")" --offset=$off --bs=$bs \
948                     --size=$bs "$@" 2>&1 |
949         tee -a "${logfile}.${test_number}"
950 }
951
952 # Check whether fio accepts --zonemode=none for zoned block devices.
953 test39() {
954     require_zbd || return $SKIP_TESTCASE
955     read_one_block --zonemode=none >/dev/null || return $?
956     check_read $((min_seq_write_size)) || return $?
957 }
958
959 # Check whether fio accepts --zonemode=strided for zoned block devices.
960 test40() {
961     local bs
962
963     bs=$((min_seq_write_size))
964     require_zbd || return $SKIP_TESTCASE
965     read_one_block --zonemode=strided |
966         grep -q 'fio: --zonesize must be specified when using --zonemode=strided' ||
967         return $?
968     read_one_block --zonemode=strided --zonesize=$bs >/dev/null || return $?
969     check_read $bs || return $?
970 }
971
972 # Check whether fio checks the zone size for zoned block devices.
973 test41() {
974     require_zbd || return $SKIP_TESTCASE
975     read_one_block --zonemode=zbd --zonesize=$((2 * zone_size)) |
976         grep -q 'job parameter zonesize.*does not match disk zone size'
977 }
978
979 # Check whether fio handles --zonesize=0 correctly for regular block devices.
980 test42() {
981     require_regular_block_dev || return $SKIP_TESTCASE
982     read_one_block --zonemode=zbd --zonesize=0 |
983         grep -q 'Specifying the zone size is mandatory for regular file/block device with --zonemode=zbd'
984 }
985
986 # Check whether fio handles --zonesize=1 correctly for regular block devices.
987 test43() {
988     require_regular_block_dev || return $SKIP_TESTCASE
989     read_one_block --zonemode=zbd --zonesize=1 |
990         grep -q 'zone size must be at least 512 bytes for --zonemode=zbd'
991 }
992
993 # Check whether fio handles --zonemode=none --zonesize=1 correctly.
994 test44() {
995     read_one_block --zonemode=none --zonesize=1 |
996         grep -q 'fio: --zonemode=none and --zonesize are not compatible'
997 }
998
999 test45() {
1000     local bs i
1001
1002     require_zbd || return $SKIP_TESTCASE
1003     prep_write
1004     bs=$((min_seq_write_size))
1005     run_one_fio_job "$(ioengine "psync")" --iodepth=1 --rw=randwrite --bs=$bs\
1006                     --offset=$((first_sequential_zone_sector * 512)) \
1007                     --size="$zone_size" --do_verify=1 --verify=md5 2>&1 |
1008         tee -a "${logfile}.${test_number}" |
1009         grep -q "fio: first I/O failed. If .* is a zoned block device, consider --zonemode=zbd"
1010 }
1011
1012 # Random write to sequential zones, libaio, 8 jobs, queue depth 64 per job
1013 test46() {
1014     local size
1015
1016     prep_write
1017     size=$((4 * zone_size))
1018     run_fio_on_seq "$(ioengine "libaio")" --iodepth=64 --rw=randwrite --bs=4K \
1019                    --group_reporting=1 --numjobs=8 \
1020                    >> "${logfile}.${test_number}" 2>&1 || return $?
1021     check_written $((size * 8)) || return $?
1022 }
1023
1024 # Check whether fio handles --zonemode=zbd --zoneskip=1 correctly.
1025 test47() {
1026     local bs
1027
1028     prep_write
1029     bs=$((min_seq_write_size))
1030     run_fio_on_seq "$(ioengine "psync")" --rw=write --bs=$bs --zoneskip=1 \
1031                     >> "${logfile}.${test_number}" 2>&1 && return 1
1032     grep -q 'zoneskip 1 is not a multiple of the device zone size' "${logfile}.${test_number}"
1033 }
1034
1035 # Multiple overlapping random write jobs for the same drive and with a
1036 # limited number of open zones. This is similar to test29, but uses libaio
1037 # to stress test zone locking.
1038 test48() {
1039     local i jobs=16 off opts=()
1040
1041     require_zbd || return $SKIP_TESTCASE
1042     require_seq_zones 80 || return $SKIP_TESTCASE
1043
1044     off=$((first_sequential_zone_sector * 512 + 64 * zone_size))
1045     size=$((16*zone_size))
1046
1047     [ -n "$is_zbd" ] && reset_zone "$dev" -1
1048
1049     opts=("--aux-path=/tmp" "--allow_file_create=0" "--significant_figures=10")
1050     opts+=("--debug=zbd")
1051     opts+=("$(ioengine "libaio")" "--rw=randwrite" "--direct=1")
1052     opts+=("--time_based" "--runtime=30")
1053     opts+=("--zonemode=zbd" "--zonesize=${zone_size}")
1054     opts+=("--max_open_zones=4")
1055     for ((i=0;i<jobs;i++)); do
1056         opts+=("--name=job$i" "--filename=$dev" "--offset=$off" "--bs=16K")
1057         opts+=("--io_size=$zone_size" "--iodepth=256" "--thread=1")
1058         opts+=("--size=$size" "--group_reporting=1")
1059         # max_open_zones is already specified
1060         opts+=($(job_var_opts_exclude "--max_open_zones"))
1061     done
1062
1063     fio=$(dirname "$0")/../../fio
1064
1065     { echo; echo "fio ${opts[*]}"; echo; } >>"${logfile}.${test_number}"
1066
1067     timeout -v -s KILL 180s \
1068             "${dynamic_analyzer[@]}" "$fio" "${opts[@]}" \
1069             >> "${logfile}.${test_number}" 2>&1 || return $?
1070 }
1071
1072 # Check if fio handles --zonecapacity on a normal block device correctly
1073 test49() {
1074
1075     require_regular_block_dev || return $SKIP_TESTCASE
1076
1077     size=$((2 * zone_size))
1078     capacity=$((zone_size * 3 / 4))
1079
1080     run_one_fio_job "$(ioengine "psync")" --rw=write \
1081                     --zonemode=zbd --zonesize="${zone_size}" \
1082                     --zonecapacity=${capacity} \
1083                     --verify=md5  --size=${size} >>"${logfile}.${test_number}" 2>&1 ||
1084         return $?
1085     check_written $((capacity * 2)) || return $?
1086     check_read $((capacity * 2)) || return $?
1087 }
1088
1089 # Verify that conv zones are not locked and only seq zones are locked during
1090 # random read on conv-seq mixed zones.
1091 test50() {
1092         local off
1093
1094         require_zbd || return $SKIP_TESTCASE
1095         require_conv_zones 8 || return $SKIP_TESTCASE
1096         require_seq_zones 8 || return $SKIP_TESTCASE
1097
1098         reset_zone "${dev}" -1
1099
1100         off=$((first_sequential_zone_sector * 512 - 8 * zone_size))
1101         run_fio --name=job --filename=${dev} --offset=${off} --bs=64K \
1102                 --size=$((16 * zone_size)) "$(ioengine "libaio")" --rw=randread\
1103                 --time_based --runtime=3 --zonemode=zbd --zonesize=${zone_size}\
1104                 --direct=1 --group_reporting=1 ${job_var_opts[@]} \
1105                 >> "${logfile}.${test_number}" 2>&1 || return $?
1106 }
1107
1108 # Verify that conv zones are neither locked nor opened during random write on
1109 # conv-seq mixed zones. Zone lock and zone open shall happen only on seq zones.
1110 test51() {
1111         local off jobs=16
1112         local -a opts
1113
1114         require_zbd || return $SKIP_TESTCASE
1115         require_conv_zones 8 || return $SKIP_TESTCASE
1116         require_seq_zones 8 || return $SKIP_TESTCASE
1117
1118         reset_zone "$dev" -1
1119
1120         off=$((first_sequential_zone_sector * 512 - 8 * zone_size))
1121         opts+=("--size=$((16 * zone_size))" "$(ioengine "libaio")")
1122         opts+=("--zonemode=zbd" "--direct=1" "--zonesize=${zone_size}")
1123         opts+=("--max_open_zones=2" "--offset=$off")
1124         opts+=("--thread=1" "--group_reporting=1")
1125         opts+=("--time_based" "--runtime=30" "--rw=randwrite")
1126         for ((i=0;i<jobs;i++)); do
1127                 opts+=("--name=job${i}" "--filename=$dev")
1128                 opts+=("--bs=$(((i+1)*16))K")
1129                 opts+=($(job_var_opts_exclude "--max_open_zones"))
1130         done
1131         run_fio "${opts[@]}" >> "${logfile}.${test_number}" 2>&1 || return $?
1132 }
1133
1134 # Verify that zone_reset_threshold only accounts written bytes in seq
1135 # zones, and written data bytes of conv zones are not counted.
1136 test52() {
1137         local off io_size
1138
1139         require_zbd || return $SKIP_TESTCASE
1140         require_conv_zones 8 || return $SKIP_TESTCASE
1141         require_seq_zones 8 || return $SKIP_TESTCASE
1142
1143         reset_zone "${dev}" -1
1144
1145         # Total I/O size is 1/8 = 0.125 of the I/O range of cont + seq zones.
1146         # Set zone_reset_threshold as 0.1. The threshold size is less than
1147         # 0.125, then, reset count zero is expected.
1148         # On the other hand, half of the I/O range is covered by conv zones.
1149         # If fio would count the conv zones for zone_reset_threshold, the ratio
1150         # were more than 0.5 and would trigger zone resets.
1151
1152         off=$((first_sequential_zone_sector * 512 - 8 * zone_size))
1153         io_size=$((zone_size * 16 / 8))
1154         run_fio --name=job --filename=$dev --rw=randwrite --bs=$((zone_size/16))\
1155                 --size=$((zone_size * 16)) --softrandommap=1 \
1156                 --io_size=$((io_size)) "$(ioengine "psync")" --offset=$off \
1157                 --zonemode=zbd --direct=1 --zonesize=${zone_size} \
1158                 --zone_reset_threshold=.1 --zone_reset_frequency=1.0 \
1159                 ${job_var_opts[@]} --debug=zbd \
1160                 >> "${logfile}.${test_number}" 2>&1 || return $?
1161
1162         check_written ${io_size} || return $?
1163         check_reset_count -eq 0 || return $?
1164 }
1165
1166 # Check both reads and writes are executed by random I/O to conventional zones.
1167 test53() {
1168         local off capacity io read_b=0 written_b=0
1169
1170         require_zbd || return $SKIP_TESTCASE
1171         require_conv_zones 4 || return $SKIP_TESTCASE
1172
1173         off=$((first_sequential_zone_sector * 512 - 4 * zone_size))
1174         capacity=$(total_zone_capacity 4 $off $dev)
1175         run_fio --name=job --filename=${dev} --rw=randrw --bs=64K \
1176                 --size=$((4 * zone_size)) "$(ioengine "psync")" --offset=${off}\
1177                 --zonemode=zbd --direct=1 --zonesize=${zone_size} \
1178                 ${job_var_opts[@]} \
1179                 >> "${logfile}.${test_number}" 2>&1 || return $?
1180
1181         written_b=$(fio_written <"${logfile}.${test_number}")
1182         read_b=$(fio_read <"${logfile}.${test_number}")
1183         io=$((written_b + read_b))
1184         echo "Number of bytes read: $read_b" >>"${logfile}.${test_number}"
1185         echo "Number of bytes written: $written_b" >>"${logfile}.${test_number}"
1186         echo "Total number of bytes read and written: $io <> $capacity" \
1187              >>"${logfile}.${test_number}"
1188         if ((io==capacity && written_b != 0 && read_b != 0)); then
1189                 return 0
1190         fi
1191         return 1
1192 }
1193
1194 # Test read/write mix with verify.
1195 test54() {
1196         require_zbd || return $SKIP_TESTCASE
1197         require_seq_zones 8 || return $SKIP_TESTCASE
1198
1199         run_fio --name=job --filename=${dev} "$(ioengine "libaio")" \
1200                 --time_based=1 --runtime=30s --continue_on_error=0 \
1201                 --offset=$((first_sequential_zone_sector * 512)) \
1202                 --size=$((8*zone_size)) --direct=1 --iodepth=1 \
1203                 --rw=randrw:2 --rwmixwrite=25 --bsrange=4k-${zone_size} \
1204                 --zonemode=zbd --zonesize=${zone_size} \
1205                 --verify=crc32c --do_verify=1 --verify_backlog=2 \
1206                 --alloc-size=65536 --random_generator=tausworthe64 \
1207                 ${job_var_opts[@]} --debug=zbd \
1208                 >> "${logfile}.${test_number}" 2>&1 || return $?
1209 }
1210
1211 # test 'z' suffix parsing only
1212 test55() {
1213         local bs
1214         bs=$((min_seq_write_size))
1215
1216         require_zbd || return $SKIP_TESTCASE
1217         # offset=1z + offset_increment=10z + size=2z
1218         require_seq_zones 13 || return $SKIP_TESTCASE
1219
1220         run_fio --name=j                \
1221                 --filename=${dev}       \
1222                 --direct=1              \
1223                 "$(ioengine "psync")"   \
1224                 --zonemode=zbd          \
1225                 --zonesize=${zone_size} \
1226                 --rw=write              \
1227                 --bs=${bs}              \
1228                 --numjobs=2             \
1229                 --offset_increment=10z  \
1230                 --offset=1z             \
1231                 --size=2z               \
1232                 --io_size=3z            \
1233                 ${job_var_opts[@]} --debug=zbd \
1234                 >> "${logfile}.${test_number}" 2>&1 || return $?
1235 }
1236
1237 # test 'z' suffix parsing only
1238 test56() {
1239         local bs
1240         bs=$((min_seq_write_size))
1241
1242         require_regular_block_dev || return $SKIP_TESTCASE
1243         require_seq_zones 10 || return $SKIP_TESTCASE
1244
1245         run_fio --name=j                \
1246                 --filename=${dev}       \
1247                 --direct=1              \
1248                 "$(ioengine "psync")"   \
1249                 --zonemode=strided      \
1250                 --zonesize=${zone_size} \
1251                 --rw=write              \
1252                 --bs=${bs}              \
1253                 --size=10z              \
1254                 --zoneskip=2z           \
1255                 ${job_var_opts[@]} --debug=zbd \
1256                 >> "${logfile}.${test_number}" 2>&1 || return $?
1257 }
1258
1259 # Test that repeated async write job does not cause zone reset during writes
1260 # in-flight, when the block size is not a divisor of the zone size.
1261 test57() {
1262         local bs off
1263
1264         require_zbd || return $SKIP_TESTCASE
1265
1266         bs=$((4096 * 7))
1267         off=$((first_sequential_zone_sector * 512))
1268
1269         run_fio --name=job --filename="${dev}" --rw=randwrite --bs="${bs}" \
1270                 --offset="${off}" --size=$((4 * zone_size)) --iodepth=256 \
1271                 "$(ioengine "libaio")" --time_based=1 --runtime=30s \
1272                 --zonemode=zbd --direct=1 --zonesize="${zone_size}" \
1273                 ${job_var_opts[@]} \
1274                 >> "${logfile}.${test_number}" 2>&1 || return $?
1275 }
1276
1277 # Random writes and random trims to sequential write required zones for 30s.
1278 test58() {
1279     local off size bs
1280
1281     require_seq_zones 128 || return $SKIP_TESTCASE
1282
1283     size=$((zone_size * 128))
1284     bs="$(max $((zone_size / 128)) "$min_seq_write_size")"
1285     prep_write
1286     off=$((first_sequential_zone_sector * 512))
1287     run_fio --zonemode=zbd --direct=1 --zonesize="${zone_size}" --thread=1 \
1288             --filename="${dev}" --norandommap=1 \
1289             --name="precondition"  --rw=write "$(ioengine "psync")" \
1290             --offset="${off}" --size=$((zone_size * 16)) --bs="${bs}" \
1291             "${job_var_opts[@]}" \
1292             --name=wjob --wait_for="precondition" --rw=randwrite \
1293             "$(ioengine "libaio")" --iodepth=8 \
1294             --offset="${off}" --size="${size}" --bs="${bs}" \
1295             --time_based --runtime=30s --flow=128 "${job_var_opts[@]}" \
1296             --name=trimjob --wait_for="precondition" --rw=randtrim \
1297             "$(ioengine "psync")" \
1298             --offset="${off}" --size="${size}" --bs="${zone_size}" \
1299             --time_based --runtime=30s --flow=1 "${job_var_opts[@]}" \
1300             >>"${logfile}.${test_number}" 2>&1
1301 }
1302
1303 # Test zone_reset_threshold with verify.
1304 test59() {
1305         local off bs loops=2 size=$((zone_size)) w
1306         local -a workloads=(write randwrite rw randrw)
1307
1308         prep_write
1309         off=$((first_sequential_zone_sector * 512))
1310
1311         bs=$(min $((256*1024)) "$zone_size")
1312         for w in "${workloads[@]}"; do
1313                 run_fio_on_seq "$(ioengine "psync")" --rw=${w} --bs="$bs" \
1314                                --size=$size --loops=$loops --do_verify=1 \
1315                                --verify=md5 --zone_reset_frequency=.9 \
1316                                --zone_reset_threshold=.1 \
1317                                >> "${logfile}.${test_number}" 2>&1 || return $?
1318         done
1319 }
1320
1321 # Test fio errors out experimental_verify option with zonemode=zbd.
1322 test60() {
1323         run_fio_on_seq "$(ioengine "psync")" --rw=write --size=$zone_size \
1324                        --do_verify=1 --verify=md5 --experimental_verify=1 \
1325                        >> "${logfile}.${test_number}" 2>&1 && return 1
1326         grep -q 'not support experimental verify' "${logfile}.${test_number}"
1327 }
1328
1329 # Test fio errors out zone_reset_threshold option for multiple jobs with
1330 # different write ranges.
1331 test61() {
1332         run_fio_on_seq "$(ioengine "psync")" --rw=write --size="$zone_size" \
1333                        --numjobs=2 --offset_increment="$zone_size" \
1334                        --zone_reset_threshold=0.1 --zone_reset_frequency=1 \
1335                        --exitall_on_error=1 \
1336                        >> "${logfile}.${test_number}" 2>&1 && return 1
1337         grep -q 'different write ranges' "${logfile}.${test_number}"
1338 }
1339
1340 # Test zone_reset_threshold option works for multiple jobs with same write
1341 # range.
1342 test62() {
1343         local bs loops=2 size=$((zone_size))
1344
1345         [ -n "$is_zbd" ] && reset_zone "$dev" -1
1346
1347         # Two jobs write to single zone twice. Reset zone happens at next write
1348         # after half of the zone gets filled. So 2 * 2 * 2 - 1 = 7 times zone
1349         # resets are expected.
1350         bs=$(min $((256*1024)) $((zone_size / 4)))
1351         run_fio_on_seq "$(ioengine "psync")" --rw=write --bs="$bs" \
1352                        --size=$size --loops=$loops --numjobs=2 \
1353                        --zone_reset_frequency=1 --zone_reset_threshold=.5 \
1354                        --group_reporting=1 \
1355                        >> "${logfile}.${test_number}" 2>&1 || return $?
1356         check_written $((size * loops * 2)) || return $?
1357         check_reset_count -eq 7 || return $?
1358 }
1359
1360 # Test zone_reset_threshold option works for a read job and a write job with
1361 # different IO range.
1362 test63() {
1363         local bs loops=2 size=$((zone_size)) off1 off2
1364
1365         [ -n "$is_zbd" ] && reset_zone "$dev" -1
1366
1367         off1=$((first_sequential_zone_sector * 512))
1368         off2=$((off1 + zone_size))
1369         bs=$(min $((256*1024)) $((zone_size / 4)))
1370
1371         # One job writes to single zone twice. Reset zone happens at next write
1372         # after half of the zone gets filled. So 2 * 2 - 1 = 3 times zone resets
1373         # are expected.
1374         run_fio "$(ioengine "psync")" --bs="$bs" --size=$size --loops=$loops \
1375                 --filename="$dev" --group_reporting=1 \
1376                 --zonemode=zbd --zonesize="$zone_size" --direct=1 \
1377                 --zone_reset_frequency=1 --zone_reset_threshold=.5 \
1378                 --name=r --rw=read --offset=$off1 "${job_var_opts[@]}" \
1379                 --name=w --rw=write --offset=$off2 "${job_var_opts[@]}" \
1380                        >> "${logfile}.${test_number}" 2>&1 || return $?
1381         check_written $((size * loops)) || return $?
1382         check_reset_count -eq 3 || return $?
1383 }
1384
1385 # Test write zone accounting handles almost full zones correctly. Prepare an
1386 # almost full, but not full zone. Write to the zone with verify using larger
1387 # block size. Then confirm fio does not report write zone accounting failure.
1388 test64() {
1389         local bs cap
1390
1391         [ -n "$is_zbd" ] && reset_zone "$dev" -1
1392
1393         bs=$((zone_size / 8))
1394         cap=$(total_zone_capacity 1 $((first_sequential_zone_sector*512)) $dev)
1395         run_fio_on_seq "$(ioengine "psync")" --rw=write --bs="$bs" \
1396                        --size=$((zone_size)) \
1397                        --io_size=$((cap - bs)) \
1398                        >> "${logfile}.${test_number}" 2>&1 || return $?
1399
1400         bs=$((zone_size / 2))
1401         run_fio_on_seq "$(ioengine "psync")" --rw=write --bs="$bs" \
1402                        --size=$((zone_size)) --do_verify=1 --verify=md5 \
1403                        >> "${logfile}.${test_number}" 2>&1 || return $?
1404 }
1405
1406 # Test open zone accounting handles trim workload correctly. Prepare open zones
1407 # as many as max_open_zones=4. Trim one of the 4 zones. Then write to another
1408 # zone and check the write amount is expected size.
1409 test65() {
1410         local off capacity
1411
1412         [ -n "$is_zbd" ] && reset_zone "$dev" -1
1413
1414         off=$((first_sequential_zone_sector * 512))
1415         capacity=$(total_zone_capacity 1 $off "$dev")
1416         run_fio --zonemode=zbd --direct=1 --zonesize="$zone_size" --thread=1 \
1417                 --filename="$dev" --group_reporting=1 --max_open_zones=4 \
1418                 "$(ioengine "psync")" \
1419                 --name="prep_open_zones" --rw=randwrite --offset="$off" \
1420                 --size="$((zone_size * 4))" --bs=4096 --io_size="$zone_size" \
1421                 --name=trimjob --wait_for="prep_open_zones" --rw=trim \
1422                 --bs="$zone_size" --offset="$off" --size="$zone_size" \
1423                 --name=write --wait_for="trimjob" --rw=write --bs=4096 \
1424                 --offset="$((off + zone_size * 4))" --size="$zone_size" \
1425                 >> "${logfile}.${test_number}" 2>&1
1426
1427         check_written $((zone_size + capacity))
1428 }
1429
1430 # Test closed zones are handled as open zones. This test case requires zoned
1431 # block devices which has same max_open_zones and max_active_zones.
1432 test66() {
1433         local i off
1434
1435         require_zbd || return $SKIP_TESTCASE
1436         require_max_active_zones 2 || return $SKIP_TESTCASE
1437         require_max_open_zones "${max_active_zones}" || return $SKIP_TESTCASE
1438         require_seq_zones $((max_active_zones * 16)) || return $SKIP_TESTCASE
1439
1440         reset_zone "$dev" -1
1441
1442         # Prepare max_active_zones in closed condition.
1443         off=$((first_sequential_zone_sector * 512))
1444         run_fio --name=w --filename="$dev" --zonemod=zbd --direct=1 \
1445                 --offset=$((off)) --zonesize="${zone_size}" --rw=randwrite \
1446                 --bs=4096 --size="$((zone_size * max_active_zones))" \
1447                 --io_size="${zone_size}" "$(ioengine "psync")" \
1448                 >> "${logfile}.${test_number}" 2>&1 || return $?
1449         for ((i = 0; i < max_active_zones; i++)); do
1450                 close_zone "$dev" $((off / 512)) || return $?
1451                 off=$((off + zone_size))
1452         done
1453
1454         # Run random write to the closed zones and empty zones. This confirms
1455         # that fio handles closed zones as write target open zones. Otherwise,
1456         # fio writes to the empty zones and hit the max_active_zones limit.
1457         off=$((first_sequential_zone_sector * 512))
1458         run_one_fio_job --zonemod=zbd --direct=1 \
1459                        "$(ioengine "psync")" --rw=randwrite --bs=4096 \
1460                        --max_open_zones="$max_active_zones" --offset=$((off)) \
1461                        --size=$((max_active_zones * 16 * zone_size)) \
1462                        --io_size=$((zone_size)) --zonesize="${zone_size}" \
1463                        --time_based --runtime=5s \
1464                        >> "${logfile}.${test_number}" 2>&1
1465 }
1466
1467 # Test max_active_zones limit failure is reported with good error message.
1468 test67() {
1469         local i off
1470
1471         require_zbd || return $SKIP_TESTCASE
1472         require_max_active_zones 2 || return $SKIP_TESTCASE
1473         require_max_open_zones "${max_active_zones}" || return $SKIP_TESTCASE
1474         require_seq_zones $((max_active_zones + 1)) || return $SKIP_TESTCASE
1475
1476         reset_zone "$dev" -1
1477
1478         # Prepare max_active_zones in open condition.
1479         off=$((first_sequential_zone_sector * 512))
1480         run_fio --name=w --filename="$dev" --zonemod=zbd --direct=1 \
1481                 --offset=$((off)) --zonesize="${zone_size}" --rw=randwrite \
1482                 --bs=4096 --size="$((zone_size * max_active_zones))" \
1483                 --io_size="${zone_size}" "$(ioengine "psync")" \
1484                 >> "${logfile}.${test_number}" 2>&1 || return $?
1485
1486         # Write to antoher zone and trigger max_active_zones limit error.
1487         off=$((off + zone_size * max_active_zones))
1488         run_one_fio_job --zonemod=zbd --direct=1 "$(ioengine "psync")" \
1489                         --rw=write --bs=$min_seq_write_size --offset=$((off)) \
1490                         --size=$((zone_size)) --zonesize="${zone_size}" \
1491                         >> "${logfile}.${test_number}" 2>&1 && return $?
1492         grep -q 'Exceeded max_active_zones limit' "${logfile}.${test_number}"
1493 }
1494
1495 SECONDS=0
1496 tests=()
1497 dynamic_analyzer=()
1498 reset_all_zones=
1499 reset_before_write=
1500 use_libzbc=
1501 zbd_debug=
1502 max_open_zones_opt=
1503 quit_on_err=
1504 force_io_uring=
1505
1506 while [ "${1#-}" != "$1" ]; do
1507   case "$1" in
1508     -d) dynamic_analyzer=(valgrind "--read-var-info=yes" "--tool=drd"
1509                           "--show-confl-seg=no");
1510         shift;;
1511     -e) dynamic_analyzer=(valgrind "--read-var-info=yes" "--tool=helgrind");
1512         shift;;
1513     -l) use_libzbc=1; shift;;
1514     -r) reset_all_zones=1; shift;;
1515     -w) reset_before_write=1; shift;;
1516     -t) tests+=("$2"); shift; shift;;
1517     -o) max_open_zones_opt="${2}"; shift; shift;;
1518     -v) dynamic_analyzer=(valgrind "--read-var-info=yes");
1519         shift;;
1520     -q) quit_on_err=1; shift;;
1521     -z) zbd_debug=1; shift;;
1522     -u) force_io_uring=1; shift;;
1523     --) shift; break;;
1524      *) usage; exit 1;;
1525   esac
1526 done
1527
1528 if [ $# != 1 ]; then
1529     usage
1530     exit 1
1531 fi
1532
1533 if [ -n "$use_libzbc" -a -n "$force_io_uring" ]; then
1534     echo "Please specify only one of -l and -u options"
1535     exit 1
1536 fi
1537
1538 # shellcheck source=functions
1539 source "$(dirname "$0")/functions" || exit $?
1540
1541 global_var_opts=()
1542 job_var_opts=()
1543 if [ -n "$zbd_debug" ]; then
1544     global_var_opts+=("--debug=zbd")
1545 fi
1546 dev=$1
1547 realdev=$(readlink -f "$dev")
1548 basename=$(basename "$realdev")
1549
1550 if [[ -b "$realdev" ]]; then
1551         major=$((0x$(stat -L -c '%t' "$realdev"))) || exit $?
1552         minor=$((0x$(stat -L -c '%T' "$realdev"))) || exit $?
1553         disk_size=$(($(<"/sys/dev/block/$major:$minor/size")*512))
1554
1555         # When the target is a partition device, get basename of its
1556         # holder device to access sysfs path of the holder device
1557         if [[ -r "/sys/dev/block/$major:$minor/partition" ]]; then
1558                 realsysfs=$(readlink "/sys/dev/block/$major:$minor")
1559                 basename=$(basename "${realsysfs%/*}")
1560         fi
1561         min_seq_write_size=$(min_seq_write_size "$basename")
1562         case "$(<"/sys/class/block/$basename/queue/zoned")" in
1563         host-managed|host-aware)
1564                 is_zbd=true
1565                 if ! check_blkzone "${dev}"; then
1566                         exit 1
1567                 fi
1568                 if ! result=($(first_sequential_zone "$dev")); then
1569                         echo "Failed to determine first sequential zone"
1570                         exit 1
1571                 fi
1572                 first_sequential_zone_sector=${result[0]}
1573                 sectors_per_zone=${result[1]}
1574                 zone_size=$((sectors_per_zone * 512))
1575                 if ! max_open_zones=$(max_open_zones "$dev"); then
1576                         echo "Failed to determine maximum number of open zones"
1577                         exit 1
1578                 fi
1579                 max_active_zones=$(max_active_zones "$dev")
1580                 set_io_scheduler "$basename" deadline || exit $?
1581                 if [ -n "$reset_all_zones" ]; then
1582                         reset_zone "$dev" -1
1583                 fi
1584                 ;;
1585         *)
1586                 first_sequential_zone_sector=$(((disk_size / 2) &
1587                                                 (min_seq_write_size - 1)))
1588                 zone_size=$(max 65536 "$min_seq_write_size")
1589                 sectors_per_zone=$((zone_size / 512))
1590                 max_open_zones=128
1591                 max_active_zones=0
1592                 set_io_scheduler "$basename" none || exit $?
1593                 ;;
1594         esac
1595 elif [[ -c "$realdev" ]]; then
1596         # For an SG node, we must have libzbc option specified
1597         if [[ ! -n "$use_libzbc" ]]; then
1598                 echo "Character device files can only be used with -l (libzbc) option"
1599                 exit 1
1600         fi
1601
1602         if ! $(is_zbc "$dev"); then
1603                 echo "Device is not a ZBC disk"
1604                 exit 1
1605         fi
1606         is_zbd=true
1607
1608         if ! disk_size=($(( $(zbc_disk_sectors "$dev") * 512))); then
1609                 echo "Failed to determine disk size"
1610                 exit 1
1611         fi
1612         if ! min_seq_write_size=($(zbc_physical_block_size "$dev")); then
1613                 echo "Failed to determine physical block size"
1614                 exit 1
1615         fi
1616         if ! result=($(first_sequential_zone "$dev")); then
1617                 echo "Failed to determine first sequential zone"
1618                 exit 1
1619         fi
1620         first_sequential_zone_sector=${result[0]}
1621         sectors_per_zone=${result[1]}
1622         zone_size=$((sectors_per_zone * 512))
1623         if ! max_open_zones=$(max_open_zones "$dev"); then
1624                 echo "Failed to determine maximum number of open zones"
1625                 exit 1
1626         fi
1627         max_active_zones=0
1628         if [ -n "$reset_all_zones" ]; then
1629                 reset_zone "$dev" -1
1630         fi
1631 fi
1632
1633 if [[ -n ${max_open_zones_opt} ]]; then
1634         # Override max_open_zones with the script option value
1635         max_open_zones="${max_open_zones_opt}"
1636         global_var_opts+=("--ignore_zone_limits=1")
1637         job_var_opts+=("--max_open_zones=${max_open_zones_opt}")
1638 fi
1639
1640 echo -n "First sequential zone starts at sector $first_sequential_zone_sector;"
1641 echo " zone size: $((zone_size >> 20)) MB"
1642
1643 zone_cap_bs=$(zone_cap_bs "$dev" "$zone_size")
1644
1645 if [ "${#tests[@]}" = 0 ]; then
1646     readarray -t tests < <(declare -F | grep "test[0-9]*" | \
1647                                    tr -c -d "[:digit:]\n" | sort -n)
1648 fi
1649
1650 logfile=$0.log
1651
1652 passed=0
1653 skipped=0
1654 failed=0
1655 if [ -t 1 ]; then
1656     red="\e[1;31m"
1657     green="\e[1;32m"
1658     cyan="\e[1;36m"
1659     end="\e[m"
1660 else
1661     red=""
1662     green=""
1663     end=""
1664 fi
1665 rc=0
1666
1667 intr=0
1668 trap 'intr=1' SIGINT
1669 ret=0
1670
1671 for test_number in "${tests[@]}"; do
1672     rm -f "${logfile}.${test_number}"
1673     unset SKIP_REASON
1674     echo -n "Running test $(printf "%02d" $test_number) ... "
1675     eval "test$test_number"
1676     ret=$?
1677     if ((!ret)) && check_log $test_number; then
1678         status="PASS"
1679         cc_status="${green}${status}${end}"
1680         ((passed++))
1681     elif ((ret==SKIP_TESTCASE)); then
1682         status="SKIP"
1683         echo "${SKIP_REASON}" >> "${logfile}.${test_number}"
1684         cc_status="${cyan}${status}${end}    ${SKIP_REASON}"
1685         ((skipped++))
1686     else
1687         status="FAIL"
1688         cc_status="${red}${status}${end}"
1689         ((failed++))
1690         rc=1
1691     fi
1692     echo -e "$cc_status"
1693     echo "$status" >> "${logfile}.${test_number}"
1694     [ $intr -ne 0 ] && exit 1
1695     [ -n "$quit_on_err" -a "$rc" -ne 0 ] && exit 1
1696 done
1697
1698 echo "$passed tests passed"
1699 if [ $skipped -gt 0 ]; then
1700     echo " $skipped tests skipped"
1701 fi
1702 if [ $failed -gt 0 ]; then
1703     echo " $failed tests failed"
1704 fi
1705 echo "Run time: $(TZ=UTC0 printf "%(%H:%M:%S)T\n" $(( SECONDS )) )"
1706 exit $rc