Merge remote-tracking branch 'asoc/topic/core' into asoc-next
[linux-2.6-block.git] / arch / arm / lib / memset.S
1 /*
2  *  linux/arch/arm/lib/memset.S
3  *
4  *  Copyright (C) 1995-2000 Russell King
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 as
8  * published by the Free Software Foundation.
9  *
10  *  ASM optimised string functions
11  */
12 #include <linux/linkage.h>
13 #include <asm/assembler.h>
14 #include <asm/unwind.h>
15
16         .text
17         .align  5
18
19 ENTRY(mmioset)
20 ENTRY(memset)
21 UNWIND( .fnstart         )
22         ands    r3, r0, #3              @ 1 unaligned?
23         mov     ip, r0                  @ preserve r0 as return value
24         bne     6f                      @ 1
25 /*
26  * we know that the pointer in ip is aligned to a word boundary.
27  */
28 1:      orr     r1, r1, r1, lsl #8
29         orr     r1, r1, r1, lsl #16
30         mov     r3, r1
31         cmp     r2, #16
32         blt     4f
33
34 #if ! CALGN(1)+0
35
36 /*
37  * We need 2 extra registers for this loop - use r8 and the LR
38  */
39         stmfd   sp!, {r8, lr}
40 UNWIND( .fnend              )
41 UNWIND( .fnstart            )
42 UNWIND( .save {r8, lr}      )
43         mov     r8, r1
44         mov     lr, r1
45
46 2:      subs    r2, r2, #64
47         stmgeia ip!, {r1, r3, r8, lr}   @ 64 bytes at a time.
48         stmgeia ip!, {r1, r3, r8, lr}
49         stmgeia ip!, {r1, r3, r8, lr}
50         stmgeia ip!, {r1, r3, r8, lr}
51         bgt     2b
52         ldmeqfd sp!, {r8, pc}           @ Now <64 bytes to go.
53 /*
54  * No need to correct the count; we're only testing bits from now on
55  */
56         tst     r2, #32
57         stmneia ip!, {r1, r3, r8, lr}
58         stmneia ip!, {r1, r3, r8, lr}
59         tst     r2, #16
60         stmneia ip!, {r1, r3, r8, lr}
61         ldmfd   sp!, {r8, lr}
62 UNWIND( .fnend              )
63
64 #else
65
66 /*
67  * This version aligns the destination pointer in order to write
68  * whole cache lines at once.
69  */
70
71         stmfd   sp!, {r4-r8, lr}
72 UNWIND( .fnend                 )
73 UNWIND( .fnstart               )
74 UNWIND( .save {r4-r8, lr}      )
75         mov     r4, r1
76         mov     r5, r1
77         mov     r6, r1
78         mov     r7, r1
79         mov     r8, r1
80         mov     lr, r1
81
82         cmp     r2, #96
83         tstgt   ip, #31
84         ble     3f
85
86         and     r8, ip, #31
87         rsb     r8, r8, #32
88         sub     r2, r2, r8
89         movs    r8, r8, lsl #(32 - 4)
90         stmcsia ip!, {r4, r5, r6, r7}
91         stmmiia ip!, {r4, r5}
92         tst     r8, #(1 << 30)
93         mov     r8, r1
94         strne   r1, [ip], #4
95
96 3:      subs    r2, r2, #64
97         stmgeia ip!, {r1, r3-r8, lr}
98         stmgeia ip!, {r1, r3-r8, lr}
99         bgt     3b
100         ldmeqfd sp!, {r4-r8, pc}
101
102         tst     r2, #32
103         stmneia ip!, {r1, r3-r8, lr}
104         tst     r2, #16
105         stmneia ip!, {r4-r7}
106         ldmfd   sp!, {r4-r8, lr}
107 UNWIND( .fnend                 )
108
109 #endif
110
111 UNWIND( .fnstart            )
112 4:      tst     r2, #8
113         stmneia ip!, {r1, r3}
114         tst     r2, #4
115         strne   r1, [ip], #4
116 /*
117  * When we get here, we've got less than 4 bytes to zero.  We
118  * may have an unaligned pointer as well.
119  */
120 5:      tst     r2, #2
121         strneb  r1, [ip], #1
122         strneb  r1, [ip], #1
123         tst     r2, #1
124         strneb  r1, [ip], #1
125         ret     lr
126
127 6:      subs    r2, r2, #4              @ 1 do we have enough
128         blt     5b                      @ 1 bytes to align with?
129         cmp     r3, #2                  @ 1
130         strltb  r1, [ip], #1            @ 1
131         strleb  r1, [ip], #1            @ 1
132         strb    r1, [ip], #1            @ 1
133         add     r2, r2, r3              @ 1 (r2 = r2 - (4 - r3))
134         b       1b
135 UNWIND( .fnend   )
136 ENDPROC(memset)
137 ENDPROC(mmioset)