ubifs: Implement O_TMPFILE
[linux-block.git] / fs / ubifs / dir.c
1 /* * This file is part of UBIFS.
2  *
3  * Copyright (C) 2006-2008 Nokia Corporation.
4  * Copyright (C) 2006, 2007 University of Szeged, Hungary
5  *
6  * This program is free software; you can redistribute it and/or modify it
7  * under the terms of the GNU General Public License version 2 as published by
8  * the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but WITHOUT
11  * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
12  * FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License for
13  * more details.
14  *
15  * You should have received a copy of the GNU General Public License along with
16  * this program; if not, write to the Free Software Foundation, Inc., 51
17  * Franklin St, Fifth Floor, Boston, MA 02110-1301 USA
18  *
19  * Authors: Artem Bityutskiy (Битюцкий Артём)
20  *          Adrian Hunter
21  *          Zoltan Sogor
22  */
23
24 /*
25  * This file implements directory operations.
26  *
27  * All FS operations in this file allocate budget before writing anything to the
28  * media. If they fail to allocate it, the error is returned. The only
29  * exceptions are 'ubifs_unlink()' and 'ubifs_rmdir()' which keep working even
30  * if they unable to allocate the budget, because deletion %-ENOSPC failure is
31  * not what users are usually ready to get. UBIFS budgeting subsystem has some
32  * space reserved for these purposes.
33  *
34  * All operations in this file write all inodes which they change straight
35  * away, instead of marking them dirty. For example, 'ubifs_link()' changes
36  * @i_size of the parent inode and writes the parent inode together with the
37  * target inode. This was done to simplify file-system recovery which would
38  * otherwise be very difficult to do. The only exception is rename which marks
39  * the re-named inode dirty (because its @i_ctime is updated) but does not
40  * write it, but just marks it as dirty.
41  */
42
43 #include "ubifs.h"
44
45 /**
46  * inherit_flags - inherit flags of the parent inode.
47  * @dir: parent inode
48  * @mode: new inode mode flags
49  *
50  * This is a helper function for 'ubifs_new_inode()' which inherits flag of the
51  * parent directory inode @dir. UBIFS inodes inherit the following flags:
52  * o %UBIFS_COMPR_FL, which is useful to switch compression on/of on
53  *   sub-directory basis;
54  * o %UBIFS_SYNC_FL - useful for the same reasons;
55  * o %UBIFS_DIRSYNC_FL - similar, but relevant only to directories.
56  *
57  * This function returns the inherited flags.
58  */
59 static int inherit_flags(const struct inode *dir, umode_t mode)
60 {
61         int flags;
62         const struct ubifs_inode *ui = ubifs_inode(dir);
63
64         if (!S_ISDIR(dir->i_mode))
65                 /*
66                  * The parent is not a directory, which means that an extended
67                  * attribute inode is being created. No flags.
68                  */
69                 return 0;
70
71         flags = ui->flags & (UBIFS_COMPR_FL | UBIFS_SYNC_FL | UBIFS_DIRSYNC_FL);
72         if (!S_ISDIR(mode))
73                 /* The "DIRSYNC" flag only applies to directories */
74                 flags &= ~UBIFS_DIRSYNC_FL;
75         return flags;
76 }
77
78 /**
79  * ubifs_new_inode - allocate new UBIFS inode object.
80  * @c: UBIFS file-system description object
81  * @dir: parent directory inode
82  * @mode: inode mode flags
83  *
84  * This function finds an unused inode number, allocates new inode and
85  * initializes it. Returns new inode in case of success and an error code in
86  * case of failure.
87  */
88 struct inode *ubifs_new_inode(struct ubifs_info *c, const struct inode *dir,
89                               umode_t mode)
90 {
91         struct inode *inode;
92         struct ubifs_inode *ui;
93
94         inode = new_inode(c->vfs_sb);
95         ui = ubifs_inode(inode);
96         if (!inode)
97                 return ERR_PTR(-ENOMEM);
98
99         /*
100          * Set 'S_NOCMTIME' to prevent VFS form updating [mc]time of inodes and
101          * marking them dirty in file write path (see 'file_update_time()').
102          * UBIFS has to fully control "clean <-> dirty" transitions of inodes
103          * to make budgeting work.
104          */
105         inode->i_flags |= S_NOCMTIME;
106
107         inode_init_owner(inode, dir, mode);
108         inode->i_mtime = inode->i_atime = inode->i_ctime =
109                          ubifs_current_time(inode);
110         inode->i_mapping->nrpages = 0;
111
112         switch (mode & S_IFMT) {
113         case S_IFREG:
114                 inode->i_mapping->a_ops = &ubifs_file_address_operations;
115                 inode->i_op = &ubifs_file_inode_operations;
116                 inode->i_fop = &ubifs_file_operations;
117                 break;
118         case S_IFDIR:
119                 inode->i_op  = &ubifs_dir_inode_operations;
120                 inode->i_fop = &ubifs_dir_operations;
121                 inode->i_size = ui->ui_size = UBIFS_INO_NODE_SZ;
122                 break;
123         case S_IFLNK:
124                 inode->i_op = &ubifs_symlink_inode_operations;
125                 break;
126         case S_IFSOCK:
127         case S_IFIFO:
128         case S_IFBLK:
129         case S_IFCHR:
130                 inode->i_op  = &ubifs_file_inode_operations;
131                 break;
132         default:
133                 BUG();
134         }
135
136         ui->flags = inherit_flags(dir, mode);
137         ubifs_set_inode_flags(inode);
138         if (S_ISREG(mode))
139                 ui->compr_type = c->default_compr;
140         else
141                 ui->compr_type = UBIFS_COMPR_NONE;
142         ui->synced_i_size = 0;
143
144         spin_lock(&c->cnt_lock);
145         /* Inode number overflow is currently not supported */
146         if (c->highest_inum >= INUM_WARN_WATERMARK) {
147                 if (c->highest_inum >= INUM_WATERMARK) {
148                         spin_unlock(&c->cnt_lock);
149                         ubifs_err(c, "out of inode numbers");
150                         make_bad_inode(inode);
151                         iput(inode);
152                         return ERR_PTR(-EINVAL);
153                 }
154                 ubifs_warn(c, "running out of inode numbers (current %lu, max %u)",
155                            (unsigned long)c->highest_inum, INUM_WATERMARK);
156         }
157
158         inode->i_ino = ++c->highest_inum;
159         /*
160          * The creation sequence number remains with this inode for its
161          * lifetime. All nodes for this inode have a greater sequence number,
162          * and so it is possible to distinguish obsolete nodes belonging to a
163          * previous incarnation of the same inode number - for example, for the
164          * purpose of rebuilding the index.
165          */
166         ui->creat_sqnum = ++c->max_sqnum;
167         spin_unlock(&c->cnt_lock);
168         return inode;
169 }
170
171 static int dbg_check_name(const struct ubifs_info *c,
172                           const struct ubifs_dent_node *dent,
173                           const struct qstr *nm)
174 {
175         if (!dbg_is_chk_gen(c))
176                 return 0;
177         if (le16_to_cpu(dent->nlen) != nm->len)
178                 return -EINVAL;
179         if (memcmp(dent->name, nm->name, nm->len))
180                 return -EINVAL;
181         return 0;
182 }
183
184 static struct dentry *ubifs_lookup(struct inode *dir, struct dentry *dentry,
185                                    unsigned int flags)
186 {
187         int err;
188         union ubifs_key key;
189         struct inode *inode = NULL;
190         struct ubifs_dent_node *dent;
191         struct ubifs_info *c = dir->i_sb->s_fs_info;
192
193         dbg_gen("'%pd' in dir ino %lu", dentry, dir->i_ino);
194
195         if (dentry->d_name.len > UBIFS_MAX_NLEN)
196                 return ERR_PTR(-ENAMETOOLONG);
197
198         dent = kmalloc(UBIFS_MAX_DENT_NODE_SZ, GFP_NOFS);
199         if (!dent)
200                 return ERR_PTR(-ENOMEM);
201
202         dent_key_init(c, &key, dir->i_ino, &dentry->d_name);
203
204         err = ubifs_tnc_lookup_nm(c, &key, dent, &dentry->d_name);
205         if (err) {
206                 if (err == -ENOENT) {
207                         dbg_gen("not found");
208                         goto done;
209                 }
210                 goto out;
211         }
212
213         if (dbg_check_name(c, dent, &dentry->d_name)) {
214                 err = -EINVAL;
215                 goto out;
216         }
217
218         inode = ubifs_iget(dir->i_sb, le64_to_cpu(dent->inum));
219         if (IS_ERR(inode)) {
220                 /*
221                  * This should not happen. Probably the file-system needs
222                  * checking.
223                  */
224                 err = PTR_ERR(inode);
225                 ubifs_err(c, "dead directory entry '%pd', error %d",
226                           dentry, err);
227                 ubifs_ro_mode(c, err);
228                 goto out;
229         }
230
231 done:
232         kfree(dent);
233         /*
234          * Note, d_splice_alias() would be required instead if we supported
235          * NFS.
236          */
237         d_add(dentry, inode);
238         return NULL;
239
240 out:
241         kfree(dent);
242         return ERR_PTR(err);
243 }
244
245 static int ubifs_create(struct inode *dir, struct dentry *dentry, umode_t mode,
246                         bool excl)
247 {
248         struct inode *inode;
249         struct ubifs_info *c = dir->i_sb->s_fs_info;
250         int err, sz_change = CALC_DENT_SIZE(dentry->d_name.len);
251         struct ubifs_budget_req req = { .new_ino = 1, .new_dent = 1,
252                                         .dirtied_ino = 1 };
253         struct ubifs_inode *dir_ui = ubifs_inode(dir);
254
255         /*
256          * Budget request settings: new inode, new direntry, changing the
257          * parent directory inode.
258          */
259
260         dbg_gen("dent '%pd', mode %#hx in dir ino %lu",
261                 dentry, mode, dir->i_ino);
262
263         err = ubifs_budget_space(c, &req);
264         if (err)
265                 return err;
266
267         inode = ubifs_new_inode(c, dir, mode);
268         if (IS_ERR(inode)) {
269                 err = PTR_ERR(inode);
270                 goto out_budg;
271         }
272
273         err = ubifs_init_security(dir, inode, &dentry->d_name);
274         if (err)
275                 goto out_inode;
276
277         mutex_lock(&dir_ui->ui_mutex);
278         dir->i_size += sz_change;
279         dir_ui->ui_size = dir->i_size;
280         dir->i_mtime = dir->i_ctime = inode->i_ctime;
281         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 0, 0);
282         if (err)
283                 goto out_cancel;
284         mutex_unlock(&dir_ui->ui_mutex);
285
286         ubifs_release_budget(c, &req);
287         insert_inode_hash(inode);
288         d_instantiate(dentry, inode);
289         return 0;
290
291 out_cancel:
292         dir->i_size -= sz_change;
293         dir_ui->ui_size = dir->i_size;
294         mutex_unlock(&dir_ui->ui_mutex);
295 out_inode:
296         make_bad_inode(inode);
297         iput(inode);
298 out_budg:
299         ubifs_release_budget(c, &req);
300         ubifs_err(c, "cannot create regular file, error %d", err);
301         return err;
302 }
303
304 static int ubifs_tmpfile(struct inode *dir, struct dentry *dentry,
305                          umode_t mode)
306 {
307         struct inode *inode;
308         struct ubifs_info *c = dir->i_sb->s_fs_info;
309         struct ubifs_budget_req req = { .new_ino = 1, .new_dent = 1};
310         struct ubifs_budget_req ino_req = { .dirtied_ino = 1 };
311         struct ubifs_inode *ui, *dir_ui = ubifs_inode(dir);
312         int err, instantiated = 0;
313
314         /*
315          * Budget request settings: new dirty inode, new direntry,
316          * budget for dirtied inode will be released via writeback.
317          */
318
319         dbg_gen("dent '%pd', mode %#hx in dir ino %lu",
320                 dentry, mode, dir->i_ino);
321
322         err = ubifs_budget_space(c, &req);
323         if (err)
324                 return err;
325
326         err = ubifs_budget_space(c, &ino_req);
327         if (err) {
328                 ubifs_release_budget(c, &req);
329                 return err;
330         }
331
332         inode = ubifs_new_inode(c, dir, mode);
333         if (IS_ERR(inode)) {
334                 err = PTR_ERR(inode);
335                 goto out_budg;
336         }
337         ui = ubifs_inode(inode);
338
339         err = ubifs_init_security(dir, inode, &dentry->d_name);
340         if (err)
341                 goto out_inode;
342
343         mutex_lock(&ui->ui_mutex);
344         insert_inode_hash(inode);
345         d_tmpfile(dentry, inode);
346         ubifs_assert(ui->dirty);
347         instantiated = 1;
348         mutex_unlock(&ui->ui_mutex);
349
350         mutex_lock(&dir_ui->ui_mutex);
351         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 1, 0);
352         if (err)
353                 goto out_cancel;
354         mutex_unlock(&dir_ui->ui_mutex);
355
356         ubifs_release_budget(c, &req);
357
358         return 0;
359
360 out_cancel:
361         mutex_unlock(&dir_ui->ui_mutex);
362 out_inode:
363         make_bad_inode(inode);
364         if (!instantiated)
365                 iput(inode);
366 out_budg:
367         ubifs_release_budget(c, &req);
368         if (!instantiated)
369                 ubifs_release_budget(c, &ino_req);
370         ubifs_err(c, "cannot create temporary file, error %d", err);
371         return err;
372 }
373
374 /**
375  * vfs_dent_type - get VFS directory entry type.
376  * @type: UBIFS directory entry type
377  *
378  * This function converts UBIFS directory entry type into VFS directory entry
379  * type.
380  */
381 static unsigned int vfs_dent_type(uint8_t type)
382 {
383         switch (type) {
384         case UBIFS_ITYPE_REG:
385                 return DT_REG;
386         case UBIFS_ITYPE_DIR:
387                 return DT_DIR;
388         case UBIFS_ITYPE_LNK:
389                 return DT_LNK;
390         case UBIFS_ITYPE_BLK:
391                 return DT_BLK;
392         case UBIFS_ITYPE_CHR:
393                 return DT_CHR;
394         case UBIFS_ITYPE_FIFO:
395                 return DT_FIFO;
396         case UBIFS_ITYPE_SOCK:
397                 return DT_SOCK;
398         default:
399                 BUG();
400         }
401         return 0;
402 }
403
404 /*
405  * The classical Unix view for directory is that it is a linear array of
406  * (name, inode number) entries. Linux/VFS assumes this model as well.
407  * Particularly, 'readdir()' call wants us to return a directory entry offset
408  * which later may be used to continue 'readdir()'ing the directory or to
409  * 'seek()' to that specific direntry. Obviously UBIFS does not really fit this
410  * model because directory entries are identified by keys, which may collide.
411  *
412  * UBIFS uses directory entry hash value for directory offsets, so
413  * 'seekdir()'/'telldir()' may not always work because of possible key
414  * collisions. But UBIFS guarantees that consecutive 'readdir()' calls work
415  * properly by means of saving full directory entry name in the private field
416  * of the file description object.
417  *
418  * This means that UBIFS cannot support NFS which requires full
419  * 'seekdir()'/'telldir()' support.
420  */
421 static int ubifs_readdir(struct file *file, struct dir_context *ctx)
422 {
423         int err;
424         struct qstr nm;
425         union ubifs_key key;
426         struct ubifs_dent_node *dent;
427         struct inode *dir = file_inode(file);
428         struct ubifs_info *c = dir->i_sb->s_fs_info;
429
430         dbg_gen("dir ino %lu, f_pos %#llx", dir->i_ino, ctx->pos);
431
432         if (ctx->pos > UBIFS_S_KEY_HASH_MASK || ctx->pos == 2)
433                 /*
434                  * The directory was seek'ed to a senseless position or there
435                  * are no more entries.
436                  */
437                 return 0;
438
439         if (file->f_version == 0) {
440                 /*
441                  * The file was seek'ed, which means that @file->private_data
442                  * is now invalid. This may also be just the first
443                  * 'ubifs_readdir()' invocation, in which case
444                  * @file->private_data is NULL, and the below code is
445                  * basically a no-op.
446                  */
447                 kfree(file->private_data);
448                 file->private_data = NULL;
449         }
450
451         /*
452          * 'generic_file_llseek()' unconditionally sets @file->f_version to
453          * zero, and we use this for detecting whether the file was seek'ed.
454          */
455         file->f_version = 1;
456
457         /* File positions 0 and 1 correspond to "." and ".." */
458         if (ctx->pos < 2) {
459                 ubifs_assert(!file->private_data);
460                 if (!dir_emit_dots(file, ctx))
461                         return 0;
462
463                 /* Find the first entry in TNC and save it */
464                 lowest_dent_key(c, &key, dir->i_ino);
465                 nm.name = NULL;
466                 dent = ubifs_tnc_next_ent(c, &key, &nm);
467                 if (IS_ERR(dent)) {
468                         err = PTR_ERR(dent);
469                         goto out;
470                 }
471
472                 ctx->pos = key_hash_flash(c, &dent->key);
473                 file->private_data = dent;
474         }
475
476         dent = file->private_data;
477         if (!dent) {
478                 /*
479                  * The directory was seek'ed to and is now readdir'ed.
480                  * Find the entry corresponding to @ctx->pos or the closest one.
481                  */
482                 dent_key_init_hash(c, &key, dir->i_ino, ctx->pos);
483                 nm.name = NULL;
484                 dent = ubifs_tnc_next_ent(c, &key, &nm);
485                 if (IS_ERR(dent)) {
486                         err = PTR_ERR(dent);
487                         goto out;
488                 }
489                 ctx->pos = key_hash_flash(c, &dent->key);
490                 file->private_data = dent;
491         }
492
493         while (1) {
494                 dbg_gen("feed '%s', ino %llu, new f_pos %#x",
495                         dent->name, (unsigned long long)le64_to_cpu(dent->inum),
496                         key_hash_flash(c, &dent->key));
497                 ubifs_assert(le64_to_cpu(dent->ch.sqnum) >
498                              ubifs_inode(dir)->creat_sqnum);
499
500                 nm.len = le16_to_cpu(dent->nlen);
501                 if (!dir_emit(ctx, dent->name, nm.len,
502                                le64_to_cpu(dent->inum),
503                                vfs_dent_type(dent->type)))
504                         return 0;
505
506                 /* Switch to the next entry */
507                 key_read(c, &dent->key, &key);
508                 nm.name = dent->name;
509                 dent = ubifs_tnc_next_ent(c, &key, &nm);
510                 if (IS_ERR(dent)) {
511                         err = PTR_ERR(dent);
512                         goto out;
513                 }
514
515                 kfree(file->private_data);
516                 ctx->pos = key_hash_flash(c, &dent->key);
517                 file->private_data = dent;
518                 cond_resched();
519         }
520
521 out:
522         kfree(file->private_data);
523         file->private_data = NULL;
524
525         if (err != -ENOENT) {
526                 ubifs_err(c, "cannot find next direntry, error %d", err);
527                 return err;
528         }
529
530         /* 2 is a special value indicating that there are no more direntries */
531         ctx->pos = 2;
532         return 0;
533 }
534
535 /* Free saved readdir() state when the directory is closed */
536 static int ubifs_dir_release(struct inode *dir, struct file *file)
537 {
538         kfree(file->private_data);
539         file->private_data = NULL;
540         return 0;
541 }
542
543 /**
544  * lock_2_inodes - a wrapper for locking two UBIFS inodes.
545  * @inode1: first inode
546  * @inode2: second inode
547  *
548  * We do not implement any tricks to guarantee strict lock ordering, because
549  * VFS has already done it for us on the @i_mutex. So this is just a simple
550  * wrapper function.
551  */
552 static void lock_2_inodes(struct inode *inode1, struct inode *inode2)
553 {
554         mutex_lock_nested(&ubifs_inode(inode1)->ui_mutex, WB_MUTEX_1);
555         mutex_lock_nested(&ubifs_inode(inode2)->ui_mutex, WB_MUTEX_2);
556 }
557
558 /**
559  * unlock_2_inodes - a wrapper for unlocking two UBIFS inodes.
560  * @inode1: first inode
561  * @inode2: second inode
562  */
563 static void unlock_2_inodes(struct inode *inode1, struct inode *inode2)
564 {
565         mutex_unlock(&ubifs_inode(inode2)->ui_mutex);
566         mutex_unlock(&ubifs_inode(inode1)->ui_mutex);
567 }
568
569 static int ubifs_link(struct dentry *old_dentry, struct inode *dir,
570                       struct dentry *dentry)
571 {
572         struct ubifs_info *c = dir->i_sb->s_fs_info;
573         struct inode *inode = d_inode(old_dentry);
574         struct ubifs_inode *ui = ubifs_inode(inode);
575         struct ubifs_inode *dir_ui = ubifs_inode(dir);
576         int err, sz_change = CALC_DENT_SIZE(dentry->d_name.len);
577         struct ubifs_budget_req req = { .new_dent = 1, .dirtied_ino = 2,
578                                 .dirtied_ino_d = ALIGN(ui->data_len, 8) };
579
580         /*
581          * Budget request settings: new direntry, changing the target inode,
582          * changing the parent inode.
583          */
584
585         dbg_gen("dent '%pd' to ino %lu (nlink %d) in dir ino %lu",
586                 dentry, inode->i_ino,
587                 inode->i_nlink, dir->i_ino);
588         ubifs_assert(inode_is_locked(dir));
589         ubifs_assert(inode_is_locked(inode));
590
591         err = dbg_check_synced_i_size(c, inode);
592         if (err)
593                 return err;
594
595         err = ubifs_budget_space(c, &req);
596         if (err)
597                 return err;
598
599         lock_2_inodes(dir, inode);
600         inc_nlink(inode);
601         ihold(inode);
602         inode->i_ctime = ubifs_current_time(inode);
603         dir->i_size += sz_change;
604         dir_ui->ui_size = dir->i_size;
605         dir->i_mtime = dir->i_ctime = inode->i_ctime;
606         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 0, 0);
607         if (err)
608                 goto out_cancel;
609         unlock_2_inodes(dir, inode);
610
611         ubifs_release_budget(c, &req);
612         d_instantiate(dentry, inode);
613         return 0;
614
615 out_cancel:
616         dir->i_size -= sz_change;
617         dir_ui->ui_size = dir->i_size;
618         drop_nlink(inode);
619         unlock_2_inodes(dir, inode);
620         ubifs_release_budget(c, &req);
621         iput(inode);
622         return err;
623 }
624
625 static int ubifs_unlink(struct inode *dir, struct dentry *dentry)
626 {
627         struct ubifs_info *c = dir->i_sb->s_fs_info;
628         struct inode *inode = d_inode(dentry);
629         struct ubifs_inode *dir_ui = ubifs_inode(dir);
630         int sz_change = CALC_DENT_SIZE(dentry->d_name.len);
631         int err, budgeted = 1;
632         struct ubifs_budget_req req = { .mod_dent = 1, .dirtied_ino = 2 };
633         unsigned int saved_nlink = inode->i_nlink;
634
635         /*
636          * Budget request settings: deletion direntry, deletion inode (+1 for
637          * @dirtied_ino), changing the parent directory inode. If budgeting
638          * fails, go ahead anyway because we have extra space reserved for
639          * deletions.
640          */
641
642         dbg_gen("dent '%pd' from ino %lu (nlink %d) in dir ino %lu",
643                 dentry, inode->i_ino,
644                 inode->i_nlink, dir->i_ino);
645         ubifs_assert(inode_is_locked(dir));
646         ubifs_assert(inode_is_locked(inode));
647         err = dbg_check_synced_i_size(c, inode);
648         if (err)
649                 return err;
650
651         err = ubifs_budget_space(c, &req);
652         if (err) {
653                 if (err != -ENOSPC)
654                         return err;
655                 budgeted = 0;
656         }
657
658         lock_2_inodes(dir, inode);
659         inode->i_ctime = ubifs_current_time(dir);
660         drop_nlink(inode);
661         dir->i_size -= sz_change;
662         dir_ui->ui_size = dir->i_size;
663         dir->i_mtime = dir->i_ctime = inode->i_ctime;
664         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 1, 0);
665         if (err)
666                 goto out_cancel;
667         unlock_2_inodes(dir, inode);
668
669         if (budgeted)
670                 ubifs_release_budget(c, &req);
671         else {
672                 /* We've deleted something - clean the "no space" flags */
673                 c->bi.nospace = c->bi.nospace_rp = 0;
674                 smp_wmb();
675         }
676         return 0;
677
678 out_cancel:
679         dir->i_size += sz_change;
680         dir_ui->ui_size = dir->i_size;
681         set_nlink(inode, saved_nlink);
682         unlock_2_inodes(dir, inode);
683         if (budgeted)
684                 ubifs_release_budget(c, &req);
685         return err;
686 }
687
688 /**
689  * check_dir_empty - check if a directory is empty or not.
690  * @c: UBIFS file-system description object
691  * @dir: VFS inode object of the directory to check
692  *
693  * This function checks if directory @dir is empty. Returns zero if the
694  * directory is empty, %-ENOTEMPTY if it is not, and other negative error codes
695  * in case of of errors.
696  */
697 static int check_dir_empty(struct ubifs_info *c, struct inode *dir)
698 {
699         struct qstr nm = { .name = NULL };
700         struct ubifs_dent_node *dent;
701         union ubifs_key key;
702         int err;
703
704         lowest_dent_key(c, &key, dir->i_ino);
705         dent = ubifs_tnc_next_ent(c, &key, &nm);
706         if (IS_ERR(dent)) {
707                 err = PTR_ERR(dent);
708                 if (err == -ENOENT)
709                         err = 0;
710         } else {
711                 kfree(dent);
712                 err = -ENOTEMPTY;
713         }
714         return err;
715 }
716
717 static int ubifs_rmdir(struct inode *dir, struct dentry *dentry)
718 {
719         struct ubifs_info *c = dir->i_sb->s_fs_info;
720         struct inode *inode = d_inode(dentry);
721         int sz_change = CALC_DENT_SIZE(dentry->d_name.len);
722         int err, budgeted = 1;
723         struct ubifs_inode *dir_ui = ubifs_inode(dir);
724         struct ubifs_budget_req req = { .mod_dent = 1, .dirtied_ino = 2 };
725
726         /*
727          * Budget request settings: deletion direntry, deletion inode and
728          * changing the parent inode. If budgeting fails, go ahead anyway
729          * because we have extra space reserved for deletions.
730          */
731
732         dbg_gen("directory '%pd', ino %lu in dir ino %lu", dentry,
733                 inode->i_ino, dir->i_ino);
734         ubifs_assert(inode_is_locked(dir));
735         ubifs_assert(inode_is_locked(inode));
736         err = check_dir_empty(c, d_inode(dentry));
737         if (err)
738                 return err;
739
740         err = ubifs_budget_space(c, &req);
741         if (err) {
742                 if (err != -ENOSPC)
743                         return err;
744                 budgeted = 0;
745         }
746
747         lock_2_inodes(dir, inode);
748         inode->i_ctime = ubifs_current_time(dir);
749         clear_nlink(inode);
750         drop_nlink(dir);
751         dir->i_size -= sz_change;
752         dir_ui->ui_size = dir->i_size;
753         dir->i_mtime = dir->i_ctime = inode->i_ctime;
754         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 1, 0);
755         if (err)
756                 goto out_cancel;
757         unlock_2_inodes(dir, inode);
758
759         if (budgeted)
760                 ubifs_release_budget(c, &req);
761         else {
762                 /* We've deleted something - clean the "no space" flags */
763                 c->bi.nospace = c->bi.nospace_rp = 0;
764                 smp_wmb();
765         }
766         return 0;
767
768 out_cancel:
769         dir->i_size += sz_change;
770         dir_ui->ui_size = dir->i_size;
771         inc_nlink(dir);
772         set_nlink(inode, 2);
773         unlock_2_inodes(dir, inode);
774         if (budgeted)
775                 ubifs_release_budget(c, &req);
776         return err;
777 }
778
779 static int ubifs_mkdir(struct inode *dir, struct dentry *dentry, umode_t mode)
780 {
781         struct inode *inode;
782         struct ubifs_inode *dir_ui = ubifs_inode(dir);
783         struct ubifs_info *c = dir->i_sb->s_fs_info;
784         int err, sz_change = CALC_DENT_SIZE(dentry->d_name.len);
785         struct ubifs_budget_req req = { .new_ino = 1, .new_dent = 1 };
786
787         /*
788          * Budget request settings: new inode, new direntry and changing parent
789          * directory inode.
790          */
791
792         dbg_gen("dent '%pd', mode %#hx in dir ino %lu",
793                 dentry, mode, dir->i_ino);
794
795         err = ubifs_budget_space(c, &req);
796         if (err)
797                 return err;
798
799         inode = ubifs_new_inode(c, dir, S_IFDIR | mode);
800         if (IS_ERR(inode)) {
801                 err = PTR_ERR(inode);
802                 goto out_budg;
803         }
804
805         err = ubifs_init_security(dir, inode, &dentry->d_name);
806         if (err)
807                 goto out_inode;
808
809         mutex_lock(&dir_ui->ui_mutex);
810         insert_inode_hash(inode);
811         inc_nlink(inode);
812         inc_nlink(dir);
813         dir->i_size += sz_change;
814         dir_ui->ui_size = dir->i_size;
815         dir->i_mtime = dir->i_ctime = inode->i_ctime;
816         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 0, 0);
817         if (err) {
818                 ubifs_err(c, "cannot create directory, error %d", err);
819                 goto out_cancel;
820         }
821         mutex_unlock(&dir_ui->ui_mutex);
822
823         ubifs_release_budget(c, &req);
824         d_instantiate(dentry, inode);
825         return 0;
826
827 out_cancel:
828         dir->i_size -= sz_change;
829         dir_ui->ui_size = dir->i_size;
830         drop_nlink(dir);
831         mutex_unlock(&dir_ui->ui_mutex);
832 out_inode:
833         make_bad_inode(inode);
834         iput(inode);
835 out_budg:
836         ubifs_release_budget(c, &req);
837         return err;
838 }
839
840 static int ubifs_mknod(struct inode *dir, struct dentry *dentry,
841                        umode_t mode, dev_t rdev)
842 {
843         struct inode *inode;
844         struct ubifs_inode *ui;
845         struct ubifs_inode *dir_ui = ubifs_inode(dir);
846         struct ubifs_info *c = dir->i_sb->s_fs_info;
847         union ubifs_dev_desc *dev = NULL;
848         int sz_change = CALC_DENT_SIZE(dentry->d_name.len);
849         int err, devlen = 0;
850         struct ubifs_budget_req req = { .new_ino = 1, .new_dent = 1,
851                                         .new_ino_d = ALIGN(devlen, 8),
852                                         .dirtied_ino = 1 };
853
854         /*
855          * Budget request settings: new inode, new direntry and changing parent
856          * directory inode.
857          */
858
859         dbg_gen("dent '%pd' in dir ino %lu", dentry, dir->i_ino);
860
861         if (S_ISBLK(mode) || S_ISCHR(mode)) {
862                 dev = kmalloc(sizeof(union ubifs_dev_desc), GFP_NOFS);
863                 if (!dev)
864                         return -ENOMEM;
865                 devlen = ubifs_encode_dev(dev, rdev);
866         }
867
868         err = ubifs_budget_space(c, &req);
869         if (err) {
870                 kfree(dev);
871                 return err;
872         }
873
874         inode = ubifs_new_inode(c, dir, mode);
875         if (IS_ERR(inode)) {
876                 kfree(dev);
877                 err = PTR_ERR(inode);
878                 goto out_budg;
879         }
880
881         init_special_inode(inode, inode->i_mode, rdev);
882         inode->i_size = ubifs_inode(inode)->ui_size = devlen;
883         ui = ubifs_inode(inode);
884         ui->data = dev;
885         ui->data_len = devlen;
886
887         err = ubifs_init_security(dir, inode, &dentry->d_name);
888         if (err)
889                 goto out_inode;
890
891         mutex_lock(&dir_ui->ui_mutex);
892         dir->i_size += sz_change;
893         dir_ui->ui_size = dir->i_size;
894         dir->i_mtime = dir->i_ctime = inode->i_ctime;
895         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 0, 0);
896         if (err)
897                 goto out_cancel;
898         mutex_unlock(&dir_ui->ui_mutex);
899
900         ubifs_release_budget(c, &req);
901         insert_inode_hash(inode);
902         d_instantiate(dentry, inode);
903         return 0;
904
905 out_cancel:
906         dir->i_size -= sz_change;
907         dir_ui->ui_size = dir->i_size;
908         mutex_unlock(&dir_ui->ui_mutex);
909 out_inode:
910         make_bad_inode(inode);
911         iput(inode);
912 out_budg:
913         ubifs_release_budget(c, &req);
914         return err;
915 }
916
917 static int ubifs_symlink(struct inode *dir, struct dentry *dentry,
918                          const char *symname)
919 {
920         struct inode *inode;
921         struct ubifs_inode *ui;
922         struct ubifs_inode *dir_ui = ubifs_inode(dir);
923         struct ubifs_info *c = dir->i_sb->s_fs_info;
924         int err, len = strlen(symname);
925         int sz_change = CALC_DENT_SIZE(dentry->d_name.len);
926         struct ubifs_budget_req req = { .new_ino = 1, .new_dent = 1,
927                                         .new_ino_d = ALIGN(len, 8),
928                                         .dirtied_ino = 1 };
929
930         /*
931          * Budget request settings: new inode, new direntry and changing parent
932          * directory inode.
933          */
934
935         dbg_gen("dent '%pd', target '%s' in dir ino %lu", dentry,
936                 symname, dir->i_ino);
937
938         if (len > UBIFS_MAX_INO_DATA)
939                 return -ENAMETOOLONG;
940
941         err = ubifs_budget_space(c, &req);
942         if (err)
943                 return err;
944
945         inode = ubifs_new_inode(c, dir, S_IFLNK | S_IRWXUGO);
946         if (IS_ERR(inode)) {
947                 err = PTR_ERR(inode);
948                 goto out_budg;
949         }
950
951         ui = ubifs_inode(inode);
952         ui->data = kmalloc(len + 1, GFP_NOFS);
953         if (!ui->data) {
954                 err = -ENOMEM;
955                 goto out_inode;
956         }
957
958         memcpy(ui->data, symname, len);
959         ((char *)ui->data)[len] = '\0';
960         inode->i_link = ui->data;
961         /*
962          * The terminating zero byte is not written to the flash media and it
963          * is put just to make later in-memory string processing simpler. Thus,
964          * data length is @len, not @len + %1.
965          */
966         ui->data_len = len;
967         inode->i_size = ubifs_inode(inode)->ui_size = len;
968
969         err = ubifs_init_security(dir, inode, &dentry->d_name);
970         if (err)
971                 goto out_inode;
972
973         mutex_lock(&dir_ui->ui_mutex);
974         dir->i_size += sz_change;
975         dir_ui->ui_size = dir->i_size;
976         dir->i_mtime = dir->i_ctime = inode->i_ctime;
977         err = ubifs_jnl_update(c, dir, &dentry->d_name, inode, 0, 0);
978         if (err)
979                 goto out_cancel;
980         mutex_unlock(&dir_ui->ui_mutex);
981
982         ubifs_release_budget(c, &req);
983         insert_inode_hash(inode);
984         d_instantiate(dentry, inode);
985         return 0;
986
987 out_cancel:
988         dir->i_size -= sz_change;
989         dir_ui->ui_size = dir->i_size;
990         mutex_unlock(&dir_ui->ui_mutex);
991 out_inode:
992         make_bad_inode(inode);
993         iput(inode);
994 out_budg:
995         ubifs_release_budget(c, &req);
996         return err;
997 }
998
999 /**
1000  * lock_3_inodes - a wrapper for locking three UBIFS inodes.
1001  * @inode1: first inode
1002  * @inode2: second inode
1003  * @inode3: third inode
1004  *
1005  * This function is used for 'ubifs_rename()' and @inode1 may be the same as
1006  * @inode2 whereas @inode3 may be %NULL.
1007  *
1008  * We do not implement any tricks to guarantee strict lock ordering, because
1009  * VFS has already done it for us on the @i_mutex. So this is just a simple
1010  * wrapper function.
1011  */
1012 static void lock_3_inodes(struct inode *inode1, struct inode *inode2,
1013                           struct inode *inode3)
1014 {
1015         mutex_lock_nested(&ubifs_inode(inode1)->ui_mutex, WB_MUTEX_1);
1016         if (inode2 != inode1)
1017                 mutex_lock_nested(&ubifs_inode(inode2)->ui_mutex, WB_MUTEX_2);
1018         if (inode3)
1019                 mutex_lock_nested(&ubifs_inode(inode3)->ui_mutex, WB_MUTEX_3);
1020 }
1021
1022 /**
1023  * unlock_3_inodes - a wrapper for unlocking three UBIFS inodes for rename.
1024  * @inode1: first inode
1025  * @inode2: second inode
1026  * @inode3: third inode
1027  */
1028 static void unlock_3_inodes(struct inode *inode1, struct inode *inode2,
1029                             struct inode *inode3)
1030 {
1031         if (inode3)
1032                 mutex_unlock(&ubifs_inode(inode3)->ui_mutex);
1033         if (inode1 != inode2)
1034                 mutex_unlock(&ubifs_inode(inode2)->ui_mutex);
1035         mutex_unlock(&ubifs_inode(inode1)->ui_mutex);
1036 }
1037
1038 static int ubifs_rename(struct inode *old_dir, struct dentry *old_dentry,
1039                         struct inode *new_dir, struct dentry *new_dentry)
1040 {
1041         struct ubifs_info *c = old_dir->i_sb->s_fs_info;
1042         struct inode *old_inode = d_inode(old_dentry);
1043         struct inode *new_inode = d_inode(new_dentry);
1044         struct ubifs_inode *old_inode_ui = ubifs_inode(old_inode);
1045         int err, release, sync = 0, move = (new_dir != old_dir);
1046         int is_dir = S_ISDIR(old_inode->i_mode);
1047         int unlink = !!new_inode;
1048         int new_sz = CALC_DENT_SIZE(new_dentry->d_name.len);
1049         int old_sz = CALC_DENT_SIZE(old_dentry->d_name.len);
1050         struct ubifs_budget_req req = { .new_dent = 1, .mod_dent = 1,
1051                                         .dirtied_ino = 3 };
1052         struct ubifs_budget_req ino_req = { .dirtied_ino = 1,
1053                         .dirtied_ino_d = ALIGN(old_inode_ui->data_len, 8) };
1054         struct timespec time;
1055         unsigned int uninitialized_var(saved_nlink);
1056
1057         /*
1058          * Budget request settings: deletion direntry, new direntry, removing
1059          * the old inode, and changing old and new parent directory inodes.
1060          *
1061          * However, this operation also marks the target inode as dirty and
1062          * does not write it, so we allocate budget for the target inode
1063          * separately.
1064          */
1065
1066         dbg_gen("dent '%pd' ino %lu in dir ino %lu to dent '%pd' in dir ino %lu",
1067                 old_dentry, old_inode->i_ino, old_dir->i_ino,
1068                 new_dentry, new_dir->i_ino);
1069         ubifs_assert(inode_is_locked(old_dir));
1070         ubifs_assert(inode_is_locked(new_dir));
1071         if (unlink)
1072                 ubifs_assert(inode_is_locked(new_inode));
1073
1074
1075         if (unlink && is_dir) {
1076                 err = check_dir_empty(c, new_inode);
1077                 if (err)
1078                         return err;
1079         }
1080
1081         err = ubifs_budget_space(c, &req);
1082         if (err)
1083                 return err;
1084         err = ubifs_budget_space(c, &ino_req);
1085         if (err) {
1086                 ubifs_release_budget(c, &req);
1087                 return err;
1088         }
1089
1090         lock_3_inodes(old_dir, new_dir, new_inode);
1091
1092         /*
1093          * Like most other Unix systems, set the @i_ctime for inodes on a
1094          * rename.
1095          */
1096         time = ubifs_current_time(old_dir);
1097         old_inode->i_ctime = time;
1098
1099         /* We must adjust parent link count when renaming directories */
1100         if (is_dir) {
1101                 if (move) {
1102                         /*
1103                          * @old_dir loses a link because we are moving
1104                          * @old_inode to a different directory.
1105                          */
1106                         drop_nlink(old_dir);
1107                         /*
1108                          * @new_dir only gains a link if we are not also
1109                          * overwriting an existing directory.
1110                          */
1111                         if (!unlink)
1112                                 inc_nlink(new_dir);
1113                 } else {
1114                         /*
1115                          * @old_inode is not moving to a different directory,
1116                          * but @old_dir still loses a link if we are
1117                          * overwriting an existing directory.
1118                          */
1119                         if (unlink)
1120                                 drop_nlink(old_dir);
1121                 }
1122         }
1123
1124         old_dir->i_size -= old_sz;
1125         ubifs_inode(old_dir)->ui_size = old_dir->i_size;
1126         old_dir->i_mtime = old_dir->i_ctime = time;
1127         new_dir->i_mtime = new_dir->i_ctime = time;
1128
1129         /*
1130          * And finally, if we unlinked a direntry which happened to have the
1131          * same name as the moved direntry, we have to decrement @i_nlink of
1132          * the unlinked inode and change its ctime.
1133          */
1134         if (unlink) {
1135                 /*
1136                  * Directories cannot have hard-links, so if this is a
1137                  * directory, just clear @i_nlink.
1138                  */
1139                 saved_nlink = new_inode->i_nlink;
1140                 if (is_dir)
1141                         clear_nlink(new_inode);
1142                 else
1143                         drop_nlink(new_inode);
1144                 new_inode->i_ctime = time;
1145         } else {
1146                 new_dir->i_size += new_sz;
1147                 ubifs_inode(new_dir)->ui_size = new_dir->i_size;
1148         }
1149
1150         /*
1151          * Do not ask 'ubifs_jnl_rename()' to flush write-buffer if @old_inode
1152          * is dirty, because this will be done later on at the end of
1153          * 'ubifs_rename()'.
1154          */
1155         if (IS_SYNC(old_inode)) {
1156                 sync = IS_DIRSYNC(old_dir) || IS_DIRSYNC(new_dir);
1157                 if (unlink && IS_SYNC(new_inode))
1158                         sync = 1;
1159         }
1160         err = ubifs_jnl_rename(c, old_dir, old_dentry, new_dir, new_dentry,
1161                                sync);
1162         if (err)
1163                 goto out_cancel;
1164
1165         unlock_3_inodes(old_dir, new_dir, new_inode);
1166         ubifs_release_budget(c, &req);
1167
1168         mutex_lock(&old_inode_ui->ui_mutex);
1169         release = old_inode_ui->dirty;
1170         mark_inode_dirty_sync(old_inode);
1171         mutex_unlock(&old_inode_ui->ui_mutex);
1172
1173         if (release)
1174                 ubifs_release_budget(c, &ino_req);
1175         if (IS_SYNC(old_inode))
1176                 err = old_inode->i_sb->s_op->write_inode(old_inode, NULL);
1177         return err;
1178
1179 out_cancel:
1180         if (unlink) {
1181                 set_nlink(new_inode, saved_nlink);
1182         } else {
1183                 new_dir->i_size -= new_sz;
1184                 ubifs_inode(new_dir)->ui_size = new_dir->i_size;
1185         }
1186         old_dir->i_size += old_sz;
1187         ubifs_inode(old_dir)->ui_size = old_dir->i_size;
1188         if (is_dir) {
1189                 if (move) {
1190                         inc_nlink(old_dir);
1191                         if (!unlink)
1192                                 drop_nlink(new_dir);
1193                 } else {
1194                         if (unlink)
1195                                 inc_nlink(old_dir);
1196                 }
1197         }
1198         unlock_3_inodes(old_dir, new_dir, new_inode);
1199         ubifs_release_budget(c, &ino_req);
1200         ubifs_release_budget(c, &req);
1201         return err;
1202 }
1203
1204 int ubifs_getattr(struct vfsmount *mnt, struct dentry *dentry,
1205                   struct kstat *stat)
1206 {
1207         loff_t size;
1208         struct inode *inode = d_inode(dentry);
1209         struct ubifs_inode *ui = ubifs_inode(inode);
1210
1211         mutex_lock(&ui->ui_mutex);
1212         generic_fillattr(inode, stat);
1213         stat->blksize = UBIFS_BLOCK_SIZE;
1214         stat->size = ui->ui_size;
1215
1216         /*
1217          * Unfortunately, the 'stat()' system call was designed for block
1218          * device based file systems, and it is not appropriate for UBIFS,
1219          * because UBIFS does not have notion of "block". For example, it is
1220          * difficult to tell how many block a directory takes - it actually
1221          * takes less than 300 bytes, but we have to round it to block size,
1222          * which introduces large mistake. This makes utilities like 'du' to
1223          * report completely senseless numbers. This is the reason why UBIFS
1224          * goes the same way as JFFS2 - it reports zero blocks for everything
1225          * but regular files, which makes more sense than reporting completely
1226          * wrong sizes.
1227          */
1228         if (S_ISREG(inode->i_mode)) {
1229                 size = ui->xattr_size;
1230                 size += stat->size;
1231                 size = ALIGN(size, UBIFS_BLOCK_SIZE);
1232                 /*
1233                  * Note, user-space expects 512-byte blocks count irrespectively
1234                  * of what was reported in @stat->size.
1235                  */
1236                 stat->blocks = size >> 9;
1237         } else
1238                 stat->blocks = 0;
1239         mutex_unlock(&ui->ui_mutex);
1240         return 0;
1241 }
1242
1243 const struct inode_operations ubifs_dir_inode_operations = {
1244         .lookup      = ubifs_lookup,
1245         .create      = ubifs_create,
1246         .link        = ubifs_link,
1247         .symlink     = ubifs_symlink,
1248         .unlink      = ubifs_unlink,
1249         .mkdir       = ubifs_mkdir,
1250         .rmdir       = ubifs_rmdir,
1251         .mknod       = ubifs_mknod,
1252         .rename      = ubifs_rename,
1253         .setattr     = ubifs_setattr,
1254         .getattr     = ubifs_getattr,
1255         .setxattr    = generic_setxattr,
1256         .getxattr    = generic_getxattr,
1257         .listxattr   = ubifs_listxattr,
1258         .removexattr = generic_removexattr,
1259 #ifdef CONFIG_UBIFS_ATIME_SUPPORT
1260         .update_time = ubifs_update_time,
1261 #endif
1262         .tmpfile     = ubifs_tmpfile,
1263 };
1264
1265 const struct file_operations ubifs_dir_operations = {
1266         .llseek         = generic_file_llseek,
1267         .release        = ubifs_dir_release,
1268         .read           = generic_read_dir,
1269         .iterate_shared = ubifs_readdir,
1270         .fsync          = ubifs_fsync,
1271         .unlocked_ioctl = ubifs_ioctl,
1272 #ifdef CONFIG_COMPAT
1273         .compat_ioctl   = ubifs_compat_ioctl,
1274 #endif
1275 };