Btrfs: very minimal locking
[linux-2.6-block.git] / fs / btrfs / super.c
1 #include <linux/module.h>
2 #include <linux/buffer_head.h>
3 #include <linux/fs.h>
4 #include <linux/pagemap.h>
5 #include <linux/highmem.h>
6 #include <linux/time.h>
7 #include <linux/init.h>
8 #include <linux/string.h>
9 #include <linux/smp_lock.h>
10 #include <linux/backing-dev.h>
11 #include "ctree.h"
12 #include "disk-io.h"
13 #include "transaction.h"
14
15 #define BTRFS_SUPER_MAGIC 0x9123682E
16
17 static struct inode_operations btrfs_dir_inode_operations;
18 static struct super_operations btrfs_super_ops;
19 static struct file_operations btrfs_dir_file_operations;
20
21 #if 0
22 /* some random number */
23
24 static struct super_operations ramfs_ops;
25
26 static struct backing_dev_info ramfs_backing_dev_info = {
27         .ra_pages       = 0,    /* No readahead */
28         .capabilities   = BDI_CAP_NO_ACCT_DIRTY | BDI_CAP_NO_WRITEBACK |
29                           BDI_CAP_MAP_DIRECT | BDI_CAP_MAP_COPY |
30                           BDI_CAP_READ_MAP | BDI_CAP_WRITE_MAP | BDI_CAP_EXEC_MAP,
31 };
32
33 struct inode *ramfs_get_inode(struct super_block *sb, int mode, dev_t dev)
34 {
35         struct inode * inode = new_inode(sb);
36
37         if (inode) {
38                 inode->i_mode = mode;
39                 inode->i_uid = current->fsuid;
40                 inode->i_gid = current->fsgid;
41                 inode->i_blocks = 0;
42                 inode->i_mapping->a_ops = &ramfs_aops;
43                 inode->i_mapping->backing_dev_info = &ramfs_backing_dev_info;
44                 inode->i_atime = inode->i_mtime = inode->i_ctime = CURRENT_TIME;
45                 switch (mode & S_IFMT) {
46                 default:
47                         init_special_inode(inode, mode, dev);
48                         break;
49                 case S_IFREG:
50                         inode->i_op = &ramfs_file_inode_operations;
51                         inode->i_fop = &ramfs_file_operations;
52                         break;
53                 case S_IFDIR:
54                         inode->i_op = &ramfs_dir_inode_operations;
55                         inode->i_fop = &simple_dir_operations;
56
57                         /* directory inodes start off with i_nlink == 2 (for "." entry) */
58                         inc_nlink(inode);
59                         break;
60                 case S_IFLNK:
61                         inode->i_op = &page_symlink_inode_operations;
62                         break;
63                 }
64         }
65         return inode;
66 }
67
68 /*
69  * File creation. Allocate an inode, and we're done..
70  */
71 /* SMP-safe */
72 static int
73 ramfs_mknod(struct inode *dir, struct dentry *dentry, int mode, dev_t dev)
74 {
75         struct inode * inode = ramfs_get_inode(dir->i_sb, mode, dev);
76         int error = -ENOSPC;
77
78         if (inode) {
79                 if (dir->i_mode & S_ISGID) {
80                         inode->i_gid = dir->i_gid;
81                         if (S_ISDIR(mode))
82                                 inode->i_mode |= S_ISGID;
83                 }
84                 d_instantiate(dentry, inode);
85                 dget(dentry);   /* Extra count - pin the dentry in core */
86                 error = 0;
87                 dir->i_mtime = dir->i_ctime = CURRENT_TIME;
88         }
89         return error;
90 }
91
92 static int ramfs_mkdir(struct inode * dir, struct dentry * dentry, int mode)
93 {
94         int retval = ramfs_mknod(dir, dentry, mode | S_IFDIR, 0);
95         if (!retval)
96                 inc_nlink(dir);
97         return retval;
98 }
99
100 static int ramfs_create(struct inode *dir, struct dentry *dentry, int mode, struct nameidata *nd)
101 {
102         return ramfs_mknod(dir, dentry, mode | S_IFREG, 0);
103 }
104
105 static int ramfs_symlink(struct inode * dir, struct dentry *dentry, const char * symname)
106 {
107         struct inode *inode;
108         int error = -ENOSPC;
109
110         inode = ramfs_get_inode(dir->i_sb, S_IFLNK|S_IRWXUGO, 0);
111         if (inode) {
112                 int l = strlen(symname)+1;
113                 error = page_symlink(inode, symname, l);
114                 if (!error) {
115                         if (dir->i_mode & S_ISGID)
116                                 inode->i_gid = dir->i_gid;
117                         d_instantiate(dentry, inode);
118                         dget(dentry);
119                         dir->i_mtime = dir->i_ctime = CURRENT_TIME;
120                 } else
121                         iput(inode);
122         }
123         return error;
124 }
125
126 static struct inode_operations ramfs_dir_inode_operations = {
127         .create         = ramfs_create,
128         .lookup         = simple_lookup,
129         .link           = simple_link,
130         .unlink         = simple_unlink,
131         .symlink        = ramfs_symlink,
132         .mkdir          = ramfs_mkdir,
133         .rmdir          = simple_rmdir,
134         .mknod          = ramfs_mknod,
135         .rename         = simple_rename,
136 };
137 #endif
138
139 static void btrfs_read_locked_inode(struct inode *inode)
140 {
141         struct btrfs_path path;
142         struct btrfs_inode_item *inode_item;
143         struct btrfs_root *root = btrfs_sb(inode->i_sb);
144         int ret;
145         btrfs_init_path(&path);
146         ret = btrfs_lookup_inode(NULL, root, &path, inode->i_ino, 0);
147         if (ret) {
148                 make_bad_inode(inode);
149                 return;
150         }
151         inode_item = btrfs_item_ptr(btrfs_buffer_leaf(path.nodes[0]),
152                                   path.slots[0],
153                                   struct btrfs_inode_item);
154
155         inode->i_mode = btrfs_inode_mode(inode_item);
156         inode->i_nlink = btrfs_inode_nlink(inode_item);
157         inode->i_uid = btrfs_inode_uid(inode_item);
158         inode->i_gid = btrfs_inode_gid(inode_item);
159         inode->i_size = btrfs_inode_size(inode_item);
160         inode->i_atime.tv_sec = btrfs_timespec_sec(&inode_item->atime);
161         inode->i_atime.tv_nsec = btrfs_timespec_nsec(&inode_item->atime);
162         inode->i_mtime.tv_sec = btrfs_timespec_sec(&inode_item->mtime);
163         inode->i_mtime.tv_nsec = btrfs_timespec_nsec(&inode_item->mtime);
164         inode->i_ctime.tv_sec = btrfs_timespec_sec(&inode_item->ctime);
165         inode->i_ctime.tv_nsec = btrfs_timespec_nsec(&inode_item->ctime);
166         inode->i_blocks = btrfs_inode_nblocks(inode_item);
167         inode->i_generation = btrfs_inode_generation(inode_item);
168         btrfs_release_path(root, &path);
169         switch (inode->i_mode & S_IFMT) {
170 #if 0
171         default:
172                 init_special_inode(inode, inode->i_mode,
173                                    btrfs_inode_rdev(inode_item));
174                 break;
175 #endif
176         case S_IFREG:
177                 break;
178         case S_IFDIR:
179                 inode->i_op = &btrfs_dir_inode_operations;
180                 inode->i_fop = &btrfs_dir_file_operations;
181                 break;
182         case S_IFLNK:
183                 // inode->i_op = &page_symlink_inode_operations;
184                 break;
185         }
186         return;
187 }
188
189 static int btrfs_inode_by_name(struct inode *dir, struct dentry *dentry,
190                               ino_t *ino)
191 {
192         const char *name = dentry->d_name.name;
193         int namelen = dentry->d_name.len;
194         struct btrfs_dir_item *di;
195         struct btrfs_path path;
196         struct btrfs_root *root = btrfs_sb(dir->i_sb);
197         int ret;
198
199         btrfs_init_path(&path);
200         ret = btrfs_lookup_dir_item(NULL, root, &path, dir->i_ino, name,
201                                     namelen, 0);
202         if (ret || !btrfs_match_dir_item_name(root, &path, name, namelen)) {
203                 *ino = 0;
204                 goto out;
205         }
206         di = btrfs_item_ptr(btrfs_buffer_leaf(path.nodes[0]), path.slots[0],
207                             struct btrfs_dir_item);
208         *ino = btrfs_dir_objectid(di);
209 out:
210         btrfs_release_path(root, &path);
211         return ret;
212 }
213
214 static struct dentry *btrfs_lookup(struct inode *dir, struct dentry *dentry,
215                                    struct nameidata *nd)
216 {
217         struct inode * inode;
218         ino_t ino;
219         int ret;
220
221         if (dentry->d_name.len > BTRFS_NAME_LEN)
222                 return ERR_PTR(-ENAMETOOLONG);
223
224         ret = btrfs_inode_by_name(dir, dentry, &ino);
225         if (ret < 0)
226                 return ERR_PTR(ret);
227         inode = NULL;
228         if (ino) {
229                 inode = iget(dir->i_sb, ino);
230                 if (!inode)
231                         return ERR_PTR(-EACCES);
232         }
233         return d_splice_alias(inode, dentry);
234 }
235
236 static int btrfs_readdir(struct file *filp, void *dirent, filldir_t filldir)
237 {
238         struct inode *inode = filp->f_path.dentry->d_inode;
239         struct btrfs_root *root = btrfs_sb(inode->i_sb);
240         struct btrfs_item *item;
241         struct btrfs_dir_item *di;
242         struct btrfs_key key;
243         struct btrfs_path path;
244         int ret;
245         u32 nritems;
246         struct btrfs_leaf *leaf;
247         int slot;
248         int advance;
249         unsigned char d_type = DT_UNKNOWN;
250         int over = 0;
251
252         key.objectid = inode->i_ino;
253         key.flags = 0;
254         btrfs_set_key_type(&key, BTRFS_DIR_ITEM_KEY);
255         key.offset = filp->f_pos;
256         btrfs_init_path(&path);
257         ret = btrfs_search_slot(NULL, root, &key, &path, 0, 0);
258         if (ret < 0) {
259                 goto err;
260         }
261         advance = 0;
262         while(1) {
263                 leaf = btrfs_buffer_leaf(path.nodes[0]);
264                 nritems = btrfs_header_nritems(&leaf->header);
265                 slot = path.slots[0];
266                 if (advance) {
267                         if (slot == nritems -1) {
268                                 ret = btrfs_next_leaf(root, &path);
269                                 if (ret)
270                                         break;
271                                 leaf = btrfs_buffer_leaf(path.nodes[0]);
272                                 nritems = btrfs_header_nritems(&leaf->header);
273                                 slot = path.slots[0];
274                         } else {
275                                 slot++;
276                                 path.slots[0]++;
277                         }
278                 }
279                 advance = 1;
280                 item = leaf->items + slot;
281                 if (btrfs_disk_key_objectid(&item->key) != key.objectid)
282                         break;
283                 if (btrfs_disk_key_type(&item->key) != BTRFS_DIR_ITEM_KEY)
284                         continue;
285                 if (btrfs_disk_key_offset(&item->key) < filp->f_pos)
286                         continue;
287                 di = btrfs_item_ptr(leaf, slot, struct btrfs_dir_item);
288                 over = filldir(dirent, (const char *)(di + 1),
289                                btrfs_dir_name_len(di),
290                                btrfs_disk_key_offset(&item->key),
291                                btrfs_dir_objectid(di), d_type);
292                 if (over) {
293                         filp->f_pos = btrfs_disk_key_offset(&item->key);
294                         break;
295                 }
296                 filp->f_pos = btrfs_disk_key_offset(&item->key) + 1;
297         }
298         ret = 0;
299 err:
300         btrfs_release_path(root, &path);
301         return ret;
302 }
303
304 static void btrfs_put_super (struct super_block * sb)
305 {
306         struct btrfs_root *root = btrfs_sb(sb);
307         int ret;
308
309         ret = close_ctree(root);
310         if (ret) {
311                 printk("close ctree returns %d\n", ret);
312         }
313         sb->s_fs_info = NULL;
314 }
315
316 static int btrfs_fill_super(struct super_block * sb, void * data, int silent)
317 {
318         struct inode * inode;
319         struct dentry * root_dentry;
320         struct btrfs_super_block *disk_super;
321         struct buffer_head *bh;
322         struct btrfs_root *root;
323
324         sb->s_maxbytes = MAX_LFS_FILESIZE;
325         sb->s_blocksize = PAGE_CACHE_SIZE;
326         sb->s_blocksize_bits = PAGE_CACHE_SHIFT;
327         sb->s_magic = BTRFS_SUPER_MAGIC;
328         sb->s_op = &btrfs_super_ops;
329         sb->s_time_gran = 1;
330
331         bh = sb_bread(sb, BTRFS_SUPER_INFO_OFFSET / sb->s_blocksize);
332         if (!bh) {
333                 printk("btrfs: unable to read on disk super\n");
334                 return -EIO;
335         }
336         disk_super = (struct btrfs_super_block *)bh->b_data;
337         root = open_ctree(sb, bh, disk_super);
338         sb->s_fs_info = root;
339         if (!root) {
340                 printk("btrfs: open_ctree failed\n");
341                 return -EIO;
342         }
343         printk("read in super total blocks %Lu root %Lu\n",
344                btrfs_super_total_blocks(disk_super),
345                btrfs_super_root_dir(disk_super));
346
347         inode = iget_locked(sb, btrfs_super_root_dir(disk_super));
348         if (!inode)
349                 return -ENOMEM;
350         if (inode->i_state & I_NEW) {
351                 btrfs_read_locked_inode(inode);
352                 unlock_new_inode(inode);
353         }
354
355         root_dentry = d_alloc_root(inode);
356         if (!root_dentry) {
357                 iput(inode);
358                 return -ENOMEM;
359         }
360         sb->s_root = root_dentry;
361
362         return 0;
363 }
364
365 static void fill_inode_item(struct btrfs_inode_item *item,
366                             struct inode *inode)
367 {
368         btrfs_set_inode_uid(item, inode->i_uid);
369         btrfs_set_inode_gid(item, inode->i_gid);
370         btrfs_set_inode_size(item, inode->i_size);
371         btrfs_set_inode_mode(item, inode->i_mode);
372         btrfs_set_inode_nlink(item, inode->i_nlink);
373         btrfs_set_timespec_sec(&item->atime, inode->i_atime.tv_sec);
374         btrfs_set_timespec_nsec(&item->atime, inode->i_atime.tv_nsec);
375         btrfs_set_timespec_sec(&item->mtime, inode->i_mtime.tv_sec);
376         btrfs_set_timespec_nsec(&item->mtime, inode->i_mtime.tv_nsec);
377         btrfs_set_timespec_sec(&item->ctime, inode->i_ctime.tv_sec);
378         btrfs_set_timespec_nsec(&item->ctime, inode->i_ctime.tv_nsec);
379         btrfs_set_inode_nblocks(item, inode->i_blocks);
380         btrfs_set_inode_generation(item, inode->i_generation);
381 }
382
383 static struct inode *btrfs_new_inode(struct btrfs_trans_handle *trans,
384                                      struct inode *dir, int mode)
385 {
386         struct inode *inode;
387         struct btrfs_inode_item inode_item;
388         struct btrfs_root *root = btrfs_sb(dir->i_sb);
389         struct btrfs_key key;
390         int ret;
391         u64 objectid;
392
393         inode = new_inode(dir->i_sb);
394         if (!inode)
395                 return ERR_PTR(-ENOMEM);
396
397         ret = btrfs_find_free_objectid(trans, root, dir->i_ino, &objectid);
398         BUG_ON(ret);
399
400         inode->i_uid = current->fsuid;
401         inode->i_gid = current->fsgid;
402         inode->i_mode = mode;
403         inode->i_ino = objectid;
404         inode->i_blocks = 0;
405         inode->i_mtime = inode->i_atime = inode->i_ctime = CURRENT_TIME_SEC;
406         fill_inode_item(&inode_item, inode);
407
408
409         key.objectid = objectid;
410         key.flags = 0;
411         key.offset = 0;
412         btrfs_set_key_type(&key, BTRFS_INODE_ITEM_KEY);
413         ret = btrfs_insert_inode_map(trans, root, objectid, &key);
414         BUG_ON(ret);
415
416         ret = btrfs_insert_inode(trans, root, objectid, &inode_item);
417         BUG_ON(ret);
418
419         insert_inode_hash(inode);
420         // FIXME mark_inode_dirty(inode)
421         return inode;
422 }
423
424 static int btrfs_add_link(struct btrfs_trans_handle *trans,
425                             struct dentry *dentry, struct inode *inode)
426 {
427         int ret;
428         ret = btrfs_insert_dir_item(trans, btrfs_sb(inode->i_sb),
429                                     dentry->d_name.name, dentry->d_name.len,
430                                     dentry->d_parent->d_inode->i_ino,
431                                     inode->i_ino, 0);
432         return ret;
433 }
434
435 static int btrfs_add_nondir(struct btrfs_trans_handle *trans,
436                             struct dentry *dentry, struct inode *inode)
437 {
438         int err = btrfs_add_link(trans, dentry, inode);
439         if (!err) {
440                 d_instantiate(dentry, inode);
441                 return 0;
442         }
443         inode_dec_link_count(inode);
444         iput(inode);
445         return err;
446 }
447
448 static int btrfs_create(struct inode *dir, struct dentry *dentry,
449                         int mode, struct nameidata *nd)
450 {
451         struct btrfs_trans_handle *trans;
452         struct btrfs_root *root = btrfs_sb(dir->i_sb);
453         struct inode *inode;
454         int err;
455
456         mutex_lock(&root->fs_info->fs_mutex);
457         trans = btrfs_start_transaction(root, 1);
458         inode = btrfs_new_inode(trans, dir, mode);
459         err = PTR_ERR(inode);
460         if (IS_ERR(inode))
461                 goto out_unlock;
462         // FIXME mark the inode dirty
463         err = btrfs_add_nondir(trans, dentry, inode);
464         dir->i_sb->s_dirt = 1;
465         btrfs_end_transaction(trans, root);
466 out_unlock:
467         mutex_unlock(&root->fs_info->fs_mutex);
468         return err;
469 }
470
471 static int btrfs_sync_fs(struct super_block *sb, int wait)
472 {
473         struct btrfs_trans_handle *trans;
474         struct btrfs_root *root;
475         int ret;
476
477         sb->s_dirt = 0;
478         if (!wait) {
479                 filemap_flush(sb->s_bdev->bd_inode->i_mapping);
480                 return 0;
481         }
482         filemap_write_and_wait(sb->s_bdev->bd_inode->i_mapping);
483
484         root = btrfs_sb(sb);
485         mutex_lock(&root->fs_info->fs_mutex);
486         trans = btrfs_start_transaction(root, 1);
487         ret = btrfs_commit_transaction(trans, root);
488         sb->s_dirt = 0;
489         BUG_ON(ret);
490 printk("btrfs sync_fs\n");
491         mutex_unlock(&root->fs_info->fs_mutex);
492         return 0;
493 }
494
495 static void btrfs_write_super(struct super_block *sb)
496 {
497         btrfs_sync_fs(sb, 1);
498 }
499
500
501 static int btrfs_get_sb(struct file_system_type *fs_type,
502         int flags, const char *dev_name, void *data, struct vfsmount *mnt)
503 {
504         return get_sb_bdev(fs_type, flags, dev_name, data,
505                            btrfs_fill_super, mnt);
506 }
507
508 static struct file_system_type btrfs_fs_type = {
509         .owner          = THIS_MODULE,
510         .name           = "btrfs",
511         .get_sb         = btrfs_get_sb,
512         .kill_sb        = kill_block_super,
513         .fs_flags       = FS_REQUIRES_DEV,
514 };
515
516 static struct super_operations btrfs_super_ops = {
517         .statfs         = simple_statfs,
518         .drop_inode     = generic_delete_inode,
519         .put_super      = btrfs_put_super,
520         .read_inode     = btrfs_read_locked_inode,
521         .write_super    = btrfs_write_super,
522         .sync_fs        = btrfs_sync_fs,
523 };
524
525 static struct inode_operations btrfs_dir_inode_operations = {
526         .lookup         = btrfs_lookup,
527         .create         = btrfs_create,
528 };
529
530 static struct file_operations btrfs_dir_file_operations = {
531         .llseek         = generic_file_llseek,
532         .read           = generic_read_dir,
533         .readdir        = btrfs_readdir,
534 };
535
536
537 static int __init init_btrfs_fs(void)
538 {
539         printk("btrfs loaded!\n");
540         return register_filesystem(&btrfs_fs_type);
541 }
542
543 static void __exit exit_btrfs_fs(void)
544 {
545         unregister_filesystem(&btrfs_fs_type);
546         printk("btrfs unloaded\n");
547 }
548
549 module_init(init_btrfs_fs)
550 module_exit(exit_btrfs_fs)
551
552 MODULE_LICENSE("GPL");