file.c
上传用户:jlfgdled
上传日期:2013-04-10
资源大小:33168k
文件大小:18k
源码类别:

Linux/Unix编程

开发平台:

Unix_Linux

  1. /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
  2.  * vim:expandtab:shiftwidth=8:tabstop=8:
  3.  *
  4.  *  Copyright (C) 2000 Stelias Computing, Inc.
  5.  *  Copyright (C) 2000 Red Hat, Inc.
  6.  *  Copyright (C) 2000 TurboLinux, Inc.
  7.  *  Copyright (C) 2000 Los Alamos National Laboratory.
  8.  *  Copyright (C) 2000, 2001 Tacit Networks, Inc.
  9.  *  Copyright (C) 2000 Peter J. Braam
  10.  *  Copyright (C) 2001 Mountain View Data, Inc. 
  11.  *  Copyright (C) 2001 Cluster File Systems, Inc. 
  12.  *
  13.  *   This file is part of InterMezzo, http://www.inter-mezzo.org.
  14.  *
  15.  *   InterMezzo is free software; you can redistribute it and/or
  16.  *   modify it under the terms of version 2 of the GNU General Public
  17.  *   License as published by the Free Software Foundation.
  18.  *
  19.  *   InterMezzo is distributed in the hope that it will be useful,
  20.  *   but WITHOUT ANY WARRANTY; without even the implied warranty of
  21.  *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  22.  *   GNU General Public License for more details.
  23.  *
  24.  *   You should have received a copy of the GNU General Public License
  25.  *   along with InterMezzo; if not, write to the Free Software
  26.  *   Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
  27.  *
  28.  *  This file manages file I/O
  29.  * 
  30.  */
  31. #include <stdarg.h>
  32. #include <asm/bitops.h>
  33. #include <asm/uaccess.h>
  34. #include <asm/system.h>
  35. #include <linux/errno.h>
  36. #include <linux/fs.h>
  37. #include <linux/ext2_fs.h>
  38. #include <linux/slab.h>
  39. #include <linux/vmalloc.h>
  40. #include <linux/sched.h>
  41. #include <linux/stat.h>
  42. #include <linux/string.h>
  43. #include <linux/locks.h>
  44. #include <linux/blkdev.h>
  45. #include <linux/init.h>
  46. #include <linux/smp_lock.h>
  47. #define __NO_VERSION__
  48. #include <linux/module.h>
  49. #include <linux/intermezzo_fs.h>
  50. #include <linux/intermezzo_psdev.h>
  51. #include <linux/fsfilter.h>
  52. /*
  53.  * these are initialized in super.c
  54.  */
  55. extern int presto_permission(struct inode *inode, int mask);
  56. static int presto_open_upcall(int minor, struct dentry *de)
  57. {
  58.         int rc;
  59.         char *path, *buffer;
  60.         struct presto_file_set *fset;
  61.         int pathlen;
  62.         struct lento_vfs_context info;
  63.         struct presto_dentry_data *dd = presto_d2d(de);
  64.         PRESTO_ALLOC(buffer, PAGE_SIZE);
  65.         if ( !buffer ) {
  66.                 CERROR("PRESTO: out of memory!n");
  67.                 return -ENOMEM;
  68.         }
  69.         fset = presto_fset(de);
  70.         path = presto_path(de, fset->fset_dentry, buffer, PAGE_SIZE);
  71.         pathlen = MYPATHLEN(buffer, path);
  72.         
  73.         CDEBUG(D_FILE, "de %p, dd %pn", de, dd);
  74.         if (dd->remote_ino == 0) {
  75.                 rc = presto_get_fileid(minor, fset, de);
  76.         }
  77.         memset (&info, 0, sizeof(info));
  78.         if (dd->remote_ino > 0) {
  79.                 info.remote_ino = dd->remote_ino;
  80.                 info.remote_generation = dd->remote_generation;
  81.         } else
  82.                 CERROR("get_fileid failed %d, ino: %Lx, fetching by namen", rc,
  83.                        dd->remote_ino);
  84.         rc = izo_upc_open(minor, pathlen, path, fset->fset_name, &info);
  85.         PRESTO_FREE(buffer, PAGE_SIZE);
  86.         return rc;
  87. }
  88. static inline int open_check_dod(struct file *file,
  89.                                  struct presto_file_set *fset)
  90. {
  91.         int gen, is_iopen = 0, minor;
  92.         struct presto_cache *cache = fset->fset_cache;
  93.         ino_t inum;
  94.         minor = presto_c2m(cache);
  95.         if ( ISLENTO(minor) ) {
  96.                 CDEBUG(D_CACHE, "is lento, not doing DOD.n");
  97.                 return 0;
  98.         }
  99.         /* Files are only ever opened by inode during backfetches, when by
  100.          * definition we have the authoritative copy of the data.  No DOD. */
  101.         is_iopen = izo_dentry_is_ilookup(file->f_dentry, &inum, &gen);
  102.         if (is_iopen) {
  103.                 CDEBUG(D_CACHE, "doing iopen, not doing DOD.n");
  104.                 return 0;
  105.         }
  106.         if (!(fset->fset_flags & FSET_DATA_ON_DEMAND)) {
  107.                 CDEBUG(D_CACHE, "fileset not on demand.n");
  108.                 return 0;
  109.         }
  110.                 
  111.         if (file->f_flags & O_TRUNC) {
  112.                 CDEBUG(D_CACHE, "fileset dod: O_TRUNC.n");
  113.                 return 0;
  114.         }
  115.                 
  116.         if (presto_chk(file->f_dentry, PRESTO_DONT_JOURNAL)) {
  117.                 CDEBUG(D_CACHE, "file under .intermezzo, not doing DODn");
  118.                 return 0;
  119.         }
  120.         if (presto_chk(file->f_dentry, PRESTO_DATA)) {
  121.                 CDEBUG(D_CACHE, "PRESTO_DATA is set, not doing DOD.n");
  122.                 return 0;
  123.         }
  124.         if (cache->cache_filter->o_trops->tr_all_data(file->f_dentry->d_inode)) {
  125.                 CDEBUG(D_CACHE, "file not sparse, not doing DOD.n");
  126.                 return 0;
  127.         }
  128.         return 1;
  129. }
  130. static int presto_file_open(struct inode *inode, struct file *file)
  131. {
  132.         int rc = 0;
  133.         struct file_operations *fops;
  134.         struct presto_cache *cache;
  135.         struct presto_file_set *fset;
  136.         struct presto_file_data *fdata;
  137.         int writable = (file->f_flags & (O_RDWR | O_WRONLY));
  138.         int minor, i;
  139.         ENTRY;
  140.         if (presto_prep(file->f_dentry, &cache, &fset) < 0) {
  141.                 EXIT;
  142.                 return -EBADF;
  143.         }
  144.         minor = presto_c2m(cache);
  145.         CDEBUG(D_CACHE, "DATA_OK: %d, ino: %ld, islento: %dn",
  146.                presto_chk(file->f_dentry, PRESTO_DATA), inode->i_ino,
  147.                ISLENTO(minor));
  148.         if ( !ISLENTO(minor) && (file->f_flags & O_RDWR ||
  149.                                  file->f_flags & O_WRONLY)) {
  150.                 CDEBUG(D_CACHE, "calling presto_get_permitn");
  151.                 if ( presto_get_permit(inode) < 0 ) {
  152.                         EXIT;
  153.                         return -EROFS;
  154.                 }
  155.                 presto_put_permit(inode);
  156.         }
  157.         if (open_check_dod(file, fset)) {
  158.                 CDEBUG(D_CACHE, "presto_open_upcalln");
  159.                 CDEBUG(D_CACHE, "dentry: %p setting DATA, ATTRn", file->f_dentry);
  160.                 presto_set(file->f_dentry, PRESTO_ATTR | PRESTO_DATA);
  161.                 rc = presto_open_upcall(minor, file->f_dentry);
  162.                 if (rc) {
  163.                         EXIT;
  164.                         CERROR("%s: returning error %dn", __FUNCTION__, rc);
  165.                         return rc;
  166.                 }
  167.         }
  168.         /* file was truncated upon open: do not refetch */
  169.         if (file->f_flags & O_TRUNC) { 
  170.                 CDEBUG(D_CACHE, "setting DATA, ATTRn");
  171.                 presto_set(file->f_dentry, PRESTO_ATTR | PRESTO_DATA);
  172.         }
  173.         fops = filter_c2cffops(cache->cache_filter);
  174.         if ( fops->open ) {
  175.                 CDEBUG(D_CACHE, "calling fs openn");
  176.                 rc = fops->open(inode, file);
  177.                 if (rc) {
  178.                         EXIT;
  179.                         return rc;
  180.                 }
  181.         }
  182.         if (writable) {
  183.                 PRESTO_ALLOC(fdata, sizeof(*fdata));
  184.                 if (!fdata) {
  185.                         EXIT;
  186.                         return -ENOMEM;
  187.                 }
  188.                 /* LOCK: XXX check that the kernel lock protects this alloc */
  189.                 fdata->fd_do_lml = 0;
  190.                 fdata->fd_bytes_written = 0;
  191.                 fdata->fd_fsuid = current->fsuid;
  192.                 fdata->fd_fsgid = current->fsgid;
  193.                 fdata->fd_mode = file->f_dentry->d_inode->i_mode;
  194.                 fdata->fd_uid = file->f_dentry->d_inode->i_uid;
  195.                 fdata->fd_gid = file->f_dentry->d_inode->i_gid;
  196.                 fdata->fd_ngroups = current->ngroups;
  197.                 for (i=0 ; i < current->ngroups ; i++)
  198.                         fdata->fd_groups[i] = current->groups[i];
  199.                 if (!ISLENTO(minor)) 
  200.                         fdata->fd_info.flags = LENTO_FL_KML; 
  201.                 else { 
  202.                         /* this is for the case of DOD, 
  203.                            reint_close will adjust flags if needed */
  204.                         fdata->fd_info.flags = 0;
  205.                 }
  206.                 presto_getversion(&fdata->fd_version, inode);
  207.                 file->private_data = fdata;
  208.         } else {
  209.                 file->private_data = NULL;
  210.         }
  211.         EXIT;
  212.         return 0;
  213. }
  214. int presto_adjust_lml(struct file *file, struct lento_vfs_context *info)
  215. {
  216.         struct presto_file_data *fdata = 
  217.                 (struct presto_file_data *) file->private_data;
  218.         if (!fdata) { 
  219.                 EXIT;
  220.                 return -EINVAL;
  221.         }
  222.                 
  223.         memcpy(&fdata->fd_info, info, sizeof(*info));
  224.         EXIT;
  225.         return 0; 
  226. }
  227. static int presto_file_release(struct inode *inode, struct file *file)
  228. {
  229.         int rc;
  230.         struct file_operations *fops;
  231.         struct presto_cache *cache;
  232.         struct presto_file_set *fset;
  233.         struct presto_file_data *fdata = 
  234.                 (struct presto_file_data *)file->private_data;
  235.         ENTRY;
  236.         rc = presto_prep(file->f_dentry, &cache, &fset);
  237.         if ( rc ) {
  238.                 EXIT;
  239.                 return rc;
  240.         }
  241.         fops = filter_c2cffops(cache->cache_filter);
  242.         if (fops && fops->release)
  243.                 rc = fops->release(inode, file);
  244.         CDEBUG(D_CACHE, "islento = %d (minor %d), rc %d, data %pn",
  245.                ISLENTO(cache->cache_psdev->uc_minor), 
  246.                cache->cache_psdev->uc_minor, rc, fdata);
  247.         /* this file was modified: ignore close errors, write KML */
  248.         if (fdata && fdata->fd_do_lml) {
  249.                 /* XXX: remove when lento gets file granularity cd */
  250.                 if ( presto_get_permit(inode) < 0 ) {
  251.                         EXIT;
  252.                         return -EROFS;
  253.                 }
  254.         
  255.                 fdata->fd_info.updated_time = file->f_dentry->d_inode->i_mtime;
  256.                 rc = presto_do_close(fset, file); 
  257.                 presto_put_permit(inode);
  258.         }
  259.         if (!rc && fdata) {
  260.                 PRESTO_FREE(fdata, sizeof(*fdata));
  261.                 file->private_data = NULL; 
  262.         }
  263.         
  264.         EXIT;
  265.         return rc;
  266. }
  267. static void presto_apply_write_policy(struct file *file,
  268.                                       struct presto_file_set *fset, loff_t res)
  269. {
  270.         struct presto_file_data *fdata =
  271.                 (struct presto_file_data *)file->private_data;
  272.         struct presto_cache *cache = fset->fset_cache;
  273.         struct presto_version new_file_ver;
  274.         int error;
  275.         struct rec_info rec;
  276.         /* Here we do a journal close after a fixed or a specified
  277.          amount of KBytes, currently a global parameter set with
  278.          sysctl. If files are open for a long time, this gives added
  279.          protection. (XXX todo: per cache, add ioctl, handle
  280.          journaling in a thread, add more options etc.)
  281.         */ 
  282.  
  283.         if ((fset->fset_flags & FSET_JCLOSE_ON_WRITE) &&
  284.             (!ISLENTO(cache->cache_psdev->uc_minor))) {
  285.                 fdata->fd_bytes_written += res;
  286.  
  287.                 if (fdata->fd_bytes_written >= fset->fset_file_maxio) {
  288.                         presto_getversion(&new_file_ver,
  289.                                           file->f_dentry->d_inode);
  290.                         /* This is really heavy weight and should be fixed
  291.                            ASAP. At most we should be recording the number
  292.                            of bytes written and not locking the kernel, 
  293.                            wait for permits, etc, on the write path. SHP
  294.                         */
  295.                         lock_kernel();
  296.                         if ( presto_get_permit(file->f_dentry->d_inode) < 0 ) {
  297.                                 EXIT;
  298.                                 /* we must be disconnected, not to worry */
  299.                                 unlock_kernel();
  300.                                 return; 
  301.                         }
  302.                         error = presto_journal_close(&rec, fset, file,
  303.                                                      file->f_dentry,
  304.                                                      &fdata->fd_version,
  305.                                                      &new_file_ver);
  306.                         presto_put_permit(file->f_dentry->d_inode);
  307.                         unlock_kernel();
  308.                         if ( error ) {
  309.                                 CERROR("presto_close: cannot journal closen");
  310.                                 /* XXX these errors are really bad */
  311.                                 /* panic(); */
  312.                                 return;
  313.                         }
  314.                         fdata->fd_bytes_written = 0;
  315.                 }
  316.         }
  317. }
  318. static ssize_t presto_file_write(struct file *file, const char *buf,
  319.                                  size_t size, loff_t *off)
  320. {
  321.         struct rec_info rec;
  322.         int error;
  323.         struct presto_cache *cache;
  324.         struct presto_file_set *fset;
  325.         struct file_operations *fops;
  326.         ssize_t res;
  327.         int do_lml_here;
  328.         void *handle = NULL;
  329.         unsigned long blocks;
  330.         struct presto_file_data *fdata;
  331.         loff_t res_size; 
  332.         error = presto_prep(file->f_dentry, &cache, &fset);
  333.         if ( error ) {
  334.                 EXIT;
  335.                 return error;
  336.         }
  337.         blocks = (size >> file->f_dentry->d_inode->i_sb->s_blocksize_bits) + 1;
  338.         /* XXX 3 is for ext2 indirect blocks ... */ 
  339.         res_size = 2 * PRESTO_REQHIGH + ((blocks+3) 
  340.                 << file->f_dentry->d_inode->i_sb->s_blocksize_bits);
  341.         error = presto_reserve_space(fset->fset_cache, res_size); 
  342.         CDEBUG(D_INODE, "Reserved %Ld for %dn", res_size, size); 
  343.         if ( error ) { 
  344.                 EXIT;
  345.                 return -ENOSPC;
  346.         }
  347.         CDEBUG(D_INODE, "islento %d, minor: %dn", 
  348.                ISLENTO(cache->cache_psdev->uc_minor),
  349.                cache->cache_psdev->uc_minor); 
  350.         /* 
  351.          *  XXX this lock should become a per inode lock when 
  352.          *  Vinny's changes are in; we could just use i_sem.
  353.          */
  354.         read_lock(&fset->fset_lml.fd_lock); 
  355.         fdata = (struct presto_file_data *)file->private_data;
  356.         do_lml_here = size && (fdata->fd_do_lml == 0) &&
  357.                 !presto_chk(file->f_dentry, PRESTO_DONT_JOURNAL);
  358.         if (do_lml_here)
  359.                 fdata->fd_do_lml = 1;
  360.         read_unlock(&fset->fset_lml.fd_lock); 
  361.         /* XXX 
  362.            There might be a bug here.  We need to make 
  363.            absolutely sure that the ext3_file_write commits 
  364.            after our transaction that writes the LML record.
  365.            Nesting the file write helps if new blocks are allocated. 
  366.         */
  367.         res = 0;
  368.         if (do_lml_here) {
  369.                 struct presto_version file_version;
  370.                 /* handle different space reqs from file system below! */
  371.                 handle = presto_trans_start(fset, file->f_dentry->d_inode, 
  372.                                             KML_OPCODE_WRITE);
  373.                 if ( IS_ERR(handle) ) {
  374.                         presto_release_space(fset->fset_cache, res_size); 
  375.                         CERROR("presto_write: no space for transactionn");
  376.                         return -ENOSPC;
  377.                 }
  378.                 presto_getversion(&file_version, file->f_dentry->d_inode); 
  379.                 res = presto_write_lml_close(&rec, fset, file, 
  380.                                              fdata->fd_info.remote_ino, 
  381.                                              fdata->fd_info.remote_generation, 
  382.                                              &fdata->fd_info.remote_version, 
  383.                                              &file_version);
  384.                 fdata->fd_lml_offset = rec.offset;
  385.                 if ( res ) {
  386.                         CERROR("intermezzo: PANIC failed to write LMLn");
  387.                         *(int *)0 = 1;
  388.                         EXIT;
  389.                         goto exit_write;
  390.                 }
  391.                 presto_trans_commit(fset, handle);
  392.         }
  393.         fops = filter_c2cffops(cache->cache_filter);
  394.         res = fops->write(file, buf, size, off);
  395.         if ( res != size ) {
  396.                 CDEBUG(D_FILE, "file write returns short write: size %d, res %dn", size, res); 
  397.         }
  398.         if ( (res > 0) && fdata ) 
  399.                  presto_apply_write_policy(file, fset, res);
  400.  exit_write:
  401.         presto_release_space(fset->fset_cache, res_size); 
  402.         return res;
  403. }
  404. struct file_operations presto_file_fops = {
  405.         .write   = presto_file_write,
  406.         .open    = presto_file_open,
  407.         .release = presto_file_release,
  408.         .ioctl   = presto_ioctl
  409. };
  410. struct inode_operations presto_file_iops = {
  411.         .permission   = presto_permission,
  412.         .setattr      = presto_setattr,
  413. #ifdef CONFIG_FS_EXT_ATTR
  414.         .set_ext_attr = presto_set_ext_attr,
  415. #endif
  416. };
  417. /* FIXME: I bet we want to add a lock here and in presto_file_open. */
  418. int izo_purge_file(struct presto_file_set *fset, char *file)
  419. {
  420. #if 0
  421.         void *handle = NULL;
  422.         char *path = NULL;
  423.         struct nameidata nd;
  424.         struct dentry *dentry;
  425.         int rc = 0, len;
  426.         loff_t oldsize;
  427.         /* FIXME: not mtpt it's gone */
  428.         len = strlen(fset->fset_cache->cache_mtpt) + strlen(file) + 1;
  429.         PRESTO_ALLOC(path, len + 1);
  430.         if (path == NULL)
  431.                 return -1;
  432.         sprintf(path, "%s/%s", fset->fset_cache->cache_mtpt, file);
  433.         rc = izo_lookup_file(fset, path, &nd);
  434.         if (rc)
  435.                 goto error;
  436.         dentry = nd.dentry;
  437.         /* FIXME: take a lock here */
  438.         if (dentry->d_inode->i_atime > CURRENT_TIME - 5) {
  439.                 /* We lost the race; this file was accessed while we were doing
  440.                  * ioctls and lookups and whatnot. */
  441.                 rc = -EBUSY;
  442.                 goto error_unlock;
  443.         }
  444.         /* FIXME: Check if this file is open. */
  445.         handle = presto_trans_start(fset, dentry->d_inode, KML_OPCODE_TRUNC);
  446.         if (IS_ERR(handle)) {
  447.                 rc = -ENOMEM;
  448.                 goto error_unlock;
  449.         }
  450.         /* FIXME: Write LML record */
  451.         oldsize = dentry->d_inode->i_size;
  452.         rc = izo_do_truncate(fset, dentry, 0, oldsize);
  453.         if (rc != 0)
  454.                 goto error_clear;
  455.         rc = izo_do_truncate(fset, dentry, oldsize, 0);
  456.         if (rc != 0)
  457.                 goto error_clear;
  458.  error_clear:
  459.         /* FIXME: clear LML record */
  460.  error_unlock:
  461.         /* FIXME: release the lock here */
  462.  error:
  463.         if (handle != NULL && !IS_ERR(handle))
  464.                 presto_trans_commit(fset, handle);
  465.         if (path != NULL)
  466.                 PRESTO_FREE(path, len + 1);
  467.         return rc;
  468. #else
  469.         return 0;
  470. #endif
  471. }