locking.txt
上传用户:ycwykj01
上传日期:2007-01-04
资源大小:1819k
文件大小:18k
源码类别:

网络编程

开发平台:

Unix_Linux

  1.  UNIX Advisory File Locking Implications on c-client
  2.     Mark Crispin, 28 November 1995
  3. THIS DOCUMENT HAS BEEN UPDATED TO REFLECT THE CODE IN THE
  4. IMAP-4 TOOLKIT AS OF NOVEMBER 28, 1995.  SOME STATEMENTS
  5. IN THIS DOCUMENT DO NOT APPLY TO EARLIER VERSIONS OF THE
  6. IMAP TOOLKIT.
  7. INTRODUCTION
  8.      Advisory locking is a mechanism by which cooperating processes
  9. can signal to each other their usage of a resource and whether or not
  10. that usage is critical.  It is not a mechanism to protect against
  11. processes which do not cooperate in the locking.
  12.      The most basic form of locking involves a counter.  This counter
  13. is -1 when the resource is available.  If a process wants the lock, it
  14. executes an atomic increment-and-test-if-zero.  If the value is zero,
  15. the process has the lock and can execute the critical code that needs
  16. exclusive usage of a resource.  When it is finished, it sets the lock
  17. back to -1.  In C terms:
  18.   while (++lock) /* try to get lock */
  19.     invoke_other_threads (); /* failed, try again */
  20.    .
  21.    . /* critical code  here */
  22.    .
  23.   lock = -1; /* release lock */
  24.      This particular form of locking appears most commonly in
  25. multi-threaded applications such as operating system kernels.  It
  26. makes several presumptions:
  27.  (1) it is alright to keep testing the lock (no overflow)
  28.  (2) the critical resource is single-access only
  29.  (3) there is shared writeable memory between the two threads
  30.  (4) the threads can be trusted to release the lock when finished
  31.      In applications programming on multi-user systems, most commonly
  32. the other threads are in an entirely different process, which may even
  33. be logged in as a different user.  Few operating systems offer shared
  34. writeable memory between such processes.
  35.      A means of communicating this is by use of a file with a mutually
  36. agreed upon name.  A binary semaphore can be passed by means of the
  37. existance or non-existance of that file, provided that there is an
  38. atomic means to create a file if and only if that file does not exist.
  39. In C terms:
  40. /* try to get lock */
  41.   while ((fd = open ("lockfile",O_WRONLY|O_CREAT|O_EXCL,0666)) < 0)
  42.     sleep (1); /* failed, try again */
  43.   close (fd); /* got the lock */
  44.    .
  45.    . /* critical code  here */
  46.    .
  47.   unlink ("lockfile");  /* release lock */
  48.      This form of locking makes fewer presumptions, but it still is
  49. guilty of presumptions (2) and (4) above.  Presumption (2) limits the
  50. ability to have processes sharing a resource in a non-conflicting
  51. fashion (e.g. reading from a file).  Presumption (4) leads to
  52. deadlocks should the process crash while it has a resource locked.
  53.      Most modern operating systems provide a resource locking system
  54. call that has none of these presumptions.  In particular, a mechanism
  55. is provided for identifying shared locks as opposed to exclusive
  56. locks.  A shared lock permits other processes to obtain a shared lock,
  57. but denies exclusive locks.  In other words:
  58. current state want shared want exclusive
  59. ------------- ----------- --------------
  60.  unlocked  YES  YES
  61.  locked shared  YES  NO
  62.  locked exclusive  NO  NO
  63.      Furthermore, the operating system automatically relinquishes all
  64. locks held by that process when it terminates.
  65.      A useful operation is the ability to upgrade a shared lock to
  66. exclusive (provided there are no other shared users of the lock) and
  67. to downgrade an exclusive lock to shared.  It is important that at no
  68. time is the lock ever removed; a process upgrading to exclusive must
  69. not relenquish its shared lock.
  70.      Most commonly, the resources being locked are files.  Shared
  71. locks are particularly important with files; multiple simultaneous
  72. processes can read from a file, but only one can safely write at a
  73. time.  Some writes may be safer than others; an append to the end of
  74. the file is safer than changing existing file data.  In turn, changing
  75. a file record in place is safer than rewriting the file with an
  76. entirely different structure.
  77. FILE LOCKING ON UNIX
  78.      In the oldest versions of UNIX, the use of a semaphore lockfile
  79. was the only available form of locking.  Advisory locking system calls
  80. were not added to UNIX until after the BSD vs. System V split.  Both
  81. of these system calls deal with file resources only.
  82.      Most systems only have one or the other form of locking.  AIX
  83. emulates the BSD form of locking as a jacket into the System V form.
  84. Ultrix and OSF/1 implement both forms.
  85. BSD
  86.      BSD added the flock() system call.  It offers capabilities to
  87. acquire shared lock, acquire exclusive lock, and unlock.  Optionally,
  88. the process can request an immediate error return instead of blocking
  89. when the lock is unavailable.
  90. FLOCK() BUGS
  91.      flock() advertises that it permits upgrading of shared locks to
  92. exclusive and downgrading of exclusive locks to shared, but it does so
  93. by releasing the former lock and then trying to acquire the new lock.
  94. This creates a window of vulnerability in which another process can
  95. grab the exclusive lock.  Therefore, this capability is not useful,
  96. although many programmers have been deluded by incautious reading of
  97. the flock() man page to believe otherwise.  This problem can be
  98. programmed around, once the programmer is aware of it.
  99.      flock() always returns as if it succeeded on NFS files, when in
  100. fact it is a no-op.  There is no way around this.
  101.      Leaving aside these two problems, flock() works remarkably well,
  102. and has shown itself to be robust and trustworthy.
  103. SYSTEM V/POSIX
  104.      System V added new functions to the fnctl() system call, and a
  105. simple interface through the lockf() subroutine.  This was
  106. subsequently included in POSIX.  Both offer the facility to apply the
  107. lock to a particular region of the file instead of to the entire file.
  108. lockf() only supports exclusive locks, and calls fcntl() internally;
  109. hence it won't be discussed further.
  110.      Functionally, fcntl() locking is a superset of flock(); it is
  111. possible to implement a flock() emulator using fcntl(), with one minor
  112. exception: it is not possible to acquire an exclusive lock if the file
  113. is not open for write.
  114.      The fcntl() locking functions are: query lock station of a file
  115. region, lock/unlock a region, and lock/unlock a region and block until
  116. have the lock.  The locks may be shared or exclusive.  By means of the
  117. statd and lockd daemons, fcntl() locking is available on NFS files.
  118.      When statd is started at system boot, it reads its /etc/state
  119. file (which contains the number of times it has been invoked) and
  120. /etc/sm directory (which contains a list of all remote sites which are
  121. client or server locking with this site), and notifies the statd on
  122. each of these systems that it has been restarted.  Each statd then
  123. notifies the local lockd of the restart of that system.
  124.      lockd receives fcntl() requests for NFS files.  It communicates
  125. with the lockd at the server and requests it to apply the lock, and
  126. with the statd to request it for notification when the server goes
  127. down.  It blocks until all these requests are completed.
  128.      There is quite a mythos about fcntl() locking.
  129.      One religion holds that fcntl() locking is the best thing since
  130. sliced bread, and that programs which use flock() should be converted
  131. to fcntl() so that NFS locking will work.  However, as noted above,
  132. very few systems support both calls, so such an exercise is pointless
  133. except on Ultrix and OSF/1.
  134.      Another religion, which I adhere to, has the opposite viewpoint.
  135. FCNTL() BUGS
  136.      For all of the hairy code to do individual section locking of a
  137. file, it's clear that the designers of fcntl() locking never
  138. considered some very basic locking operations.  It's as if all they
  139. knew about locking they got out of some CS textbook with not
  140. investigation of real-world needs.
  141.      It is not possible to acquire an exclusive lock unless the file
  142. is open for write.  You could have append with shared read, and thus
  143. you could have a case in which a read-only access may need to go
  144. exclusive.  This problem can be programmed around once the programmer
  145. is aware of it.
  146.      If the file is opened on another file designator in the same
  147. process, the file is unlocked even if no attempt is made to do any
  148. form of locking on the second designator.  This is a very bad bug.  It
  149. means that an application must keep track of all the files that it has
  150. opened and locked.
  151.      If there is no statd/lockd on the NFS server, fcntl() will hang
  152. forever waiting for them to appear.  This is a bad bug.  It means that
  153. any attempt to lock on a server that doesn't run these daemons will
  154. hang.  There is no way for an application to request flock() style
  155. ``try to lock, but no-op if the mechanism ain't there''.
  156.      There is a rumor to the effect that fcntl() will hang forever on
  157. local files too if there is no local statd/lockd.  These daemons are
  158. running on mailer.u, although they appear not to have much CPU time.
  159. A useful experiment would be to kill them and see if imapd is affected
  160. in any way, but I decline to do so without an OK from UCS!  ;-) If
  161. killing statd/lockd can be done without breaking fcntl() on local
  162. files, this would become one of the primary means of dealing with this
  163. problem.
  164.      The statd and lockd daemons have quite a reputation for extreme
  165. fragility.  There have been numerous reports about the locking
  166. mechanism being wedged on a systemwide or even clusterwide basis,
  167. requiring a reboot to clear.  It is rumored that this wedge, once it
  168. happens, also blocks local locking.  Presumably killing and restarting
  169. statd would suffice to clear the wedge, but I haven't verified this.
  170.      There appears to be a limit to how many locks may be in use at a
  171. time on the system, although the documentation only mentions it in
  172. passing.  On some of their systems, UCS has increased lockd's ``size
  173. of the socket buffer'', whatever that means.
  174. C-CLIENT USAGE
  175.      c-client uses flock().  On System V systems, flock() is simulated
  176. by an emulator that calls fcntl().  This emulator is provided by some
  177. systems (e.g. AIX), or uses c-client's flock.c module.
  178. BEZERK AND MMDF
  179.      Locking in the traditional UNIX formats was largely dictated by
  180. the status quo in other applications; however, additional protection
  181. is added against inadvertantly running multiple instances of a
  182. c-client application on the same mail file.
  183.      (1) c-client attempts to create a .lock file (mail file name with
  184. ``.lock'' appended) whenever it reads from, or writes to, the mail
  185. file.  This is an exclusive lock, and is held only for short periods
  186. of time while c-client is actually doing the I/O.  There is a 5-minute
  187. timeout for this lock, after which it is broken on the presumption
  188. that it is a stale lock.  If it can not create the .lock file due to
  189. an EACCES (protection failure) error, it once silently proceeded
  190. without this lock; this was for systems which protect /usr/spool/mail
  191. from unprivileged processes creating files.  Today, c-client reports
  192. an error unless it is built otherwise.  The purpose of this lock is to
  193. prevent against unfavorable interactions with mail delivery.
  194.      (2) c-client applies a shared flock() to the mail file whenever
  195. it reads from the mail file, and an exclusive flock() whenever it
  196. writes to the mail file.  This lock is freed as soon as it finishes
  197. reading.  The purpose of this lock is to prevent against unfavorable
  198. interactions with mail delivery.
  199.      (3) c-client applies an exclusive flock() to a file on /tmp
  200. (whose name represents the device and inode number of the file) when
  201. it opens the mail file.  This lock is maintained throughout the
  202. session, although c-client has a feature (called ``kiss of death'')
  203. which permits c-client to forcibly and irreversibly seize the lock
  204. from a cooperating c-client application that surrenders the lock on
  205. demand.  The purpose of this lock is to prevent against unfavorable
  206. interactions with other instances of c-client (rewriting the mail
  207. file).
  208.      Mail delivery daemons use lock (1), (2), or both.  Lock (1) works
  209. over NFS; lock (2) is the only one that works on sites that protect
  210. /usr/spool/mail against unprivileged file creation.  Prudent mail
  211. delivery daemons use both forms of locking, and of course so does
  212. c-client.
  213.      If only lock (2) is used, then multiple processes can read from
  214. the mail file simultaneously, although in real life this doesn't
  215. really change things.  The normal state of locks (1) and (2) is
  216. unlocked except for very brief periods.
  217. TENEX AND MTX
  218.      The design of the locking mechanism of these formats was
  219. motivated by a design to enable multiple simultaneous read/write
  220. access.  It is almost the reverse of how locking works with
  221. bezerk/mmdf.
  222.      (1) c-client applies a shared flock() to the mail file when it
  223. opens the mail file.  It upgrades this lock to exclusive whenever it
  224. tries to expunge the mail file.  Because of the flock() bug that
  225. upgrading a lock actually releases it, it will not do so until it has
  226. acquired an exclusive lock (2) first.  The purpose of this lock is to
  227. prevent against expunge taking place while some other c-client has the
  228. mail file open (and thus knows where all the messages are).
  229.      (2) c-client applies a shared flock() to a file on /tmp (whose
  230. name represents the device and inode number of the file) when it
  231. parses the mail file.  It applies an exclusive flock() to this file
  232. when it appends new mail to the mail file, as well as before it
  233. attempts to upgrade lock (1) to exclusive.  The purpose of this lock
  234. is to prevent against data being appended while some other c-client is
  235. parsing mail in the file (to prevent reading of incomplete messages).
  236. It also protects against the lock-releasing timing race on lock (1).
  237. OBSERVATIONS
  238.      In a perfect world, locking works.  You are protected against
  239. unfavorable interactions with the mailer and against your own mistake
  240. by running more than one instance of your mail reader.  In tenex/mtx
  241. formats, you have the additional benefit that multiple simultaneous
  242. read/write access works, with the sole restriction being that you
  243. can't expunge if there are any sharers of the mail file.
  244.      If the mail file is NFS-mounted, then flock() locking is a silent
  245. no-op.  This is the way BSD implements flock(), and c-client's
  246. emulation of flock() through fcntl() tests for NFS files and
  247. duplicates this functionality.  There is no locking protection for
  248. tenex/mtx mail files at all, and only protection against the mailer
  249. for bezerk/mmdf mail files.  This has been the accepted state of
  250. affairs on UNIX for many sad years.
  251.      If you can not create .lock files, it should not affect locking,
  252. since the flock() locks suffice for all protection.  This is, however,
  253. not true if the mailer does not check for flock() locking, or if the
  254. the mail file is NFS-mounted.
  255.      What this means is that there is *no* locking protection at all
  256. in the case of a client using an NFS-mounted /usr/spool/mail that does
  257. not permit file creation by unprivileged programs.  It is impossible,
  258. under these circumstances, for an unprivileged program to do anything
  259. about it.  Worse, if EACCES errors on .lock file creation are no-op'ed
  260. , the user won't even know about it.  This is arguably a site
  261. configuration error.
  262.      The problem with not being able to create .lock files exists on
  263. System V as well, but the failure modes for flock() -- which is
  264. implemented via fcntl() -- are different.
  265.      On System V, if the mail file is NFS-mounted and either the
  266. client or the server lacks a functioning statd/lockd pair, then the
  267. lock attempt would have hung forever if it weren't for the fact that
  268. c-client tests for NFS and no-ops the flock() emulator in this case.
  269. Systemwide or clusterwide failures of statd/lockd have been known to
  270. occur which cause all locks in all processes to hang (including
  271. local?).  Without the special NFS test made by c-client, there would
  272. be no way to request BSD-style no-op behavior, nor is there any way to
  273. determine that this is happening other than the system being hung.
  274.      The additional locking introduced by c-client was shown to cause
  275. much more stress on the System V locking mechanism than has
  276. traditionally been placed upon it.  If it was stressed too far, all
  277. hell broke loose.  Fortunately, this is now past history.
  278. TRADEOFFS
  279.      c-client based applications have a reasonable chance of winning
  280. as long as you don't use NFS for remote access to mail files.  That's
  281. what IMAP is for, after all.  It is, however, very important to
  282. realize that you can *not* use the lock-upgrade feature by itself
  283. because it releases the lock as an interim step -- you need to have
  284. lock-upgrading guarded by another lock.
  285.      If you have the misfortune of using System V, you are likely to
  286. run into problems sooner or later having to do with statd/lockd.  You
  287. basically end up with one of three unsatisfactory choices:
  288. 1) Grit your teeth and live with it.
  289. 2) Try to make it work:
  290.    a) avoid NFS access so as not to stress statd/lockd.
  291.    b) try to understand the code in statd/lockd and hack it
  292.       to be more robust.
  293.    c) hunt out the system limit of locks, if there is one,
  294.       and increase it.  Figure on at least two locks per
  295.       simultaneous imapd process and four locks per Pine
  296.       process.  Better yet, make the limit be 10 times the
  297.       maximum number of processes.
  298.    d) increase the socket buffer (-S switch to lockd) if
  299.       it is offered.  I don't know what this actually does,
  300.       but giving lockd more resources to do its work can't
  301.       hurt.  Maybe.
  302. 3) Decide that it can't possibly work, and turn off the 
  303.    fcntl() calls in your program.
  304. 4) If nuking statd/lockd can be done without breaking local
  305.    locking, then do so.  This would make SVR4 have the same
  306.    limitations as BSD locking, with a couple of additional
  307.    bugs.
  308. 5) Check for NFS, and don't do the fcntl() in the NFS case.
  309.    This is what c-client does.
  310.      Note that if you are going to use NFS to access files on a server
  311. which does not have statd/lockd running, your only choice is (3), (4),
  312. or (5).  Here again, IMAP can bail you out.
  313.      These problems aren't unique to c-client applications; they have
  314. also been reported with Elm, Mediamail, and other email tools.
  315.      Of the other two SVR4 locking bugs:
  316.      Programmer awareness is necessary to deal with the bug that you
  317. can not get an exclusive lock unless the file is open for write.  I
  318. believe that c-client has fixed all of these cases.
  319.      The problem about opening a second designator smashing any
  320. current locks on the file has not been addressed satisfactorily yet.
  321. This is not an easy problem to deal with, especially in c-client which
  322. really doesn't know what other files/streams may be open by Pine.
  323.      Aren't you so happy that you bought an System V system?