os_map.c
上传用户:tsgydb
上传日期:2007-04-14
资源大小:10674k
文件大小:11k
源码类别:

MySQL数据库

开发平台:

Visual C++

  1. /*-
  2.  * See the file LICENSE for redistribution information.
  3.  *
  4.  * Copyright (c) 1996, 1997, 1998, 1999, 2000
  5.  * Sleepycat Software.  All rights reserved.
  6.  */
  7. #include "db_config.h"
  8. #ifndef lint
  9. static const char revid[] = "$Id: os_map.c,v 11.32 2000/11/30 00:58:42 ubell Exp $";
  10. #endif /* not lint */
  11. #ifndef NO_SYSTEM_INCLUDES
  12. #include <sys/types.h>
  13. #ifdef HAVE_MMAP
  14. #include <sys/mman.h>
  15. #endif
  16. #ifdef HAVE_SHMGET
  17. #include <sys/ipc.h>
  18. #include <sys/shm.h>
  19. #endif
  20. #include <string.h>
  21. #endif
  22. #include "db_int.h"
  23. #include "db_page.h"
  24. #include "db_ext.h"
  25. #include "os_jump.h"
  26. #ifdef HAVE_MMAP
  27. static int __os_map __P((DB_ENV *, char *, DB_FH *, size_t, int, int, void **));
  28. #endif
  29. #ifndef HAVE_SHMGET
  30. static int __db_nosystemmem __P((DB_ENV *));
  31. #endif
  32. /*
  33.  * __os_r_sysattach --
  34.  * Create/join a shared memory region.
  35.  *
  36.  * PUBLIC: int __os_r_sysattach __P((DB_ENV *, REGINFO *, REGION *));
  37.  */
  38. int
  39. __os_r_sysattach(dbenv, infop, rp)
  40. DB_ENV *dbenv;
  41. REGINFO *infop;
  42. REGION *rp;
  43. {
  44. if (F_ISSET(dbenv, DB_ENV_SYSTEM_MEM)) {
  45. /*
  46.  * If the region is in system memory on UNIX, we use shmget(2).
  47.  *
  48.  * !!!
  49.  * There exist spinlocks that don't work in shmget memory, e.g.,
  50.  * the HP/UX msemaphore interface.  If we don't have locks that
  51.  * will work in shmget memory, we better be private and not be
  52.  * threaded.  If we reach this point, we know we're public, so
  53.  * it's an error.
  54.  */
  55. #if defined(MUTEX_NO_SHMGET_LOCKS)
  56. __db_err(dbenv,
  57.     "architecture does not support locks inside system shared memory");
  58. return (EINVAL);
  59. #endif
  60. #if defined(HAVE_SHMGET)
  61. {
  62. key_t segid;
  63. int id, ret;
  64. /*
  65.  * We could potentially create based on REGION_CREATE_OK, but
  66.  * that's dangerous -- we might get crammed in sideways if
  67.  * some of the expected regions exist but others do not.  Also,
  68.  * if the requested size differs from an existing region's
  69.  * actual size, then all sorts of nasty things can happen.
  70.  * Basing create solely on REGION_CREATE is much safer -- a
  71.  * recovery will get us straightened out.
  72.  */
  73. if (F_ISSET(infop, REGION_CREATE)) {
  74. /*
  75.  * The application must give us a base System V IPC key
  76.  * value.  Adjust that value based on the region's ID,
  77.  * and correct so the user's original value appears in
  78.  * the ipcs output.
  79.  */
  80. if (dbenv->shm_key == INVALID_REGION_SEGID) {
  81. __db_err(dbenv,
  82.     "no base system shared memory ID specified");
  83. return (EINVAL);
  84. }
  85. segid = (key_t)(dbenv->shm_key + (infop->id - 1));
  86. /*
  87.  * If map to an existing region, assume the application
  88.  * crashed and we're restarting.  Delete the old region
  89.  * and re-try.  If that fails, return an error, the
  90.  * application will have to select a different segment
  91.  * ID or clean up some other way.
  92.  */
  93. if ((id = shmget(segid, 0, 0)) != -1) {
  94. (void)shmctl(id, IPC_RMID, NULL);
  95. if ((id = shmget(segid, 0, 0)) != -1) {
  96. __db_err(dbenv,
  97. "shmget: key: %ld: shared system memory region already exists",
  98.     (long)segid);
  99. return (EAGAIN);
  100. }
  101. }
  102. if ((id =
  103.     shmget(segid, rp->size, IPC_CREAT | 0600)) == -1) {
  104. ret = __os_get_errno();
  105. __db_err(dbenv,
  106. "shmget: key: %ld: unable to create shared system memory region: %s",
  107.     (long)segid, strerror(ret));
  108. return (ret);
  109. }
  110. rp->segid = id;
  111. } else
  112. id = rp->segid;
  113. if ((infop->addr = shmat(id, NULL, 0)) == (void *)-1) {
  114. infop->addr = NULL;
  115. ret = __os_get_errno();
  116. __db_err(dbenv,
  117. "shmat: id %d: unable to attach to shared system memory region: %s",
  118.     id, strerror(ret));
  119. return (ret);
  120. }
  121. return (0);
  122. }
  123. #else
  124. return (__db_nosystemmem(dbenv));
  125. #endif
  126. }
  127. #ifdef HAVE_MMAP
  128. {
  129. DB_FH fh;
  130. int ret;
  131. /*
  132.  * Try to open/create the shared region file.  We DO NOT need to
  133.  * ensure that multiple threads/processes attempting to
  134.  * simultaneously create the region are properly ordered,
  135.  * our caller has already taken care of that.
  136.  */
  137. if ((ret = __os_open(dbenv, infop->name, DB_OSO_REGION |
  138.     (F_ISSET(infop, REGION_CREATE_OK) ? DB_OSO_CREATE : 0),
  139.     infop->mode, &fh)) != 0)
  140. __db_err(dbenv, "%s: %s", infop->name, db_strerror(ret));
  141. /*
  142.  * If we created the file, grow it to its full size before mapping
  143.  * it in.  We really want to avoid touching the buffer cache after
  144.  * mmap(2) is called, doing anything else confuses the hell out of
  145.  * systems without merged VM/buffer cache systems, or, more to the
  146.  * point, *badly* merged VM/buffer cache systems.
  147.  */
  148. if (ret == 0 && F_ISSET(infop, REGION_CREATE))
  149. ret = __os_finit(dbenv,
  150.     &fh, rp->size, DB_GLOBAL(db_region_init));
  151. /* Map the file in. */
  152. if (ret == 0)
  153. ret = __os_map(dbenv,
  154.     infop->name, &fh, rp->size, 1, 0, &infop->addr);
  155.  (void)__os_closehandle(&fh);
  156. return (ret);
  157. }
  158. #else
  159. COMPQUIET(infop, NULL);
  160. COMPQUIET(rp, NULL);
  161. __db_err(dbenv,
  162.     "architecture lacks mmap(2), shared environments not possible");
  163. return (__db_eopnotsup(dbenv));
  164. #endif
  165. }
  166. /*
  167.  * __os_r_sysdetach --
  168.  * Detach from a shared memory region.
  169.  *
  170.  * PUBLIC: int __os_r_sysdetach __P((DB_ENV *, REGINFO *, int));
  171.  */
  172. int
  173. __os_r_sysdetach(dbenv, infop, destroy)
  174. DB_ENV *dbenv;
  175. REGINFO *infop;
  176. int destroy;
  177. {
  178. REGION *rp;
  179. rp = infop->rp;
  180. if (F_ISSET(dbenv, DB_ENV_SYSTEM_MEM)) {
  181. #ifdef HAVE_SHMGET
  182. int ret, segid;
  183. /*
  184.  * We may be about to remove the memory referenced by rp,
  185.  * save the segment ID, and (optionally) wipe the original.
  186.  */
  187. segid = rp->segid;
  188. if (destroy)
  189. rp->segid = INVALID_REGION_SEGID;
  190. if (shmdt(infop->addr) != 0) {
  191. ret = __os_get_errno();
  192. __db_err(dbenv, "shmdt: %s", strerror(ret));
  193. return (ret);
  194. }
  195. if (destroy && shmctl(segid, IPC_RMID,
  196.     NULL) != 0 && (ret = __os_get_errno()) != EINVAL) {
  197. __db_err(dbenv,
  198.     "shmctl: id %ld: unable to delete system shared memory region: %s",
  199.     segid, strerror(ret));
  200. return (ret);
  201. }
  202. return (0);
  203. #else
  204. return (__db_nosystemmem(dbenv));
  205. #endif
  206. }
  207. #ifdef HAVE_MMAP
  208. #ifdef HAVE_MUNLOCK
  209. if (F_ISSET(dbenv, DB_ENV_LOCKDOWN))
  210. (void)munlock(infop->addr, rp->size);
  211. #endif
  212. if (munmap(infop->addr, rp->size) != 0) {
  213. int ret;
  214. ret = __os_get_errno();
  215. __db_err(dbenv, "munmap: %s", strerror(ret));
  216. return (ret);
  217. }
  218. if (destroy && __os_region_unlink(dbenv, infop->name) != 0)
  219. return (__os_get_errno());
  220. return (0);
  221. #else
  222. COMPQUIET(destroy, 0);
  223. return (EINVAL);
  224. #endif
  225. }
  226. /*
  227.  * __os_mapfile --
  228.  * Map in a shared memory file.
  229.  *
  230.  * PUBLIC: int __os_mapfile __P((DB_ENV *,
  231.  * PUBLIC:     char *, DB_FH *, size_t, int, void **));
  232.  */
  233. int
  234. __os_mapfile(dbenv, path, fhp, len, is_rdonly, addrp)
  235. DB_ENV *dbenv;
  236. char *path;
  237. DB_FH *fhp;
  238. int is_rdonly;
  239. size_t len;
  240. void **addrp;
  241. {
  242. #if defined(HAVE_MMAP) && !defined(HAVE_QNX)
  243. return (__os_map(dbenv, path, fhp, len, 0, is_rdonly, addrp));
  244. #else
  245. COMPQUIET(dbenv, NULL);
  246. COMPQUIET(path, NULL);
  247. COMPQUIET(fhp, NULL);
  248. COMPQUIET(is_rdonly, 0);
  249. COMPQUIET(len, 0);
  250. COMPQUIET(addrp, NULL);
  251. return (EINVAL);
  252. #endif
  253. }
  254. /*
  255.  * __os_unmapfile --
  256.  * Unmap the shared memory file.
  257.  *
  258.  * PUBLIC: int __os_unmapfile __P((DB_ENV *, void *, size_t));
  259.  */
  260. int
  261. __os_unmapfile(dbenv, addr, len)
  262. DB_ENV *dbenv;
  263. void *addr;
  264. size_t len;
  265. {
  266. /* If the user replaced the map call, call through their interface. */
  267. if (__db_jump.j_unmap != NULL)
  268. return (__db_jump.j_unmap(addr, len));
  269. #ifdef HAVE_MMAP
  270. #ifdef HAVE_MUNLOCK
  271. if (F_ISSET(dbenv, DB_ENV_LOCKDOWN))
  272. (void)munlock(addr, len);
  273. #else
  274. COMPQUIET(dbenv, NULL);
  275. #endif
  276. return (munmap(addr, len) ? __os_get_errno() : 0);
  277. #else
  278. COMPQUIET(dbenv, NULL);
  279. return (EINVAL);
  280. #endif
  281. }
  282. #ifdef HAVE_MMAP
  283. /*
  284.  * __os_map --
  285.  * Call the mmap(2) function.
  286.  */
  287. static int
  288. __os_map(dbenv, path, fhp, len, is_region, is_rdonly, addrp)
  289. DB_ENV *dbenv;
  290. char *path;
  291. DB_FH *fhp;
  292. int is_region, is_rdonly;
  293. size_t len;
  294. void **addrp;
  295. {
  296. void *p;
  297. int flags, prot, ret;
  298. /* If the user replaced the map call, call through their interface. */
  299. if (__db_jump.j_map != NULL)
  300. return (__db_jump.j_map
  301.     (path, len, is_region, is_rdonly, addrp));
  302. /*
  303.  * If it's read-only, it's private, and if it's not, it's shared.
  304.  * Don't bother with an additional parameter.
  305.  */
  306. flags = is_rdonly ? MAP_PRIVATE : MAP_SHARED;
  307. #ifdef MAP_FILE
  308. /*
  309.  * Historically, MAP_FILE was required for mapping regular files,
  310.  * even though it was the default.  Some systems have it, some
  311.  * don't, some that have it set it to 0.
  312.  */
  313. flags |= MAP_FILE;
  314. #endif
  315. /*
  316.  * I know of no systems that implement the flag to tell the system
  317.  * that the region contains semaphores, but it's not an unreasonable
  318.  * thing to do, and has been part of the design since forever.  I
  319.  * don't think anyone will object, but don't set it for read-only
  320.  * files, it doesn't make sense.
  321.  */
  322. #ifdef MAP_HASSEMAPHORE
  323. if (is_region && !is_rdonly)
  324. flags |= MAP_HASSEMAPHORE;
  325. #else
  326. COMPQUIET(is_region, 0);
  327. #endif
  328. prot = PROT_READ | (is_rdonly ? 0 : PROT_WRITE);
  329. /*
  330.  * XXX
  331.  * Work around a bug in the VMS V7.1 mmap() implementation.  To map
  332.  * a file into memory on VMS it needs to be opened in a certain way,
  333.  * originally.  To get the file opened in that certain way, the VMS
  334.  * mmap() closes the file and re-opens it.  When it does this, it
  335.  * doesn't flush any caches out to disk before closing.  The problem
  336.  * this causes us is that when the memory cache doesn't get written
  337.  * out, the file isn't big enough to match the memory chunk and the
  338.  * mmap() call fails.  This call to fsync() fixes the problem.  DEC
  339.  * thinks this isn't a bug because of language in XPG5 discussing user
  340.  * responsibility for on-disk and in-memory synchronization.
  341.  */
  342. #ifdef VMS
  343. if (__os_fsync(dbenv, fhp) == -1)
  344. return (__os_get_errno());
  345. #endif
  346. /* MAP_FAILED was not defined in early mmap implementations. */
  347. #ifndef MAP_FAILED
  348. #define MAP_FAILED -1
  349. #endif
  350. if ((p = mmap(NULL,
  351.     len, prot, flags, fhp->fd, (off_t)0)) == (void *)MAP_FAILED) {
  352. ret = __os_get_errno();
  353. __db_err(dbenv, "mmap: %s", strerror(ret));
  354. return (ret);
  355. }
  356. #ifdef HAVE_MLOCK
  357. /*
  358.  * If it's a region, we want to make sure that the memory isn't paged.
  359.  * For example, Solaris will page large mpools because it thinks that
  360.  * I/O buffer memory is more important than we are.  The mlock system
  361.  * call may or may not succeed (mlock is restricted to the super-user
  362.  * on some systems).  Currently, the only other use of mmap in DB is
  363.  * to map read-only databases -- we don't want them paged, either, so
  364.  * the call isn't conditional.
  365.  */
  366. if (F_ISSET(dbenv, DB_ENV_LOCKDOWN) && mlock(p, len) != 0) {
  367. ret = __os_get_errno();
  368. (void)munmap(p, len);
  369. __db_err(dbenv, "mlock: %s", strerror(ret));
  370. return (ret);
  371. }
  372. #else
  373. COMPQUIET(dbenv, NULL);
  374. #endif
  375. *addrp = p;
  376. return (0);
  377. }
  378. #endif
  379. #ifndef HAVE_SHMGET
  380. /*
  381.  * __db_nosystemmem --
  382.  * No system memory environments error message.
  383.  */
  384. static int
  385. __db_nosystemmem(dbenv)
  386. DB_ENV *dbenv;
  387. {
  388. __db_err(dbenv,
  389.     "architecture doesn't support environments in system memory");
  390. return (__db_eopnotsup(dbenv));
  391. }
  392. #endif