e820.c
上传用户:jlfgdled
上传日期:2013-04-10
资源大小:33168k
文件大小:15k
源码类别:

Linux/Unix编程

开发平台:

Unix_Linux

  1. /* 
  2.  * Handle the memory map.
  3.  * The functions here do the job until bootmem takes over.
  4.  * $Id: e820.c,v 1.4 2002/09/19 19:25:32 ak Exp $
  5.  */
  6. #include <linux/config.h>
  7. #include <linux/kernel.h>
  8. #include <linux/types.h>
  9. #include <linux/init.h>
  10. #include <linux/bootmem.h>
  11. #include <linux/ioport.h>
  12. #include <asm/page.h>
  13. #include <asm/e820.h>
  14. #include <asm/proto.h>
  15. #include <asm/bootsetup.h>
  16. extern unsigned long table_start, table_end;
  17. extern char _end[];
  18. extern struct resource code_resource, data_resource, vram_resource;
  19. /* Check for some hardcoded bad areas that early boot is not allowed to touch */ 
  20. static inline int bad_addr(unsigned long *addrp, unsigned long size)
  21. unsigned long addr = *addrp, last = addr + size; 
  22. /* various gunk below that needed for SMP startup */
  23. if (addr < 7*PAGE_SIZE) { 
  24. *addrp = 7*PAGE_SIZE; 
  25. return 1; 
  26. }
  27. /* direct mapping tables of the kernel */
  28. if (last >= table_start<<PAGE_SHIFT && addr < table_end<<PAGE_SHIFT) { 
  29. *addrp = table_end << PAGE_SHIFT; 
  30. return 1;
  31. /* initrd */ 
  32. #ifdef CONFIG_BLK_DEV_INITRD
  33. if (LOADER_TYPE && INITRD_START && last >= INITRD_START && 
  34.     addr < INITRD_START+INITRD_SIZE) { 
  35. *addrp = INITRD_START + INITRD_SIZE; 
  36. return 1;
  37. #endif
  38. /* kernel code + 640k memory hole (later should not be needed, but 
  39.    be paranoid for now) */
  40. if (last >= 640*1024 && addr < __pa_symbol(&_end)) { 
  41. *addrp = __pa_symbol(&_end);
  42. return 1;
  43. }
  44. /* XXX ramdisk image here? */ 
  45. return 0;
  46. int __init e820_mapped(unsigned long start, unsigned long end, int type) 
  47. int i;
  48. for (i = 0; i < e820.nr_map; i++) { 
  49. struct e820entry *ei = &e820.map[i]; 
  50. if (type && ei->type != type) 
  51. continue;
  52. if (ei->addr >= end || ei->addr + ei->size < start) 
  53. continue; 
  54. return 1; 
  55. return 0;
  56. }
  57. /* 
  58.  * Find a free area in a specific range. 
  59.  */ 
  60. unsigned long __init find_e820_area(unsigned long start, unsigned long end, unsigned size) 
  61. int i; 
  62. for (i = 0; i < e820.nr_map; i++) { 
  63. struct e820entry *ei = &e820.map[i]; 
  64. unsigned long addr = ei->addr, last; 
  65. if (ei->type != E820_RAM) 
  66. continue; 
  67. if (addr < start) 
  68. addr = start;
  69. if (addr > ei->addr + ei->size) 
  70. continue; 
  71. while (bad_addr(&addr, size) && addr+size < ei->addr + ei->size)
  72. ;
  73. last = addr + size;
  74. if (last > ei->addr + ei->size)
  75. continue;
  76. if (last > end) 
  77. continue;
  78. return addr; 
  79. return -1UL;
  80. /* 
  81.  * Free bootmem based on the e820 table for a node.
  82.  */
  83. void __init e820_bootmem_free(pg_data_t *pgdat, unsigned long start,unsigned long end)
  84. {
  85. int i;
  86. for (i = 0; i < e820.nr_map; i++) {
  87. struct e820entry *ei = &e820.map[i]; 
  88. unsigned long last, addr;
  89. if (ei->type != E820_RAM || 
  90.     ei->addr+ei->size <= start || 
  91.     ei->addr > end)
  92. continue;
  93. addr = round_up(ei->addr, PAGE_SIZE);
  94. if (addr < start) 
  95. addr = start;
  96. last = round_down(ei->addr + ei->size, PAGE_SIZE); 
  97. if (last >= end)
  98. last = end; 
  99. if (last > addr && last-addr >= PAGE_SIZE)
  100. free_bootmem_node(pgdat, addr, last-addr);
  101. }
  102. }
  103. /*
  104.  * Find the highest page frame number we have available
  105.  */
  106. void __init e820_end_of_ram(void)
  107. {
  108. int i;
  109. end_pfn = 0;
  110. for (i = 0; i < e820.nr_map; i++) {
  111. struct e820entry *ei = &e820.map[i]; 
  112. unsigned long start, end;
  113. /* count all types of areas for now to map ACPI easily */
  114. start = round_up(ei->addr, PAGE_SIZE); 
  115. end = round_down(ei->addr + ei->size, PAGE_SIZE); 
  116. if (start >= end)
  117. continue;
  118. if (end > end_pfn<<PAGE_SHIFT)
  119. end_pfn = end>>PAGE_SHIFT;
  120. }
  121. if (end_pfn > MAXMEM >> PAGE_SHIFT)
  122. end_pfn = MAXMEM >> PAGE_SHIFT;
  123. }
  124. /* 
  125.  * Mark e820 reserved areas as busy for the resource manager.
  126.  */
  127. void __init e820_reserve_resources(void)
  128. {
  129. int i;
  130. for (i = 0; i < e820.nr_map; i++) {
  131. struct resource *res;
  132. if (e820.map[i].addr + e820.map[i].size > 0x100000000ULL)
  133. continue;
  134. res = alloc_bootmem_low(sizeof(struct resource));
  135. switch (e820.map[i].type) {
  136. case E820_RAM: res->name = "System RAM"; break;
  137. case E820_ACPI: res->name = "ACPI Tables"; break;
  138. case E820_NVS: res->name = "ACPI Non-volatile Storage"; break;
  139. default: res->name = "reserved";
  140. }
  141. res->start = e820.map[i].addr;
  142. res->end = res->start + e820.map[i].size - 1;
  143. res->flags = IORESOURCE_MEM | IORESOURCE_BUSY;
  144. request_resource(&iomem_resource, res);
  145. if (e820.map[i].type == E820_RAM) {
  146. /*
  147.  *  We dont't know which RAM region contains kernel data,
  148.  *  so we try it repeatedly and let the resource manager
  149.  *  test it.
  150.  */
  151. request_resource(res, &code_resource);
  152. request_resource(res, &data_resource);
  153. }
  154. }
  155. }
  156. /* 
  157.  * Add a memory region to the kernel e820 map.
  158.  */ 
  159. void __init add_memory_region(unsigned long start, unsigned long size, int type)
  160. {
  161. int x = e820.nr_map;
  162. if (x == E820MAX) {
  163. printk(KERN_ERR "Ooops! Too many entries in the memory map!n");
  164. return;
  165. }
  166. e820.map[x].addr = start;
  167. e820.map[x].size = size;
  168. e820.map[x].type = type;
  169. e820.nr_map++;
  170. }
  171. void __init e820_print_map(char *who)
  172. {
  173. int i;
  174. for (i = 0; i < e820.nr_map; i++) {
  175. printk(" %s: %016Lx - %016Lx ", who,
  176. (unsigned long long) e820.map[i].addr,
  177. (unsigned long long) (e820.map[i].addr + e820.map[i].size));
  178. switch (e820.map[i].type) {
  179. case E820_RAM: printk("(usable)n");
  180. break;
  181. case E820_RESERVED:
  182. printk("(reserved)n");
  183. break;
  184. case E820_ACPI:
  185. printk("(ACPI data)n");
  186. break;
  187. case E820_NVS:
  188. printk("(ACPI NVS)n");
  189. break;
  190. default: printk("type %un", e820.map[i].type);
  191. break;
  192. }
  193. }
  194. }
  195. /*
  196.  * Sanitize the BIOS e820 map.
  197.  *
  198.  * Some e820 responses include overlapping entries.  The following 
  199.  * replaces the original e820 map with a new one, removing overlaps.
  200.  *
  201.  */
  202. static int __init sanitize_e820_map(struct e820entry * biosmap, char * pnr_map)
  203. {
  204. struct change_member {
  205. struct e820entry *pbios; /* pointer to original bios entry */
  206. unsigned long long addr; /* address for this change point */
  207. };
  208. static struct change_member change_point_list[2*E820MAX] __initdata;
  209. static struct change_member *change_point[2*E820MAX] __initdata;
  210. static struct e820entry *overlap_list[E820MAX] __initdata;
  211. static struct e820entry new_bios[E820MAX] __initdata;
  212. struct change_member *change_tmp;
  213. unsigned long current_type, last_type;
  214. unsigned long long last_addr;
  215. int chgidx, still_changing;
  216. int overlap_entries;
  217. int new_bios_entry;
  218. int old_nr, new_nr;
  219. int i;
  220. /*
  221. Visually we're performing the following (1,2,3,4 = memory types)...
  222. Sample memory map (w/overlaps):
  223.    ____22__________________
  224.    ______________________4_
  225.    ____1111________________
  226.    _44_____________________
  227.    11111111________________
  228.    ____________________33__
  229.    ___________44___________
  230.    __________33333_________
  231.    ______________22________
  232.    ___________________2222_
  233.    _________111111111______
  234.    _____________________11_
  235.    _________________4______
  236. Sanitized equivalent (no overlap):
  237.    1_______________________
  238.    _44_____________________
  239.    ___1____________________
  240.    ____22__________________
  241.    ______11________________
  242.    _________1______________
  243.    __________3_____________
  244.    ___________44___________
  245.    _____________33_________
  246.    _______________2________
  247.    ________________1_______
  248.    _________________4______
  249.    ___________________2____
  250.    ____________________33__
  251.    ______________________4_
  252. */
  253. /* if there's only one memory region, don't bother */
  254. if (*pnr_map < 2)
  255. return -1;
  256. old_nr = *pnr_map;
  257. /* bail out if we find any unreasonable addresses in bios map */
  258. for (i=0; i<old_nr; i++)
  259. if (biosmap[i].addr + biosmap[i].size < biosmap[i].addr)
  260. return -1;
  261. /* create pointers for initial change-point information (for sorting) */
  262. for (i=0; i < 2*old_nr; i++)
  263. change_point[i] = &change_point_list[i];
  264. /* record all known change-points (starting and ending addresses) */
  265. chgidx = 0;
  266. for (i=0; i < old_nr; i++) {
  267. change_point[chgidx]->addr = biosmap[i].addr;
  268. change_point[chgidx++]->pbios = &biosmap[i];
  269. change_point[chgidx]->addr = biosmap[i].addr + biosmap[i].size;
  270. change_point[chgidx++]->pbios = &biosmap[i];
  271. }
  272. /* sort change-point list by memory addresses (low -> high) */
  273. still_changing = 1;
  274. while (still_changing) {
  275. still_changing = 0;
  276. for (i=1; i < 2*old_nr; i++)  {
  277. /* if <current_addr> > <last_addr>, swap */
  278. /* or, if current=<start_addr> & last=<end_addr>, swap */
  279. if ((change_point[i]->addr < change_point[i-1]->addr) ||
  280. ((change_point[i]->addr == change_point[i-1]->addr) &&
  281.  (change_point[i]->addr == change_point[i]->pbios->addr) &&
  282.  (change_point[i-1]->addr != change_point[i-1]->pbios->addr))
  283.    )
  284. {
  285. change_tmp = change_point[i];
  286. change_point[i] = change_point[i-1];
  287. change_point[i-1] = change_tmp;
  288. still_changing=1;
  289. }
  290. }
  291. }
  292. /* create a new bios memory map, removing overlaps */
  293. overlap_entries=0;  /* number of entries in the overlap table */
  294. new_bios_entry=0;  /* index for creating new bios map entries */
  295. last_type = 0;  /* start with undefined memory type */
  296. last_addr = 0;  /* start with 0 as last starting address */
  297. /* loop through change-points, determining affect on the new bios map */
  298. for (chgidx=0; chgidx < 2*old_nr; chgidx++)
  299. {
  300. /* keep track of all overlapping bios entries */
  301. if (change_point[chgidx]->addr == change_point[chgidx]->pbios->addr)
  302. {
  303. /* add map entry to overlap list (> 1 entry implies an overlap) */
  304. overlap_list[overlap_entries++]=change_point[chgidx]->pbios;
  305. }
  306. else
  307. {
  308. /* remove entry from list (order independent, so swap with last) */
  309. for (i=0; i<overlap_entries; i++)
  310. {
  311. if (overlap_list[i] == change_point[chgidx]->pbios)
  312. overlap_list[i] = overlap_list[overlap_entries-1];
  313. }
  314. overlap_entries--;
  315. }
  316. /* if there are overlapping entries, decide which "type" to use */
  317. /* (larger value takes precedence -- 1=usable, 2,3,4,4+=unusable) */
  318. current_type = 0;
  319. for (i=0; i<overlap_entries; i++)
  320. if (overlap_list[i]->type > current_type)
  321. current_type = overlap_list[i]->type;
  322. /* continue building up new bios map based on this information */
  323. if (current_type != last_type) {
  324. if (last_type != 0)  {
  325. new_bios[new_bios_entry].size =
  326. change_point[chgidx]->addr - last_addr;
  327. /* move forward only if the new size was non-zero */
  328. if (new_bios[new_bios_entry].size != 0)
  329. if (++new_bios_entry >= E820MAX)
  330. break;  /* no more space left for new bios entries */
  331. }
  332. if (current_type != 0) {
  333. new_bios[new_bios_entry].addr = change_point[chgidx]->addr;
  334. new_bios[new_bios_entry].type = current_type;
  335. last_addr=change_point[chgidx]->addr;
  336. }
  337. last_type = current_type;
  338. }
  339. }
  340. new_nr = new_bios_entry;   /* retain count for new bios entries */
  341. /* copy new bios mapping into original location */
  342. memcpy(biosmap, new_bios, new_nr*sizeof(struct e820entry));
  343. *pnr_map = new_nr;
  344. return 0;
  345. }
  346. /*
  347.  * Copy the BIOS e820 map into a safe place.
  348.  *
  349.  * Sanity-check it while we're at it..
  350.  *
  351.  * If we're lucky and live on a modern system, the setup code
  352.  * will have given us a memory map that we can use to properly
  353.  * set up memory.  If we aren't, we'll fake a memory map.
  354.  *
  355.  * We check to see that the memory map contains at least 2 elements
  356.  * before we'll use it, because the detection code in setup.S may
  357.  * not be perfect and most every PC known to man has two memory
  358.  * regions: one from 0 to 640k, and one from 1mb up.  (The IBM
  359.  * thinkpad 560x, for example, does not cooperate with the memory
  360.  * detection code.)
  361.  */
  362. static int __init copy_e820_map(struct e820entry * biosmap, int nr_map)
  363. {
  364. /* Only one memory region (or negative)? Ignore it */
  365. if (nr_map < 2)
  366. return -1;
  367. do {
  368. unsigned long start = biosmap->addr;
  369. unsigned long size = biosmap->size;
  370. unsigned long end = start + size;
  371. unsigned long type = biosmap->type;
  372. /* Overflow in 64 bits? Ignore the memory map. */
  373. if (start > end)
  374. return -1;
  375. /*
  376.  * Some BIOSes claim RAM in the 640k - 1M region.
  377.  * Not right. Fix it up.
  378.  * 
  379.  * This should be removed on Hammer which is supposed to not
  380.  * have non e820 covered ISA mappings there, but I had some strange
  381.  * problems so it stays for now.  -AK
  382.  */
  383. if (type == E820_RAM) {
  384. if (start < 0x100000ULL && end > 0xA0000ULL) {
  385. if (start < 0xA0000ULL)
  386. add_memory_region(start, 0xA0000ULL-start, type);
  387. if (end <= 0x100000ULL)
  388. continue;
  389. start = 0x100000ULL;
  390. size = end - start;
  391. }
  392. }
  393. add_memory_region(start, size, type);
  394. } while (biosmap++,--nr_map);
  395. return 0;
  396. }
  397. void __init setup_memory_region(void)
  398. {
  399. char *who = "BIOS-e820";
  400. /*
  401.  * Try to copy the BIOS-supplied E820-map.
  402.  *
  403.  * Otherwise fake a memory map; one section from 0k->640k,
  404.  * the next section from 1mb->appropriate_mem_k
  405.  */
  406. sanitize_e820_map(E820_MAP, &E820_MAP_NR);
  407. if (copy_e820_map(E820_MAP, E820_MAP_NR) < 0) {
  408. unsigned long mem_size;
  409. /* compare results from other methods and take the greater */
  410. if (ALT_MEM_K < EXT_MEM_K) {
  411. mem_size = EXT_MEM_K;
  412. who = "BIOS-88";
  413. } else {
  414. mem_size = ALT_MEM_K;
  415. who = "BIOS-e801";
  416. }
  417. e820.nr_map = 0;
  418. add_memory_region(0, LOWMEMSIZE(), E820_RAM);
  419. add_memory_region(HIGH_MEMORY, mem_size << 10, E820_RAM);
  420.    }
  421. printk(KERN_INFO "BIOS-provided physical RAM map:n");
  422. e820_print_map(who);
  423. }
  424. extern char command_line[], saved_command_line[];
  425. extern int fallback_aper_order;
  426. extern int iommu_setup(char *opt);
  427. void __init parse_mem_cmdline (char ** cmdline_p)
  428. {
  429. char c = ' ', *to = command_line, *from = COMMAND_LINE;
  430. int len = 0;
  431. int usermem = 0;
  432. /* Save unparsed command line copy for /proc/cmdline */
  433. memcpy(saved_command_line, COMMAND_LINE, COMMAND_LINE_SIZE);
  434. saved_command_line[COMMAND_LINE_SIZE-1] = '';
  435. for (;;) {
  436. if (c != ' ') 
  437. goto next;
  438. /*
  439.  * "mem=XXX[kKmM]" defines a memory region from HIGH_MEM
  440.  * to <mem>, overriding the bios size.
  441.  * "mem=XXX[KkmM]@XXX[KkmM]" defines a memory region from
  442.  * <start> to <start>+<mem>, overriding the bios size.
  443.  */
  444. if (!memcmp(from, "mem=", 4)) {
  445. if (to != command_line)
  446. to--;
  447. else if (!memcmp(from+4, "exactmap", 8)) {
  448. from += 8+4;
  449. e820.nr_map = 0;
  450. usermem = 1;
  451. } else {
  452. /* If the user specifies memory size, we
  453.  * blow away any automatically generated
  454.  * size
  455.  */
  456. unsigned long long start_at, mem_size;
  457.  
  458. if (usermem == 0) {
  459. /* first time in: zap the whitelist
  460.  * and reinitialize it with the
  461.  * standard low-memory region.
  462.  */
  463. e820.nr_map = 0;
  464. usermem = 1;
  465. add_memory_region(0, LOWMEMSIZE(), E820_RAM);
  466. }
  467. mem_size = memparse(from+4, &from);
  468. if (*from == '@')
  469. start_at = memparse(from+1, &from);
  470. else {
  471. start_at = HIGH_MEMORY;
  472. mem_size -= HIGH_MEMORY;
  473. usermem=0;
  474. }
  475. add_memory_region(start_at, mem_size, E820_RAM);
  476. }
  477. }
  478. #ifdef CONFIG_GART_IOMMU 
  479. else if (!memcmp(from,"iommu=",6)) { 
  480. iommu_setup(from+6); 
  481. #endif
  482. next:
  483. c = *(from++);
  484. if (!c)
  485. break;
  486. if (COMMAND_LINE_SIZE <= ++len)
  487. break;
  488. *(to++) = c;
  489. }
  490. *to = '';
  491. *cmdline_p = command_line;
  492. if (usermem) {
  493. printk(KERN_INFO "user-defined physical RAM map:n");
  494. e820_print_map("user");
  495. }
  496. }