init.c
上传用户:lgb322
上传日期:2013-02-24
资源大小:30529k
文件大小:12k
源码类别:

嵌入式Linux

开发平台:

Unix_Linux

  1. /*
  2.  * Initialize MMU support.
  3.  *
  4.  * Copyright (C) 1998-2001 Hewlett-Packard Co
  5.  * Copyright (C) 1998-2001 David Mosberger-Tang <davidm@hpl.hp.com>
  6.  */
  7. #include <linux/config.h>
  8. #include <linux/kernel.h>
  9. #include <linux/init.h>
  10. #include <linux/bootmem.h>
  11. #include <linux/mm.h>
  12. #include <linux/reboot.h>
  13. #include <linux/slab.h>
  14. #include <linux/swap.h>
  15. #include <asm/bitops.h>
  16. #include <asm/dma.h>
  17. #include <asm/efi.h>
  18. #include <asm/ia32.h>
  19. #include <asm/io.h>
  20. #include <asm/machvec.h>
  21. #include <asm/pgalloc.h>
  22. #include <asm/sal.h>
  23. #include <asm/system.h>
  24. #include <asm/uaccess.h>
  25. #include <asm/tlb.h>
  26. mmu_gather_t mmu_gathers[NR_CPUS];
  27. /* References to section boundaries: */
  28. extern char _stext, _etext, _edata, __init_begin, __init_end;
  29. extern void ia64_tlb_init (void);
  30. unsigned long MAX_DMA_ADDRESS = PAGE_OFFSET + 0x100000000UL;
  31. static unsigned long totalram_pages;
  32. int
  33. do_check_pgt_cache (int low, int high)
  34. {
  35. int freed = 0;
  36. if (pgtable_cache_size > high) {
  37. do {
  38. if (pgd_quicklist)
  39. free_page((unsigned long)pgd_alloc_one_fast(0)), ++freed;
  40. if (pmd_quicklist)
  41. free_page((unsigned long)pmd_alloc_one_fast(0, 0)), ++freed;
  42. if (pte_quicklist)
  43. free_page((unsigned long)pte_alloc_one_fast(0, 0)), ++freed;
  44. } while (pgtable_cache_size > low);
  45. }
  46. return freed;
  47. }
  48. /*
  49.  * This performs some platform-dependent address space initialization.
  50.  * On IA-64, we want to setup the VM area for the register backing
  51.  * store (which grows upwards) and install the gateway page which is
  52.  * used for signal trampolines, etc.
  53.  */
  54. void
  55. ia64_init_addr_space (void)
  56. {
  57. struct vm_area_struct *vma;
  58. /*
  59.  * If we're out of memory and kmem_cache_alloc() returns NULL,
  60.  * we simply ignore the problem.  When the process attempts to
  61.  * write to the register backing store for the first time, it
  62.  * will get a SEGFAULT in this case.
  63.  */
  64. vma = kmem_cache_alloc(vm_area_cachep, SLAB_KERNEL);
  65. if (vma) {
  66. vma->vm_mm = current->mm;
  67. vma->vm_start = IA64_RBS_BOT;
  68. vma->vm_end = vma->vm_start + PAGE_SIZE;
  69. vma->vm_page_prot = PAGE_COPY;
  70. vma->vm_flags = VM_READ|VM_WRITE|VM_MAYREAD|VM_MAYWRITE|VM_GROWSUP;
  71. vma->vm_ops = NULL;
  72. vma->vm_pgoff = 0;
  73. vma->vm_file = NULL;
  74. vma->vm_private_data = NULL;
  75. insert_vm_struct(current->mm, vma);
  76. }
  77. }
  78. void
  79. free_initmem (void)
  80. {
  81. unsigned long addr;
  82. addr = (unsigned long) &__init_begin;
  83. for (; addr < (unsigned long) &__init_end; addr += PAGE_SIZE) {
  84. clear_bit(PG_reserved, &virt_to_page(addr)->flags);
  85. set_page_count(virt_to_page(addr), 1);
  86. free_page(addr);
  87. ++totalram_pages;
  88. }
  89. printk ("Freeing unused kernel memory: %ldkB freedn",
  90. (&__init_end - &__init_begin) >> 10);
  91. }
  92. void
  93. free_initrd_mem(unsigned long start, unsigned long end)
  94. {
  95. /*
  96.  * EFI uses 4KB pages while the kernel can use 4KB  or bigger.
  97.  * Thus EFI and the kernel may have different page sizes. It is
  98.  * therefore possible to have the initrd share the same page as
  99.  * the end of the kernel (given current setup).
  100.  *
  101.  * To avoid freeing/using the wrong page (kernel sized) we:
  102.  * - align up the beginning of initrd
  103.  * - align down the end of initrd
  104.  *
  105.  *  |             |
  106.  *  |=============| a000
  107.  *  |             |
  108.  *  |             |
  109.  *  |             | 9000
  110.  *  |/////////////|
  111.  *  |/////////////|
  112.  *  |=============| 8000
  113.  *  |///INITRD////|
  114.  *  |/////////////|
  115.  *  |/////////////| 7000
  116.  *  |             |
  117.  *  |KKKKKKKKKKKKK|
  118.  *  |=============| 6000
  119.  *  |KKKKKKKKKKKKK|
  120.  *  |KKKKKKKKKKKKK|
  121.  *  K=kernel using 8KB pages
  122.  *
  123.  * In this example, we must free page 8000 ONLY. So we must align up
  124.  * initrd_start and keep initrd_end as is.
  125.  */
  126. start = PAGE_ALIGN(start);
  127. end = end & PAGE_MASK;
  128. if (start < end)
  129. printk ("Freeing initrd memory: %ldkB freedn", (end - start) >> 10);
  130. for (; start < end; start += PAGE_SIZE) {
  131. if (!VALID_PAGE(virt_to_page(start)))
  132. continue;
  133. clear_bit(PG_reserved, &virt_to_page(start)->flags);
  134. set_page_count(virt_to_page(start), 1);
  135. free_page(start);
  136. ++totalram_pages;
  137. }
  138. }
  139. void
  140. si_meminfo (struct sysinfo *val)
  141. {
  142. val->totalram = totalram_pages;
  143. val->sharedram = 0;
  144. val->freeram = nr_free_pages();
  145. val->bufferram = atomic_read(&buffermem_pages);
  146. val->totalhigh = 0;
  147. val->freehigh = 0;
  148. val->mem_unit = PAGE_SIZE;
  149. return;
  150. }
  151. void
  152. show_mem(void)
  153. {
  154. int i, total = 0, reserved = 0;
  155. int shared = 0, cached = 0;
  156. printk("Mem-info:n");
  157. show_free_areas();
  158. #ifdef CONFIG_DISCONTIGMEM
  159. {
  160. pg_data_t *pgdat = pgdat_list;
  161. printk("Free swap:       %6dkBn", nr_swap_pages<<(PAGE_SHIFT-10));
  162. do {
  163. printk("Node ID: %dn", pgdat->node_id);
  164. for(i = 0; i < pgdat->node_size; i++) {
  165. if (PageReserved(pgdat->node_mem_map+i))
  166. reserved++;
  167. else if (PageSwapCache(pgdat->node_mem_map+i))
  168. cached++;
  169. else if (page_count(pgdat->node_mem_map + i))
  170. shared += page_count(pgdat->node_mem_map + i) - 1;
  171. }
  172. printk("t%d pages of RAMn", pgdat->node_size);
  173. printk("t%d reserved pagesn", reserved);
  174. printk("t%d pages sharedn", shared);
  175. printk("t%d pages swap cachedn", cached);
  176. pgdat = pgdat->node_next;
  177. } while (pgdat);
  178. printk("Total of %ld pages in page table cachen", pgtable_cache_size);
  179. show_buffers();
  180. printk("%d free buffer pagesn", nr_free_buffer_pages());
  181. }
  182. #else /* !CONFIG_DISCONTIGMEM */
  183. printk("Free swap:       %6dkBn", nr_swap_pages<<(PAGE_SHIFT-10));
  184. i = max_mapnr;
  185. while (i-- > 0) {
  186. total++;
  187. if (PageReserved(mem_map+i))
  188. reserved++;
  189. else if (PageSwapCache(mem_map+i))
  190. cached++;
  191. else if (page_count(mem_map + i))
  192. shared += page_count(mem_map + i) - 1;
  193. }
  194. printk("%d pages of RAMn", total);
  195. printk("%d reserved pagesn", reserved);
  196. printk("%d pages sharedn", shared);
  197. printk("%d pages swap cachedn", cached);
  198. printk("%ld pages in page table cachen", pgtable_cache_size);
  199. show_buffers();
  200. #endif /* !CONFIG_DISCONTIGMEM */
  201. }
  202. /*
  203.  * This is like put_dirty_page() but installs a clean page with PAGE_GATE protection
  204.  * (execute-only, typically).
  205.  */
  206. struct page *
  207. put_gate_page (struct page *page, unsigned long address)
  208. {
  209. pgd_t *pgd;
  210. pmd_t *pmd;
  211. pte_t *pte;
  212. if (!PageReserved(page))
  213. printk("put_gate_page: gate page at 0x%p not in reserved memoryn",
  214.        page_address(page));
  215. pgd = pgd_offset_k(address); /* note: this is NOT pgd_offset()! */
  216. spin_lock(&init_mm.page_table_lock);
  217. {
  218. pmd = pmd_alloc(&init_mm, pgd, address);
  219. if (!pmd)
  220. goto out;
  221. pte = pte_alloc(&init_mm, pmd, address);
  222. if (!pte)
  223. goto out;
  224. if (!pte_none(*pte)) {
  225. pte_ERROR(*pte);
  226. goto out;
  227. }
  228. flush_page_to_ram(page);
  229. set_pte(pte, mk_pte(page, PAGE_GATE));
  230. }
  231.   out: spin_unlock(&init_mm.page_table_lock);
  232. /* no need for flush_tlb */
  233. return page;
  234. }
  235. void __init
  236. ia64_mmu_init (void *my_cpu_data)
  237. {
  238. unsigned long flags, rid, pta, impl_va_bits;
  239. extern void __init tlb_init (void);
  240. #ifdef CONFIG_DISABLE_VHPT
  241. # define VHPT_ENABLE_BIT 0
  242. #else
  243. # define VHPT_ENABLE_BIT 1
  244. #endif
  245. /*
  246.  * Set up the kernel identity mapping for regions 6 and 5.  The mapping for region
  247.  * 7 is setup up in _start().
  248.  */
  249. ia64_clear_ic(flags);
  250. rid = ia64_rid(IA64_REGION_ID_KERNEL, __IA64_UNCACHED_OFFSET);
  251. ia64_set_rr(__IA64_UNCACHED_OFFSET, (rid << 8) | (IA64_GRANULE_SHIFT << 2));
  252. rid = ia64_rid(IA64_REGION_ID_KERNEL, VMALLOC_START);
  253. ia64_set_rr(VMALLOC_START, (rid << 8) | (PAGE_SHIFT << 2) | 1);
  254. /* ensure rr6 is up-to-date before inserting the PERCPU_ADDR translation: */
  255. ia64_srlz_d();
  256. ia64_itr(0x2, IA64_TR_PERCPU_DATA, PERCPU_ADDR,
  257.  pte_val(mk_pte_phys(__pa(my_cpu_data), PAGE_KERNEL)), PAGE_SHIFT);
  258. __restore_flags(flags);
  259. ia64_srlz_i();
  260. /*
  261.  * Check if the virtually mapped linear page table (VMLPT) overlaps with a mapped
  262.  * address space.  The IA-64 architecture guarantees that at least 50 bits of
  263.  * virtual address space are implemented but if we pick a large enough page size
  264.  * (e.g., 64KB), the mapped address space is big enough that it will overlap with
  265.  * VMLPT.  I assume that once we run on machines big enough to warrant 64KB pages,
  266.  * IMPL_VA_MSB will be significantly bigger, so this is unlikely to become a
  267.  * problem in practice.  Alternatively, we could truncate the top of the mapped
  268.  * address space to not permit mappings that would overlap with the VMLPT.
  269.  * --davidm 00/12/06
  270.  */
  271. # define pte_bits 3
  272. # define mapped_space_bits (3*(PAGE_SHIFT - pte_bits) + PAGE_SHIFT)
  273. /*
  274.  * The virtual page table has to cover the entire implemented address space within
  275.  * a region even though not all of this space may be mappable.  The reason for
  276.  * this is that the Access bit and Dirty bit fault handlers perform
  277.  * non-speculative accesses to the virtual page table, so the address range of the
  278.  * virtual page table itself needs to be covered by virtual page table.
  279.  */
  280. # define vmlpt_bits (impl_va_bits - PAGE_SHIFT + pte_bits)
  281. # define POW2(n) (1ULL << (n))
  282. impl_va_bits = ffz(~(local_cpu_data->unimpl_va_mask | (7UL << 61)));
  283. if (impl_va_bits < 51 || impl_va_bits > 61)
  284. panic("CPU has bogus IMPL_VA_MSB value of %lu!n", impl_va_bits - 1);
  285. /* place the VMLPT at the end of each page-table mapped region: */
  286. pta = POW2(61) - POW2(vmlpt_bits);
  287. if (POW2(mapped_space_bits) >= pta)
  288. panic("mm/init: overlap between virtually mapped linear page table and "
  289.       "mapped kernel space!");
  290. /*
  291.  * Set the (virtually mapped linear) page table address.  Bit
  292.  * 8 selects between the short and long format, bits 2-7 the
  293.  * size of the table, and bit 0 whether the VHPT walker is
  294.  * enabled.
  295.  */
  296. ia64_set_pta(pta | (0 << 8) | (vmlpt_bits << 2) | VHPT_ENABLE_BIT);
  297. ia64_tlb_init();
  298. }
  299. /*
  300.  * Set up the page tables.
  301.  */
  302. void
  303. paging_init (void)
  304. {
  305. unsigned long max_dma, zones_size[MAX_NR_ZONES];
  306. clear_page((void *) ZERO_PAGE_ADDR);
  307. /* initialize mem_map[] */
  308. memset(zones_size, 0, sizeof(zones_size));
  309. max_dma = virt_to_phys((void *) MAX_DMA_ADDRESS) >> PAGE_SHIFT;
  310. if (max_low_pfn < max_dma)
  311. zones_size[ZONE_DMA] = max_low_pfn;
  312. else {
  313. zones_size[ZONE_DMA] = max_dma;
  314. zones_size[ZONE_NORMAL] = max_low_pfn - max_dma;
  315. }
  316. free_area_init(zones_size);
  317. }
  318. static int
  319. count_pages (u64 start, u64 end, void *arg)
  320. {
  321. unsigned long *count = arg;
  322. *count += (end - start) >> PAGE_SHIFT;
  323. return 0;
  324. }
  325. static int
  326. count_reserved_pages (u64 start, u64 end, void *arg)
  327. {
  328. unsigned long num_reserved = 0;
  329. unsigned long *count = arg;
  330. struct page *pg;
  331. for (pg = virt_to_page(start); pg < virt_to_page(end); ++pg)
  332. if (PageReserved(pg))
  333. ++num_reserved;
  334. *count += num_reserved;
  335. return 0;
  336. }
  337. void
  338. mem_init (void)
  339. {
  340. extern char __start_gate_section[];
  341. long reserved_pages, codesize, datasize, initsize;
  342. unsigned long num_pgt_pages;
  343. #ifdef CONFIG_PCI
  344. /*
  345.  * This needs to be called _after_ the command line has been parsed but _before_
  346.  * any drivers that may need the PCI DMA interface are initialized or bootmem has
  347.  * been freed.
  348.  */
  349. platform_pci_dma_init();
  350. #endif
  351. if (!mem_map)
  352. BUG();
  353. num_physpages = 0;
  354. efi_memmap_walk(count_pages, &num_physpages);
  355. max_mapnr = max_low_pfn;
  356. high_memory = __va(max_low_pfn * PAGE_SIZE);
  357. totalram_pages += free_all_bootmem();
  358. reserved_pages = 0;
  359. efi_memmap_walk(count_reserved_pages, &reserved_pages);
  360. codesize =  (unsigned long) &_etext - (unsigned long) &_stext;
  361. datasize =  (unsigned long) &_edata - (unsigned long) &_etext;
  362. initsize =  (unsigned long) &__init_end - (unsigned long) &__init_begin;
  363. printk("Memory: %luk/%luk available (%luk code, %luk reserved, %luk data, %luk init)n",
  364.        (unsigned long) nr_free_pages() << (PAGE_SHIFT - 10),
  365.        max_mapnr << (PAGE_SHIFT - 10), codesize >> 10, reserved_pages << (PAGE_SHIFT - 10),
  366.        datasize >> 10, initsize >> 10);
  367. /*
  368.  * Allow for enough (cached) page table pages so that we can map the entire memory
  369.  * at least once.  Each task also needs a couple of page tables pages, so add in a
  370.  * fudge factor for that (don't use "threads-max" here; that would be wrong!).
  371.  * Don't allow the cache to be more than 10% of total memory, though.
  372.  */
  373. # define NUM_TASKS 500 /* typical number of tasks */
  374. num_pgt_pages = nr_free_pages() / PTRS_PER_PGD + NUM_TASKS;
  375. if (num_pgt_pages > nr_free_pages() / 10)
  376. num_pgt_pages = nr_free_pages() / 10;
  377. if (num_pgt_pages > pgt_cache_water[1])
  378. pgt_cache_water[1] = num_pgt_pages;
  379. /* install the gate page in the global page table: */
  380. put_gate_page(virt_to_page(__start_gate_section), GATE_ADDR);
  381. #ifdef CONFIG_IA32_SUPPORT
  382. ia32_gdt_init();
  383. #endif
  384. }