README.mm
上传用户:jlfgdled
上传日期:2013-04-10
资源大小:33168k
文件大小:11k
源码类别:

Linux/Unix编程

开发平台:

Unix_Linux

  1. Memory management for CRIS/MMU
  2. ------------------------------
  3. HISTORY:
  4. $Log: README.mm,v $
  5. Revision 1.1  2000/07/10 16:25:21  bjornw
  6. Initial revision
  7. Revision 1.4  2000/01/17 02:31:59  bjornw
  8. Added discussion of paging and VM.
  9. Revision 1.3  1999/12/03 16:43:23  hp
  10. Blurb about that the 3.5G-limitation is not a MMU limitation
  11. Revision 1.2  1999/12/03 16:04:21  hp
  12. Picky comment about not mapping the first page
  13. Revision 1.1  1999/12/03 15:41:30  bjornw
  14. First version of CRIS/MMU memory layout specification.
  15. ------------------------------
  16. See the ETRAX-NG HSDD for reference.
  17. We use the page-size of 8 kbytes, as opposed to the i386 page-size of 4 kbytes.
  18. The MMU can, apart from the normal mapping of pages, also do a top-level
  19. segmentation of the kernel memory space. We use this feature to avoid having
  20. to use page-tables to map the physical memory into the kernel's address
  21. space. We also use it to keep the user-mode virtual mapping in the same
  22. map during kernel-mode, so that the kernel easily can access the corresponding
  23. user-mode process' data.
  24. As a comparision, the Linux/i386 2.0 puts the kernel and physical RAM at
  25. address 0, overlapping with the user-mode virtual space, so that descriptor
  26. registers are needed for each memory access to specify which MMU space to
  27. map through. That changed in 2.2, putting the kernel/physical RAM at 
  28. 0xc0000000, to co-exist with the user-mode mapping. We will do something
  29. quite similar, but with the additional complexity of having to map the
  30. internal chip I/O registers and the flash memory area (including SRAM
  31. and peripherial chip-selets).
  32. The kernel-mode segmentation map:
  33.         ------------------------                ------------------------
  34. FFFFFFFF|                      | => cached      |                      | 
  35.         |    kernel seg_f      |    flash       |                      |
  36. F0000000|______________________|                |                      |
  37. EFFFFFFF|                      | => uncached    |                      | 
  38.         |    kernel seg_e      |    flash       |                      |
  39. E0000000|______________________|                |        DRAM          |
  40. DFFFFFFF|                      |  paged to any  |      Un-cached       | 
  41.         |    kernel seg_d      |    =======>    |                      |
  42. D0000000|______________________|                |                      |
  43. CFFFFFFF|                      |                |                      | 
  44.         |    kernel seg_c      |==             |                      |
  45. C0000000|______________________|               |______________________|
  46. BFFFFFFF|                      |  uncached      |                      |
  47.         |    kernel seg_b      |==============>|       Registers      |
  48. B0000000|______________________|      c        |______________________|
  49. AFFFFFFF|                      |       a       |                      |
  50.         |                      |        c      | FLASH/SRAM/Peripheral|
  51.         |                      |         h     |______________________|
  52.         |                      |          e    |                      |
  53.         |                      |           d   |                      |
  54.         | kernel seg_0 - seg_a |            ==>|         DRAM         | 
  55.         |                      |                |        Cached        |
  56.         |                      |  paged to any  |                      |
  57.         |                      |    =======>    |______________________| 
  58.         |                      |                |                      |
  59.         |                      |                |        Illegal       |
  60.         |                      |                |______________________|
  61.         |                      |                |                      |      
  62.         |                      |                | FLASH/SRAM/Peripheral|
  63. 00000000|______________________|                |______________________|
  64. In user-mode it looks the same except that only the space 0-AFFFFFFF is
  65. available. Therefore, in this model, the virtual address space per process
  66. is limited to 0xb0000000 bytes (minus 8192 bytes, since the first page,
  67. 0..8191, is never mapped, in order to trap NULL references).
  68. It also means that the total physical RAM that can be mapped is 256 MB
  69. (kseg_c above). More RAM can be mapped by choosing a different segmentation
  70. and shrinking the user-mode memory space.
  71. The MMU can map all 4 GB in user mode, but doing that would mean that a
  72. few extra instructions would be needed for each access to user mode
  73. memory.
  74. The kernel needs access to both cached and uncached flash. Uncached is
  75. necessary because of the special write/erase sequences. Also, the 
  76. peripherial chip-selects are decoded from that region.
  77. The kernel also needs its own virtual memory space. That is kseg_d. It
  78. is used by the vmalloc() kernel function to allocate virtual contiguous
  79. chunks of memory not possible using the normal kmalloc physical RAM 
  80. allocator.
  81. The setting of the actual MMU control registers to use this layout would
  82. be something like this:
  83. R_MMU_KSEG = ( ( seg_f, seg     ) |   // Flash cached
  84.                ( seg_e, seg     ) |   // Flash uncached
  85.                ( seg_d, page    ) |   // kernel vmalloc area    
  86.                ( seg_c, seg     ) |   // kernel linear segment
  87.                ( seg_b, seg     ) |   // kernel linear segment
  88.                ( seg_a, page    ) |
  89.                ( seg_9, page    ) |
  90.                ( seg_8, page    ) |
  91.                ( seg_7, page    ) |
  92.                ( seg_6, page    ) |
  93.                ( seg_5, page    ) |
  94.                ( seg_4, page    ) |
  95.                ( seg_3, page    ) |
  96.                ( seg_2, page    ) |
  97.                ( seg_1, page    ) |
  98.                ( seg_0, page    ) );
  99. R_MMU_KBASE_HI = ( ( base_f, 0x0 ) |   // flash/sram/periph cached
  100.                    ( base_e, 0x8 ) |   // flash/sram/periph uncached
  101.                    ( base_d, 0x0 ) |   // don't care
  102.                    ( base_c, 0x4 ) |   // physical RAM cached area
  103.                    ( base_b, 0xb ) |   // uncached on-chip registers
  104.                    ( base_a, 0x0 ) |   // don't care
  105.                    ( base_9, 0x0 ) |   // don't care
  106.                    ( base_8, 0x0 ) );  // don't care
  107. R_MMU_KBASE_LO = ( ( base_7, 0x0 ) |   // don't care
  108.                    ( base_6, 0x0 ) |   // don't care
  109.                    ( base_5, 0x0 ) |   // don't care
  110.                    ( base_4, 0x0 ) |   // don't care
  111.                    ( base_3, 0x0 ) |   // don't care
  112.                    ( base_2, 0x0 ) |   // don't care
  113.                    ( base_1, 0x0 ) |   // don't care
  114.                    ( base_0, 0x0 ) );  // don't care
  115. NOTE: while setting up the MMU, we run in a non-mapped mode in the DRAM (0x40
  116. segment) and need to setup the seg_4 to a unity mapping, so that we don't get
  117. a fault before we have had time to jump into the real kernel segment (0xc0). This
  118. is done in head.S temporarily, but fixed by the kernel later in paging_init.
  119. Paging - PTE's, PMD's and PGD's
  120. -------------------------------
  121. [ References: asm/pgtable.h, asm/page.h, asm/mmu.h ]
  122. The paging mechanism uses virtual addresses to split a process memory-space into
  123. pages, a page being the smallest unit that can be freely remapped in memory. On
  124. Linux/CRIS, a page is 8192 bytes (for technical reasons not equal to 4096 as in 
  125. most other 32-bit architectures). It would be inefficient to let a virtual memory
  126. mapping be controlled by a long table of page mappings, so it is broken down into
  127. a 2-level structure with a Page Directory containing pointers to Page Tables which
  128. each have maps of up to 2048 pages (8192 / sizeof(void *)). Linux can actually
  129. handle 3-level structures as well, with a Page Middle Directory in between, but
  130. in many cases, this is folded into a two-level structure by excluding the Middle
  131. Directory.
  132. We'll take a look at how an address is translated while we discuss how it's handled
  133. in the Linux kernel.
  134. The example address is 0xd004000c; in binary this is:
  135. 31       23       15       7      0
  136. 11010000 00000100 00000000 00001100
  137. |______| |__________||____________|
  138.   PGD        PTE       page offset
  139. Given the top-level Page Directory, the offset in that directory is calculated
  140. using the upper 8 bits:
  141. extern inline pgd_t * pgd_offset(struct mm_struct * mm, unsigned long address)
  142. {
  143. return mm->pgd + (address >> PGDIR_SHIFT);
  144. }
  145. PGDIR_SHIFT is the log2 of the amount of memory an entry in the PGD can map; in our
  146. case it is 24, corresponding to 16 MB. This means that each entry in the PGD 
  147. corresponds to 16 MB of virtual memory.
  148. The pgd_t from our example will therefore be the 208'th (0xd0) entry in mm->pgd.
  149. Since the Middle Directory does not exist, it is a unity mapping:
  150. extern inline pmd_t * pmd_offset(pgd_t * dir, unsigned long address)
  151. {
  152. return (pmd_t *) dir;
  153. }
  154. The Page Table provides the final lookup by using bits 13 to 23 as index:
  155. extern inline pte_t * pte_offset(pmd_t * dir, unsigned long address)
  156. {
  157. return (pte_t *) pmd_page(*dir) + ((address >> PAGE_SHIFT) &
  158.    (PTRS_PER_PTE - 1));
  159. }
  160. PAGE_SHIFT is the log2 of the size of a page; 13 in our case. PTRS_PER_PTE is
  161. the number of pointers that fit in a Page Table and is used to mask off the 
  162. PGD-part of the address.
  163. The so-far unused bits 0 to 12 are used to index inside a page linearily.
  164. The VM system
  165. -------------
  166. The kernels own page-directory is the swapper_pg_dir, cleared in paging_init, 
  167. and contains the kernels virtual mappings (the kernel itself is not paged - it
  168. is mapped linearily using kseg_c as described above). Architectures without
  169. kernel segments like the i386, need to setup swapper_pg_dir directly in head.S
  170. to map the kernel itself. swapper_pg_dir is pointed to by init_mm.pgd as the
  171. init-task's PGD.
  172. To see what support functions are used to setup a page-table, let's look at the
  173. kernel's internal paged memory system, vmalloc/vfree.
  174. void * vmalloc(unsigned long size)
  175. The vmalloc-system keeps a paged segment in kernel-space at 0xd0000000. What
  176. happens first is that a virtual address chunk is allocated to the request using
  177. get_vm_area(size). After that, physical RAM pages are allocated and put into
  178. the kernel's page-table using alloc_area_pages(addr, size). 
  179. static int alloc_area_pages(unsigned long address, unsigned long size)
  180. First the PGD entry is found using init_mm.pgd. This is passed to
  181. alloc_area_pmd (remember the 3->2 folding). It uses pte_alloc_kernel to
  182. check if the PGD entry points anywhere - if not, a page table page is
  183. allocated and the PGD entry updated. Then the alloc_area_pte function is
  184. used just like alloc_area_pmd to check which page table entry is desired, 
  185. and a physical page is allocated and the table entry updated. All of this
  186. is repeated at the top-level until the entire address range specified has 
  187. been mapped.