align.c
上传用户:jlfgdled
上传日期:2013-04-10
资源大小:33168k
文件大小:9k
源码类别:

Linux/Unix编程

开发平台:

Unix_Linux

  1. /*
  2.  * BK Id: SCCS/s.align.c 1.5 05/17/01 18:14:21 cort
  3.  */
  4. /*
  5.  * align.c - handle alignment exceptions for the Power PC.
  6.  *
  7.  * Copyright (c) 1996 Paul Mackerras <paulus@cs.anu.edu.au>
  8.  * Copyright (c) 1998-1999 TiVo, Inc.
  9.  *   PowerPC 403GCX modifications.
  10.  * Copyright (c) 1999 Grant Erickson <grant@lcse.umn.edu>
  11.  *   PowerPC 403GCX/405GP modifications.
  12.  */
  13. #include <linux/config.h>
  14. #include <linux/kernel.h>
  15. #include <linux/mm.h>
  16. #include <asm/ptrace.h>
  17. #include <asm/processor.h>
  18. #include <asm/uaccess.h>
  19. #include <asm/system.h>
  20. #include <asm/cache.h>
  21. struct aligninfo {
  22. unsigned char len;
  23. unsigned char flags;
  24. };
  25. #if defined(CONFIG_4xx) || defined(CONFIG_POWER4)
  26. #define OPCD(inst) (((inst) & 0xFC000000) >> 26)
  27. #define RS(inst) (((inst) & 0x03E00000) >> 21)
  28. #define RA(inst) (((inst) & 0x001F0000) >> 16)
  29. #define IS_DFORM(code) ((code) >= 32 && (code) <= 47)
  30. #endif
  31. #define INVALID { 0, 0 }
  32. #define LD 1 /* load */
  33. #define ST 2 /* store */
  34. #define SE 4 /* sign-extend value */
  35. #define F 8 /* to/from fp regs */
  36. #define U 0x10 /* update index register */
  37. #define M 0x20 /* multiple load/store */
  38. #define S 0x40 /* single-precision fp, or byte-swap value */
  39. #define HARD 0x80 /* string, stwcx. */
  40. #define DCBZ 0x5f /* 8xx/82xx dcbz faults when cache not enabled */
  41. /*
  42.  * The PowerPC stores certain bits of the instruction that caused the
  43.  * alignment exception in the DSISR register.  This array maps those
  44.  * bits to information about the operand length and what the
  45.  * instruction would do.
  46.  */
  47. static struct aligninfo aligninfo[128] = {
  48. { 4, LD }, /* 00 0 0000: lwz / lwarx */
  49. INVALID, /* 00 0 0001 */
  50. { 4, ST }, /* 00 0 0010: stw */
  51. INVALID, /* 00 0 0011 */
  52. { 2, LD }, /* 00 0 0100: lhz */
  53. { 2, LD+SE }, /* 00 0 0101: lha */
  54. { 2, ST }, /* 00 0 0110: sth */
  55. { 4, LD+M }, /* 00 0 0111: lmw */
  56. { 4, LD+F+S }, /* 00 0 1000: lfs */
  57. { 8, LD+F }, /* 00 0 1001: lfd */
  58. { 4, ST+F+S }, /* 00 0 1010: stfs */
  59. { 8, ST+F }, /* 00 0 1011: stfd */
  60. INVALID, /* 00 0 1100 */
  61. INVALID, /* 00 0 1101 */
  62. INVALID, /* 00 0 1110 */
  63. INVALID, /* 00 0 1111 */
  64. { 4, LD+U }, /* 00 1 0000: lwzu */
  65. INVALID, /* 00 1 0001 */
  66. { 4, ST+U }, /* 00 1 0010: stwu */
  67. INVALID, /* 00 1 0011 */
  68. { 2, LD+U }, /* 00 1 0100: lhzu */
  69. { 2, LD+SE+U }, /* 00 1 0101: lhau */
  70. { 2, ST+U }, /* 00 1 0110: sthu */
  71. { 4, ST+M }, /* 00 1 0111: stmw */
  72. { 4, LD+F+S+U }, /* 00 1 1000: lfsu */
  73. { 8, LD+F+U }, /* 00 1 1001: lfdu */
  74. { 4, ST+F+S+U }, /* 00 1 1010: stfsu */
  75. { 8, ST+F+U }, /* 00 1 1011: stfdu */
  76. INVALID, /* 00 1 1100 */
  77. INVALID, /* 00 1 1101 */
  78. INVALID, /* 00 1 1110 */
  79. INVALID, /* 00 1 1111 */
  80. INVALID, /* 01 0 0000 */
  81. INVALID, /* 01 0 0001 */
  82. INVALID, /* 01 0 0010 */
  83. INVALID, /* 01 0 0011 */
  84. INVALID, /* 01 0 0100 */
  85. INVALID, /* 01 0 0101: lwax?? */
  86. INVALID, /* 01 0 0110 */
  87. INVALID, /* 01 0 0111 */
  88. { 0, LD+HARD }, /* 01 0 1000: lswx */
  89. { 0, LD+HARD }, /* 01 0 1001: lswi */
  90. { 0, ST+HARD }, /* 01 0 1010: stswx */
  91. { 0, ST+HARD }, /* 01 0 1011: stswi */
  92. INVALID, /* 01 0 1100 */
  93. INVALID, /* 01 0 1101 */
  94. INVALID, /* 01 0 1110 */
  95. INVALID, /* 01 0 1111 */
  96. INVALID, /* 01 1 0000 */
  97. INVALID, /* 01 1 0001 */
  98. INVALID, /* 01 1 0010 */
  99. INVALID, /* 01 1 0011 */
  100. INVALID, /* 01 1 0100 */
  101. INVALID, /* 01 1 0101: lwaux?? */
  102. INVALID, /* 01 1 0110 */
  103. INVALID, /* 01 1 0111 */
  104. INVALID, /* 01 1 1000 */
  105. INVALID, /* 01 1 1001 */
  106. INVALID, /* 01 1 1010 */
  107. INVALID, /* 01 1 1011 */
  108. INVALID, /* 01 1 1100 */
  109. INVALID, /* 01 1 1101 */
  110. INVALID, /* 01 1 1110 */
  111. INVALID, /* 01 1 1111 */
  112. INVALID, /* 10 0 0000 */
  113. INVALID, /* 10 0 0001 */
  114. { 0, ST+HARD }, /* 10 0 0010: stwcx. */
  115. INVALID, /* 10 0 0011 */
  116. INVALID, /* 10 0 0100 */
  117. INVALID, /* 10 0 0101 */
  118. INVALID, /* 10 0 0110 */
  119. INVALID, /* 10 0 0111 */
  120. { 4, LD+S }, /* 10 0 1000: lwbrx */
  121. INVALID, /* 10 0 1001 */
  122. { 4, ST+S }, /* 10 0 1010: stwbrx */
  123. INVALID, /* 10 0 1011 */
  124. { 2, LD+S }, /* 10 0 1100: lhbrx */
  125. INVALID, /* 10 0 1101 */
  126. { 2, ST+S }, /* 10 0 1110: sthbrx */
  127. INVALID, /* 10 0 1111 */
  128. INVALID, /* 10 1 0000 */
  129. INVALID, /* 10 1 0001 */
  130. INVALID, /* 10 1 0010 */
  131. INVALID, /* 10 1 0011 */
  132. INVALID, /* 10 1 0100 */
  133. INVALID, /* 10 1 0101 */
  134. INVALID, /* 10 1 0110 */
  135. INVALID, /* 10 1 0111 */
  136. INVALID, /* 10 1 1000 */
  137. INVALID, /* 10 1 1001 */
  138. INVALID, /* 10 1 1010 */
  139. INVALID, /* 10 1 1011 */
  140. INVALID, /* 10 1 1100 */
  141. INVALID, /* 10 1 1101 */
  142. INVALID, /* 10 1 1110 */
  143. { 0, ST+HARD }, /* 10 1 1111: dcbz */
  144. { 4, LD }, /* 11 0 0000: lwzx */
  145. INVALID, /* 11 0 0001 */
  146. { 4, ST }, /* 11 0 0010: stwx */
  147. INVALID, /* 11 0 0011 */
  148. { 2, LD }, /* 11 0 0100: lhzx */
  149. { 2, LD+SE }, /* 11 0 0101: lhax */
  150. { 2, ST }, /* 11 0 0110: sthx */
  151. INVALID, /* 11 0 0111 */
  152. { 4, LD+F+S }, /* 11 0 1000: lfsx */
  153. { 8, LD+F }, /* 11 0 1001: lfdx */
  154. { 4, ST+F+S }, /* 11 0 1010: stfsx */
  155. { 8, ST+F }, /* 11 0 1011: stfdx */
  156. INVALID, /* 11 0 1100 */
  157. INVALID, /* 11 0 1101 */
  158. INVALID, /* 11 0 1110 */
  159. INVALID, /* 11 0 1111 */
  160. { 4, LD+U }, /* 11 1 0000: lwzux */
  161. INVALID, /* 11 1 0001 */
  162. { 4, ST+U }, /* 11 1 0010: stwux */
  163. INVALID, /* 11 1 0011 */
  164. { 2, LD+U }, /* 11 1 0100: lhzux */
  165. { 2, LD+SE+U }, /* 11 1 0101: lhaux */
  166. { 2, ST+U }, /* 11 1 0110: sthux */
  167. INVALID, /* 11 1 0111 */
  168. { 4, LD+F+S+U }, /* 11 1 1000: lfsux */
  169. { 8, LD+F+U }, /* 11 1 1001: lfdux */
  170. { 4, ST+F+S+U }, /* 11 1 1010: stfsux */
  171. { 8, ST+F+U }, /* 11 1 1011: stfdux */
  172. INVALID, /* 11 1 1100 */
  173. INVALID, /* 11 1 1101 */
  174. INVALID, /* 11 1 1110 */
  175. INVALID, /* 11 1 1111 */
  176. };
  177. #define SWAP(a, b) (t = (a), (a) = (b), (b) = t)
  178. int
  179. fix_alignment(struct pt_regs *regs)
  180. {
  181. int instr, nb, flags;
  182. #if defined(CONFIG_4xx) || defined(CONFIG_POWER4)
  183. int opcode, f1, f2, f3;
  184. #endif
  185. int i, t;
  186. int reg, areg;
  187. unsigned char *addr;
  188. union {
  189. long l;
  190. float f;
  191. double d;
  192. unsigned char v[8];
  193. } data;
  194. #if defined(CONFIG_4xx) || defined(CONFIG_POWER4)
  195. /* The 4xx-family processors have no DSISR register,
  196.  * so we emulate it.
  197.  * The POWER4 has a DSISR register but doesn't set it on
  198.  * an alignment fault.  -- paulus
  199.  */
  200. instr = *((unsigned int *)regs->nip);
  201. opcode = OPCD(instr);
  202. reg = RS(instr);
  203. areg = RA(instr);
  204. if (IS_DFORM(opcode)) {
  205. f1 = 0;
  206. f2 = (instr & 0x04000000) >> 26;
  207. f3 = (instr & 0x78000000) >> 27;
  208. } else {
  209. f1 = (instr & 0x00000006) >> 1;
  210. f2 = (instr & 0x00000040) >> 6;
  211. f3 = (instr & 0x00000780) >> 7;
  212. }
  213. instr = ((f1 << 5) | (f2 << 4) | f3);
  214. #else
  215. reg = (regs->dsisr >> 5) & 0x1f; /* source/dest register */
  216. areg = regs->dsisr & 0x1f; /* register to update */
  217. instr = (regs->dsisr >> 10) & 0x7f;
  218. #endif
  219. nb = aligninfo[instr].len;
  220. if (nb == 0) {
  221. long *p;
  222. int i;
  223. if (instr != DCBZ)
  224. return 0; /* too hard or invalid instruction */
  225. /*
  226.  * The dcbz (data cache block zero) instruction
  227.  * gives an alignment fault if used on non-cacheable
  228.  * memory.  We handle the fault mainly for the
  229.  * case when we are running with the cache disabled
  230.  * for debugging.
  231.  */
  232. p = (long *) (regs->dar & -L1_CACHE_BYTES);
  233. for (i = 0; i < L1_CACHE_BYTES / sizeof(long); ++i)
  234. p[i] = 0;
  235. return 1;
  236. }
  237. flags = aligninfo[instr].flags;
  238. /* For the 4xx-family processors, the 'dar' field of the
  239.  * pt_regs structure is overloaded and is really from the DEAR.
  240.  */
  241. addr = (unsigned char *)regs->dar;
  242. /* Verify the address of the operand */
  243. if (user_mode(regs)) {
  244. if (verify_area((flags & ST? VERIFY_WRITE: VERIFY_READ), addr, nb))
  245. return -EFAULT; /* bad address */
  246. }
  247. if ((flags & F) && (regs->msr & MSR_FP))
  248. giveup_fpu(current);
  249. if (flags & M)
  250. return 0; /* too hard for now */
  251. /* If we read the operand, copy it in */
  252. if (flags & LD) {
  253. if (nb == 2) {
  254. data.v[0] = data.v[1] = 0;
  255. if (__get_user(data.v[2], addr)
  256.     || __get_user(data.v[3], addr+1))
  257. return -EFAULT;
  258. } else {
  259. for (i = 0; i < nb; ++i)
  260. if (__get_user(data.v[i], addr+i))
  261. return -EFAULT;
  262. }
  263. }
  264. switch (flags & ~U) {
  265. case LD+SE:
  266. if (data.v[2] >= 0x80)
  267. data.v[0] = data.v[1] = -1;
  268. /* fall through */
  269. case LD:
  270. regs->gpr[reg] = data.l;
  271. break;
  272. case LD+S:
  273. if (nb == 2) {
  274. SWAP(data.v[2], data.v[3]);
  275. } else {
  276. SWAP(data.v[0], data.v[3]);
  277. SWAP(data.v[1], data.v[2]);
  278. }
  279. regs->gpr[reg] = data.l;
  280. break;
  281. case ST:
  282. data.l = regs->gpr[reg];
  283. break;
  284. case ST+S:
  285. data.l = regs->gpr[reg];
  286. if (nb == 2) {
  287. SWAP(data.v[2], data.v[3]);
  288. } else {
  289. SWAP(data.v[0], data.v[3]);
  290. SWAP(data.v[1], data.v[2]);
  291. }
  292. break;
  293. case LD+F:
  294. current->thread.fpr[reg] = data.d;
  295. break;
  296. case ST+F:
  297. data.d = current->thread.fpr[reg];
  298. break;
  299. /* these require some floating point conversions... */
  300. /* we'd like to use the assignment, but we have to compile
  301.  * the kernel with -msoft-float so it doesn't use the
  302.  * fp regs for copying 8-byte objects. */
  303. case LD+F+S:
  304. enable_kernel_fp();
  305. cvt_fd(&data.f, &current->thread.fpr[reg], &current->thread.fpscr);
  306. /* current->thread.fpr[reg] = data.f; */
  307. break;
  308. case ST+F+S:
  309. enable_kernel_fp();
  310. cvt_df(&current->thread.fpr[reg], &data.f, &current->thread.fpscr);
  311. /* data.f = current->thread.fpr[reg]; */
  312. break;
  313. default:
  314. printk("align: can't handle flags=%xn", flags);
  315. return 0;
  316. }
  317. if (flags & ST) {
  318. if (nb == 2) {
  319. if (__put_user(data.v[2], addr)
  320.     || __put_user(data.v[3], addr+1))
  321. return -EFAULT;
  322. } else {
  323. for (i = 0; i < nb; ++i)
  324. if (__put_user(data.v[i], addr+i))
  325. return -EFAULT;
  326. }
  327. }
  328. if (flags & U) {
  329. regs->gpr[areg] = regs->dar;
  330. }
  331. return 1;
  332. }