math.c
上传用户:lgb322
上传日期:2013-02-24
资源大小:30529k
文件大小:14k
源码类别:

嵌入式Linux

开发平台:

Unix_Linux

  1. /* $Id: math.c,v 1.11 1999/12/20 05:02:25 davem Exp $
  2.  * arch/sparc64/math-emu/math.c
  3.  *
  4.  * Copyright (C) 1997,1999 Jakub Jelinek (jj@ultra.linux.cz)
  5.  * Copyright (C) 1999 David S. Miller (davem@redhat.com)
  6.  *
  7.  * Emulation routines originate from soft-fp package, which is part
  8.  * of glibc and has appropriate copyrights in it.
  9.  */
  10. #include <linux/types.h>
  11. #include <linux/sched.h>
  12. #include <asm/fpumacro.h>
  13. #include <asm/ptrace.h>
  14. #include <asm/uaccess.h>
  15. #include "sfp-util.h"
  16. #include <math-emu/soft-fp.h>
  17. #include <math-emu/single.h>
  18. #include <math-emu/double.h>
  19. #include <math-emu/quad.h>
  20. /* QUAD - ftt == 3 */
  21. #define FMOVQ 0x003
  22. #define FNEGQ 0x007
  23. #define FABSQ 0x00b
  24. #define FSQRTQ 0x02b
  25. #define FADDQ 0x043
  26. #define FSUBQ 0x047
  27. #define FMULQ 0x04b
  28. #define FDIVQ 0x04f
  29. #define FDMULQ 0x06e
  30. #define FQTOX 0x083
  31. #define FXTOQ 0x08c
  32. #define FQTOS 0x0c7
  33. #define FQTOD 0x0cb
  34. #define FITOQ 0x0cc
  35. #define FSTOQ 0x0cd
  36. #define FDTOQ 0x0ce
  37. #define FQTOI 0x0d3
  38. /* SUBNORMAL - ftt == 2 */
  39. #define FSQRTS 0x029
  40. #define FSQRTD 0x02a
  41. #define FADDS 0x041
  42. #define FADDD 0x042
  43. #define FSUBS 0x045
  44. #define FSUBD 0x046
  45. #define FMULS 0x049
  46. #define FMULD 0x04a
  47. #define FDIVS 0x04d
  48. #define FDIVD 0x04e
  49. #define FSMULD 0x069
  50. #define FSTOX 0x081
  51. #define FDTOX 0x082
  52. #define FDTOS 0x0c6
  53. #define FSTOD 0x0c9
  54. #define FSTOI 0x0d1
  55. #define FDTOI 0x0d2
  56. /* FPOP2 */
  57. #define FCMPQ 0x053
  58. #define FCMPEQ 0x057
  59. #define FMOVQ0 0x003
  60. #define FMOVQ1 0x043
  61. #define FMOVQ2 0x083
  62. #define FMOVQ3 0x0c3
  63. #define FMOVQI 0x103
  64. #define FMOVQX 0x183
  65. #define FMOVQZ 0x027
  66. #define FMOVQLE 0x047
  67. #define FMOVQLZ 0x067
  68. #define FMOVQNZ 0x0a7
  69. #define FMOVQGZ 0x0c7
  70. #define FMOVQGE 0x0e7
  71. #define FSR_TEM_SHIFT 23UL
  72. #define FSR_TEM_MASK (0x1fUL << FSR_TEM_SHIFT)
  73. #define FSR_AEXC_SHIFT 5UL
  74. #define FSR_AEXC_MASK (0x1fUL << FSR_AEXC_SHIFT)
  75. #define FSR_CEXC_SHIFT 0UL
  76. #define FSR_CEXC_MASK (0x1fUL << FSR_CEXC_SHIFT)
  77. /* All routines returning an exception to raise should detect
  78.  * such exceptions _before_ rounding to be consistant with
  79.  * the behavior of the hardware in the implemented cases
  80.  * (and thus with the recommendations in the V9 architecture
  81.  * manual).
  82.  *
  83.  * We return 0 if a SIGFPE should be sent, 1 otherwise.
  84.  */
  85. static inline int record_exception(struct pt_regs *regs, int eflag)
  86. {
  87. u64 fsr = current->thread.xfsr[0];
  88. int would_trap;
  89. /* Determine if this exception would have generated a trap. */
  90. would_trap = (fsr & ((long)eflag << FSR_TEM_SHIFT)) != 0UL;
  91. /* If trapping, we only want to signal one bit. */
  92. if(would_trap != 0) {
  93. eflag &= ((fsr & FSR_TEM_MASK) >> FSR_TEM_SHIFT);
  94. if((eflag & (eflag - 1)) != 0) {
  95. if(eflag & FP_EX_INVALID)
  96. eflag = FP_EX_INVALID;
  97. else if(eflag & FP_EX_OVERFLOW)
  98. eflag = FP_EX_OVERFLOW;
  99. else if(eflag & FP_EX_UNDERFLOW)
  100. eflag = FP_EX_UNDERFLOW;
  101. else if(eflag & FP_EX_DIVZERO)
  102. eflag = FP_EX_DIVZERO;
  103. else if(eflag & FP_EX_INEXACT)
  104. eflag = FP_EX_INEXACT;
  105. }
  106. }
  107. /* Set CEXC, here is the rule:
  108.  *
  109.  *    In general all FPU ops will set one and only one
  110.  *    bit in the CEXC field, this is always the case
  111.  *    when the IEEE exception trap is enabled in TEM.
  112.  */
  113. fsr &= ~(FSR_CEXC_MASK);
  114. fsr |= ((long)eflag << FSR_CEXC_SHIFT);
  115. /* Set the AEXC field, rule is:
  116.  *
  117.  *    If a trap would not be generated, the
  118.  *    CEXC just generated is OR'd into the
  119.  *    existing value of AEXC.
  120.  */
  121. if(would_trap == 0)
  122. fsr |= ((long)eflag << FSR_AEXC_SHIFT);
  123. /* If trapping, indicate fault trap type IEEE. */
  124. if(would_trap != 0)
  125. fsr |= (1UL << 14);
  126. current->thread.xfsr[0] = fsr;
  127. /* If we will not trap, advance the program counter over
  128.  * the instruction being handled.
  129.  */
  130. if(would_trap == 0) {
  131. regs->tpc = regs->tnpc;
  132. regs->tnpc += 4;
  133. }
  134. return (would_trap ? 0 : 1);
  135. }
  136. typedef union {
  137. u32 s;
  138. u64 d;
  139. u64 q[2];
  140. } *argp;
  141. int do_mathemu(struct pt_regs *regs, struct fpustate *f)
  142. {
  143. unsigned long pc = regs->tpc;
  144. unsigned long tstate = regs->tstate;
  145. u32 insn = 0;
  146. int type = 0;
  147. /* ftt tells which ftt it may happen in, r is rd, b is rs2 and a is rs1. The *u arg tells
  148.    whether the argument should be packed/unpacked (0 - do not unpack/pack, 1 - unpack/pack)
  149.    non-u args tells the size of the argument (0 - no argument, 1 - single, 2 - double, 3 - quad */
  150. #define TYPE(ftt, r, ru, b, bu, a, au) type = (au << 2) | (a << 0) | (bu << 5) | (b << 3) | (ru << 8) | (r << 6) | (ftt << 9)
  151. int freg;
  152. static u64 zero[2] = { 0L, 0L };
  153. int flags;
  154. FP_DECL_EX;
  155. FP_DECL_S(SA); FP_DECL_S(SB); FP_DECL_S(SR);
  156. FP_DECL_D(DA); FP_DECL_D(DB); FP_DECL_D(DR);
  157. FP_DECL_Q(QA); FP_DECL_Q(QB); FP_DECL_Q(QR);
  158. int IR;
  159. long XR, xfsr;
  160. if(tstate & TSTATE_PRIV)
  161. die_if_kernel("FPQuad from kernel", regs);
  162. if(current->thread.flags & SPARC_FLAG_32BIT)
  163. pc = (u32)pc;
  164. if (get_user(insn, (u32 *)pc) != -EFAULT) {
  165. if ((insn & 0xc1f80000) == 0x81a00000) /* FPOP1 */ {
  166. switch ((insn >> 5) & 0x1ff) {
  167. /* QUAD - ftt == 3 */
  168. case FMOVQ:
  169. case FNEGQ:
  170. case FABSQ: TYPE(3,3,0,3,0,0,0); break;
  171. case FSQRTQ: TYPE(3,3,1,3,1,0,0); break;
  172. case FADDQ:
  173. case FSUBQ:
  174. case FMULQ:
  175. case FDIVQ: TYPE(3,3,1,3,1,3,1); break;
  176. case FDMULQ: TYPE(3,3,1,2,1,2,1); break;
  177. case FQTOX: TYPE(3,2,0,3,1,0,0); break;
  178. case FXTOQ: TYPE(3,3,1,2,0,0,0); break;
  179. case FQTOS: TYPE(3,1,1,3,1,0,0); break;
  180. case FQTOD: TYPE(3,2,1,3,1,0,0); break;
  181. case FITOQ: TYPE(3,3,1,1,0,0,0); break;
  182. case FSTOQ: TYPE(3,3,1,1,1,0,0); break;
  183. case FDTOQ: TYPE(3,3,1,2,1,0,0); break;
  184. case FQTOI: TYPE(3,1,0,3,1,0,0); break;
  185. /* SUBNORMAL - ftt == 2 */
  186. case FSQRTS: TYPE(2,1,1,1,1,0,0); break;
  187. case FSQRTD: TYPE(2,2,1,2,1,0,0); break;
  188. case FADDD:
  189. case FSUBD:
  190. case FMULD:
  191. case FDIVD: TYPE(2,2,1,2,1,2,1); break;
  192. case FADDS:
  193. case FSUBS:
  194. case FMULS:
  195. case FDIVS: TYPE(2,1,1,1,1,1,1); break;
  196. case FSMULD: TYPE(2,2,1,1,1,1,1); break;
  197. case FSTOX: TYPE(2,2,0,1,1,0,0); break;
  198. case FDTOX: TYPE(2,2,0,2,1,0,0); break;
  199. case FDTOS: TYPE(2,1,1,2,1,0,0); break;
  200. case FSTOD: TYPE(2,2,1,1,1,0,0); break;
  201. case FSTOI: TYPE(2,1,0,1,1,0,0); break;
  202. case FDTOI: TYPE(2,1,0,2,1,0,0); break;
  203. }
  204. }
  205. else if ((insn & 0xc1f80000) == 0x81a80000) /* FPOP2 */ {
  206. IR = 2;
  207. switch ((insn >> 5) & 0x1ff) {
  208. case FCMPQ: TYPE(3,0,0,3,1,3,1); break;
  209. case FCMPEQ: TYPE(3,0,0,3,1,3,1); break;
  210. /* Now the conditional fmovq support */
  211. case FMOVQ0:
  212. case FMOVQ1:
  213. case FMOVQ2:
  214. case FMOVQ3:
  215. /* fmovq %fccX, %fY, %fZ */
  216. if (!((insn >> 11) & 3))
  217. XR = current->thread.xfsr[0] >> 10;
  218. else
  219. XR = current->thread.xfsr[0] >> (30 + ((insn >> 10) & 0x6));
  220. XR &= 3;
  221. IR = 0;
  222. switch ((insn >> 14) & 0x7) {
  223. /* case 0: IR = 0; break; */ /* Never */
  224. case 1: if (XR) IR = 1; break; /* Not Equal */
  225. case 2: if (XR == 1 || XR == 2) IR = 1; break; /* Less or Greater */
  226. case 3: if (XR & 1) IR = 1; break; /* Unordered or Less */
  227. case 4: if (XR == 1) IR = 1; break; /* Less */
  228. case 5: if (XR & 2) IR = 1; break; /* Unordered or Greater */
  229. case 6: if (XR == 2) IR = 1; break; /* Greater */
  230. case 7: if (XR == 3) IR = 1; break; /* Unordered */
  231. }
  232. if ((insn >> 14) & 8)
  233. IR ^= 1;
  234. break;
  235. case FMOVQI:
  236. case FMOVQX:
  237. /* fmovq %[ix]cc, %fY, %fZ */
  238. XR = regs->tstate >> 32;
  239. if ((insn >> 5) & 0x80)
  240. XR >>= 4;
  241. XR &= 0xf;
  242. IR = 0;
  243. freg = ((XR >> 2) ^ XR) & 2;
  244. switch ((insn >> 14) & 0x7) {
  245. /* case 0: IR = 0; break; */ /* Never */
  246. case 1: if (XR & 4) IR = 1; break; /* Equal */
  247. case 2: if ((XR & 4) || freg) IR = 1; break; /* Less or Equal */
  248. case 3: if (freg) IR = 1; break; /* Less */
  249. case 4: if (XR & 5) IR = 1; break; /* Less or Equal Unsigned */
  250. case 5: if (XR & 1) IR = 1; break; /* Carry Set */
  251. case 6: if (XR & 8) IR = 1; break; /* Negative */
  252. case 7: if (XR & 2) IR = 1; break; /* Overflow Set */
  253. }
  254. if ((insn >> 14) & 8)
  255. IR ^= 1;
  256. break;
  257. case FMOVQZ:
  258. case FMOVQLE:
  259. case FMOVQLZ:
  260. case FMOVQNZ:
  261. case FMOVQGZ:
  262. case FMOVQGE:
  263. freg = (insn >> 14) & 0x1f;
  264. if (!freg)
  265. XR = 0;
  266. else if (freg < 16)
  267. XR = regs->u_regs[freg];
  268. else if (current->thread.flags & SPARC_FLAG_32BIT) {
  269. struct reg_window32 *win32;
  270. flushw_user ();
  271. win32 = (struct reg_window32 *)((unsigned long)((u32)regs->u_regs[UREG_FP]));
  272. get_user(XR, &win32->locals[freg - 16]);
  273. } else {
  274. struct reg_window *win;
  275. flushw_user ();
  276. win = (struct reg_window *)(regs->u_regs[UREG_FP] + STACK_BIAS);
  277. get_user(XR, &win->locals[freg - 16]);
  278. }
  279. IR = 0;
  280. switch ((insn >> 10) & 3) {
  281. case 1: if (!XR) IR = 1; break; /* Register Zero */
  282. case 2: if (XR <= 0) IR = 1; break; /* Register Less Than or Equal to Zero */
  283. case 3: if (XR < 0) IR = 1; break; /* Register Less Than Zero */
  284. }
  285. if ((insn >> 10) & 4)
  286. IR ^= 1;
  287. break;
  288. }
  289. if (IR == 0) {
  290. /* The fmov test was false. Do a nop instead */
  291. current->thread.xfsr[0] &= ~(FSR_CEXC_MASK);
  292. regs->tpc = regs->tnpc;
  293. regs->tnpc += 4;
  294. return 1;
  295. } else if (IR == 1) {
  296. /* Change the instruction into plain fmovq */
  297. insn = (insn & 0x3e00001f) | 0x81a00060;
  298. TYPE(3,3,0,3,0,0,0); 
  299. }
  300. }
  301. }
  302. if (type) {
  303. argp rs1 = NULL, rs2 = NULL, rd = NULL;
  304. freg = (current->thread.xfsr[0] >> 14) & 0xf;
  305. if (freg != (type >> 9))
  306. goto err;
  307. current->thread.xfsr[0] &= ~0x1c000;
  308. freg = ((insn >> 14) & 0x1f);
  309. switch (type & 0x3) {
  310. case 3: if (freg & 2) {
  311. current->thread.xfsr[0] |= (6 << 14) /* invalid_fp_register */;
  312. goto err;
  313. }
  314. case 2: freg = ((freg & 1) << 5) | (freg & 0x1e);
  315. case 1: rs1 = (argp)&f->regs[freg];
  316. flags = (freg < 32) ? FPRS_DL : FPRS_DU; 
  317. if (!(current->thread.fpsaved[0] & flags))
  318. rs1 = (argp)&zero;
  319. break;
  320. }
  321. switch (type & 0x7) {
  322. case 7: FP_UNPACK_QP (QA, rs1); break;
  323. case 6: FP_UNPACK_DP (DA, rs1); break;
  324. case 5: FP_UNPACK_SP (SA, rs1); break;
  325. }
  326. freg = (insn & 0x1f);
  327. switch ((type >> 3) & 0x3) {
  328. case 3: if (freg & 2) {
  329. current->thread.xfsr[0] |= (6 << 14) /* invalid_fp_register */;
  330. goto err;
  331. }
  332. case 2: freg = ((freg & 1) << 5) | (freg & 0x1e);
  333. case 1: rs2 = (argp)&f->regs[freg];
  334. flags = (freg < 32) ? FPRS_DL : FPRS_DU; 
  335. if (!(current->thread.fpsaved[0] & flags))
  336. rs2 = (argp)&zero;
  337. break;
  338. }
  339. switch ((type >> 3) & 0x7) {
  340. case 7: FP_UNPACK_QP (QB, rs2); break;
  341. case 6: FP_UNPACK_DP (DB, rs2); break;
  342. case 5: FP_UNPACK_SP (SB, rs2); break;
  343. }
  344. freg = ((insn >> 25) & 0x1f);
  345. switch ((type >> 6) & 0x3) {
  346. case 3: if (freg & 2) {
  347. current->thread.xfsr[0] |= (6 << 14) /* invalid_fp_register */;
  348. goto err;
  349. }
  350. case 2: freg = ((freg & 1) << 5) | (freg & 0x1e);
  351. case 1: rd = (argp)&f->regs[freg];
  352. flags = (freg < 32) ? FPRS_DL : FPRS_DU; 
  353. if (!(current->thread.fpsaved[0] & FPRS_FEF)) {
  354. current->thread.fpsaved[0] = FPRS_FEF;
  355. current->thread.gsr[0] = 0;
  356. }
  357. if (!(current->thread.fpsaved[0] & flags)) {
  358. if (freg < 32)
  359. memset(f->regs, 0, 32*sizeof(u32));
  360. else
  361. memset(f->regs+32, 0, 32*sizeof(u32));
  362. }
  363. current->thread.fpsaved[0] |= flags;
  364. break;
  365. }
  366. switch ((insn >> 5) & 0x1ff) {
  367. /* + */
  368. case FADDS: FP_ADD_S (SR, SA, SB); break;
  369. case FADDD: FP_ADD_D (DR, DA, DB); break;
  370. case FADDQ: FP_ADD_Q (QR, QA, QB); break;
  371. /* - */
  372. case FSUBS: FP_SUB_S (SR, SA, SB); break;
  373. case FSUBD: FP_SUB_D (DR, DA, DB); break;
  374. case FSUBQ: FP_SUB_Q (QR, QA, QB); break;
  375. /* * */
  376. case FMULS: FP_MUL_S (SR, SA, SB); break;
  377. case FSMULD: FP_CONV (D, S, 1, 1, DA, SA);
  378.      FP_CONV (D, S, 1, 1, DB, SB);
  379. case FMULD: FP_MUL_D (DR, DA, DB); break;
  380. case FDMULQ: FP_CONV (Q, D, 2, 1, QA, DA);
  381.      FP_CONV (Q, D, 2, 1, QB, DB);
  382. case FMULQ: FP_MUL_Q (QR, QA, QB); break;
  383. /* / */
  384. case FDIVS: FP_DIV_S (SR, SA, SB); break;
  385. case FDIVD: FP_DIV_D (DR, DA, DB); break;
  386. case FDIVQ: FP_DIV_Q (QR, QA, QB); break;
  387. /* sqrt */
  388. case FSQRTS: FP_SQRT_S (SR, SB); break;
  389. case FSQRTD: FP_SQRT_D (DR, DB); break;
  390. case FSQRTQ: FP_SQRT_Q (QR, QB); break;
  391. /* mov */
  392. case FMOVQ: rd->q[0] = rs2->q[0]; rd->q[1] = rs2->q[1]; break;
  393. case FABSQ: rd->q[0] = rs2->q[0] & 0x7fffffffffffffffUL; rd->q[1] = rs2->q[1]; break;
  394. case FNEGQ: rd->q[0] = rs2->q[0] ^ 0x8000000000000000UL; rd->q[1] = rs2->q[1]; break;
  395. /* float to int */
  396. case FSTOI: FP_TO_INT_S (IR, SB, 32, 1); break;
  397. case FDTOI: FP_TO_INT_D (IR, DB, 32, 1); break;
  398. case FQTOI: FP_TO_INT_Q (IR, QB, 32, 1); break;
  399. case FSTOX: FP_TO_INT_S (XR, SB, 64, 1); break;
  400. case FDTOX: FP_TO_INT_D (XR, DB, 64, 1); break;
  401. case FQTOX: FP_TO_INT_Q (XR, QB, 64, 1); break;
  402. /* int to float */
  403. case FITOQ: IR = rs2->s; FP_FROM_INT_Q (QR, IR, 32, int); break;
  404. case FXTOQ: XR = rs2->d; FP_FROM_INT_Q (QR, XR, 64, long); break;
  405. /* float to float */
  406. case FSTOD: FP_CONV (D, S, 1, 1, DR, SB); break;
  407. case FSTOQ: FP_CONV (Q, S, 2, 1, QR, SB); break;
  408. case FDTOQ: FP_CONV (Q, D, 2, 1, QR, DB); break;
  409. case FDTOS: FP_CONV (S, D, 1, 1, SR, DB); break;
  410. case FQTOS: FP_CONV (S, Q, 1, 2, SR, QB); break;
  411. case FQTOD: FP_CONV (D, Q, 1, 2, DR, QB); break;
  412. /* comparison */
  413. case FCMPQ:
  414. case FCMPEQ:
  415. FP_CMP_Q(XR, QB, QA, 3);
  416. if (XR == 3 &&
  417.     (((insn >> 5) & 0x1ff) == FCMPEQ ||
  418.      FP_ISSIGNAN_Q(QA) ||
  419.      FP_ISSIGNAN_Q(QB)))
  420. FP_SET_EXCEPTION (FP_EX_INVALID);
  421. }
  422. if (!FP_INHIBIT_RESULTS) {
  423. switch ((type >> 6) & 0x7) {
  424. case 0: xfsr = current->thread.xfsr[0];
  425. if (XR == -1) XR = 2;
  426. switch (freg & 3) {
  427. /* fcc0, 1, 2, 3 */
  428. case 0: xfsr &= ~0xc00; xfsr |= (XR << 10); break;
  429. case 1: xfsr &= ~0x300000000UL; xfsr |= (XR << 32); break;
  430. case 2: xfsr &= ~0xc00000000UL; xfsr |= (XR << 34); break;
  431. case 3: xfsr &= ~0x3000000000UL; xfsr |= (XR << 36); break;
  432. }
  433. current->thread.xfsr[0] = xfsr;
  434. break;
  435. case 1: rd->s = IR; break;
  436. case 2: rd->d = XR; break;
  437. case 5: FP_PACK_SP (rd, SR); break;
  438. case 6: FP_PACK_DP (rd, DR); break;
  439. case 7: FP_PACK_QP (rd, QR); break;
  440. }
  441. }
  442. if(_fex != 0)
  443. return record_exception(regs, _fex);
  444. /* Success and no exceptions detected. */
  445. current->thread.xfsr[0] &= ~(FSR_CEXC_MASK);
  446. regs->tpc = regs->tnpc;
  447. regs->tnpc += 4;
  448. return 1;
  449. }
  450. err: return 0;
  451. }