avyuv2yuv.c
上传用户:dangjiwu
上传日期:2013-07-19
资源大小:42019k
文件大小:8k
源码类别:

Symbian

开发平台:

Visual C++

  1. /* ***** BEGIN LICENSE BLOCK *****
  2.  * Source last modified: $Id: avyuv2yuv.c,v 1.2.36.1 2004/07/09 02:00:18 hubbe Exp $
  3.  * 
  4.  * Portions Copyright (c) 1995-2004 RealNetworks, Inc. All Rights Reserved.
  5.  * 
  6.  * The contents of this file, and the files included with this file,
  7.  * are subject to the current version of the RealNetworks Public
  8.  * Source License (the "RPSL") available at
  9.  * http://www.helixcommunity.org/content/rpsl unless you have licensed
  10.  * the file under the current version of the RealNetworks Community
  11.  * Source License (the "RCSL") available at
  12.  * http://www.helixcommunity.org/content/rcsl, in which case the RCSL
  13.  * will apply. You may also obtain the license terms directly from
  14.  * RealNetworks.  You may not use this file except in compliance with
  15.  * the RPSL or, if you have a valid RCSL with RealNetworks applicable
  16.  * to this file, the RCSL.  Please see the applicable RPSL or RCSL for
  17.  * the rights, obligations and limitations governing use of the
  18.  * contents of the file.
  19.  * 
  20.  * Alternatively, the contents of this file may be used under the
  21.  * terms of the GNU General Public License Version 2 or later (the
  22.  * "GPL") in which case the provisions of the GPL are applicable
  23.  * instead of those above. If you wish to allow use of your version of
  24.  * this file only under the terms of the GPL, and not to allow others
  25.  * to use your version of this file under the terms of either the RPSL
  26.  * or RCSL, indicate your decision by deleting the provisions above
  27.  * and replace them with the notice and other provisions required by
  28.  * the GPL. If you do not delete the provisions above, a recipient may
  29.  * use your version of this file under the terms of any one of the
  30.  * RPSL, the RCSL or the GPL.
  31.  * 
  32.  * This file is part of the Helix DNA Technology. RealNetworks is the
  33.  * developer of the Original Code and owns the copyrights in the
  34.  * portions it created.
  35.  * 
  36.  * This file, and the files included with this file, is distributed
  37.  * and made available on an 'AS IS' basis, WITHOUT WARRANTY OF ANY
  38.  * KIND, EITHER EXPRESS OR IMPLIED, AND REALNETWORKS HEREBY DISCLAIMS
  39.  * ALL SUCH WARRANTIES, INCLUDING WITHOUT LIMITATION, ANY WARRANTIES
  40.  * OF MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE, QUIET
  41.  * ENJOYMENT OR NON-INFRINGEMENT.
  42.  * 
  43.  * Technology Compatibility Kit Test Suite(s) Location:
  44.  *    http://www.helixcommunity.org/content/tck
  45.  * 
  46.  * Contributor(s):
  47.  * 
  48.  * ***** END LICENSE BLOCK ***** */
  49. #ifdef _MACINTOSH
  50. #pragma altivec_model on
  51. #define VecI8 vector signed char
  52. #define VecU8 vector unsigned char
  53. #define VecI16 vector signed short
  54. #define VecU16 vector unsigned short
  55. #define VecI32 vector signed int
  56. #define VecU32 vector unsigned int
  57. #define U32 unsigned int
  58. #define COMBINE(b0,b1,b2,b3)  
  59.     ((unsigned int)(b3) | ((unsigned int)(b2) << 8) | 
  60.     ((unsigned int)(b1) << 16) | ((unsigned int)(b0) << 24))
  61.     
  62.     
  63. #ifdef _MACINTOSH
  64. #ifdef __cplusplus
  65. extern "C"
  66. #endif
  67. void
  68. AltiVec_lineI420toYUY2 (
  69. unsigned char *sy, 
  70. unsigned char *su, 
  71. unsigned char *sv,
  72. unsigned char *d,
  73. int dest_dx);
  74. #endif
  75. void
  76. AltiVec_lineI420toYUY2 (
  77. unsigned char *sy, 
  78. unsigned char *su, 
  79. unsigned char *sv,
  80. unsigned char *d,
  81. int dest_dx)
  82. {
  83. VecU8 v0, v1;
  84. VecU8 v2, v3;
  85. VecU8 v4, v5;
  86. VecU8 v6, v7;
  87. VecU8 vPY, vPU, vPV;
  88. // convert until *d is 16-byte aligned
  89. while (((int)d & 15) != 0)
  90. {
  91. *(U32*)d = COMBINE(sy[0], su[0], sy[1], sv[0]);
  92. sy += 2;
  93. su++;
  94. sv++;
  95. d += 4;
  96. dest_dx -= 2;
  97. }
  98. // Special case for all pointers 16-byte aligned
  99. if ((((int)sy | (int)su | (int)sv) & 15) == 0)
  100. {
  101. while (dest_dx >= 32)
  102. {
  103. v0  = vec_ld(0, sy); // v0 = y0|y1|y2|y3|y4|y5|y6|y7|y8|y9|ya|yb|yc|yd|ye|yf
  104. v2  = vec_ld(0, su); // v2 = u0|u1|u2|u3|u4|u5|u6|u7|u8|u9|ua|ub|uc|ud|ue|uf
  105. v4  = vec_ld(0, sv); // v4 = v0|v1|v2|v3|v4|v5|v6|v7|v8|v9|va|vb|vc|vd|ve|vf
  106. v6  = vec_mergeh(v2, v4); // v6 = u0|v0|u1|v1|u2|v2|u3|v3|u4|v4|u5|v5|u6|v6|u7|v7
  107. v7  = vec_mergeh(v0, v6); // v7 = y0|u0|y1|v0|y2|u1|y3|v1|y4|u2|y5|v2|y6|u3|y7|v3
  108. vec_st(v7, 0, d); // store
  109. v7  = vec_mergel(v0, v6); // v7 = y8|u4|y9|v4|ya|u5|yb|v5|yc|u6|yd|v6|ye|u7|yf|v7
  110. vec_st(v7, 16, d); // store
  111. v0  = vec_ld(16, sy); // v0 = y0|y1|y2|y3|y4|y5|y6|y7|y8|y9|ya|yb|yc|yd|ye|yf
  112. v6  = vec_mergel(v2, v4); // v6 = u8|v8|u9|v9|ua|va|ub|vb|uc|vc|ud|vd|ue|ve|uf|vf
  113. v7  = vec_mergeh(v0, v6); // v7 = y0|u8|y1|v8|y2|u9|y3|v9|y4|ua|y5|va|y6|ub|y7|vb
  114. vec_st(v7, 32, d); // store
  115. v7  = vec_mergel(v0, v6); // v7 = y8|uc|y9|vc|ya|ud|yb|vd|yc|ue|yd|ve|ye|uf|yf|vf
  116. vec_st(v7, 48, d); // store
  117. sy += 32;
  118. su += 16;
  119. sv += 16;
  120. d  += 64;
  121. dest_dx -= 32;
  122. }
  123. while (dest_dx >= 16)
  124. {
  125. v0  = vec_ld(0, sy); // v0 = y0|y1|y2|y3|y4|y5|y6|y7|y8|y9|ya|yb|yc|yd|ye|yf
  126. v2  = vec_ld(0, su); // v2 = u0|u1|u2|u3|u4|u5|u6|u7|u8|u9|ua|ub|uc|ud|ue|uf
  127. v4  = vec_ld(0, sv); // v4 = v0|v1|v2|v3|v4|v5|v6|v7|v8|v9|va|vb|vc|vd|ve|vf
  128. v6  = vec_mergeh(v2, v4); // v6 = u0|v0|u1|v1|u2|v2|u3|v3|u4|v4|u5|v5|u6|v6|u7|v7
  129. v7  = vec_mergeh(v0, v6); // v7 = y0|u0|y1|v0|y2|u1|y3|v1|y4|u2|y5|v2|y6|u3|y7|v3
  130. vec_st(v7, 0, d); // store
  131. v7  = vec_mergel(v0, v6); // v7 = y8|u4|y9|v4|ya|u5|yb|v5|yc|u6|yd|v6|ye|u7|yf|v7
  132. vec_st(v7, 16, d); // store
  133. sy += 16;
  134. su += 8;
  135. sv += 8;
  136. d  += 32;
  137. dest_dx -= 16;
  138. }
  139. }
  140. else
  141. {
  142. vPY = vec_lvsl(0, sy);
  143. vPU = vec_lvsl(0, su);
  144. vPV = vec_lvsl(0, sv);
  145. v0  = vec_ld(0, sy);
  146. v2  = vec_ld(0, su);
  147. v4  = vec_ld(0, sv);
  148. while (dest_dx >= 32)
  149. {
  150. // Load Y - 16 pels
  151. v1  = vec_ld(16, sy);
  152. v0  = vec_perm(v0, v1, vPY); // v0 = y0|y1|y2|y3|y4|y5|y6|y7|y8|y9|ya|yb|yc|yd|ye|yf
  153. // Load U - 16 pels
  154. v3  = vec_ld(16, su);
  155. v2  = vec_perm(v2, v3, vPU); // v2 = u0|u1|u2|u3|u4|u5|u6|u7|u8|u9|ua|ub|uc|ud|ue|uf
  156. // Load V - 16 pels
  157. v5  = vec_ld(16, sv);
  158. v4  = vec_perm(v4, v5, vPV); // v4 = v0|v1|v2|v3|v4|v5|v6|v7|v8|v9|va|vb|vc|vd|ve|vf
  159. v6  = vec_mergeh(v2, v4); // v6 = u0|v0|u1|v1|u2|v2|u3|v3|u4|v4|u5|v5|u6|v6|u7|v7
  160. v7  = vec_mergeh(v0, v6); // v7 = y0|u0|y1|v0|y2|u1|y3|v1|y4|u2|y5|v2|y6|u3|y7|v3
  161. // Store 8 YUYV pels
  162. vec_st(v7, 0, d);
  163. v7  = vec_mergel(v0, v6); // v7 = y8|u4|y9|v4|ya|u5|yb|v5|yc|u6|yd|v6|ye|u7|yf|v7
  164. // Store 8 YUYV pels
  165. vec_st(v7, 16, d);
  166. // Load Y - 16 pels
  167. v0  = vec_ld(32, sy);
  168. v1  = vec_perm(v1, v0, vPY); // v1 = y0|y1|y2|y3|y4|y5|y6|y7|y8|y9|ya|yb|yc|yd|ye|yf
  169. v6  = vec_mergel(v2, v4); // v6 = u8|v8|u9|v9|ua|va|ub|vb|uc|vc|ud|vd|ue|ve|uf|vf
  170. v7  = vec_mergeh(v1, v6); // v7 = y0|u8|y1|v8|y2|u9|y3|v9|y4|ua|y5|va|y6|ub|y7|vb
  171. // Store 8 YUYV pels
  172. vec_st(v7, 32, d);
  173. v7  = vec_mergel(v1, v6); // v7 = y8|uc|y9|vc|ya|ud|yb|vd|yc|ue|yd|ve|ye|uf|yf|vf
  174. // Store 8 YUYV pels
  175. vec_st(v7, 48, d);
  176. v2  = v3;
  177. v4  = v5;
  178. sy += 32;
  179. su += 16;
  180. sv += 16;
  181. d  += 64;
  182. dest_dx -= 32;
  183. }
  184. while (dest_dx >= 16)
  185. {
  186. // Load Y - 16 pels
  187. v1  = vec_ld(16, sy);
  188. v0  = vec_perm(v0, v1, vPY); // v0 = y0|y1|y2|y3|y4|y5|y6|y7|y8|y9|ya|yb|yc|yd|ye|yf
  189. // Load U - 16 pels
  190. v3  = vec_ld(16, su);
  191. v2  = vec_perm(v2, v3, vPU); // v2 = u0|u1|u2|u3|u4|u5|u6|u7|u8|u9|ua|ub|uc|ud|ue|uf
  192. // Load V - 16 pels
  193. v5  = vec_ld(16, sv);
  194. v4  = vec_perm(v4, v5, vPV); // v4 = v0|v1|v2|v3|v4|v5|v6|v7|v8|v9|va|vb|vc|vd|ve|vf
  195. v6  = vec_mergeh(v2, v4); // v6 = u0|v0|u1|v1|u2|v2|u3|v3|u4|v4|u5|v5|u6|v6|u7|v7
  196. v7  = vec_mergeh(v0, v6); // v7 = y0|u0|y1|v0|y2|u1|y3|v1|y4|u2|y5|v2|y6|u3|y7|v3
  197. // Store 8 YUYV pels
  198. vec_st(v7, 0, d);
  199. v7  = vec_mergel(v0, v6); // v7 = y8|u4|y9|v4|ya|u5|yb|v5|yc|u6|yd|v6|ye|u7|yf|v7
  200. // Store 8 YUYV pels
  201. vec_st(v7, 16, d);
  202. sy += 16;
  203. su += 8;
  204. sv += 8;
  205. d  += 32;
  206. dest_dx -= 16;
  207. }
  208. }
  209. while (dest_dx)
  210. {
  211. *(U32*)d = COMBINE(sy[0], su[0], sy[1], sv[0]);
  212. sy += 2;
  213. su++;
  214. sv++;
  215. d += 4;
  216. dest_dx -= 2;
  217. }
  218. }
  219. #pragma altivec_model off
  220. #endif // _MACINTOSH