444.c
上传用户:zhongxx05
上传日期:2007-06-06
资源大小:33641k
文件大小:32k
源码类别:

Symbian

开发平台:

C/C++

  1. /* ***** BEGIN LICENSE BLOCK ***** 
  2.  * Version: RCSL 1.0/RPSL 1.0 
  3.  *  
  4.  * Portions Copyright (c) 1995-2002 RealNetworks, Inc. All Rights Reserved. 
  5.  *      
  6.  * The contents of this file, and the files included with this file, are 
  7.  * subject to the current version of the RealNetworks Public Source License 
  8.  * Version 1.0 (the "RPSL") available at 
  9.  * http://www.helixcommunity.org/content/rpsl unless you have licensed 
  10.  * the file under the RealNetworks Community Source License Version 1.0 
  11.  * (the "RCSL") available at http://www.helixcommunity.org/content/rcsl, 
  12.  * in which case the RCSL will apply. You may also obtain the license terms 
  13.  * directly from RealNetworks.  You may not use this file except in 
  14.  * compliance with the RPSL or, if you have a valid RCSL with RealNetworks 
  15.  * applicable to this file, the RCSL.  Please see the applicable RPSL or 
  16.  * RCSL for the rights, obligations and limitations governing use of the 
  17.  * contents of the file.  
  18.  *  
  19.  * This file is part of the Helix DNA Technology. RealNetworks is the 
  20.  * developer of the Original Code and owns the copyrights in the portions 
  21.  * it created. 
  22.  *  
  23.  * This file, and the files included with this file, is distributed and made 
  24.  * available on an 'AS IS' basis, WITHOUT WARRANTY OF ANY KIND, EITHER 
  25.  * EXPRESS OR IMPLIED, AND REALNETWORKS HEREBY DISCLAIMS ALL SUCH WARRANTIES, 
  26.  * INCLUDING WITHOUT LIMITATION, ANY WARRANTIES OF MERCHANTABILITY, FITNESS 
  27.  * FOR A PARTICULAR PURPOSE, QUIET ENJOYMENT OR NON-INFRINGEMENT. 
  28.  * 
  29.  * Technology Compatibility Kit Test Suite(s) Location: 
  30.  *    http://www.helixcommunity.org/content/tck 
  31.  * 
  32.  * Contributor(s): 
  33.  *  
  34.  * ***** END LICENSE BLOCK ***** */ 
  35. #include <stdlib.h>
  36. #include "nostatic/colorlib.h"
  37. #include "nostatic/yuv.h"
  38. /*
  39.  * Format-conversion routines.
  40.  * Use:
  41.  *  int XXXXtoYYYYEx (unsigned char *dest_ptr, int dest_width, int dest_height,
  42.  *      int dest_pitch, int dest_x, int dest_y, int dest_dx, int dest_dy,
  43.  *      unsigned char *src_ptr, int src_width, int src_height, int src_pitch,
  44.  *      int src_x, int src_y, int src_dx, int src_dy);
  45.  * Input:
  46.  *  dest_ptr - pointer to a destination buffer
  47.  *  dest_width, dest_height - width/height of the destination image (pixels)
  48.  *  dest_pitch - pitch of the dest. buffer (in bytes; <0 - if bottom up image)
  49.  *  dest_x, dest_y, dest_dx, dest_dy - destination rectangle (pixels)
  50.  *  src_ptr - pointer to an input image
  51.  *  src_width, src_height - width/height of the input image (pixels)
  52.  *  src_pitch - pitch of the source buffer (in bytes; <0 - if bottom up image)
  53.  *  src_x, src_y, src_dx, src_dy - source rectangle (pixels)
  54.  * Returns:
  55.  *  0 - if success; -1 if failure.
  56.  * Notes:
  57.  *  a) In all cases, pointers to the source and destination buffers must be
  58.  *     DWORD aligned, and both pitch parameters must be multiple of 4!!!
  59.  *  b) Converters that deal with YUV 4:2:2, or 4:2:0 formats may also require
  60.  *     rectangle parameters (x,y,dx,dy) to be multiple of 2. Failure to provide
  61.  *     aligned rectangles will result in partially converted image.
  62.  *  c) Currently only scale factors of 1:1 and 2:1 are supported; if the rates
  63.  *     dest_dx/src_dx & dest_dy/src_dy are neither 1, or 2, the converters
  64.  *     will fail.
  65.  */
  66. #define BYTESPERPIXEL 2
  67. /* Indexing tables */
  68. static const int next[3] = {1, 2, 0};                 /* (ibuf+1)%3 table */
  69. static const int next2[3] = {2, 0, 1};                /* (ibuf+2)%3 table */
  70. /* Half resolution converter.  */
  71. static void halfI420toRGB444 (unsigned char *d1,
  72. int dest_x, unsigned char *sy1, 
  73. unsigned char *sy2, unsigned char *su, 
  74. unsigned char *sv, int src_x, int dx, int isodd,
  75.       color_data_t* pcd)
  76. {
  77.   /* check if we have misaligned input/output: */
  78.   if ((src_x ^ dest_x) & 1) {
  79.     
  80.     ; /* not implemented yet */
  81.     
  82.   } else {
  83.     
  84.     /* aligned input/output: */
  85.     register int y11, y12;
  86.     register int rv1, guv1, bu1, rv2, guv2, bu2;
  87.     register int i;
  88.     
  89.     /* source width should always be multiples of 4 */
  90.     /*    assert((src_x & 3)==0); */
  91.     /* convert all integral 2x4 blocks: */
  92.     if (isodd)
  93.       for (i = 0; i < dx/4; i ++) {
  94. /* first 2x2 block */
  95. rv1 = pcd->rvtab[sv[0]];
  96. guv1 = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  97. bu1 = pcd->butab[su[0]];
  98. y11 = (pcd->ytab[sy1[0]] + pcd->ytab[sy1[1]] + pcd->ytab[sy2[0]] + pcd->ytab[sy2[1]])>>2; /* avg */
  99. /* second 2x2 block */
  100. rv2  = pcd->rvtab[sv[1]];
  101. guv2 = pcd->gutab[su[1]] + pcd->gvtab[sv[1]];
  102. bu2  = pcd->butab[su[1]];
  103. y12 = (pcd->ytab[sy1[2]] + pcd->ytab[sy1[3]] + pcd->ytab[sy2[2]] + pcd->ytab[sy2[3]])>>2;
  104. /* output 4 bytes at a time */
  105. *(unsigned int *)(d1+0) =
  106.   (CLIP4[y11 + bu1  + DITH4L] << 0)  |
  107.   (CLIP4[y11 + guv1 + DITH4L] << 4)  |
  108.   (CLIP4[y11 + rv1  + DITH4L] << 8) |
  109.   (CLIP4[y12 + bu2  + DITH4H] << 16) |
  110.   (CLIP4[y12 + guv2 + DITH4H] << 20) |
  111.   (CLIP4[y12 + rv2  + DITH4H] << 24) ;
  112. /* next 4x2 block */
  113. sy1 += 4; sy2 += 4;
  114. su += 2; sv += 2;
  115. d1 += 2*BPP2;
  116.       }
  117.     else
  118.       for (i = 0; i < dx/4; i ++) {
  119. /* first 2x2 block */
  120. rv1 = pcd->rvtab[sv[0]];
  121. guv1 = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  122. bu1 = pcd->butab[su[0]];
  123. y11 = (pcd->ytab[sy1[0]] + pcd->ytab[sy1[1]] + pcd->ytab[sy2[0]] + pcd->ytab[sy2[1]])>>2; /* avg */
  124. /* second 2x2 block */
  125. rv2  = pcd->rvtab[sv[1]];
  126. guv2 = pcd->gutab[su[1]] + pcd->gvtab[sv[1]];
  127. bu2  = pcd->butab[su[1]];
  128. y12 = (pcd->ytab[sy1[2]] + pcd->ytab[sy1[3]] + pcd->ytab[sy2[2]] + pcd->ytab[sy2[3]])>>2;
  129. /* output 4 bytes at a time */
  130. *(unsigned int *)(d1+0) =
  131.   (CLIP4[y11 + bu1  + DITH4H] << 0)  |
  132.   (CLIP4[y11 + guv1 + DITH4H] << 4)  |
  133.   (CLIP4[y11 + rv1  + DITH4H] << 8) |
  134.   (CLIP4[y12 + bu2  + DITH4L] << 16) |
  135.   (CLIP4[y12 + guv2 + DITH4L] << 20) |
  136.   (CLIP4[y12 + rv2  + DITH4L] << 24) ;
  137. /* next 4x2 block */
  138. sy1 += 4; sy2 += 4;
  139. su += 2; sv += 2;
  140. d1 += 2*BPP2;
  141.       }
  142.   }
  143. }
  144. static void dblineI420toRGB444 (unsigned char *d1, unsigned char *d2, 
  145. int dest_x, unsigned char *sy1, 
  146. unsigned char *sy2, unsigned char *su, 
  147. unsigned char *sv, int src_x, int dx,
  148. color_data_t* pcd)
  149. {
  150.     /* check if we have misaligned input/output: */
  151.     if ((src_x ^ dest_x) & 1) {
  152.         ; /* not implemented yet */
  153.     } else {
  154.         /* aligned input/output: */
  155.         register int y11, y12, y21, y22;
  156.         register int rv, guv, bu;
  157.         register int i;
  158.         /* convert first 2x1 block: */
  159.         if (dest_x & 1) {
  160.             rv  = pcd->rvtab[sv[0]];
  161.             guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  162.             bu  = pcd->butab[su[0]];
  163.             y11 = pcd->ytab[sy1[0]];
  164.             y21 = pcd->ytab[sy2[0]];
  165.             /* output 2 bytes at a time */
  166.             *(unsigned short *)(d1+0) =
  167.                 (CLIP4[y11 + bu  + DITH4L] << 0)  |
  168.                 (CLIP4[y11 + guv + DITH4L] << 4)  |
  169.                 (CLIP4[y11 + rv  + DITH4L] << 8) ;
  170.             *(unsigned short *)(d2+0) =
  171.                 (CLIP4[y21 + bu  + DITH4H] << 0)  |
  172.                 (CLIP4[y21 + guv + DITH4H] << 4)  |
  173.                 (CLIP4[y21 + rv  + DITH4H] << 8) ;
  174.             sy1 += 1; sy2 += 1;
  175.             su += 1; sv += 1;
  176.             d1 += BPP2; d2 += BPP2;
  177.             dest_x ++; dx --;
  178.         }
  179.         /* convert first 2x2 block: */
  180.         if (dest_x & 2) {
  181.             rv  = pcd->rvtab[sv[0]];
  182.             guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  183.             bu  = pcd->butab[su[0]];
  184.             y11 = pcd->ytab[sy1[0]];
  185.             y12 = pcd->ytab[sy1[1]];
  186.             /* output 4 bytes at a time */
  187.             *(unsigned int *)(d1+0) =
  188.                 (CLIP4[y11 + bu  + DITH4L] << 0)  |
  189.                 (CLIP4[y11 + guv + DITH4L] << 4)  |
  190.                 (CLIP4[y11 + rv  + DITH4L] << 8) |
  191.                 (CLIP4[y12 + bu  + DITH4H] << 16) |
  192.                 (CLIP4[y12 + guv + DITH4H] << 20) |
  193.                 (CLIP4[y12 + rv  + DITH4H] << 24) ;
  194.             y21 = pcd->ytab[sy2[0]];
  195.             y22 = pcd->ytab[sy2[1]];
  196.             *(unsigned int *)(d2+0) =
  197.                 (CLIP4[y21 + bu  + DITH4H] << 0)  |
  198.                 (CLIP4[y21 + guv + DITH4H] << 4)  |
  199.                 (CLIP4[y21 + rv  + DITH4H] << 8) |
  200.                 (CLIP4[y22 + bu  + DITH4L] << 16) |
  201.                 (CLIP4[y22 + guv + DITH4L] << 20) |
  202.                 (CLIP4[y22 + rv  + DITH4L] << 24) ;
  203.             sy1 += 2; sy2 += 2;
  204.             su += 1; sv += 1;
  205.             d1 += 2*BPP2; d2 += 2*BPP2;
  206.             dest_x += 2; dx -= 2;
  207.         }
  208.         /* convert all integral 2x4 blocks: */
  209.         for (i = 0; i < dx/4; i ++) {
  210.             /* first 2x2 block */
  211.             rv = pcd->rvtab[sv[0]];
  212.             guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  213.             bu = pcd->butab[su[0]];
  214.             y11 = pcd->ytab[sy1[0]];
  215.             y12 = pcd->ytab[sy1[1]];
  216.             /* output 4 bytes at a time */
  217.             *(unsigned int *)(d1+0) =
  218.                 (CLIP4[y11 + bu  + DITH4L] << 0)  |
  219.                 (CLIP4[y11 + guv + DITH4L] << 4)  |
  220.                 (CLIP4[y11 + rv  + DITH4L] << 8) |
  221.                 (CLIP4[y12 + bu  + DITH4H] << 16) |
  222.                 (CLIP4[y12 + guv + DITH4H] << 20) |
  223.                 (CLIP4[y12 + rv  + DITH4H] << 24) ;
  224.             y21 = pcd->ytab[sy2[0]];
  225.             y22 = pcd->ytab[sy2[1]];
  226.             *(unsigned int *)(d2+0) =
  227.                 (CLIP4[y21 + bu  + DITH4H] << 0)  |
  228.                 (CLIP4[y21 + guv + DITH4H] << 4)  |
  229.                 (CLIP4[y21 + rv  + DITH4H] << 8) |
  230.                 (CLIP4[y22 + bu  + DITH4L] << 16) |
  231.                 (CLIP4[y22 + guv + DITH4L] << 20) |
  232.                 (CLIP4[y22 + rv  + DITH4L] << 24) ;
  233.             /* second 2x2 block */
  234.             rv  = pcd->rvtab[sv[1]];
  235.             guv = pcd->gutab[su[1]] + pcd->gvtab[sv[1]];
  236.             bu  = pcd->butab[su[1]];
  237.             y11 = pcd->ytab[sy1[2]];
  238.             y12 = pcd->ytab[sy1[3]];
  239.             *(unsigned int *)(d1+2*BPP2) =
  240.                 (CLIP4[y11 + bu  + DITH4L] << 0)  |
  241.                 (CLIP4[y11 + guv + DITH4L] << 4)  |
  242.                 (CLIP4[y11 + rv  + DITH4L] << 8) |
  243.                 (CLIP4[y12 + bu  + DITH4H] << 16) |
  244.                 (CLIP4[y12 + guv + DITH4H] << 20) |
  245.                 (CLIP4[y12 + rv  + DITH4H] << 24) ;
  246.             y21 = pcd->ytab[sy2[2]];
  247.             y22 = pcd->ytab[sy2[3]];
  248.             *(unsigned int *)(d2+2*BPP2) =
  249.                 (CLIP4[y21 + bu  + DITH4H] << 0)  |
  250.                 (CLIP4[y21 + guv + DITH4H] << 4)  |
  251.                 (CLIP4[y21 + rv  + DITH4H] << 8) |
  252.                 (CLIP4[y22 + bu  + DITH4L] << 16) |
  253.                 (CLIP4[y22 + guv + DITH4L] << 20) |
  254.                 (CLIP4[y22 + rv  + DITH4L] << 24) ;
  255.             /* next 4x2 block */
  256.             sy1 += 4; sy2 += 4;
  257.             su += 2; sv += 2;
  258.             d1 += 4*BPP2; d2 += 4*BPP2;
  259.         }
  260.         /* convert last 2x2 block: */
  261.         if (dx & 2) {
  262.             rv = pcd->rvtab[sv[0]];
  263.             guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  264.             bu = pcd->butab[su[0]];
  265.             y11 = pcd->ytab[sy1[0]];
  266.             y12 = pcd->ytab[sy1[1]];
  267.             /* output 4 bytes at a time */
  268.             *(unsigned int *)(d1+0) =
  269.                 (CLIP4[y11 + bu  + DITH4L] << 0)  |
  270.                 (CLIP4[y11 + guv + DITH4L] << 4)  |
  271.                 (CLIP4[y11 + rv  + DITH4L] << 8) |
  272.                 (CLIP4[y12 + bu  + DITH4H] << 16) |
  273.                 (CLIP4[y12 + guv + DITH4H] << 20) |
  274.                 (CLIP4[y12 + rv  + DITH4H] << 24) ;
  275.             y21 = pcd->ytab[sy2[0]];
  276.             y22 = pcd->ytab[sy2[1]];
  277.             *(unsigned int *)(d2+0) =
  278.                 (CLIP4[y21 + bu  + DITH4H] << 0)  |
  279.                 (CLIP4[y21 + guv + DITH4H] << 4)  |
  280.                 (CLIP4[y21 + rv  + DITH4H] << 8) |
  281.                 (CLIP4[y22 + bu  + DITH4L] << 16) |
  282.                 (CLIP4[y22 + guv + DITH4L] << 20) |
  283.                 (CLIP4[y22 + rv  + DITH4L] << 24) ;
  284.             sy1 += 2; sy2 += 2;
  285.             su += 1; sv += 1;
  286.             d1 += 2*BPP2; d2 += 2*BPP2;
  287.             dx -= 2;
  288.         }
  289.         /* convert last 2x1 block: */
  290.         if (dx & 1) {
  291.             rv  = pcd->rvtab[sv[0]];
  292.             guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  293.             bu  = pcd->butab[su[0]];
  294.             y11 = pcd->ytab[sy1[0]];
  295.             y21 = pcd->ytab[sy2[0]];
  296.             /* output 2 bytes at a time */
  297.             *(unsigned short *)(d1+0) =
  298.                 (CLIP4[y11 + bu  + DITH4L] << 0)  |
  299.                 (CLIP4[y11 + guv + DITH4L] << 4)  |
  300.                 (CLIP4[y11 + rv  + DITH4L] << 8) ;
  301.             *(unsigned short *)(d2+0) =
  302.                 (CLIP4[y21 + bu  + DITH4H] << 0)  |
  303.                 (CLIP4[y21 + guv + DITH4H] << 4)  |
  304.                 (CLIP4[y21 + rv  + DITH4H] << 8) ;
  305.         }
  306.     }
  307. }
  308. #define DITH1X4L 0x01002004
  309. #define DITH1X4H 0x0300600C
  310. #define DITH2X4L 0x02004008
  311. #define DITH2X4H 0x0600C018
  312. #define DITH4X4L 0x04008010
  313. #define DITH4X4H 0x0C018030
  314. /* RGB444 version: */
  315. static void dblineXRGBtoRGB444x2 (unsigned char *d1, unsigned char *d2, int dest_x,
  316.     unsigned char *s1, unsigned char *s2, int src_x, int dx,
  317. color_data_t* pcd)
  318. {
  319.     register unsigned int a, b, c, d, e, f;
  320.     register unsigned int w, x, y, z;
  321.     /* convert first 2x1 block: */
  322.     if (dest_x & 1) {
  323.         /* Input pels  =>   Output pels
  324.          *  a b             w  x
  325.          *  c d             w' x'
  326.          */
  327.         /* top line */
  328.         a = *(unsigned int *)s1;
  329.         b = *(unsigned int *)(s1+BPP4);
  330.         w = a     + DITH1X4L;
  331.         x = a + b + DITH2X4H;
  332.         /* pack and store */
  333.         *(unsigned int *)d1 =
  334.             ((w & 0x000000f0) >> 4)  |
  335.             ((w & 0x00078000) >> 11) |
  336.             ((w & 0x3c000000) >> 18) |
  337.             ((x & 0x000001e0) << 11) |
  338.             ((x & 0x000f0000) << 4)  |
  339.             ((x & 0x78000000) >> 3);
  340.         /* bottom line */
  341.         c = *(unsigned int *)s2;
  342.         d = *(unsigned int *)(s2+BPP4);
  343.         w = a + c         + DITH2X4H;
  344.         x = a + b + c + d + DITH4X4L;
  345.         /* pack and store */
  346.         *(unsigned int *)d2 =
  347.             ((w & 0x000001e0) >> 5)  |
  348.             ((w & 0x000f0000) >> 12) |
  349.             ((w & 0x78000000) >> 19) |
  350.             ((x & 0x000003c0) << 10) |
  351.             ((x & 0x001e0000) << 3)  |
  352.             ((x & 0xf0000000) >> 4);
  353.         /* bump pointers to next block */
  354.         s1 += BPP4; s2 += BPP4;
  355.         d1 += 2*BPP2; d2 += 2*BPP2;
  356.         dx -= 1;
  357.     }
  358.     /* process all integral 2x2 blocks: */
  359.     while (dx > 2) {    /* we need to leave at least one block */
  360.         /*
  361.          * Input stored as 00 RRRRRRRR 000 GGGGGGGG 000 BBBBBBBB
  362.          *
  363.          * Input pels       Output pels
  364.          *  a b e           w  x  y  z
  365.          *  c d f           w' x' y' z'
  366.          */
  367.         /* top line */
  368.         a = *(unsigned int *)s1;
  369.         b = *(unsigned int *)(s1+BPP4);
  370.         e = *(unsigned int *)(s1+2*BPP4);
  371.         w = a     + DITH1X4L;
  372.         x = a + b + DITH2X4H;
  373.         y = b     + DITH1X4L;
  374.         z = b + e + DITH2X4H;
  375.         /* pack and store */
  376.         *(unsigned int *)d1 =
  377.             ((w & 0x000000f0) >> 4)  |
  378.             ((w & 0x00078000) >> 11) |
  379.             ((w & 0x3c000000) >> 18) |
  380.             ((x & 0x000001e0) << 11) |
  381.             ((x & 0x000f0000) << 4)  |
  382.             ((x & 0x78000000) >> 3);
  383.         *(unsigned int *)(d1+2*BPP2) =
  384.             ((y & 0x000000f0) >> 4)  |
  385.             ((y & 0x00078000) >> 11) |
  386.             ((y & 0x3c000000) >> 18) |
  387.             ((z & 0x000001e0) << 11) |
  388.             ((z & 0x000f0000) << 4)  |
  389.             ((z & 0x78000000) >> 3);
  390.         /* bottom line */
  391.         c = *(unsigned int *)s2;
  392.         d = *(unsigned int *)(s2+BPP4);
  393.         f = *(unsigned int *)(s2+2*BPP4);
  394.         w = a + c         + DITH2X4H;
  395.         x = a + b + c + d + DITH4X4L;
  396.         y = b + d         + DITH2X4H;
  397.         z = b + e + d + f + DITH4X4L;
  398.         /* pack and store */
  399.         *(unsigned int *)d2 =
  400.             ((w & 0x000001e0) >> 5)  |
  401.             ((w & 0x000f0000) >> 12) |
  402.             ((w & 0x78000000) >> 19) |
  403.             ((x & 0x000003c0) << 10) |
  404.             ((x & 0x001e0000) << 3)  |
  405.             ((x & 0xf0000000) >> 4);
  406.         *(unsigned int *)(d2+2*BPP2) =
  407.             ((y & 0x000001e0) >> 5)  |
  408.             ((y & 0x000f0000) >> 12) |
  409.             ((y & 0x78000000) >> 19) |
  410.             ((z & 0x000003c0) << 10) |
  411.             ((z & 0x001e0000) << 3)  |
  412.             ((z & 0xf0000000) >> 4);
  413.         /* next 2x2 input block */
  414.         s1 += 2*BPP4; s2 += 2*BPP4;
  415.         d1 += 4*BPP2; d2 += 4*BPP2;
  416.         dx -= 2;
  417.     }
  418.     /* check if this is the last 2x2 block: */
  419.     if (dx > 1) {
  420.         /*
  421.          * For last 4 output pels, repeat final input pel
  422.          * for offscreen input.  Equivalent to pixel-doubling the
  423.          * last output pel.
  424.          */
  425.         /* top line */
  426.         a = *(unsigned int *)s1;
  427.         b = *(unsigned int *)(s1+BPP4);
  428.         e = b;      /* repeat last input pel */
  429.         w = a     + DITH1X4L;
  430.         x = a + b + DITH2X4H;
  431.         y = b     + DITH1X4L;
  432.         z = b + e + DITH2X4H;
  433.         /* pack and store */
  434.         *(unsigned int *)d1 =
  435.             ((w & 0x000000f0) >> 4)  |
  436.             ((w & 0x00078000) >> 11) |
  437.             ((w & 0x3c000000) >> 18) |
  438.             ((x & 0x000001e0) << 11) |
  439.             ((x & 0x000f0000) << 4)  |
  440.             ((x & 0x78000000) >> 3);
  441.         *(unsigned int *)(d1+2*BPP2) =
  442.             ((y & 0x000000f0) >> 4)  |
  443.             ((y & 0x00078000) >> 11) |
  444.             ((y & 0x3c000000) >> 18) |
  445.             ((z & 0x000001e0) << 11) |
  446.             ((z & 0x000f0000) << 4)  |
  447.             ((z & 0x78000000) >> 3);
  448.         /* bottom line */
  449.         c = *(unsigned int *)s2;
  450.         d = *(unsigned int *)(s2+BPP4);
  451.         f = d;      /* repeat last input pel */
  452.         w = a + c         + DITH2X4H;
  453.         x = a + b + c + d + DITH4X4L;
  454.         y = b + d         + DITH2X4H;
  455.         z = b + e + d + f + DITH4X4L;
  456.         *(unsigned int *)d2 =
  457.             ((w & 0x000001e0) >> 5)  |
  458.             ((w & 0x000f0000) >> 12) |
  459.             ((w & 0x78000000) >> 19) |
  460.             ((x & 0x000003c0) << 10) |
  461.             ((x & 0x001e0000) << 3)  |
  462.             ((x & 0xf0000000) >> 4);
  463.         *(unsigned int *)(d2+2*BPP2) =
  464.             ((y & 0x000001e0) >> 5)  |
  465.             ((y & 0x000f0000) >> 12) |
  466.             ((y & 0x78000000) >> 19) |
  467.             ((z & 0x000003c0) << 10) |
  468.             ((z & 0x001e0000) << 3)  |
  469.             ((z & 0xf0000000) >> 4);
  470.     } else {
  471.         /* last 2x1 block: */
  472.         /* Input pels  =>   Output pels
  473.          *  a b             w  x
  474.          *  c d             w' x'
  475.          */
  476.         /* top line */
  477.         a = *(unsigned int *)s1;
  478.         b = a;      /* repeat last input pel */
  479.         w = a     + DITH1X4L;
  480.         x = a + b + DITH2X4H;
  481.         /* pack and store */
  482.         *(unsigned int *)d1 =
  483.             ((w & 0x000000f0) >> 4)  |
  484.             ((w & 0x00078000) >> 11) |
  485.             ((w & 0x3c000000) >> 18) |
  486.             ((x & 0x000001e0) << 11) |
  487.             ((x & 0x000f0000) << 4)  |
  488.             ((x & 0x78000000) >> 3);
  489.         /* bottom line */
  490.         c = *(unsigned int *)s2;
  491.         d = c;      /* repeat last input pel */
  492.         w = a + c         + DITH2X4H;
  493.         x = a + b + c + d + DITH4X4L;
  494.         /* pack and store */
  495.         *(unsigned int *)d2 =
  496.             ((w & 0x000001e0) >> 5)  |
  497.             ((w & 0x000f0000) >> 12) |
  498.             ((w & 0x78000000) >> 19) |
  499.             ((x & 0x000003c0) << 10) |
  500.             ((x & 0x001e0000) << 3)  |
  501.             ((x & 0xf0000000) >> 4);
  502.     }
  503. }
  504. /*
  505.  * Convert two YUV lines into RGB linebufs.
  506.  * Produces two RGB lines per call.
  507.  * Output in padded RGB format, needed for SIMD interpolation.
  508.  */
  509. static void dblineI420toXRGB (unsigned char *d1, unsigned char *d2, int dest_x,
  510.     unsigned char *sy1, unsigned char *sy2, unsigned char *su, unsigned char *sv,
  511.       int src_x, int dx,
  512.       color_data_t* pcd)
  513. {
  514.     register int y1, y2, rv, guv, bu;
  515.     register int i;
  516.     /* convert first 2x1 block: */
  517.     if (src_x & 1) {
  518.         bu  = pcd->butab[su[0]];
  519.         guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  520.         rv  = pcd->rvtab[sv[0]];
  521.         y1  = pcd->ytab[sy1[0]];
  522.         y2  = pcd->ytab[sy2[0]];
  523.         /* first line 00rrrrrr.rr000ggg.ggggg000.bbbbbbbb: */
  524.         *(unsigned int *)(d1+0) =
  525.             (CLIP8[y1 + bu])        |
  526.             (CLIP8[y1 + guv] << 11) |
  527.             (CLIP8[y1 + rv]  << 22) ;
  528.         /* second line 00rrrrrr.rr000ggg.ggggg000.bbbbbbbb: */
  529.         *(unsigned int *)(d2+0) =
  530.             (CLIP8[y2 + bu])        |
  531.             (CLIP8[y2 + guv] << 11) |
  532.             (CLIP8[y2 + rv]  << 22) ;
  533.         sy1 += 1; sy2 += 1;
  534.         su += 1; sv += 1;
  535.         d1 += BPP4; d2 += BPP4;
  536.         dx --;
  537.     }
  538.     /* convert all integral 2x2 blocks: */
  539.     for (i = 0; i < dx/2; i ++) {
  540.         bu = pcd->butab[su[0]];
  541.         guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  542.         rv = pcd->rvtab[sv[0]];
  543.         y1 = pcd->ytab[sy1[0]];
  544.         y2 = pcd->ytab[sy2[0]];
  545.         /* first line 00rrrrrr.rr000ggg.ggggg000.bbbbbbbb: */
  546.         *(unsigned int *)(d1+0) =
  547.             (CLIP8[y1 + bu])        |
  548.             (CLIP8[y1 + guv] << 11) |
  549.             (CLIP8[y1 + rv]  << 22) ;
  550.         /* second line 00rrrrrr.rr000ggg.ggggg000.bbbbbbbb: */
  551.         *(unsigned int *)(d2+0) =
  552.             (CLIP8[y2 + bu])        |
  553.             (CLIP8[y2 + guv] << 11) |
  554.             (CLIP8[y2 + rv]  << 22) ;
  555.         /* 2nd row: */
  556.         y1 = pcd->ytab[sy1[1]];
  557.         y2 = pcd->ytab[sy2[1]];
  558.         /* first line 00rrrrrr.rr000ggg.ggggg000.bbbbbbbb: */
  559.         *(unsigned int *)(d1+BPP4) =
  560.             (CLIP8[y1 + bu])        |
  561.             (CLIP8[y1 + guv] << 11) |
  562.             (CLIP8[y1 + rv]  << 22) ;
  563.         /* second line 00rrrrrr.rr000ggg.ggggg000.bbbbbbbb: */
  564.         *(unsigned int *)(d2+BPP4) =
  565.             (CLIP8[y2 + bu])        |
  566.             (CLIP8[y2 + guv] << 11) |
  567.             (CLIP8[y2 + rv]  << 22) ;
  568.         /* next 2x2 block */
  569.         sy1 += 2; sy2 += 2;
  570.         su += 1; sv += 1;
  571.         d1 += 2*BPP4; d2 += 2*BPP4;
  572.     }
  573.     /* convert last 2x1 block: */
  574.     if (dx & 1) {
  575.         bu = pcd->butab[su[0]];
  576.         guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  577.         rv = pcd->rvtab[sv[0]];
  578.         y1 = pcd->ytab[sy1[0]];
  579.         y2 = pcd->ytab[sy2[0]];
  580.         /* first line 00rrrrrr.rr000ggg.ggggg000.bbbbbbbb: */
  581.         *(unsigned int *)(d1+0) =
  582.             (CLIP8[y1 + bu])        |
  583.             (CLIP8[y1 + guv] << 11) |
  584.             (CLIP8[y1 + rv]  << 22) ;
  585.         /* second line BGR0 */
  586.         *(unsigned int *)(d2+0) =
  587.             (CLIP8[y2 + bu])        |
  588.             (CLIP8[y2 + guv] << 11) |
  589.             (CLIP8[y2 + rv]  << 22) ;
  590.     }
  591. }
  592. /*
  593.  * I420->RGB444 converter:
  594.  */
  595. int I420toRGB444 (unsigned char *dest_ptr, int dest_width, int dest_height,
  596.     int dest_pitch, int dest_x, int dest_y, int dest_dx, int dest_dy,
  597.     unsigned char *src_ptr, int src_width, int src_height, int src_pitch,
  598.     int src_x, int src_y, int src_dx, int src_dy,
  599.   color_data_t* pcd)
  600. {
  601.     /* scale factors: */
  602.     int scale_x, scale_y;
  603.     /* check arguments: */
  604.     if (!chk_args (dest_ptr, dest_width, dest_height, dest_pitch,
  605.    dest_x, dest_y, dest_dx, dest_dy, src_ptr, src_width, 
  606.    src_height, src_pitch, src_x, src_y, src_dx, src_dy, 
  607.    &scale_x, &scale_y))
  608.       return -1;
  609.     /* check if bottop-up images: */
  610.     if (dest_pitch < 0) dest_ptr -= (dest_height-1) * dest_pitch;
  611.     if (src_pitch <= 0) return -1;          /* not supported */
  612.     /* check if 1:1 scale: */
  613.     if (scale_x == 1 && scale_y == 1) {
  614.         /* color converter to use: */
  615.         void (*dbline) (unsigned char *d1, unsigned char *d2, int dest_x,
  616.             unsigned char *sy1, unsigned char *sy2, unsigned char *su, unsigned char *sv,
  617.             int src_x, int dx, color_data_t* pcd) = 
  618.             dblineI420toRGB444;
  619.         /* local variables: */
  620.         unsigned char *sy1, *sy2, *su, *sv, *d1, *d2;
  621.         register int j;
  622.         /* get pointers: */
  623.         sy1 = src_ptr + (src_x + src_y * src_pitch);        /* luma offset */
  624.         sy2 = sy1 + src_pitch;
  625.         su  = src_ptr + src_height * src_pitch + (src_x/2 + src_y/2 * src_pitch);
  626.         sv  = su + src_height * src_pitch / 4;
  627.         d1  = dest_ptr + dest_x * 2 + dest_y * dest_pitch; /* RGB offset */
  628.         d2  = d1 + dest_pitch;
  629.         /* convert a top line: */
  630.         if (src_y & 1) {                        /* chroma shift */
  631.             /* this is a bit inefficient, but who cares??? */
  632.             (* dbline) (d1, d1, dest_x, sy1, sy1, su, sv, src_x, src_dx, pcd);
  633.             sy1 += src_pitch;   sy2 += src_pitch;
  634.             su  += src_pitch/2; sv  += src_pitch/2;
  635.             d1  += dest_pitch;  d2  += dest_pitch;
  636.             dest_dy --;
  637.         }
  638.         /* convert aligned portion of the image: */
  639.         for (j = 0; j < dest_dy/2; j ++) {
  640.             /* convert two lines a time: */
  641.             (* dbline) (d1, d2, dest_x, sy1, sy2, su, sv, src_x, src_dx, pcd);
  642.             sy1 += src_pitch*2; sy2 += src_pitch*2;
  643.             su  += src_pitch/2; sv  += src_pitch/2;
  644.             d1  += dest_pitch*2; d2 += dest_pitch*2;
  645.         }
  646.         /* convert bottom line (if dest_dy is odd): */
  647.         if (dest_dy & 1) {
  648.             /* convert one line only: */
  649.             (* dbline) (d1, d1, dest_x, sy1, sy1, su, sv, src_x, src_dx, pcd);
  650.         }
  651.         return 0;
  652.     }
  653.     /* check if 2:1 scale: */
  654.     if (scale_x == 2 && scale_y == 2) {
  655.         /* color converter & interpolator to use: */
  656.         void (*cvt) (unsigned char *d1, unsigned char *d2, int dest_x,
  657.             unsigned char *sy1, unsigned char *sy2, unsigned char *su, unsigned char *sv,
  658.             int src_x, int dx, color_data_t* pcd) = dblineI420toXRGB;
  659.         void (*x2) (unsigned char *d1, unsigned char *d2, int dest_x,
  660.             unsigned char *s1, unsigned char *s2, int src_x, int dx, color_data_t* pcd) = dblineXRGBtoRGB444x2;
  661.         /* local variables: */
  662.         unsigned char *sy1, *sy2, *su, *sv, *d1, *d2;
  663.         register int dy = src_dy;
  664.         /* line buffers (we want them to be as compact as possible): */
  665.         int ibuf = 0;                           /* circular buffer index */
  666.         unsigned char * buf[3];                 /* actual pointers  */
  667.         buf[0] = pcd->linebuf;
  668.         buf[1] = pcd->linebuf + src_dx * BPP4;
  669.         buf[2] = pcd->linebuf + 2 * src_dx * BPP4;
  670.         /* get pointers: */
  671.         sy1 = src_ptr + (src_x + src_y * src_pitch);        /* luma offset */
  672.         sy2 = sy1 + src_pitch;
  673.         su  = src_ptr + src_height * src_pitch + (src_x/2 + src_y/2 * src_pitch);
  674.         sv  = su + src_height * src_pitch / 4;
  675.         d1  = dest_ptr + dest_x * BYTESPERPIXEL + dest_y * dest_pitch; /* RGB offset */
  676.         d2  = d1 + dest_pitch;
  677.         /* check if we have misaligned top line: */
  678.         if (src_y & 1) {
  679.             /* convert an odd first line: */
  680.             (*cvt) (buf[ibuf], buf[ibuf], 0, sy1, sy1, su, sv, src_x, src_dx, pcd);
  681.             sy1 += src_pitch;   sy2 += src_pitch;
  682.             su  += src_pitch/2; sv  += src_pitch/2;
  683.             dy --;
  684.         } else {
  685.             /* otherwise, convert first two lines: */
  686.             (*cvt) (buf[next[ibuf]], buf[next2[ibuf]], 0, sy1, sy2, su, sv, src_x, src_dx, pcd);
  687.             sy1 += src_pitch*2; sy2 += src_pitch*2;
  688.             su  += src_pitch/2; sv  += src_pitch/2;
  689.             ibuf = next[ibuf];      /* skip first interpolation: */
  690.             (*x2) (d1, d2, dest_x, buf[ibuf], buf[next[ibuf]], 0, src_dx, pcd);
  691.             d1  += dest_pitch*2; d2  += dest_pitch*2;
  692.             ibuf = next[ibuf];
  693.             dy -= 2;
  694.         }
  695.         /*
  696.          * Convert & interpolate the main portion of image:
  697.          *
  698.          *  source:      temp.store:                destination:
  699.          *
  700.          *               buf[ibuf] -------    /--> d1
  701.          *                                  x2  --> d2
  702.          *  s1 --   /-> buf[next[ibuf]] -<    /--> d1'=d1+2*pitch
  703.          *        cvt                       x2 ---> d2'=d2+2*pitch
  704.          *  s2 --/   -> buf[next2[ibuf]] /
  705.          */
  706.         while (dy >= 2) {
  707.             /* convert two lines into XRGB buffers: */
  708.             (*cvt) (buf[next[ibuf]], buf[next2[ibuf]], 0, sy1, sy2, su, sv, src_x, src_dx, pcd);
  709.             sy1 += src_pitch*2; sy2 += src_pitch*2;
  710.             su  += src_pitch/2; sv  += src_pitch/2;
  711.             /* interpolate first line: */
  712.             (*x2) (d1, d2, dest_x, buf[ibuf], buf[next[ibuf]], 0, src_dx, pcd);
  713.             d1  += dest_pitch*2; d2  += dest_pitch*2;
  714.             ibuf = next[ibuf];
  715.             /* interpolate second one: */
  716.             (*x2) (d1, d2, dest_x, buf[ibuf], buf[next[ibuf]], 0, src_dx, pcd);
  717.             d1  += dest_pitch*2; d2  += dest_pitch*2;
  718.             ibuf = next[ibuf];
  719.             dy -= 2;
  720.         }
  721.         /* check the # of remaining rows: */
  722.         if (dy & 1) {
  723.             /* convert the last odd line: */
  724.             (*cvt) (buf[next[ibuf]], buf[next[ibuf]], 0, sy1, sy1, su, sv, src_x, src_dx, pcd);
  725.             /* interpolate first line: */
  726.             (*x2) (d1, d2, dest_x, buf[ibuf], buf[next[ibuf]], 0, src_dx, pcd);
  727.             d1  += dest_pitch*2; d2  += dest_pitch*2;
  728.             ibuf = next[ibuf];
  729.             /* replicate the last line: */
  730.             (*x2) (d1, d2, dest_x, buf[ibuf], buf[ibuf], 0, src_dx, pcd);
  731.         } else {
  732.             /* replicate the last line: */
  733.             (*x2) (d1, d2, dest_x, buf[ibuf], buf[ibuf], 0, src_dx, pcd);
  734.         }
  735.         return 0;
  736.     }
  737.     /* check for 1/2 X scaling */
  738.     if (scale_x == 0 && scale_y == 0) {
  739.         /* local variables: */
  740.         unsigned char *sy1, *sy2, *su, *sv, *d1, *d2;
  741.         register int j;
  742.         /* get pointers: */
  743.         sy1 = src_ptr + (src_x + src_y * src_pitch);        /* luma offset */
  744.         sy2 = sy1 + src_pitch;
  745.         su  = src_ptr + src_height * src_pitch + (src_x/2 + src_y/2 * src_pitch);
  746.         sv  = su + src_height * src_pitch / 4;
  747.         d1  = dest_ptr + dest_x * 2 + dest_y * dest_pitch; /* RGB offset */
  748.         d2  = d1 + dest_pitch;
  749.         /* convert aligned portion of the image: */
  750.         for (j = 0; j < dest_dy>>1; j ++) {
  751.             /* convert two lines a time: */
  752.             halfI420toRGB444 (d1, dest_x, sy1, sy2, su, sv, src_x, src_dx, 0, pcd);
  753.             sy1 += src_pitch*2; sy2 += src_pitch*2;
  754.             su  += src_pitch/2; sv  += src_pitch/2;
  755.             d1  += dest_pitch;
  756.             halfI420toRGB444 (d1, dest_x, sy1, sy2, su, sv, src_x, src_dx, 1, pcd);
  757.             sy1 += src_pitch*2; sy2 += src_pitch*2;
  758.             su  += src_pitch/2; sv  += src_pitch/2;
  759.             d1  += dest_pitch;
  760.         }
  761.         return 0;
  762.     }
  763.     /* conversion is not supported */
  764.     return -1;
  765. }
  766. /*
  767.  * InitI420toRGB444 initializes the minimum set of clip tables necessary to perform
  768.  * color conversion to 12 bit RGB.  The 8-bit clip table is necessary for 2x
  769.  * interpolation.
  770.  *
  771.  * This routine also calls SetSrcI420Colors, which initializes color conversion tables
  772.  * and adds color balance.
  773.  */
  774. void InitI420toRGB444(float brightness, float contrast, float saturation, float hue,
  775.       color_data_t* pcd)
  776. {
  777.     InitColorData(pcd);
  778.     SetSrcI420Colors (brightness, contrast, saturation, hue, pcd);
  779. }
  780. void UninitI420toRGB444( ){
  781.     /* noop */
  782. }