444v565.c
上传用户:zhongxx05
上传日期:2007-06-06
资源大小:33641k
文件大小:32k
源码类别:

Symbian

开发平台:

C/C++

  1. /* ***** BEGIN LICENSE BLOCK ***** 
  2.  * Version: RCSL 1.0/RPSL 1.0 
  3.  *  
  4.  * Portions Copyright (c) 1995-2002 RealNetworks, Inc. All Rights Reserved. 
  5.  *      
  6.  * The contents of this file, and the files included with this file, are 
  7.  * subject to the current version of the RealNetworks Public Source License 
  8.  * Version 1.0 (the "RPSL") available at 
  9.  * http://www.helixcommunity.org/content/rpsl unless you have licensed 
  10.  * the file under the RealNetworks Community Source License Version 1.0 
  11.  * (the "RCSL") available at http://www.helixcommunity.org/content/rcsl, 
  12.  * in which case the RCSL will apply. You may also obtain the license terms 
  13.  * directly from RealNetworks.  You may not use this file except in 
  14.  * compliance with the RPSL or, if you have a valid RCSL with RealNetworks 
  15.  * applicable to this file, the RCSL.  Please see the applicable RPSL or 
  16.  * RCSL for the rights, obligations and limitations governing use of the 
  17.  * contents of the file.  
  18.  *  
  19.  * This file is part of the Helix DNA Technology. RealNetworks is the 
  20.  * developer of the Original Code and owns the copyrights in the portions 
  21.  * it created. 
  22.  *  
  23.  * This file, and the files included with this file, is distributed and made 
  24.  * available on an 'AS IS' basis, WITHOUT WARRANTY OF ANY KIND, EITHER 
  25.  * EXPRESS OR IMPLIED, AND REALNETWORKS HEREBY DISCLAIMS ALL SUCH WARRANTIES, 
  26.  * INCLUDING WITHOUT LIMITATION, ANY WARRANTIES OF MERCHANTABILITY, FITNESS 
  27.  * FOR A PARTICULAR PURPOSE, QUIET ENJOYMENT OR NON-INFRINGEMENT. 
  28.  * 
  29.  * Technology Compatibility Kit Test Suite(s) Location: 
  30.  *    http://www.helixcommunity.org/content/tck 
  31.  * 
  32.  * Contributor(s): 
  33.  *  
  34.  * ***** END LICENSE BLOCK ***** */ 
  35. #include <stdlib.h>
  36. #include "nostatic/colorlib.h"
  37. #include "nostatic/yuv.h"
  38. /*
  39.  * Format-conversion routines.
  40.  * Use:
  41.  *  int XXXXtoYYYYEx (unsigned char *dest_ptr, int dest_width, int dest_height,
  42.  *      int dest_pitch, int dest_x, int dest_y, int dest_dx, int dest_dy,
  43.  *      unsigned char *src_ptr, int src_width, int src_height, int src_pitch,
  44.  *      int src_x, int src_y, int src_dx, int src_dy);
  45.  * Input:
  46.  *  dest_ptr - pointer to a destination buffer
  47.  *  dest_width, dest_height - width/height of the destination image (pixels)
  48.  *  dest_pitch - pitch of the dest. buffer (in bytes; <0 - if bottom up image)
  49.  *  dest_x, dest_y, dest_dx, dest_dy - destination rectangle (pixels)
  50.  *  src_ptr - pointer to an input image
  51.  *  src_width, src_height - width/height of the input image (pixels)
  52.  *  src_pitch - pitch of the source buffer (in bytes; <0 - if bottom up image)
  53.  *  src_x, src_y, src_dx, src_dy - source rectangle (pixels)
  54.  * Returns:
  55.  *  0 - if success; -1 if failure.
  56.  * Notes:
  57.  *  a) In all cases, pointers to the source and destination buffers must be
  58.  *     DWORD aligned, and both pitch parameters must be multiple of 4!!!
  59.  *  b) Converters that deal with YUV 4:2:2, or 4:2:0 formats may also require
  60.  *     rectangle parameters (x,y,dx,dy) to be multiple of 2. Failure to provide
  61.  *     aligned rectangles will result in partially converted image.
  62.  *  c) Currently only scale factors of 1:1 and 2:1 are supported; if the rates
  63.  *     dest_dx/src_dx & dest_dy/src_dy are neither 1, or 2, the converters
  64.  *     will fail.
  65.  */
  66. #define BYTESPERPIXEL 2
  67. /* Indexing tables */
  68. static const int next[3] = {1, 2, 0};                 /* (ibuf+1)%3 table */
  69. static const int next2[3] = {2, 0, 1};                /* (ibuf+2)%3 table */
  70. /* Half resolution converter.  */
  71. static void halfI420toRGB444v565 (unsigned char *d1,
  72. int dest_x, unsigned char *sy1, 
  73. unsigned char *sy2, unsigned char *su, 
  74. unsigned char *sv, int src_x, int dx, int isodd,
  75.   color_data_t* pcd)
  76. {
  77.   /* check if we have misaligned input/output: */
  78.   if ((src_x ^ dest_x) & 1) {
  79.     
  80.     ; /* not implemented yet */
  81.     
  82.   } else {
  83.     
  84.     /* aligned input/output: */
  85.     register int y11, y12;
  86.     register int rv1, guv1, bu1, rv2, guv2, bu2;
  87.     register int i;
  88.     
  89.     /* source width should always be multiples of 4 */
  90.     /*    assert((src_x & 3)==0); */
  91.     /* convert all integral 2x4 blocks: */
  92.     if (isodd)
  93.       for (i = 0; i < dx/4; i ++) {
  94. /* first 2x2 block */
  95. rv1 = pcd->rvtab[sv[0]];
  96. guv1 = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  97. bu1 = pcd->butab[su[0]];
  98. y11 = (pcd->ytab[sy1[0]] + pcd->ytab[sy1[1]] + pcd->ytab[sy2[0]] + pcd->ytab[sy2[1]])>>2; /* avg */
  99. /* second 2x2 block */
  100. rv2  = pcd->rvtab[sv[1]];
  101. guv2 = pcd->gutab[su[1]] + pcd->gvtab[sv[1]];
  102. bu2  = pcd->butab[su[1]];
  103. y12 = (pcd->ytab[sy1[2]] + pcd->ytab[sy1[3]] + pcd->ytab[sy2[2]] + pcd->ytab[sy2[3]])>>2;
  104. /* output 4 bytes at a time */
  105. *(unsigned int *)(d1+0) =
  106.   (CLIP4[y11 + bu1  + DITH4L] << 1)  |
  107.   (CLIP4[y11 + guv1 + DITH4L] << 7)  |
  108.   (CLIP4[y11 + rv1  + DITH4L] << 12) |
  109.   (CLIP4[y12 + bu2  + DITH4H] << 17) |
  110.   (CLIP4[y12 + guv2 + DITH4H] << 23) |
  111.   (CLIP4[y12 + rv2  + DITH4H] << 28) ;
  112. /* next 4x2 block */
  113. sy1 += 4; sy2 += 4;
  114. su += 2; sv += 2;
  115. d1 += 2*BPP2;
  116.       }
  117.     else
  118.       for (i = 0; i < dx/4; i ++) {
  119. /* first 2x2 block */
  120. rv1 = pcd->rvtab[sv[0]];
  121. guv1 = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  122. bu1 = pcd->butab[su[0]];
  123. y11 = (pcd->ytab[sy1[0]] + pcd->ytab[sy1[1]] + pcd->ytab[sy2[0]] + pcd->ytab[sy2[1]])>>2; /* avg */
  124. /* second 2x2 block */
  125. rv2  = pcd->rvtab[sv[1]];
  126. guv2 = pcd->gutab[su[1]] + pcd->gvtab[sv[1]];
  127. bu2  = pcd->butab[su[1]];
  128. y12 = (pcd->ytab[sy1[2]] + pcd->ytab[sy1[3]] + pcd->ytab[sy2[2]] + pcd->ytab[sy2[3]])>>2;
  129. /* output 4 bytes at a time */
  130. *(unsigned int *)(d1+0) =
  131.   (CLIP4[y11 + bu1  + DITH4H] << 1)  |
  132.   (CLIP4[y11 + guv1 + DITH4H] << 7)  |
  133.   (CLIP4[y11 + rv1  + DITH4H] << 12) |
  134.   (CLIP4[y12 + bu2  + DITH4L] << 17) |
  135.   (CLIP4[y12 + guv2 + DITH4L] << 23) |
  136.   (CLIP4[y12 + rv2  + DITH4L] << 28) ;
  137. /* next 4x2 block */
  138. sy1 += 4; sy2 += 4;
  139. su += 2; sv += 2;
  140. d1 += 2*BPP2;
  141.       }
  142.   }
  143. }
  144. static void dblineI420toRGB444v565 (unsigned char *d1, unsigned char *d2, 
  145. int dest_x, unsigned char *sy1, 
  146. unsigned char *sy2, unsigned char *su, 
  147. unsigned char *sv, int src_x, int dx,
  148.     color_data_t* pcd)
  149. {
  150.     /* check if we have misaligned input/output: */
  151.     if ((src_x ^ dest_x) & 1) {
  152.         ; /* not implemented yet */
  153.     } else {
  154.         /* aligned input/output: */
  155.         register int y11, y12, y21, y22;
  156.         register int rv, guv, bu;
  157.         register int i;
  158.         /* convert first 2x1 block: */
  159.         if (dest_x & 1) {
  160.             rv  = pcd->rvtab[sv[0]];
  161.             guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  162.             bu  = pcd->butab[su[0]];
  163.             y11 = pcd->ytab[sy1[0]];
  164.             y21 = pcd->ytab[sy2[0]];
  165.             /* output 2 bytes at a time */
  166.             *(unsigned short *)(d1+0) =
  167.                 (CLIP4[y11 + bu  + DITH4L] << 1)  |
  168.                 (CLIP4[y11 + guv + DITH4L] << 7)  |
  169.                 (CLIP4[y11 + rv  + DITH4L] << 12) ;
  170.             *(unsigned short *)(d2+0) =
  171.                 (CLIP4[y21 + bu  + DITH4H] << 1)  |
  172.                 (CLIP4[y21 + guv + DITH4H] << 7)  |
  173.                 (CLIP4[y21 + rv  + DITH4H] << 12) ;
  174.             sy1 += 1; sy2 += 1;
  175.             su += 1; sv += 1;
  176.             d1 += BPP2; d2 += BPP2;
  177.             dest_x ++; dx --;
  178.         }
  179.         /* convert first 2x2 block: */
  180.         if (dest_x & 2) {
  181.             rv  = pcd->rvtab[sv[0]];
  182.             guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  183.             bu  = pcd->butab[su[0]];
  184.             y11 = pcd->ytab[sy1[0]];
  185.             y12 = pcd->ytab[sy1[1]];
  186.             /* output 4 bytes at a time */
  187.             *(unsigned int *)(d1+0) =
  188.                 (CLIP4[y11 + bu  + DITH4L] << 1)  |
  189.                 (CLIP4[y11 + guv + DITH4L] << 7)  |
  190.                 (CLIP4[y11 + rv  + DITH4L] << 12) |
  191.                 (CLIP4[y12 + bu  + DITH4H] << 17) |
  192.                 (CLIP4[y12 + guv + DITH4H] << 23) |
  193.                 (CLIP4[y12 + rv  + DITH4H] << 28) ;
  194.             y21 = pcd->ytab[sy2[0]];
  195.             y22 = pcd->ytab[sy2[1]];
  196.             *(unsigned int *)(d2+0) =
  197.                 (CLIP4[y21 + bu  + DITH4H] << 1)  |
  198.                 (CLIP4[y21 + guv + DITH4H] << 7)  |
  199.                 (CLIP4[y21 + rv  + DITH4H] << 12) |
  200.                 (CLIP4[y22 + bu  + DITH4L] << 17) |
  201.                 (CLIP4[y22 + guv + DITH4L] << 23) |
  202.                 (CLIP4[y22 + rv  + DITH4L] << 28) ;
  203.             sy1 += 2; sy2 += 2;
  204.             su += 1; sv += 1;
  205.             d1 += 2*BPP2; d2 += 2*BPP2;
  206.             dest_x += 2; dx -= 2;
  207.         }
  208.         /* convert all integral 2x4 blocks: */
  209.         for (i = 0; i < dx/4; i ++) {
  210.             /* first 2x2 block */
  211.             rv = pcd->rvtab[sv[0]];
  212.             guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  213.             bu = pcd->butab[su[0]];
  214.             y11 = pcd->ytab[sy1[0]];
  215.             y12 = pcd->ytab[sy1[1]];
  216.             /* output 4 bytes at a time */
  217.             *(unsigned int *)(d1+0) =
  218.                 (CLIP4[y11 + bu  + DITH4L] << 1)  |
  219.                 (CLIP4[y11 + guv + DITH4L] << 7)  |
  220.                 (CLIP4[y11 + rv  + DITH4L] << 12) |
  221.                 (CLIP4[y12 + bu  + DITH4H] << 17) |
  222.                 (CLIP4[y12 + guv + DITH4H] << 23) |
  223.                 (CLIP4[y12 + rv  + DITH4H] << 28) ;
  224.             y21 = pcd->ytab[sy2[0]];
  225.             y22 = pcd->ytab[sy2[1]];
  226.             *(unsigned int *)(d2+0) =
  227.                 (CLIP4[y21 + bu  + DITH4H] << 1)  |
  228.                 (CLIP4[y21 + guv + DITH4H] << 7)  |
  229.                 (CLIP4[y21 + rv  + DITH4H] << 12) |
  230.                 (CLIP4[y22 + bu  + DITH4L] << 17) |
  231.                 (CLIP4[y22 + guv + DITH4L] << 23) |
  232.                 (CLIP4[y22 + rv  + DITH4L] << 28) ;
  233.             /* second 2x2 block */
  234.             rv  = pcd->rvtab[sv[1]];
  235.             guv = pcd->gutab[su[1]] + pcd->gvtab[sv[1]];
  236.             bu  = pcd->butab[su[1]];
  237.             y11 = pcd->ytab[sy1[2]];
  238.             y12 = pcd->ytab[sy1[3]];
  239.             *(unsigned int *)(d1+2*BPP2) =
  240.                 (CLIP4[y11 + bu  + DITH4L] << 1)  |
  241.                 (CLIP4[y11 + guv + DITH4L] << 7)  |
  242.                 (CLIP4[y11 + rv  + DITH4L] << 12) |
  243.                 (CLIP4[y12 + bu  + DITH4H] << 17) |
  244.                 (CLIP4[y12 + guv + DITH4H] << 23) |
  245.                 (CLIP4[y12 + rv  + DITH4H] << 28) ;
  246.             y21 = pcd->ytab[sy2[2]];
  247.             y22 = pcd->ytab[sy2[3]];
  248.             *(unsigned int *)(d2+2*BPP2) =
  249.                 (CLIP4[y21 + bu  + DITH4H] << 1)  |
  250.                 (CLIP4[y21 + guv + DITH4H] << 7)  |
  251.                 (CLIP4[y21 + rv  + DITH4H] << 12) |
  252.                 (CLIP4[y22 + bu  + DITH4L] << 17) |
  253.                 (CLIP4[y22 + guv + DITH4L] << 23) |
  254.                 (CLIP4[y22 + rv  + DITH4L] << 28) ;
  255.             /* next 4x2 block */
  256.             sy1 += 4; sy2 += 4;
  257.             su += 2; sv += 2;
  258.             d1 += 4*BPP2; d2 += 4*BPP2;
  259.         }
  260.         /* convert last 2x2 block: */
  261.         if (dx & 2) {
  262.             rv = pcd->rvtab[sv[0]];
  263.             guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  264.             bu = pcd->butab[su[0]];
  265.             y11 = pcd->ytab[sy1[0]];
  266.             y12 = pcd->ytab[sy1[1]];
  267.             /* output 4 bytes at a time */
  268.             *(unsigned int *)(d1+0) =
  269.                 (CLIP4[y11 + bu  + DITH4L] << 1)  |
  270.                 (CLIP4[y11 + guv + DITH4L] << 7)  |
  271.                 (CLIP4[y11 + rv  + DITH4L] << 12) |
  272.                 (CLIP4[y12 + bu  + DITH4H] << 17) |
  273.                 (CLIP4[y12 + guv + DITH4H] << 23) |
  274.                 (CLIP4[y12 + rv  + DITH4H] << 28) ;
  275.             y21 = pcd->ytab[sy2[0]];
  276.             y22 = pcd->ytab[sy2[1]];
  277.             *(unsigned int *)(d2+0) =
  278.                 (CLIP4[y21 + bu  + DITH4H] << 1)  |
  279.                 (CLIP4[y21 + guv + DITH4H] << 7)  |
  280.                 (CLIP4[y21 + rv  + DITH4H] << 12) |
  281.                 (CLIP4[y22 + bu  + DITH4L] << 17) |
  282.                 (CLIP4[y22 + guv + DITH4L] << 23) |
  283.                 (CLIP4[y22 + rv  + DITH4L] << 28) ;
  284.             sy1 += 2; sy2 += 2;
  285.             su += 1; sv += 1;
  286.             d1 += 2*BPP2; d2 += 2*BPP2;
  287.             dx -= 2;
  288.         }
  289.         /* convert last 2x1 block: */
  290.         if (dx & 1) {
  291.             rv  = pcd->rvtab[sv[0]];
  292.             guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  293.             bu  = pcd->butab[su[0]];
  294.             y11 = pcd->ytab[sy1[0]];
  295.             y21 = pcd->ytab[sy2[0]];
  296.             /* output 2 bytes at a time */
  297.             *(unsigned short *)(d1+0) =
  298.                 (CLIP4[y11 + bu  + DITH4L] << 1)  |
  299.                 (CLIP4[y11 + guv + DITH4L] << 7)  |
  300.                 (CLIP4[y11 + rv  + DITH4L] << 12) ;
  301.             *(unsigned short *)(d2+0) =
  302.                 (CLIP4[y21 + bu  + DITH4H] << 1)  |
  303.                 (CLIP4[y21 + guv + DITH4H] << 7)  |
  304.                 (CLIP4[y21 + rv  + DITH4H] << 12) ;
  305.         }
  306.     }
  307. }
  308. #define DITH1X4L 0x01002004
  309. #define DITH1X4H 0x0300600C
  310. #define DITH2X4L 0x02004008
  311. #define DITH2X4H 0x0600C018
  312. #define DITH4X4L 0x04008010
  313. #define DITH4X4H 0x0C018030
  314. #define DITHER_MAGIC 0xc0380700
  315. /* RGB444 version: */
  316. static void dblineXRGBtoRGB444v565x2 (unsigned char *d1, unsigned char *d2, int dest_x,
  317.       unsigned char *s1, unsigned char *s2, int src_x, int dx,
  318.   color_data_t* pcd)
  319. {
  320.     register unsigned int a, b, c, d, e, f;
  321.     register unsigned int w, x, y, z;
  322.     /* convert first 2x1 block: */
  323.     if (dest_x & 1) {
  324.         /* Input pels  =>   Output pels
  325.          *  a b             w  x
  326.          *  c d             w' x'
  327.          */
  328.         /* top line */
  329.         a = *(unsigned int *)s1;
  330.         b = *(unsigned int *)(s1+BPP4);
  331.         w = a     + DITH1X4L;
  332.         x = a + b + DITH2X4H;
  333.         /* pack and store */
  334.         *(unsigned int *)d1 =
  335.             ((w & 0x000000f0) >> 3)  |
  336.             ((w & 0x00078000) >> 8) |
  337.             ((w & 0x3c000000) >> 14) |
  338.             ((x & 0x000001e0) << 12) |
  339.             ((x & 0x000f0000) << 7)  |
  340.             ((x & 0x78000000) << 1);
  341.         /* bottom line */
  342.         c = *(unsigned int *)s2;
  343.         d = *(unsigned int *)(s2+BPP4);
  344.         w = a + c         + DITH2X4H;
  345.         x = a + b + c + d + DITH4X4L;
  346.         /* pack and store */
  347.         *(unsigned int *)d2 =
  348.             ((w & 0x000001e0) >> 4)  |
  349.             ((w & 0x000f0000) >> 9) |
  350.             ((w & 0x78000000) >> 15) |
  351.             ((x & 0x000003c0) << 11) |
  352.             ((x & 0x001e0000) << 6)  |
  353.             ((x & 0xf0000000) << 0);
  354.         /* bump pointers to next block */
  355.         s1 += BPP4; s2 += BPP4;
  356.         d1 += 2*BPP2; d2 += 2*BPP2;
  357.         dx -= 1;
  358.     }
  359.     /* process all integral 2x2 blocks: */
  360.     while (dx > 2) {    /* we need to leave at least one block */
  361.         /*
  362.          * Input stored as 00 RRRRRRRR 000 GGGGGGGG 000 BBBBBBBB
  363.          *
  364.          * Input pels       Output pels
  365.          *  a b e           w  x  y  z
  366.          *  c d f           w' x' y' z'
  367.          */
  368.         /* top line */
  369.         a = *(unsigned int *)s1;
  370.         b = *(unsigned int *)(s1+BPP4);
  371.         e = *(unsigned int *)(s1+2*BPP4);
  372. w = a     + DITH1X4L;
  373. x = a + b + DITH2X4H;
  374. y = b     + DITH1X4L;
  375. z = b + e + DITH2X4H;
  376.         /* pack and store */
  377.         *(unsigned int *)d1 =
  378.             ((w & 0x000000f0) >> 3)  |
  379.             ((w & 0x00078000) >> 8)  |
  380.             ((w & 0x3c000000) >> 14) |
  381.             ((x & 0x000001e0) << 12) |
  382.             ((x & 0x000f0000) << 7)  |
  383.             ((x & 0x78000000) << 1);
  384.         *(unsigned int *)(d1+2*BPP2) =
  385.             ((y & 0x000000f0) >> 3)  |
  386.             ((y & 0x00078000) >> 8)  |
  387.             ((y & 0x3c000000) >> 14) |
  388.             ((z & 0x000001e0) << 12) |
  389.             ((z & 0x000f0000) << 7)  |
  390.             ((z & 0x78000000) << 1);
  391.         /* bottom line */
  392.         c = *(unsigned int *)s2;
  393.         d = *(unsigned int *)(s2+BPP4);
  394.         f = *(unsigned int *)(s2+2*BPP4);
  395. w = a + c         + DITH2X4H;
  396. x = a + b + c + d + DITH4X4L;
  397. y = b + d         + DITH2X4H;
  398. z = b + e + d + f + DITH4X4L;
  399.         /* pack and store */
  400.         *(unsigned int *)d2 =
  401.             ((w & 0x000001e0) >> 4)  |
  402.             ((w & 0x000f0000) >> 9)  |
  403.             ((w & 0x78000000) >> 15) |
  404.             ((x & 0x000003c0) << 11) |
  405.             ((x & 0x001e0000) << 6)  |
  406.             ((x & 0xf0000000) << 0);
  407.         *(unsigned int *)(d2+2*BPP2) =
  408.             ((y & 0x000001e0) >> 4)  |
  409.             ((y & 0x000f0000) >> 9)  |
  410.             ((y & 0x78000000) >> 15) |
  411.             ((z & 0x000003c0) << 11) |
  412.             ((z & 0x001e0000) << 6)  |
  413.             ((z & 0xf0000000) << 0);
  414.         /* next 2x2 input block */
  415.         s1 += 2*BPP4; s2 += 2*BPP4;
  416.         d1 += 4*BPP2; d2 += 4*BPP2;
  417.         dx -= 2;
  418.     }
  419.     /* check if this is the last 2x2 block: */
  420.     if (dx > 1) {
  421.         /*
  422.          * For last 4 output pels, repeat final input pel
  423.          * for offscreen input.  Equivalent to pixel-doubling the
  424.          * last output pel.
  425.          */
  426.         /* top line */
  427.         a = *(unsigned int *)s1;
  428.         b = *(unsigned int *)(s1+BPP4);
  429.         e = b;      /* repeat last input pel */
  430.         w = a     + DITH1X4L;
  431.         x = a + b + DITH2X4H;
  432.         y = b     + DITH1X4L;
  433.         z = b + e + DITH2X4H;
  434.         /* pack and store */
  435.         *(unsigned int *)d1 =
  436.             ((w & 0x000000f0) >> 3)  |
  437.             ((w & 0x00078000) >> 8)  |
  438.             ((w & 0x3c000000) >> 14) |
  439.             ((x & 0x000001e0) << 12) |
  440.             ((x & 0x000f0000) << 7)  |
  441.             ((x & 0x78000000) << 1);
  442.         *(unsigned int *)(d1+2*BPP2) =
  443.             ((y & 0x000000f0) >> 3)  |
  444.             ((y & 0x00078000) >> 8)  |
  445.             ((y & 0x3c000000) >> 14) |
  446.             ((z & 0x000001e0) << 12) |
  447.             ((z & 0x000f0000) << 7)  |
  448.             ((z & 0x78000000) << 1);
  449.         /* bottom line */
  450.         c = *(unsigned int *)s2;
  451.         d = *(unsigned int *)(s2+BPP4);
  452.         f = d;      /* repeat last input pel */
  453.         w = a + c         + DITH2X4H;
  454.         x = a + b + c + d + DITH4X4L;
  455.         y = b + d         + DITH2X4H;
  456.         z = b + e + d + f + DITH4X4L;
  457.         *(unsigned int *)d2 =
  458.             ((w & 0x000001e0) >> 4)  |
  459.             ((w & 0x000f0000) >> 9)  |
  460.             ((w & 0x78000000) >> 15) |
  461.             ((x & 0x000003c0) << 11) |
  462.             ((x & 0x001e0000) << 6)  |
  463.             ((x & 0xf0000000) << 0);
  464.         *(unsigned int *)(d2+2*BPP2) =
  465.             ((y & 0x000001e0) >> 4)  |
  466.             ((y & 0x000f0000) >> 9)  |
  467.             ((y & 0x78000000) >> 15) |
  468.             ((z & 0x000003c0) << 11) |
  469.             ((z & 0x001e0000) << 6)  |
  470.             ((z & 0xf0000000) << 0);
  471.     } else {
  472.         /* last 2x1 block: */
  473.         /* Input pels  =>   Output pels
  474.          *  a b             w  x
  475.          *  c d             w' x'
  476.          */
  477.         /* top line */
  478.         a = *(unsigned int *)s1;
  479.         b = a;      /* repeat last input pel */
  480.         w = a     + DITH1X4L;
  481.         x = a + b + DITH2X4H;
  482.         /* pack and store */
  483.         *(unsigned int *)d1 =
  484.             ((w & 0x000000f0) >> 3)  |
  485.             ((w & 0x00078000) >> 8)  |
  486.             ((w & 0x3c000000) >> 14) |
  487.             ((x & 0x000001e0) << 12) |
  488.             ((x & 0x000f0000) << 7)  |
  489.             ((x & 0x78000000) << 1);
  490.         /* bottom line */
  491.         c = *(unsigned int *)s2;
  492.         d = c;      /* repeat last input pel */
  493.         w = a + c         + DITH2X4H;
  494.         x = a + b + c + d + DITH4X4L;
  495.         /* pack and store */
  496.         *(unsigned int *)d2 =
  497.             ((w & 0x000001e0) >> 4)  |
  498.             ((w & 0x000f0000) >> 9)  |
  499.             ((w & 0x78000000) >> 15) |
  500.             ((x & 0x000003c0) << 11) |
  501.             ((x & 0x001e0000) << 6)  |
  502.             ((x & 0xf0000000) << 0);
  503.     }
  504. }
  505. /*
  506.  * Convert two YUV lines into RGB linebufs.
  507.  * Produces two RGB lines per call.
  508.  * Output in padded RGB format, needed for SIMD interpolation.
  509.  */
  510. static void dblineI420toXRGB (unsigned char *d1, unsigned char *d2, int dest_x,
  511.     unsigned char *sy1, unsigned char *sy2, unsigned char *su, unsigned char *sv,
  512.       int src_x, int dx,
  513.       color_data_t* pcd)
  514. {
  515.     register int y1, y2, rv, guv, bu;
  516.     register int i;
  517.     /* convert first 2x1 block: */
  518.     if (src_x & 1) {
  519.         bu = pcd->butab[su[0]];
  520.         guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  521.         rv = pcd->rvtab[sv[0]];
  522.         y1 = pcd->ytab[sy1[0]];
  523.         y2 = pcd->ytab[sy2[0]];
  524.         /* first line 00rrrrrr.rr000ggg.ggggg000.bbbbbbbb: */
  525.         *(unsigned int *)(d1+0) =
  526.             (CLIP8[y1 + bu])        |
  527.             (CLIP8[y1 + guv] << 11) |
  528.             (CLIP8[y1 + rv]  << 22) ;
  529.         /* second line 00rrrrrr.rr000ggg.ggggg000.bbbbbbbb: */
  530.         *(unsigned int *)(d2+0) =
  531.             (CLIP8[y2 + bu])        |
  532.             (CLIP8[y2 + guv] << 11) |
  533.             (CLIP8[y2 + rv]  << 22) ;
  534.         sy1 += 1; sy2 += 1;
  535.         su += 1; sv += 1;
  536.         d1 += BPP4; d2 += BPP4;
  537.         dx --;
  538.     }
  539.     /* convert all integral 2x2 blocks: */
  540.     for (i = 0; i < dx/2; i ++) {
  541.         bu = pcd->butab[su[0]];
  542.         guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  543.         rv = pcd->rvtab[sv[0]];
  544.         y1 = pcd->ytab[sy1[0]];
  545.         y2 = pcd->ytab[sy2[0]];
  546.         /* first line 00rrrrrr.rr000ggg.ggggg000.bbbbbbbb: */
  547.         *(unsigned int *)(d1+0) =
  548.             (CLIP8[y1 + bu])        |
  549.             (CLIP8[y1 + guv] << 11) |
  550.             (CLIP8[y1 + rv]  << 22) ;
  551.         /* second line 00rrrrrr.rr000ggg.ggggg000.bbbbbbbb: */
  552.         *(unsigned int *)(d2+0) =
  553.             (CLIP8[y2 + bu])        |
  554.             (CLIP8[y2 + guv] << 11) |
  555.             (CLIP8[y2 + rv]  << 22) ;
  556.         /* 2nd row: */
  557.         y1 = pcd->ytab[sy1[1]];
  558.         y2 = pcd->ytab[sy2[1]];
  559.         /* first line 00rrrrrr.rr000ggg.ggggg000.bbbbbbbb: */
  560.         *(unsigned int *)(d1+BPP4) =
  561.             (CLIP8[y1 + bu])        |
  562.             (CLIP8[y1 + guv] << 11) |
  563.             (CLIP8[y1 + rv]  << 22) ;
  564.         /* second line 00rrrrrr.rr000ggg.ggggg000.bbbbbbbb: */
  565.         *(unsigned int *)(d2+BPP4) =
  566.             (CLIP8[y2 + bu])        |
  567.             (CLIP8[y2 + guv] << 11) |
  568.             (CLIP8[y2 + rv]  << 22) ;
  569.         /* next 2x2 block */
  570.         sy1 += 2; sy2 += 2;
  571.         su += 1; sv += 1;
  572.         d1 += 2*BPP4; d2 += 2*BPP4;
  573.     }
  574.     /* convert last 2x1 block: */
  575.     if (dx & 1) {
  576.         bu = pcd->butab[su[0]];
  577. guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  578.         rv = pcd->rvtab[sv[0]];
  579.         y1 = pcd->ytab[sy1[0]];
  580.         y2 = pcd->ytab[sy2[0]];
  581.         /* first line 00rrrrrr.rr000ggg.ggggg000.bbbbbbbb: */
  582.         *(unsigned int *)(d1+0) =
  583.             (CLIP8[y1 + bu])        |
  584.             (CLIP8[y1 + guv] << 11) |
  585.             (CLIP8[y1 + rv]  << 22) ;
  586.         /* second line BGR0 */
  587.         *(unsigned int *)(d2+0) =
  588.             (CLIP8[y2 + bu])        |
  589.             (CLIP8[y2 + guv] << 11) |
  590.             (CLIP8[y2 + rv]  << 22) ;
  591.     }
  592. }
  593. /*
  594.  * I420->RGB444 converter:
  595.  */
  596. int I420toRGB444v565 (unsigned char *dest_ptr, int dest_width, int dest_height,
  597.     int dest_pitch, int dest_x, int dest_y, int dest_dx, int dest_dy,
  598.     unsigned char *src_ptr, int src_width, int src_height, int src_pitch,
  599.     int src_x, int src_y, int src_dx, int src_dy,
  600.       color_data_t* pcd)
  601. {
  602.     /* scale factors: */
  603.     int scale_x, scale_y;
  604.     /* check arguments: */
  605.     if (!chk_args (dest_ptr, dest_width, dest_height, dest_pitch,
  606.         dest_x, dest_y, dest_dx, dest_dy, src_ptr, src_width, src_height,
  607.         src_pitch, src_x, src_y, src_dx, src_dy, &scale_x, &scale_y))
  608.         return -1;
  609.     /* check if bottop-up images: */
  610.     if (dest_pitch < 0) dest_ptr -= (dest_height-1) * dest_pitch;
  611.     if (src_pitch <= 0) return -1;          /* not supported */
  612.     /* check if 1:1 scale: */
  613.     if (scale_x == 1 && scale_y == 1) {
  614.         /* color converter to use: */
  615.         void (*dbline) (unsigned char *d1, unsigned char *d2, int dest_x,
  616.             unsigned char *sy1, unsigned char *sy2, unsigned char *su, unsigned char *sv,
  617.             int src_x, int dx, color_data_t* pcd) = 
  618.             dblineI420toRGB444v565;
  619.         /* local variables: */
  620.         unsigned char *sy1, *sy2, *su, *sv, *d1, *d2;
  621.         register int j;
  622.         /* get pointers: */
  623.         sy1 = src_ptr + (src_x + src_y * src_pitch);        /* luma offset */
  624.         sy2 = sy1 + src_pitch;
  625.         su  = src_ptr + src_height * src_pitch + (src_x/2 + src_y/2 * src_pitch);
  626.         sv  = su + src_height * src_pitch / 4;
  627.         d1  = dest_ptr + dest_x * 2 + dest_y * dest_pitch; /* RGB offset */
  628.         d2  = d1 + dest_pitch;
  629.         /* convert a top line: */
  630.         if (src_y & 1) {                        /* chroma shift */
  631.             /* this is a bit inefficient, but who cares??? */
  632.             (* dbline) (d1, d1, dest_x, sy1, sy1, su, sv, src_x, src_dx, pcd);
  633.             sy1 += src_pitch;   sy2 += src_pitch;
  634.             su  += src_pitch/2; sv  += src_pitch/2;
  635.             d1  += dest_pitch;  d2  += dest_pitch;
  636.             dest_dy --;
  637.         }
  638.         /* convert aligned portion of the image: */
  639.         for (j = 0; j < dest_dy/2; j ++) {
  640.             /* convert two lines a time: */
  641.             (* dbline) (d1, d2, dest_x, sy1, sy2, su, sv, src_x, src_dx, pcd);
  642.             sy1 += src_pitch*2; sy2 += src_pitch*2;
  643.             su  += src_pitch/2; sv  += src_pitch/2;
  644.             d1  += dest_pitch*2; d2 += dest_pitch*2;
  645.         }
  646.         /* convert bottom line (if dest_dy is odd): */
  647.         if (dest_dy & 1) {
  648.             /* convert one line only: */
  649.             (* dbline) (d1, d1, dest_x, sy1, sy1, su, sv, src_x, src_dx, pcd);
  650.         }
  651.         return 0;
  652.     }
  653.     /* check if 2:1 scale: */
  654.     if (scale_x == 2 && scale_y == 2) {
  655.         /* color converter & interpolator to use: */
  656.         void (*cvt) (unsigned char *d1, unsigned char *d2, int dest_x,
  657.             unsigned char *sy1, unsigned char *sy2, unsigned char *su, unsigned char *sv,
  658.             int src_x, int dx, color_data_t* pcd) = dblineI420toXRGB;
  659.         void (*x2) (unsigned char *d1, unsigned char *d2, int dest_x,
  660.             unsigned char *s1, unsigned char *s2, int src_x, int dx, color_data_t* pcd) = dblineXRGBtoRGB444v565x2;
  661.         /* local variables: */
  662.         unsigned char *sy1, *sy2, *su, *sv, *d1, *d2;
  663.         register int dy = src_dy;
  664.         /* line buffers (we want them to be as compact as possible): */
  665.         int ibuf = 0;                           /* circular buffer index */
  666.         unsigned char * buf[3];                 /* actual pointers  */
  667.         buf[0] = pcd->linebuf;
  668.         buf[1] = pcd->linebuf + src_dx * BPP4;
  669.         buf[2] = pcd->linebuf + 2 * src_dx * BPP4;
  670.         /* get pointers: */
  671.         sy1 = src_ptr + (src_x + src_y * src_pitch);        /* luma offset */
  672.         sy2 = sy1 + src_pitch;
  673.         su  = src_ptr + src_height * src_pitch + (src_x/2 + src_y/2 * src_pitch);
  674.         sv  = su + src_height * src_pitch / 4;
  675.         d1  = dest_ptr + dest_x * BYTESPERPIXEL + dest_y * dest_pitch; /* RGB offset */
  676.         d2  = d1 + dest_pitch;
  677.         /* check if we have misaligned top line: */
  678.         if (src_y & 1) {
  679.             /* convert an odd first line: */
  680.             (*cvt) (buf[ibuf], buf[ibuf], 0, sy1, sy1, su, sv, src_x, src_dx, pcd);
  681.             sy1 += src_pitch;   sy2 += src_pitch;
  682.             su  += src_pitch/2; sv  += src_pitch/2;
  683.             dy --;
  684.         } else {
  685.             /* otherwise, convert first two lines: */
  686.             (*cvt) (buf[next[ibuf]], buf[next2[ibuf]], 0, sy1, sy2, su, sv, src_x, src_dx, pcd);
  687.             sy1 += src_pitch*2; sy2 += src_pitch*2;
  688.             su  += src_pitch/2; sv  += src_pitch/2;
  689.             ibuf = next[ibuf];      /* skip first interpolation: */
  690.             (*x2) (d1, d2, dest_x, buf[ibuf], buf[next[ibuf]], 0, src_dx, pcd);
  691.             d1  += dest_pitch*2; d2  += dest_pitch*2;
  692.             ibuf = next[ibuf];
  693.             dy -= 2;
  694.         }
  695.         /*
  696.          * Convert & interpolate the main portion of image:
  697.          *
  698.          *  source:      temp.store:                destination:
  699.          *
  700.          *               buf[ibuf] -------    /--> d1
  701.          *                                  x2  --> d2
  702.          *  s1 --   /-> buf[next[ibuf]] -<    /--> d1'=d1+2*pitch
  703.          *        cvt                       x2 ---> d2'=d2+2*pitch
  704.          *  s2 --/   -> buf[next2[ibuf]] /
  705.          */
  706.         while (dy >= 2) {
  707.             /* convert two lines into XRGB buffers: */
  708.             (*cvt) (buf[next[ibuf]], buf[next2[ibuf]], 0, sy1, sy2, su, sv, src_x, src_dx, pcd);
  709.             sy1 += src_pitch*2; sy2 += src_pitch*2;
  710.             su  += src_pitch/2; sv  += src_pitch/2;
  711.             /* interpolate first line: */
  712.             (*x2) (d1, d2, dest_x, buf[ibuf], buf[next[ibuf]], 0, src_dx, pcd);
  713.             d1  += dest_pitch*2; d2  += dest_pitch*2;
  714.             ibuf = next[ibuf];
  715.             /* interpolate second one: */
  716.             (*x2) (d1, d2, dest_x, buf[ibuf], buf[next[ibuf]], 0, src_dx, pcd);
  717.             d1  += dest_pitch*2; d2  += dest_pitch*2;
  718.             ibuf = next[ibuf];
  719.             dy -= 2;
  720.         }
  721.         /* check the # of remaining rows: */
  722.         if (dy & 1) {
  723.             /* convert the last odd line: */
  724.             (*cvt) (buf[next[ibuf]], buf[next[ibuf]], 0, sy1, sy1, su, sv, src_x, src_dx, pcd);
  725.             /* interpolate first line: */
  726.             (*x2) (d1, d2, dest_x, buf[ibuf], buf[next[ibuf]], 0, src_dx, pcd);
  727.             d1  += dest_pitch*2; d2  += dest_pitch*2;
  728.             ibuf = next[ibuf];
  729.             /* replicate the last line: */
  730.             (*x2) (d1, d2, dest_x, buf[ibuf], buf[ibuf], 0, src_dx, pcd);
  731.         } else {
  732.             /* replicate the last line: */
  733.             (*x2) (d1, d2, dest_x, buf[ibuf], buf[ibuf], 0, src_dx, pcd);
  734.         }
  735.         return 0;
  736.     }
  737.     /* check for 1/2 X scaling */
  738.     if (scale_x == 0 && scale_y == 0) {
  739.         /* local variables: */
  740.         unsigned char *sy1, *sy2, *su, *sv, *d1, *d2;
  741.         register int j;
  742.         /* get pointers: */
  743.         sy1 = src_ptr + (src_x + src_y * src_pitch);        /* luma offset */
  744.         sy2 = sy1 + src_pitch;
  745.         su  = src_ptr + src_height * src_pitch + (src_x/2 + src_y/2 * src_pitch);
  746.         sv  = su + src_height * src_pitch / 4;
  747.         d1  = dest_ptr + dest_x * 2 + dest_y * dest_pitch; /* RGB offset */
  748.         d2  = d1 + dest_pitch;
  749.         /* convert aligned portion of the image: */
  750.         for (j = 0; j < dest_dy>>1; j ++) {
  751.             /* convert two lines a time: */
  752.             halfI420toRGB444v565 (d1, dest_x, sy1, sy2, su, sv, src_x, src_dx, 0, pcd);
  753.             sy1 += src_pitch*2; sy2 += src_pitch*2;
  754.             su  += src_pitch/2; sv  += src_pitch/2;
  755.             d1  += dest_pitch;
  756.             halfI420toRGB444v565 (d1, dest_x, sy1, sy2, su, sv, src_x, src_dx, 1, pcd);
  757.             sy1 += src_pitch*2; sy2 += src_pitch*2;
  758.             su  += src_pitch/2; sv  += src_pitch/2;
  759.             d1  += dest_pitch;
  760.         }
  761.         return 0;
  762.     }
  763.     /* conversion is not supported */
  764.     return -1;
  765. }
  766. /*
  767.  * InitI420toRGB444v565 initializes the minimum set of clip tables necessary to perform
  768.  * color conversion to 12 bit RGB packed into a 565 value.  The 8-bit clip table is 
  769.  * necessary for 2x interpolation.
  770.  *
  771.  * This routine also calls SetSrcI420Colors, which initializes color conversion tables
  772.  * and adds color balance.
  773.  */
  774. void InitI420toRGB444v565(float brightness, float contrast, float saturation, float hue, 
  775.   color_data_t* pcd)
  776. {
  777.     InitColorData(pcd);
  778.     SetSrcI420Colors (brightness, contrast, saturation, hue, pcd);
  779. }
  780. void UninitI420toRGB444v565( ){
  781.     /* noop */
  782. }