565.c
上传用户:zhongxx05
上传日期:2007-06-06
资源大小:33641k
文件大小:32k
源码类别:

Symbian

开发平台:

C/C++

  1. 1/* ***** BEGIN LICENSE BLOCK ***** 
  2.  * Version: RCSL 1.0/RPSL 1.0 
  3.  *  
  4.  * Portions Copyright (c) 1995-2002 RealNetworks, Inc. All Rights Reserved. 
  5.  *      
  6.  * The contents of this file, and the files included with this file, are 
  7.  * subject to the current version of the RealNetworks Public Source License 
  8.  * Version 1.0 (the "RPSL") available at 
  9.  * http://www.helixcommunity.org/content/rpsl unless you have licensed 
  10.  * the file under the RealNetworks Community Source License Version 1.0 
  11.  * (the "RCSL") available at http://www.helixcommunity.org/content/rcsl, 
  12.  * in which case the RCSL will apply. You may also obtain the license terms 
  13.  * directly from RealNetworks.  You may not use this file except in 
  14.  * compliance with the RPSL or, if you have a valid RCSL with RealNetworks 
  15.  * applicable to this file, the RCSL.  Please see the applicable RPSL or 
  16.  * RCSL for the rights, obligations and limitations governing use of the 
  17.  * contents of the file.  
  18.  *  
  19.  * This file is part of the Helix DNA Technology. RealNetworks is the 
  20.  * developer of the Original Code and owns the copyrights in the portions 
  21.  * it created. 
  22.  *  
  23.  * This file, and the files included with this file, is distributed and made 
  24.  * available on an 'AS IS' basis, WITHOUT WARRANTY OF ANY KIND, EITHER 
  25.  * EXPRESS OR IMPLIED, AND REALNETWORKS HEREBY DISCLAIMS ALL SUCH WARRANTIES, 
  26.  * INCLUDING WITHOUT LIMITATION, ANY WARRANTIES OF MERCHANTABILITY, FITNESS 
  27.  * FOR A PARTICULAR PURPOSE, QUIET ENJOYMENT OR NON-INFRINGEMENT. 
  28.  * 
  29.  * Technology Compatibility Kit Test Suite(s) Location: 
  30.  *    http://www.helixcommunity.org/content/tck 
  31.  * 
  32.  * Contributor(s): 
  33.  *  
  34.  * ***** END LICENSE BLOCK ***** */ 
  35. #include <stdlib.h>
  36. #include "nostatic/colorlib.h"
  37. #include "nostatic/yuv.h"
  38. /*
  39.  * Color conversion routines for converting YUV420 as produced by the
  40.  * RealVideo decoders to RGB565.
  41.  */
  42. /*
  43.  * Format-conversion routines.
  44.  * Use:
  45.  *  int XXXXtoYYYYEx (unsigned char *dest_ptr, int dest_width, int dest_height,
  46.  *      int dest_pitch, int dest_x, int dest_y, int dest_dx, int dest_dy,
  47.  *      unsigned char *src_ptr, int src_width, int src_height, int src_pitch,
  48.  *      int src_x, int src_y, int src_dx, int src_dy);
  49.  * Input:
  50.  *  dest_ptr - pointer to a destination buffer
  51.  *  dest_width, dest_height - width/height of the destination image (pixels)
  52.  *  dest_pitch - pitch of the dest. buffer (in bytes; <0 - if bottom up image)
  53.  *  dest_x, dest_y, dest_dx, dest_dy - destination rectangle (pixels)
  54.  *  src_ptr - pointer to an input image
  55.  *  src_width, src_height - width/height of the input image (pixels)
  56.  *  src_pitch - pitch of the source buffer (in bytes; <0 - if bottom up image)
  57.  *  src_x, src_y, src_dx, src_dy - source rectangle (pixels)
  58.  * Returns:
  59.  *  0 - if success; -1 if failure.
  60.  * Notes:
  61.  *  a) In all cases, pointers to the source and destination buffers must be
  62.  *     DWORD aligned, and both pitch parameters must be multiple of 4!!!
  63.  *  b) Converters that deal with YUV 4:2:2, or 4:2:0 formats may also require
  64.  *     rectangle parameters (x,y,dx,dy) to be multiple of 2. Failure to provide
  65.  *     aligned rectangles will result in partially converted image.
  66.  *  c) Currently only scale factors of 1:1 and 2:1 are supported; if the rates
  67.  *     dest_dx/src_dx & dest_dy/src_dy are neither 1, or 2, the converters
  68.  *     will fail.
  69.  */
  70. #define BYTESPERPIXEL 2
  71. /* Indexing tables */
  72. static const int next[3] = {1, 2, 0};                 /* (ibuf+1)%3 table */
  73. static const int next2[3] = {2, 0, 1};                /* (ibuf+2)%3 table */
  74. /* Half resolution converter.  */
  75. static void halfI420toRGB565 (unsigned char *d1,
  76.       int dest_x, unsigned char *sy1, 
  77.       unsigned char *sy2, unsigned char *su, 
  78.       unsigned char *sv, int src_x, int dx, int isodd,
  79.       color_data_t* pcd)
  80. {
  81.   /* check if we have misaligned input/output: */
  82.   if ((src_x ^ dest_x) & 1) {
  83.     
  84.     ; /* not implemented yet */
  85.     
  86.   } else {
  87.     
  88.     /* aligned input/output: */
  89.     register int y11, y12;
  90.     register int rv1, guv1, bu1, rv2, guv2, bu2;
  91.     register int i;
  92.     
  93.     /* source width should always be multiples of 4 */
  94.     /*    assert((src_x & 3)==0); */
  95.     /* convert all integral 2x4 blocks: */
  96.     if (isodd)
  97.       for (i = 0; i < dx/4; i ++) {
  98. /* first 2x2 block */
  99. rv1 = pcd->rvtab[sv[0]];
  100. guv1 = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  101. bu1 = pcd->butab[su[0]];
  102. y11 = (pcd->ytab[sy1[0]] + pcd->ytab[sy1[1]] + pcd->ytab[sy2[0]] + pcd->ytab[sy2[1]])>>2; /* avg */
  103. /* second 2x2 block */
  104. rv2  = pcd->rvtab[sv[1]];
  105. guv2 = pcd->gutab[su[1]] + pcd->gvtab[sv[1]];
  106. bu2  = pcd->butab[su[1]];
  107. y12 = (pcd->ytab[sy1[2]] + pcd->ytab[sy1[3]] + pcd->ytab[sy2[2]] + pcd->ytab[sy2[3]])>>2;
  108. /* output 4 bytes at a time */
  109. *(unsigned int *)(d1+0) =
  110.   (CLIP5[y11 + bu1  + DITH5L] << 0)  |
  111.   (CLIP6[y11 + guv1 + DITH6L] << 5)  |
  112.   (CLIP5[y11 + rv1  + DITH5L] << 11) |
  113.   (CLIP5[y12 + bu2  + DITH5H] << 16) |
  114.   (CLIP6[y12 + guv2 + DITH6H] << 21) |
  115.   (CLIP5[y12 + rv2  + DITH5H] << 27) ;
  116. /* next 4x2 block */
  117. sy1 += 4; sy2 += 4;
  118. su += 2; sv += 2;
  119. d1 += 2*BPP2;
  120.       }
  121.     else
  122.       for (i = 0; i < dx/4; i ++) {
  123. /* first 2x2 block */
  124. rv1 = pcd->rvtab[sv[0]];
  125. guv1 = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  126. bu1 = pcd->butab[su[0]];
  127. y11 = (pcd->ytab[sy1[0]] + pcd->ytab[sy1[1]] + pcd->ytab[sy2[0]] + pcd->ytab[sy2[1]])>>2; /* avg */
  128. /* second 2x2 block */
  129. rv2  = pcd->rvtab[sv[1]];
  130. guv2 = pcd->gutab[su[1]] + pcd->gvtab[sv[1]];
  131. bu2  = pcd->butab[su[1]];
  132. y12 = (pcd->ytab[sy1[2]] + pcd->ytab[sy1[3]] + pcd->ytab[sy2[2]] + pcd->ytab[sy2[3]])>>2;
  133. /* output 4 bytes at a time */
  134. *(unsigned int *)(d1+0) =
  135.   (CLIP5[y11 + bu1  + DITH5H] << 0)  |
  136.   (CLIP6[y11 + guv1 + DITH6H] << 5)  |
  137.   (CLIP5[y11 + rv1  + DITH5H] << 11) |
  138.   (CLIP5[y12 + bu2  + DITH5L] << 16) |
  139.   (CLIP6[y12 + guv2 + DITH6L] << 21) |
  140.   (CLIP5[y12 + rv2  + DITH5L] << 27) ;
  141. /* next 4x2 block */
  142. sy1 += 4; sy2 += 4;
  143. su += 2; sv += 2;
  144. d1 += 2*BPP2;
  145.       }
  146.   }
  147. }
  148. static void dblineI420toRGB565 (unsigned char *d1, unsigned char *d2, 
  149. int dest_x, unsigned char *sy1, 
  150. unsigned char *sy2, unsigned char *su, 
  151. unsigned char *sv, int src_x, int dx,
  152. color_data_t* pcd)
  153. {
  154.     /* check if we have misaligned input/output: */
  155.     if ((src_x ^ dest_x) & 1) {
  156.         ; /* not implemented yet */
  157.     } else {
  158.         /* aligned input/output: */
  159.         register int y11, y12, y21, y22;
  160.         register int rv, guv, bu;
  161.         register int i;
  162.         /* convert first 2x1 block: */
  163.         if (dest_x & 1) {
  164.             rv  = pcd->rvtab[sv[0]];
  165.             guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  166.             bu  = pcd->butab[su[0]];
  167.             y11 = pcd->ytab[sy1[0]];
  168.             y21 = pcd->ytab[sy2[0]];
  169.             /* output 2 bytes at a time */
  170.             *(unsigned short *)(d1+0) =
  171.                 (CLIP5[y11 + bu  + DITH5L] << 0)  |
  172.                 (CLIP6[y11 + guv + DITH6L] << 5)  |
  173.                 (CLIP5[y11 + rv  + DITH5L] << 11) ;
  174.             *(unsigned short *)(d2+0) =
  175.                 (CLIP5[y21 + bu  + DITH5H] << 0)  |
  176.                 (CLIP6[y21 + guv + DITH6H] << 5)  |
  177.                 (CLIP5[y21 + rv  + DITH5H] << 11) ;
  178.             sy1 += 1; sy2 += 1;
  179.             su += 1; sv += 1;
  180.             d1 += BPP2; d2 += BPP2;
  181.             dest_x ++; dx --;
  182.         }
  183.         /* convert first 2x2 block: */
  184.         if (dest_x & 2) {
  185.             rv  = pcd->rvtab[sv[0]];
  186.             guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  187.             bu  = pcd->butab[su[0]];
  188.             y11 = pcd->ytab[sy1[0]];
  189.             y12 = pcd->ytab[sy1[1]];
  190.             /* output 4 bytes at a time */
  191.             *(unsigned int *)(d1+0) =
  192.                 (CLIP5[y11 + bu  + DITH5L] << 0)  |
  193.                 (CLIP6[y11 + guv + DITH6L] << 5)  |
  194.                 (CLIP5[y11 + rv  + DITH5L] << 11) |
  195.                 (CLIP5[y12 + bu  + DITH5H] << 16) |
  196.                 (CLIP6[y12 + guv + DITH6H] << 21) |
  197.                 (CLIP5[y12 + rv  + DITH5H] << 27) ;
  198.             y21 = pcd->ytab[sy2[0]];
  199.             y22 = pcd->ytab[sy2[1]];
  200.             *(unsigned int *)(d2+0) =
  201.                 (CLIP5[y21 + bu  + DITH5H] << 0)  |
  202.                 (CLIP6[y21 + guv + DITH6H] << 5)  |
  203.                 (CLIP5[y21 + rv  + DITH5H] << 11) |
  204.                 (CLIP5[y22 + bu  + DITH5L] << 16) |
  205.                 (CLIP6[y22 + guv + DITH6L] << 21) |
  206.                 (CLIP5[y22 + rv  + DITH5L] << 27) ;
  207.             sy1 += 2; sy2 += 2;
  208.             su += 1; sv += 1;
  209.             d1 += 2*BPP2; d2 += 2*BPP2;
  210.             dest_x += 2; dx -= 2;
  211.         }
  212.         /* convert all integral 2x4 blocks: */
  213.         for (i = 0; i < dx/4; i ++) {
  214.             /* first 2x2 block */
  215.             rv = pcd->rvtab[sv[0]];
  216.             guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  217.             bu = pcd->butab[su[0]];
  218.             y11 = pcd->ytab[sy1[0]];
  219.             y12 = pcd->ytab[sy1[1]];
  220.             /* output 4 bytes at a time */
  221.             *(unsigned int *)(d1+0) =
  222.                 (CLIP5[y11 + bu  + DITH5L] << 0)  |
  223.                 (CLIP6[y11 + guv + DITH6L] << 5)  |
  224.                 (CLIP5[y11 + rv  + DITH5L] << 11) |
  225.                 (CLIP5[y12 + bu  + DITH5H] << 16) |
  226.                 (CLIP6[y12 + guv + DITH6H] << 21) |
  227.                 (CLIP5[y12 + rv  + DITH5H] << 27) ;
  228.             y21 = pcd->ytab[sy2[0]];
  229.             y22 = pcd->ytab[sy2[1]];
  230.             *(unsigned int *)(d2+0) =
  231.                 (CLIP5[y21 + bu  + DITH5H] << 0)  |
  232.                 (CLIP6[y21 + guv + DITH6H] << 5)  |
  233.                 (CLIP5[y21 + rv  + DITH5H] << 11) |
  234.                 (CLIP5[y22 + bu  + DITH5L] << 16) |
  235.                 (CLIP6[y22 + guv + DITH6L] << 21) |
  236.                 (CLIP5[y22 + rv  + DITH5L] << 27) ;
  237.             /* second 2x2 block */
  238.             rv  = pcd->rvtab[sv[1]];
  239.             guv = pcd->gutab[su[1]] + pcd->gvtab[sv[1]];
  240.             bu  = pcd->butab[su[1]];
  241.             y11 = pcd->ytab[sy1[2]];
  242.             y12 = pcd->ytab[sy1[3]];
  243.             *(unsigned int *)(d1+2*BPP2) =
  244.                 (CLIP5[y11 + bu  + DITH5L] << 0)  |
  245.                 (CLIP6[y11 + guv + DITH6L] << 5)  |
  246.                 (CLIP5[y11 + rv  + DITH5L] << 11) |
  247.                 (CLIP5[y12 + bu  + DITH5H] << 16) |
  248.                 (CLIP6[y12 + guv + DITH6H] << 21) |
  249.                 (CLIP5[y12 + rv  + DITH5H] << 27) ;
  250.             y21 = pcd->ytab[sy2[2]];
  251.             y22 = pcd->ytab[sy2[3]];
  252.             *(unsigned int *)(d2+2*BPP2) =
  253.                 (CLIP5[y21 + bu  + DITH5H] << 0)  |
  254.                 (CLIP6[y21 + guv + DITH6H] << 5)  |
  255.                 (CLIP5[y21 + rv  + DITH5H] << 11) |
  256.                 (CLIP5[y22 + bu  + DITH5L] << 16) |
  257.                 (CLIP6[y22 + guv + DITH6L] << 21) |
  258.                 (CLIP5[y22 + rv  + DITH5L] << 27) ;
  259.             /* next 4x2 block */
  260.             sy1 += 4; sy2 += 4;
  261.             su += 2; sv += 2;
  262.             d1 += 4*BPP2; d2 += 4*BPP2;
  263.         }
  264.         /* convert last 2x2 block: */
  265.         if (dx & 2) {
  266.             rv = pcd->rvtab[sv[0]];
  267.             guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  268.             bu = pcd->butab[su[0]];
  269.             y11 = pcd->ytab[sy1[0]];
  270.             y12 = pcd->ytab[sy1[1]];
  271.             /* output 4 bytes at a time */
  272.             *(unsigned int *)(d1+0) =
  273.                 (CLIP5[y11 + bu  + DITH5L] << 0)  |
  274.                 (CLIP6[y11 + guv + DITH6L] << 5)  |
  275.                 (CLIP5[y11 + rv  + DITH5L] << 11) |
  276.                 (CLIP5[y12 + bu  + DITH5H] << 16) |
  277.                 (CLIP6[y12 + guv + DITH6H] << 21) |
  278.                 (CLIP5[y12 + rv  + DITH5H] << 27) ;
  279.             y21 = pcd->ytab[sy2[0]];
  280.             y22 = pcd->ytab[sy2[1]];
  281.             *(unsigned int *)(d2+0) =
  282.                 (CLIP5[y21 + bu  + DITH5H] << 0)  |
  283.                 (CLIP6[y21 + guv + DITH6H] << 5)  |
  284.                 (CLIP5[y21 + rv  + DITH5H] << 11) |
  285.                 (CLIP5[y22 + bu  + DITH5L] << 16) |
  286.                 (CLIP6[y22 + guv + DITH6L] << 21) |
  287.                 (CLIP5[y22 + rv  + DITH5L] << 27) ;
  288.             sy1 += 2; sy2 += 2;
  289.             su += 1; sv += 1;
  290.             d1 += 2*BPP2; d2 += 2*BPP2;
  291.             dx -= 2;
  292.         }
  293.         /* convert last 2x1 block: */
  294.         if (dx & 1) {
  295.             rv  = pcd->rvtab[sv[0]];
  296.             guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  297.             bu  = pcd->butab[su[0]];
  298.             y11 = pcd->ytab[sy1[0]];
  299.             y21 = pcd->ytab[sy2[0]];
  300.             /* output 2 bytes at a time */
  301.             *(unsigned short *)(d1+0) =
  302.                 (CLIP5[y11 + bu  + DITH5L] << 0)  |
  303.                 (CLIP6[y11 + guv + DITH6L] << 5)  |
  304.                 (CLIP5[y11 + rv  + DITH5L] << 11) ;
  305.             *(unsigned short *)(d2+0) =
  306.                 (CLIP5[y21 + bu  + DITH5H] << 0)  |
  307.                 (CLIP6[y21 + guv + DITH6H] << 5)  |
  308.                 (CLIP5[y21 + rv  + DITH5H] << 11) ;
  309.         }
  310.     }
  311. }
  312. #define DITH1X4L 0x01002004
  313. #define DITH1X4H 0x0300600C
  314. #define DITH2X4L 0x02004008
  315. #define DITH2X4H 0x0600C018
  316. #define DITH4X4L 0x04008010
  317. #define DITH4X4H 0x0C018030
  318. /* RGB565 version: */
  319. static void dblineXRGBtoRGB565x2 (unsigned char *d1, unsigned char *d2, int dest_x,
  320.   unsigned char *s1, unsigned char *s2, int src_x, int dx,
  321.   color_data_t* pcd)
  322. {
  323.     register unsigned int a, b, c, d, e, f;
  324.     register unsigned int w, x, y, z;
  325.     /* convert first 2x1 block: */
  326.     if (dest_x & 1) {
  327.         /* Input pels  =>   Output pels
  328.          *  a b             w  x
  329.          *  c d             w' x'
  330.          */
  331.         /* top line */
  332.         a = *(unsigned int *)s1;
  333.         b = *(unsigned int *)(s1+BPP4);
  334.         w = a     + DITH1X4L;
  335.         x = a + b + DITH2X4H;
  336.         /* pack and store */
  337.         *(unsigned int *)d1 =
  338.             ((w & 0x000000f8) >> 3)  |
  339.             ((w & 0x0007e000) >> 8)  |
  340.             ((w & 0x3e000000) >> 14) |
  341.             ((x & 0x000001f0) << 12) |
  342.             ((x & 0x000fc000) << 7)  |
  343.             ((x & 0x7c000000) << 1);
  344.         /* bottom line */
  345.         c = *(unsigned int *)s2;
  346.         d = *(unsigned int *)(s2+BPP4);
  347.         w = a + c         + DITH2X4H;
  348.         x = a + b + c + d + DITH4X4L;
  349.         /* pack and store */
  350.         *(unsigned int *)d2 =
  351.             ((w & 0x000001f0) >> 4)  |
  352.             ((w & 0x000fc000) >> 9)  |
  353.             ((w & 0x7c000000) >> 15) |
  354.             ((x & 0x000003e0) << 11) |
  355.             ((x & 0x001f8000) << 6)  |
  356.             ((x & 0xf8000000) << 0);
  357.         /* bump pointers to next block */
  358.         s1 += BPP4; s2 += BPP4;
  359.         d1 += 2*BPP2; d2 += 2*BPP2;
  360.         dx -= 1;
  361.     }
  362.     /* process all integral 2x2 blocks: */
  363.     while (dx > 2) {    /* we need to leave at least one block */
  364.         /*
  365.          * Input stored as 00 RRRRRRRR 000 GGGGGGGG 000 BBBBBBBB
  366.          *
  367.          * Input pels       Output pels
  368.          *  a b e           w  x  y  z
  369.          *  c d f           w' x' y' z'
  370.          */
  371.         /* top line */
  372.         a = *(unsigned int *)s1;
  373.         b = *(unsigned int *)(s1+BPP4);
  374.         e = *(unsigned int *)(s1+2*BPP4);
  375.         w = a     + DITH1X4L;
  376.         x = a + b + DITH2X4H;
  377.         y = b     + DITH1X4L;
  378.         z = b + e + DITH2X4H;
  379.         /* pack and store */
  380.         *(unsigned int *)d1 =
  381.             ((w & 0x000000f8) >> 3)  |
  382.             ((w & 0x0007e000) >> 8)  |
  383.             ((w & 0x3e000000) >> 14) |
  384.             ((x & 0x000001f0) << 12) |
  385.             ((x & 0x000fc000) << 7)  |
  386.             ((x & 0x7c000000) << 1);
  387.         *(unsigned int *)(d1+2*BPP2) =
  388.             ((y & 0x000000f8) >> 3)  |
  389.             ((y & 0x0007e000) >> 8)  |
  390.             ((y & 0x3e000000) >> 14) |
  391.             ((z & 0x000001f0) << 12) |
  392.             ((z & 0x000fc000) << 7)  |
  393.             ((z & 0x7c000000) << 1);
  394.         /* bottom line */
  395.         c = *(unsigned int *)s2;
  396.         d = *(unsigned int *)(s2+BPP4);
  397.         f = *(unsigned int *)(s2+2*BPP4);
  398.         w = a + c         + DITH2X4H;
  399.         x = a + b + c + d + DITH4X4L;
  400.         y = b + d         + DITH2X4H;
  401.         z = b + e + d + f + DITH4X4L;
  402.         /* pack and store */
  403.         *(unsigned int *)d2 =
  404.             ((w & 0x000001f0) >> 4)  |
  405.             ((w & 0x000fc000) >> 9)  |
  406.             ((w & 0x7c000000) >> 15) |
  407.             ((x & 0x000003e0) << 11) |
  408.             ((x & 0x001f8000) << 6)  |
  409.             ((x & 0xf8000000) << 0);
  410.         *(unsigned int *)(d2+2*BPP2) =
  411.             ((y & 0x000001f0) >> 4)  |
  412.             ((y & 0x000fc000) >> 9)  |
  413.             ((y & 0x7c000000) >> 15) |
  414.             ((z & 0x000003e0) << 11) |
  415.             ((z & 0x001f8000) << 6)  |
  416.             ((z & 0xf8000000) << 0);
  417.         /* next 2x2 input block */
  418.         s1 += 2*BPP4; s2 += 2*BPP4;
  419.         d1 += 4*BPP2; d2 += 4*BPP2;
  420.         dx -= 2;
  421.     }
  422.     /* check if this is the last 2x2 block: */
  423.     if (dx > 1) {
  424.         /*
  425.          * For last 4 output pels, repeat final input pel
  426.          * for offscreen input.  Equivalent to pixel-doubling the
  427.          * last output pel.
  428.          */
  429.         /* top line */
  430.         a = *(unsigned int *)s1;
  431.         b = *(unsigned int *)(s1+BPP4);
  432.         e = b;      /* repeat last input pel */
  433.         w = a     + DITH1X4L;
  434.         x = a + b + DITH2X4H;
  435.         y = b     + DITH1X4L;
  436.         z = b + e + DITH2X4H;
  437.         /* pack and store */
  438.         *(unsigned int *)d1 =
  439.             ((w & 0x000000f8) >> 3)  |
  440.             ((w & 0x0007e000) >> 8)  |
  441.             ((w & 0x3e000000) >> 14) |
  442.             ((x & 0x000001f0) << 12) |
  443.             ((x & 0x000fc000) << 7)  |
  444.             ((x & 0x7c000000) << 1);
  445.         *(unsigned int *)(d1+2*BPP2) =
  446.             ((y & 0x000000f8) >> 3)  |
  447.             ((y & 0x0007e000) >> 8)  |
  448.             ((y & 0x3e000000) >> 14) |
  449.             ((z & 0x000001f0) << 12) |
  450.             ((z & 0x000fc000) << 7)  |
  451.             ((z & 0x7c000000) << 1);
  452.         /* bottom line */
  453.         c = *(unsigned int *)s2;
  454.         d = *(unsigned int *)(s2+BPP4);
  455.         f = d;      /* repeat last input pel */
  456.         w = a + c         + DITH2X4H;
  457.         x = a + b + c + d + DITH4X4L;
  458.         y = b + d         + DITH2X4H;
  459.         z = b + e + d + f + DITH4X4L;
  460.         /* pack and store */
  461.         *(unsigned int *)d2 =
  462.             ((w & 0x000001f0) >> 4)  |
  463.             ((w & 0x000fc000) >> 9)  |
  464.             ((w & 0x7c000000) >> 15) |
  465.             ((x & 0x000003e0) << 11) |
  466.             ((x & 0x001f8000) << 6)  |
  467.             ((x & 0xf8000000) << 0);
  468.         *(unsigned int *)(d2+2*BPP2) =
  469.             ((y & 0x000001f0) >> 4)  |
  470.             ((y & 0x000fc000) >> 9)  |
  471.             ((y & 0x7c000000) >> 15) |
  472.             ((z & 0x000003e0) << 11) |
  473.             ((z & 0x001f8000) << 6)  |
  474.             ((z & 0xf8000000) << 0);
  475.     } else {
  476.         /* last 2x1 block: */
  477.         /* Input pels  =>   Output pels
  478.          *  a b             w  x
  479.          *  c d             w' x'
  480.          */
  481.         /* top line */
  482.         a = *(unsigned int *)s1;
  483.         b = a;      /* repeat last input pel */
  484.         w = a     + DITH1X4L;
  485.         x = a + b + DITH2X4H;
  486.         /* pack and store */
  487.         *(unsigned int *)d1 =
  488.             ((w & 0x000000f8) >> 3)  |
  489.             ((w & 0x0007e000) >> 8)  |
  490.             ((w & 0x3e000000) >> 14) |
  491.             ((x & 0x000001f0) << 12) |
  492.             ((x & 0x000fc000) << 7)  |
  493.             ((x & 0x7c000000) << 1);
  494.         /* bottom line */
  495.         c = *(unsigned int *)s2;
  496.         d = c;      /* repeat last input pel */
  497.         w = a + c         + DITH2X4H;
  498.         x = a + b + c + d + DITH4X4L;
  499.         /* pack and store */
  500.         *(unsigned int *)d2 =
  501.             ((w & 0x000001f0) >> 4)  |
  502.             ((w & 0x000fc000) >> 9)  |
  503.             ((w & 0x7c000000) >> 15) |
  504.             ((x & 0x000003e0) << 11) |
  505.             ((x & 0x001f8000) << 6)  |
  506.             ((x & 0xf8000000) << 0);
  507.     }
  508. }
  509. /*
  510.  * Convert two YUV lines into RGB linebufs.
  511.  * Produces two RGB lines per call.
  512.  * Output in padded RGB format, needed for SIMD interpolation.
  513.  */
  514. static void dblineI420toXRGB (unsigned char *d1, unsigned char *d2, int dest_x,
  515.     unsigned char *sy1, unsigned char *sy2, unsigned char *su, unsigned char *sv,
  516.       int src_x, int dx,
  517.       color_data_t* pcd)
  518. {
  519.     register int y1, y2, rv, guv, bu;
  520.     register int i;
  521.     /* convert first 2x1 block: */
  522.     if (src_x & 1) {
  523.         bu = pcd->butab[su[0]];
  524.         guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  525.         rv = pcd->rvtab[sv[0]];
  526.         y1 = pcd->ytab[sy1[0]];
  527.         y2 = pcd->ytab[sy2[0]];
  528.         /* first line 00rrrrrr.rr000ggg.ggggg000.bbbbbbbb: */
  529.         *(unsigned int *)(d1+0) =
  530.             (CLIP8[y1 + bu])        |
  531.             (CLIP8[y1 + guv] << 11) |
  532.             (CLIP8[y1 + rv]  << 22) ;
  533.         /* second line 00rrrrrr.rr000ggg.ggggg000.bbbbbbbb: */
  534.         *(unsigned int *)(d2+0) =
  535.             (CLIP8[y2 + bu])        |
  536.             (CLIP8[y2 + guv] << 11) |
  537.             (CLIP8[y2 + rv]  << 22) ;
  538.         sy1 += 1; sy2 += 1;
  539.         su += 1; sv += 1;
  540.         d1 += BPP4; d2 += BPP4;
  541.         dx --;
  542.     }
  543.     /* convert all integral 2x2 blocks: */
  544.     for (i = 0; i < dx/2; i ++) {
  545.         bu = pcd->butab[su[0]];
  546.         guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  547.         rv = pcd->rvtab[sv[0]];
  548.         y1 = pcd->ytab[sy1[0]];
  549.         y2 = pcd->ytab[sy2[0]];
  550.         /* first line 00rrrrrr.rr000ggg.ggggg000.bbbbbbbb: */
  551.         *(unsigned int *)(d1+0) =
  552.             (CLIP8[y1 + bu])        |
  553.             (CLIP8[y1 + guv] << 11) |
  554.             (CLIP8[y1 + rv]  << 22) ;
  555.         /* second line 00rrrrrr.rr000ggg.ggggg000.bbbbbbbb: */
  556.         *(unsigned int *)(d2+0) =
  557.             (CLIP8[y2 + bu])        |
  558.             (CLIP8[y2 + guv] << 11) |
  559.             (CLIP8[y2 + rv]  << 22) ;
  560.         /* 2nd row: */
  561.         y1 = pcd->ytab[sy1[1]];
  562.         y2 = pcd->ytab[sy2[1]];
  563.         /* first line 00rrrrrr.rr000ggg.ggggg000.bbbbbbbb: */
  564.         *(unsigned int *)(d1+BPP4) =
  565.             (CLIP8[y1 + bu])        |
  566.             (CLIP8[y1 + guv] << 11) |
  567.             (CLIP8[y1 + rv]  << 22) ;
  568.         /* second line 00rrrrrr.rr000ggg.ggggg000.bbbbbbbb: */
  569.         *(unsigned int *)(d2+BPP4) =
  570.             (CLIP8[y2 + bu])        |
  571.             (CLIP8[y2 + guv] << 11) |
  572.             (CLIP8[y2 + rv]  << 22) ;
  573.         /* next 2x2 block */
  574.         sy1 += 2; sy2 += 2;
  575.         su += 1; sv += 1;
  576.         d1 += 2*BPP4; d2 += 2*BPP4;
  577.     }
  578.     /* convert last 2x1 block: */
  579.     if (dx & 1) {
  580.         bu = pcd->butab[su[0]];
  581.         guv = pcd->gutab[su[0]] + pcd->gvtab[sv[0]];
  582.         rv = pcd->rvtab[sv[0]];
  583.         y1 = pcd->ytab[sy1[0]];
  584.         y2 = pcd->ytab[sy2[0]];
  585.         /* first line 00rrrrrr.rr000ggg.ggggg000.bbbbbbbb: */
  586.         *(unsigned int *)(d1+0) =
  587.             (CLIP8[y1 + bu])        |
  588.             (CLIP8[y1 + guv] << 11) |
  589.             (CLIP8[y1 + rv]  << 22) ;
  590.         /* second line BGR0 */
  591.         *(unsigned int *)(d2+0) =
  592.             (CLIP8[y2 + bu])        |
  593.             (CLIP8[y2 + guv] << 11) |
  594.             (CLIP8[y2 + rv]  << 22) ;
  595.     }
  596. }
  597. /*
  598.  * I420->RGB565 converter:
  599.  */
  600. int I420toRGB565 (unsigned char *dest_ptr, int dest_width, int dest_height,
  601.     int dest_pitch, int dest_x, int dest_y, int dest_dx, int dest_dy,
  602.     unsigned char *src_ptr, int src_width, int src_height, int src_pitch,
  603.     int src_x, int src_y, int src_dx, int src_dy,
  604.   color_data_t* pcd)
  605. {
  606.     /* scale factors: */
  607.     int scale_x, scale_y;
  608.     /* check arguments: */
  609.     if (!chk_args (dest_ptr, dest_width, dest_height, dest_pitch,
  610.         dest_x, dest_y, dest_dx, dest_dy, src_ptr, src_width, src_height,
  611.         src_pitch, src_x, src_y, src_dx, src_dy, &scale_x, &scale_y))
  612.         return -1;
  613.     /* check if bottop-up images: */
  614.     if (dest_pitch < 0) dest_ptr -= (dest_height-1) * dest_pitch;
  615.     if (src_pitch <= 0) return -1;          /* not supported */
  616.     /* check if 1:1 scale: */
  617.     if (scale_x == 1 && scale_y == 1) {
  618.         /* color converter to use: */
  619.         void (*dbline) (unsigned char *d1, unsigned char *d2, int dest_x,
  620.             unsigned char *sy1, unsigned char *sy2, unsigned char *su, unsigned char *sv,
  621.             int src_x, int dx, color_data_t* pcd) = 
  622.             dblineI420toRGB565;
  623.         /* local variables: */
  624.         unsigned char *sy1, *sy2, *su, *sv, *d1, *d2;
  625.         register int j;
  626.         /* get pointers: */
  627.         sy1 = src_ptr + (src_x + src_y * src_pitch);        /* luma offset */
  628.         sy2 = sy1 + src_pitch;
  629.         su  = src_ptr + src_height * src_pitch + (src_x/2 + src_y/2 * src_pitch);
  630.         sv  = su + src_height * src_pitch / 4;
  631.         d1  = dest_ptr + dest_x * 2 + dest_y * dest_pitch; /* RGB offset */
  632.         d2  = d1 + dest_pitch;
  633.         /* convert a top line: */
  634.         if (src_y & 1) {                        /* chroma shift */
  635.             /* this is a bit inefficient, but who cares??? */
  636.             (* dbline) (d1, d1, dest_x, sy1, sy1, su, sv, src_x, src_dx, pcd);
  637.             sy1 += src_pitch;   sy2 += src_pitch;
  638.             su  += src_pitch/2; sv  += src_pitch/2;
  639.             d1  += dest_pitch;  d2  += dest_pitch;
  640.             dest_dy --;
  641.         }
  642.         /* convert aligned portion of the image: */
  643.         for (j = 0; j < dest_dy/2; j ++) {
  644.             /* convert two lines a time: */
  645.             (* dbline) (d1, d2, dest_x, sy1, sy2, su, sv, src_x, src_dx, pcd);
  646.             sy1 += src_pitch*2; sy2 += src_pitch*2;
  647.             su  += src_pitch/2; sv  += src_pitch/2;
  648.             d1  += dest_pitch*2; d2 += dest_pitch*2;
  649.         }
  650.         /* convert bottom line (if dest_dy is odd): */
  651.         if (dest_dy & 1) {
  652.             /* convert one line only: */
  653.             (* dbline) (d1, d1, dest_x, sy1, sy1, su, sv, src_x, src_dx, pcd);
  654.         }
  655.         return 0;
  656.     }
  657.     /* check if 2:1 scale: */
  658.     if (scale_x == 2 && scale_y == 2) {
  659.         /* color converter & interpolator to use: */
  660.         void (*cvt) (unsigned char *d1, unsigned char *d2, int dest_x,
  661.             unsigned char *sy1, unsigned char *sy2, unsigned char *su, unsigned char *sv,
  662.             int src_x, int dx, color_data_t* pcd) = dblineI420toXRGB;
  663.         void (*x2) (unsigned char *d1, unsigned char *d2, int dest_x,
  664.             unsigned char *s1, unsigned char *s2, int src_x, int dx, color_data_t* pcd) = dblineXRGBtoRGB565x2;
  665.         /* local variables: */
  666.         unsigned char *sy1, *sy2, *su, *sv, *d1, *d2;
  667.         register int dy = src_dy;
  668.         /* line buffers (we want them to be as compact as possible): */
  669.         int ibuf = 0;                           /* circular buffer index */
  670.         unsigned char * buf[3];                 /* actual pointers  */
  671.         buf[0] = pcd->linebuf;
  672.         buf[1] = pcd->linebuf + src_dx * BPP4;
  673.         buf[2] = pcd->linebuf + 2 * src_dx * BPP4;
  674.         /* get pointers: */
  675.         sy1 = src_ptr + (src_x + src_y * src_pitch);        /* luma offset */
  676.         sy2 = sy1 + src_pitch;
  677.         su  = src_ptr + src_height * src_pitch + (src_x/2 + src_y/2 * src_pitch);
  678.         sv  = su + src_height * src_pitch / 4;
  679.         d1  = dest_ptr + dest_x * BYTESPERPIXEL + dest_y * dest_pitch; /* RGB offset */
  680.         d2  = d1 + dest_pitch;
  681.         /* check if we have misaligned top line: */
  682.         if (src_y & 1) {
  683.             /* convert an odd first line: */
  684.             (*cvt) (buf[ibuf], buf[ibuf], 0, sy1, sy1, su, sv, src_x, src_dx, pcd);
  685.             sy1 += src_pitch;   sy2 += src_pitch;
  686.             su  += src_pitch/2; sv  += src_pitch/2;
  687.             dy --;
  688.         } else {
  689.             /* otherwise, convert first two lines: */
  690.             (*cvt) (buf[next[ibuf]], buf[next2[ibuf]], 0, sy1, sy2, su, sv, src_x, src_dx, pcd);
  691.             sy1 += src_pitch*2; sy2 += src_pitch*2;
  692.             su  += src_pitch/2; sv  += src_pitch/2;
  693.             ibuf = next[ibuf];      /* skip first interpolation: */
  694.             (*x2) (d1, d2, dest_x, buf[ibuf], buf[next[ibuf]], 0, src_dx, pcd);
  695.             d1  += dest_pitch*2; d2  += dest_pitch*2;
  696.             ibuf = next[ibuf];
  697.             dy -= 2;
  698.         }
  699.         /*
  700.          * Convert & interpolate the main portion of image:
  701.          *
  702.          *  source:      temp.store:                destination:
  703.          *
  704.          *               buf[ibuf] -------    /--> d1
  705.          *                                  x2  --> d2
  706.          *  s1 --   /-> buf[next[ibuf]] -<    /--> d1'=d1+2*pitch
  707.          *        cvt                       x2 ---> d2'=d2+2*pitch
  708.          *  s2 --/   -> buf[next2[ibuf]] /
  709.          */
  710.         while (dy >= 2) {
  711.             /* convert two lines into XRGB buffers: */
  712.             (*cvt) (buf[next[ibuf]], buf[next2[ibuf]], 0, sy1, sy2, su, sv, src_x, src_dx, pcd);
  713.             sy1 += src_pitch*2; sy2 += src_pitch*2;
  714.             su  += src_pitch/2; sv  += src_pitch/2;
  715.             /* interpolate first line: */
  716.             (*x2) (d1, d2, dest_x, buf[ibuf], buf[next[ibuf]], 0, src_dx, pcd);
  717.             d1  += dest_pitch*2; d2  += dest_pitch*2;
  718.             ibuf = next[ibuf];
  719.             /* interpolate second one: */
  720.             (*x2) (d1, d2, dest_x, buf[ibuf], buf[next[ibuf]], 0, src_dx, pcd);
  721.             d1  += dest_pitch*2; d2  += dest_pitch*2;
  722.             ibuf = next[ibuf];
  723.             dy -= 2;
  724.         }
  725.         /* check the # of remaining rows: */
  726.         if (dy & 1) {
  727.             /* convert the last odd line: */
  728.             (*cvt) (buf[next[ibuf]], buf[next[ibuf]], 0, sy1, sy1, su, sv, src_x, src_dx, pcd);
  729.             /* interpolate first line: */
  730.             (*x2) (d1, d2, dest_x, buf[ibuf], buf[next[ibuf]], 0, src_dx, pcd);
  731.             d1  += dest_pitch*2; d2  += dest_pitch*2;
  732.             ibuf = next[ibuf];
  733.             /* replicate the last line: */
  734.             (*x2) (d1, d2, dest_x, buf[ibuf], buf[ibuf], 0, src_dx, pcd);
  735.         } else {
  736.             /* replicate the last line: */
  737.             (*x2) (d1, d2, dest_x, buf[ibuf], buf[ibuf], 0, src_dx, pcd);
  738.         }
  739.         return 0;
  740.     }
  741.     /* check for 1/2 X scaling */
  742.     if (scale_x == 0 && scale_y == 0) {
  743.         /* local variables: */
  744.         unsigned char *sy1, *sy2, *su, *sv, *d1, *d2;
  745.         register int j;
  746.         /* get pointers: */
  747.         sy1 = src_ptr + (src_x + src_y * src_pitch);        /* luma offset */
  748.         sy2 = sy1 + src_pitch;
  749.         su  = src_ptr + src_height * src_pitch + (src_x/2 + src_y/2 * src_pitch);
  750.         sv  = su + src_height * src_pitch / 4;
  751.         d1  = dest_ptr + dest_x * 2 + dest_y * dest_pitch; /* RGB offset */
  752.         d2  = d1 + dest_pitch;
  753.         /* convert aligned portion of the image: */
  754.         for (j = 0; j < dest_dy>>1; j ++) {
  755.             /* convert two lines a time: */
  756.             halfI420toRGB565 (d1, dest_x, sy1, sy2, su, sv, src_x, src_dx, 0, pcd);
  757.             sy1 += src_pitch*2; sy2 += src_pitch*2;
  758.             su  += src_pitch/2; sv  += src_pitch/2;
  759.             d1  += dest_pitch;
  760.             halfI420toRGB565 (d1, dest_x, sy1, sy2, su, sv, src_x, src_dx, 1, pcd);
  761.             sy1 += src_pitch*2; sy2 += src_pitch*2;
  762.             su  += src_pitch/2; sv  += src_pitch/2;
  763.             d1  += dest_pitch;
  764.         }
  765.         return 0;
  766.     }
  767.     /* conversion is not supported */
  768.     return -1;
  769. }
  770. /*
  771.  * InitI420toRGB565 initializes the minimum set of clip tables necessary to perform
  772.  * color conversion to 16 bit RGB.  The 8-bit clip table is necessary for 2x
  773.  * interpolation.
  774.  *
  775.  * This routine also calls SetSrcI420Colors, which initializes color conversion tables
  776.  * and adds color balance.
  777.  */
  778. void InitI420toRGB565(float brightness, float contrast, float saturation, float hue,
  779.       color_data_t* pcd)
  780. {
  781.     InitColorData(pcd);
  782.     SetSrcI420Colors (brightness, contrast, saturation, hue, pcd);
  783. }
  784. void UninitI420toRGB565( ){
  785.     /* noop */
  786. }