loopfilt.c
上传用户:zhongxx05
上传日期:2007-06-06
资源大小:33641k
文件大小:11k
源码类别:

Symbian

开发平台:

C/C++

  1. /* ***** BEGIN LICENSE BLOCK ***** 
  2.  * Version: RCSL 1.0/RPSL 1.0 
  3.  *  
  4.  * Portions Copyright (c) 1995-2002 RealNetworks, Inc. All Rights Reserved. 
  5.  *      
  6.  * The contents of this file, and the files included with this file, are 
  7.  * subject to the current version of the RealNetworks Public Source License 
  8.  * Version 1.0 (the "RPSL") available at 
  9.  * http://www.helixcommunity.org/content/rpsl unless you have licensed 
  10.  * the file under the RealNetworks Community Source License Version 1.0 
  11.  * (the "RCSL") available at http://www.helixcommunity.org/content/rcsl, 
  12.  * in which case the RCSL will apply. You may also obtain the license terms 
  13.  * directly from RealNetworks.  You may not use this file except in 
  14.  * compliance with the RPSL or, if you have a valid RCSL with RealNetworks 
  15.  * applicable to this file, the RCSL.  Please see the applicable RPSL or 
  16.  * RCSL for the rights, obligations and limitations governing use of the 
  17.  * contents of the file.  
  18.  *  
  19.  * This file is part of the Helix DNA Technology. RealNetworks is the 
  20.  * developer of the Original Code and owns the copyrights in the portions 
  21.  * it created. 
  22.  *  
  23.  * This file, and the files included with this file, is distributed and made 
  24.  * available on an 'AS IS' basis, WITHOUT WARRANTY OF ANY KIND, EITHER 
  25.  * EXPRESS OR IMPLIED, AND REALNETWORKS HEREBY DISCLAIMS ALL SUCH WARRANTIES, 
  26.  * INCLUDING WITHOUT LIMITATION, ANY WARRANTIES OF MERCHANTABILITY, FITNESS 
  27.  * FOR A PARTICULAR PURPOSE, QUIET ENJOYMENT OR NON-INFRINGEMENT. 
  28.  * 
  29.  * Technology Compatibility Kit Test Suite(s) Location: 
  30.  *    http://www.helixcommunity.org/content/tck 
  31.  * 
  32.  * Contributor(s): 
  33.  *  
  34.  * ***** END LICENSE BLOCK ***** */ 
  35. //#include <stdio.h>
  36. //#include <stdlib.h>
  37. #include "dllindex.h"
  38. #include "h261defs.h"
  39. #include "h261func.h"
  40. #include "loopfilt.h"
  41. extern void loopfilt8( PIXEL input[], int xdim, PIXEL output[] )
  42. {
  43.     union {
  44.         U16     half[8][8]; // 16b take longer than 32b writes on 486/Pentium
  45.         U32     word[8][4];
  46.     } temp;     // Area to hold data after filtering in horizontal dimension
  47.     union {
  48.         PIXEL   * pix;
  49.         U32     * word;
  50.     } out_ptr;  // Access output as bytes or as words
  51.     int row, col, a[7], out;
  52.     
  53.     // Perform horizontal filtering
  54.     for (row = 0; row < 8; row++) {
  55.         a[0] = input[0] + input[1];
  56.         a[1] = input[1] + input[2];
  57.         a[2] = input[2] + input[3];
  58.         a[3] = input[3] + input[4];
  59. #ifdef LITTLE_ENDIAN    // Avoid 16 b. Stores on X86
  60.         temp.word[row][0] = (input[0] << 2) + ((a[1] + a[2]) << 16);    // temp[0], temp[2]
  61.         temp.word[row][2] = a[0] + a[1]  +  ((a[2] + a[3]) << 16);      // temp[1], temp[3]
  62. #elif defined BIG_ENDIAN
  63.         temp.half[row][0] = input[0] << 2;  // temp[0]
  64.         temp.half[row][1] = a[1] + a[2];    // temp[2]
  65.         temp.half[row][4] = a[0] + a[1];    // temp[1]
  66.         temp.half[row][5] = a[2] + a[3];    // temp[3]
  67. #else
  68. #   error
  69. #endif
  70.         a[4] = input[4] + input[5];
  71.         a[5] = input[5] + input[6];
  72.         a[6] = input[6] + input[7];
  73. #ifdef LITTLE_ENDIAN
  74.         temp.word[row][1] = a[3] + a[4]  +  ((a[5] + a[6]) << 16);  // temp[4], temp[6]
  75.         temp.word[row][3] = a[4] + a[5]  +  (input[7] << (16 + 2)); // temp[5], temp[7]
  76. #elif defined BIG_ENDIAN
  77.         temp.half[row][2] = a[3] + a[4];    // temp[4]
  78.         temp.half[row][3] = a[5] + a[6];    // temp[6]
  79.         temp.half[row][6] = a[4] + a[5];    // temp[5]
  80.         temp.half[row][7] = input[7] << 2;  // temp[7]
  81. #else
  82. #   error
  83. #endif
  84.         input += xdim;
  85.     }
  86.     
  87.     // Perform vertical filtering on two columns at a time
  88.     for (col = 0; col < 2; col++) {
  89.         
  90.         // col=0: Filter cols 0 and 2; col=1: Filter cols 4 and 6
  91.         a[0] = temp.word[0][col] + temp.word[1][col];
  92.         a[1] = temp.word[1][col] + temp.word[2][col] + 0x80008L;   // Round;
  93.         a[2] = temp.word[2][col] + temp.word[3][col];
  94.         a[3] = temp.word[3][col] + temp.word[4][col] + 0x80008L;   // Round;
  95.         a[4] = temp.word[4][col] + temp.word[5][col];
  96.         a[5] = temp.word[5][col] + temp.word[6][col] + 0x80008L;   // Round;
  97.         a[6] = temp.word[6][col] + temp.word[7][col];
  98.         out_ptr.pix = output + (col << 2);
  99. #ifdef LITTLE_ENDIAN
  100.         *(out_ptr.word) = (temp.word[0][col] + 0x20002L) >> 2; // Round
  101.         out_ptr.pix += xdim;
  102.         *(out_ptr.word) = (a[0] + a[1]) >> 4;
  103.         out_ptr.pix += xdim;
  104.         *(out_ptr.word) = (a[1] + a[2]) >> 4;
  105.         out_ptr.pix += xdim;
  106.         *(out_ptr.word) = (a[2] + a[3]) >> 4;
  107.         out_ptr.pix += xdim;
  108.         *(out_ptr.word) = (a[3] + a[4]) >> 4;
  109.         out_ptr.pix += xdim;
  110.         *(out_ptr.word) = (a[4] + a[5]) >> 4;
  111.         out_ptr.pix += xdim;
  112.         *(out_ptr.word) = (a[5] + a[6]) >> 4;
  113.         out_ptr.pix += xdim;
  114.         *(out_ptr.word) = (temp.word[7][col] + 0x20002L) >> 2; // Round
  115. #elif defined BIG_ENDIAN
  116.         *(out_ptr.word) = (temp.word[0][col] + 0x20002L) << 6; // Round
  117.         out_ptr.pix += xdim;
  118.         *(out_ptr.word) = (a[0] + a[1]) << 4;
  119.         out_ptr.pix += xdim;
  120.         *(out_ptr.word) = (a[1] + a[2]) << 4;
  121.         out_ptr.pix += xdim;
  122.         *(out_ptr.word) = (a[2] + a[3]) << 4;
  123.         out_ptr.pix += xdim;
  124.         *(out_ptr.word) = (a[3] + a[4]) << 4;
  125.         out_ptr.pix += xdim;
  126.         *(out_ptr.word) = (a[4] + a[5]) << 4;
  127.         out_ptr.pix += xdim;
  128.         *(out_ptr.word) = (a[5] + a[6]) << 4;
  129.         out_ptr.pix += xdim;
  130.         *(out_ptr.word) = (temp.word[7][col] + 0x20002L) << 6; // Round
  131. #else
  132. #   error
  133. #endif
  134.         
  135.         // col=0: Filter cols 1 and 3; col=1: Filter cols 5 and 7
  136.         a[0] = temp.word[0][col+2] + temp.word[1][col+2];
  137.         a[1] = temp.word[1][col+2] + temp.word[2][col+2] + 0x80008L;   // Round;
  138.         a[2] = temp.word[2][col+2] + temp.word[3][col+2];
  139.         a[3] = temp.word[3][col+2] + temp.word[4][col+2] + 0x80008L;   // Round;
  140.         a[4] = temp.word[4][col+2] + temp.word[5][col+2];
  141.         a[5] = temp.word[5][col+2] + temp.word[6][col+2] + 0x80008L;   // Round;
  142.         a[6] = temp.word[6][col+2] + temp.word[7][col+2];
  143.         out_ptr.pix = output + (col << 2) + 1;
  144.         out = (temp.word[0][col+2] + 0x20002L) >> 2;    // Round
  145. #ifdef LITTLE_ENDIAN       
  146.         *(out_ptr.pix) = out;
  147.         *(out_ptr.pix + 2) = out >> 16;
  148.         
  149.         out_ptr.pix += xdim;
  150.         out = (a[0] + a[1]) >> 4;
  151.         *(out_ptr.pix) = out;
  152.         *(out_ptr.pix + 2) = out >> 16;
  153.         
  154.         out_ptr.pix += xdim;
  155.         out = (a[1] + a[2]) >> 4;
  156.         *(out_ptr.pix) = out;
  157.         *(out_ptr.pix + 2) = out >> 16;
  158.         
  159.         out_ptr.pix += xdim;
  160.         out = (a[2] + a[3]) >> 4;
  161.         *(out_ptr.pix) = out;
  162.         *(out_ptr.pix + 2) = out >> 16;
  163.         
  164.         out_ptr.pix += xdim;
  165.         out = (a[3] + a[4]) >> 4;
  166.         *(out_ptr.pix) = out;
  167.         *(out_ptr.pix + 2) = out >> 16;
  168.         
  169.         out_ptr.pix += xdim;
  170.         out = (a[4] + a[5]) >> 4;
  171.         *(out_ptr.pix) = out;
  172.         *(out_ptr.pix + 2) = out >> 16;
  173.         
  174.         out_ptr.pix += xdim;
  175.         out = (a[5] + a[6]) >> 4;
  176.         *(out_ptr.pix) = out;
  177.         *(out_ptr.pix + 2) = out >> 16;
  178.         
  179.         out_ptr.pix += xdim;
  180.         out = (temp.word[7][col+2] + 0x20002L) >> 2; // Round
  181.         *(out_ptr.pix) = out;
  182.         *(out_ptr.pix + 2) = out >> 16;
  183. #elif defined BIG_ENDIAN
  184.         *(out_ptr.pix + 2) = out;
  185.         *(out_ptr.pix) = out >> 16;
  186.         
  187.         out_ptr.pix += xdim;
  188.         out = (a[0] + a[1]) >> 4;
  189.         *(out_ptr.pix + 2) = out;
  190.         *(out_ptr.pix) = out >> 16;
  191.         
  192.         out_ptr.pix += xdim;
  193.         out = (a[1] + a[2]) >> 4;
  194.         *(out_ptr.pix + 2) = out;
  195.         *(out_ptr.pix) = out >> 16;
  196.         
  197.         out_ptr.pix += xdim;
  198.         out = (a[2] + a[3]) >> 4;
  199.         *(out_ptr.pix + 2) = out;
  200.         *(out_ptr.pix) = out >> 16;
  201.         
  202.         out_ptr.pix += xdim;
  203.         out = (a[3] + a[4]) >> 4;
  204.         *(out_ptr.pix + 2) = out;
  205.         *(out_ptr.pix) = out >> 16;
  206.         
  207.         out_ptr.pix += xdim;
  208.         out = (a[4] + a[5]) >> 4;
  209.         *(out_ptr.pix + 2) = out;
  210.         *(out_ptr.pix) = out >> 16;
  211.         
  212.         out_ptr.pix += xdim;
  213.         out = (a[5] + a[6]) >> 4;
  214.         *(out_ptr.pix + 2) = out;
  215.         *(out_ptr.pix) = out >> 16;
  216.         
  217.         out_ptr.pix += xdim;
  218.         out = (temp.word[7][col+2] + 0x20002L) >> 2; // Round
  219.         *(out_ptr.pix + 2) = out;
  220.         *(out_ptr.pix) = out >> 16;
  221. #else
  222. #   error
  223. #endif
  224.     }
  225.     return;
  226. }
  227. //  LoopFilter - assumes same line offset for input and output
  228. extern int  LoopFilter( MACROBLOCK_DESCR *mb, PICTURE *prev_pic, PICTURE *pic )
  229. {
  230.     int     row, col, status, cx, cy, pic_offset, prev_offset;
  231.     PIXEL   * source, * dest;
  232.     status = OK;
  233.     // Wrap motion vectors to allowed range
  234.     while (mb->mv_x < MV_MIN) {
  235.         mb->mv_x += MV_WRAP;
  236.     }
  237.     while (mb->mv_x > MV_MAX) {
  238.         mb->mv_x -= MV_WRAP;
  239.     }
  240.     while (mb->mv_y < MV_MIN) {
  241.         mb->mv_y += MV_WRAP;
  242.     }
  243.     while (mb->mv_y > MV_MAX) {
  244.         mb->mv_y -= MV_WRAP;
  245.     }
  246.     // Compute pointers
  247.     col = 16 * mb->x;
  248.     row = 16 * mb->y;
  249.     if (col == 0  &&  mb->mv_x < 0) {    // Pointing left of first col?
  250.         mb->mv_x = 0, status = H261_ERROR;
  251.     }
  252.     if (col == pic->y.nhor - 16  &&  mb->mv_x > 0) {  // Right of last col?
  253.         mb->mv_x = 0, status = H261_ERROR;
  254.     }
  255.     if (row == 0  &&  mb->mv_y < 0) {    // Pointing above first row?
  256.         mb->mv_y = 0, status = H261_ERROR;
  257.     }
  258.     if (row == pic->y.nvert - 16  &&  mb->mv_y > 0) {  // Below last row?
  259.         mb->mv_y = 0, status = H261_ERROR;
  260.     }
  261.     dest = pic->y.ptr + col + row * pic->y.hoffset;
  262.     source = prev_pic->y.ptr + col + mb->mv_x
  263.                     + (row + mb->mv_y) * pic->y.hoffset;
  264.     // Filter luminance
  265.     loopfilt8( source, (int)pic->y.hoffset, dest );
  266.     loopfilt8( source + 8, (int)pic->y.hoffset, dest + 8);
  267.     source += pic->y.hoffset << 3;  // Advance 8 lines
  268.     dest += pic->y.hoffset << 3;
  269.     loopfilt8( source, (int)pic->y.hoffset, dest );
  270.     loopfilt8( source + 8, (int)pic->y.hoffset, dest + 8);
  271.     // Filter chrominance
  272.     if (pic->color) {
  273.         col = 8 * mb->x;
  274.         row = 8 * mb->y;
  275.         // Truncate motion vectors for chroma towards zero
  276.         if (mb->mv_x < 0) {
  277.             cx = (mb->mv_x + 1) >> 1;
  278.         } else {
  279.             cx = mb->mv_x >> 1;
  280.         }
  281.         if (mb->mv_y < 0) {
  282.             cy = (mb->mv_y + 1) >> 1;
  283.         } else {
  284.             cy = mb->mv_y >> 1;
  285.         }
  286.         // Assuming same offset for Cr and Cb
  287.         pic_offset = col + row * pic->cb.hoffset;
  288.         prev_offset = col + cx + (row + cy) * pic->cb.hoffset;
  289.         dest = pic->cb.ptr + pic_offset;
  290.         source = prev_pic->cb.ptr + prev_offset;
  291.         loopfilt8( source, (int)pic->cb.hoffset, dest );
  292.         dest = pic->cr.ptr + pic_offset;
  293.         source = prev_pic->cr.ptr + prev_offset;
  294.         loopfilt8( source, (int)pic->cr.hoffset, dest );
  295.     }
  296.     return (status);
  297. }