loopfilt.c
上传用户:dangjiwu
上传日期:2013-07-19
资源大小:42019k
文件大小:12k
源码类别:

Symbian

开发平台:

Visual C++

  1. /* ***** BEGIN LICENSE BLOCK *****
  2.  * Source last modified: $Id: loopfilt.c,v 1.1.1.1.42.1 2004/07/09 01:56:22 hubbe Exp $
  3.  * 
  4.  * Portions Copyright (c) 1995-2004 RealNetworks, Inc. All Rights Reserved.
  5.  * 
  6.  * The contents of this file, and the files included with this file,
  7.  * are subject to the current version of the RealNetworks Public
  8.  * Source License (the "RPSL") available at
  9.  * http://www.helixcommunity.org/content/rpsl unless you have licensed
  10.  * the file under the current version of the RealNetworks Community
  11.  * Source License (the "RCSL") available at
  12.  * http://www.helixcommunity.org/content/rcsl, in which case the RCSL
  13.  * will apply. You may also obtain the license terms directly from
  14.  * RealNetworks.  You may not use this file except in compliance with
  15.  * the RPSL or, if you have a valid RCSL with RealNetworks applicable
  16.  * to this file, the RCSL.  Please see the applicable RPSL or RCSL for
  17.  * the rights, obligations and limitations governing use of the
  18.  * contents of the file.
  19.  * 
  20.  * Alternatively, the contents of this file may be used under the
  21.  * terms of the GNU General Public License Version 2 or later (the
  22.  * "GPL") in which case the provisions of the GPL are applicable
  23.  * instead of those above. If you wish to allow use of your version of
  24.  * this file only under the terms of the GPL, and not to allow others
  25.  * to use your version of this file under the terms of either the RPSL
  26.  * or RCSL, indicate your decision by deleting the provisions above
  27.  * and replace them with the notice and other provisions required by
  28.  * the GPL. If you do not delete the provisions above, a recipient may
  29.  * use your version of this file under the terms of any one of the
  30.  * RPSL, the RCSL or the GPL.
  31.  * 
  32.  * This file is part of the Helix DNA Technology. RealNetworks is the
  33.  * developer of the Original Code and owns the copyrights in the
  34.  * portions it created.
  35.  * 
  36.  * This file, and the files included with this file, is distributed
  37.  * and made available on an 'AS IS' basis, WITHOUT WARRANTY OF ANY
  38.  * KIND, EITHER EXPRESS OR IMPLIED, AND REALNETWORKS HEREBY DISCLAIMS
  39.  * ALL SUCH WARRANTIES, INCLUDING WITHOUT LIMITATION, ANY WARRANTIES
  40.  * OF MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE, QUIET
  41.  * ENJOYMENT OR NON-INFRINGEMENT.
  42.  * 
  43.  * Technology Compatibility Kit Test Suite(s) Location:
  44.  *    http://www.helixcommunity.org/content/tck
  45.  * 
  46.  * Contributor(s):
  47.  * 
  48.  * ***** END LICENSE BLOCK ***** */
  49. //#include <stdio.h>
  50. //#include <stdlib.h>
  51. #include "dllindex.h"
  52. #include "h261defs.h"
  53. #include "h261func.h"
  54. #include "loopfilt.h"
  55. extern void loopfilt8( PIXEL input[], int xdim, PIXEL output[] )
  56. {
  57.     union {
  58.         U16     half[8][8]; // 16b take longer than 32b writes on 486/Pentium
  59.         U32     word[8][4];
  60.     } temp;     // Area to hold data after filtering in horizontal dimension
  61.     union {
  62.         PIXEL   * pix;
  63.         U32     * word;
  64.     } out_ptr;  // Access output as bytes or as words
  65.     int row, col, a[7], out;
  66.     
  67.     // Perform horizontal filtering
  68.     for (row = 0; row < 8; row++) {
  69.         a[0] = input[0] + input[1];
  70.         a[1] = input[1] + input[2];
  71.         a[2] = input[2] + input[3];
  72.         a[3] = input[3] + input[4];
  73. #ifdef LITTLE_ENDIAN    // Avoid 16 b. Stores on X86
  74.         temp.word[row][0] = (input[0] << 2) + ((a[1] + a[2]) << 16);    // temp[0], temp[2]
  75.         temp.word[row][2] = a[0] + a[1]  +  ((a[2] + a[3]) << 16);      // temp[1], temp[3]
  76. #elif defined BIG_ENDIAN
  77.         temp.half[row][0] = input[0] << 2;  // temp[0]
  78.         temp.half[row][1] = a[1] + a[2];    // temp[2]
  79.         temp.half[row][4] = a[0] + a[1];    // temp[1]
  80.         temp.half[row][5] = a[2] + a[3];    // temp[3]
  81. #else
  82. #   error
  83. #endif
  84.         a[4] = input[4] + input[5];
  85.         a[5] = input[5] + input[6];
  86.         a[6] = input[6] + input[7];
  87. #ifdef LITTLE_ENDIAN
  88.         temp.word[row][1] = a[3] + a[4]  +  ((a[5] + a[6]) << 16);  // temp[4], temp[6]
  89.         temp.word[row][3] = a[4] + a[5]  +  (input[7] << (16 + 2)); // temp[5], temp[7]
  90. #elif defined BIG_ENDIAN
  91.         temp.half[row][2] = a[3] + a[4];    // temp[4]
  92.         temp.half[row][3] = a[5] + a[6];    // temp[6]
  93.         temp.half[row][6] = a[4] + a[5];    // temp[5]
  94.         temp.half[row][7] = input[7] << 2;  // temp[7]
  95. #else
  96. #   error
  97. #endif
  98.         input += xdim;
  99.     }
  100.     
  101.     // Perform vertical filtering on two columns at a time
  102.     for (col = 0; col < 2; col++) {
  103.         
  104.         // col=0: Filter cols 0 and 2; col=1: Filter cols 4 and 6
  105.         a[0] = temp.word[0][col] + temp.word[1][col];
  106.         a[1] = temp.word[1][col] + temp.word[2][col] + 0x80008L;   // Round;
  107.         a[2] = temp.word[2][col] + temp.word[3][col];
  108.         a[3] = temp.word[3][col] + temp.word[4][col] + 0x80008L;   // Round;
  109.         a[4] = temp.word[4][col] + temp.word[5][col];
  110.         a[5] = temp.word[5][col] + temp.word[6][col] + 0x80008L;   // Round;
  111.         a[6] = temp.word[6][col] + temp.word[7][col];
  112.         out_ptr.pix = output + (col << 2);
  113. #ifdef LITTLE_ENDIAN
  114.         *(out_ptr.word) = (temp.word[0][col] + 0x20002L) >> 2; // Round
  115.         out_ptr.pix += xdim;
  116.         *(out_ptr.word) = (a[0] + a[1]) >> 4;
  117.         out_ptr.pix += xdim;
  118.         *(out_ptr.word) = (a[1] + a[2]) >> 4;
  119.         out_ptr.pix += xdim;
  120.         *(out_ptr.word) = (a[2] + a[3]) >> 4;
  121.         out_ptr.pix += xdim;
  122.         *(out_ptr.word) = (a[3] + a[4]) >> 4;
  123.         out_ptr.pix += xdim;
  124.         *(out_ptr.word) = (a[4] + a[5]) >> 4;
  125.         out_ptr.pix += xdim;
  126.         *(out_ptr.word) = (a[5] + a[6]) >> 4;
  127.         out_ptr.pix += xdim;
  128.         *(out_ptr.word) = (temp.word[7][col] + 0x20002L) >> 2; // Round
  129. #elif defined BIG_ENDIAN
  130.         *(out_ptr.word) = (temp.word[0][col] + 0x20002L) << 6; // Round
  131.         out_ptr.pix += xdim;
  132.         *(out_ptr.word) = (a[0] + a[1]) << 4;
  133.         out_ptr.pix += xdim;
  134.         *(out_ptr.word) = (a[1] + a[2]) << 4;
  135.         out_ptr.pix += xdim;
  136.         *(out_ptr.word) = (a[2] + a[3]) << 4;
  137.         out_ptr.pix += xdim;
  138.         *(out_ptr.word) = (a[3] + a[4]) << 4;
  139.         out_ptr.pix += xdim;
  140.         *(out_ptr.word) = (a[4] + a[5]) << 4;
  141.         out_ptr.pix += xdim;
  142.         *(out_ptr.word) = (a[5] + a[6]) << 4;
  143.         out_ptr.pix += xdim;
  144.         *(out_ptr.word) = (temp.word[7][col] + 0x20002L) << 6; // Round
  145. #else
  146. #   error
  147. #endif
  148.         
  149.         // col=0: Filter cols 1 and 3; col=1: Filter cols 5 and 7
  150.         a[0] = temp.word[0][col+2] + temp.word[1][col+2];
  151.         a[1] = temp.word[1][col+2] + temp.word[2][col+2] + 0x80008L;   // Round;
  152.         a[2] = temp.word[2][col+2] + temp.word[3][col+2];
  153.         a[3] = temp.word[3][col+2] + temp.word[4][col+2] + 0x80008L;   // Round;
  154.         a[4] = temp.word[4][col+2] + temp.word[5][col+2];
  155.         a[5] = temp.word[5][col+2] + temp.word[6][col+2] + 0x80008L;   // Round;
  156.         a[6] = temp.word[6][col+2] + temp.word[7][col+2];
  157.         out_ptr.pix = output + (col << 2) + 1;
  158.         out = (temp.word[0][col+2] + 0x20002L) >> 2;    // Round
  159. #ifdef LITTLE_ENDIAN       
  160.         *(out_ptr.pix) = out;
  161.         *(out_ptr.pix + 2) = out >> 16;
  162.         
  163.         out_ptr.pix += xdim;
  164.         out = (a[0] + a[1]) >> 4;
  165.         *(out_ptr.pix) = out;
  166.         *(out_ptr.pix + 2) = out >> 16;
  167.         
  168.         out_ptr.pix += xdim;
  169.         out = (a[1] + a[2]) >> 4;
  170.         *(out_ptr.pix) = out;
  171.         *(out_ptr.pix + 2) = out >> 16;
  172.         
  173.         out_ptr.pix += xdim;
  174.         out = (a[2] + a[3]) >> 4;
  175.         *(out_ptr.pix) = out;
  176.         *(out_ptr.pix + 2) = out >> 16;
  177.         
  178.         out_ptr.pix += xdim;
  179.         out = (a[3] + a[4]) >> 4;
  180.         *(out_ptr.pix) = out;
  181.         *(out_ptr.pix + 2) = out >> 16;
  182.         
  183.         out_ptr.pix += xdim;
  184.         out = (a[4] + a[5]) >> 4;
  185.         *(out_ptr.pix) = out;
  186.         *(out_ptr.pix + 2) = out >> 16;
  187.         
  188.         out_ptr.pix += xdim;
  189.         out = (a[5] + a[6]) >> 4;
  190.         *(out_ptr.pix) = out;
  191.         *(out_ptr.pix + 2) = out >> 16;
  192.         
  193.         out_ptr.pix += xdim;
  194.         out = (temp.word[7][col+2] + 0x20002L) >> 2; // Round
  195.         *(out_ptr.pix) = out;
  196.         *(out_ptr.pix + 2) = out >> 16;
  197. #elif defined BIG_ENDIAN
  198.         *(out_ptr.pix + 2) = out;
  199.         *(out_ptr.pix) = out >> 16;
  200.         
  201.         out_ptr.pix += xdim;
  202.         out = (a[0] + a[1]) >> 4;
  203.         *(out_ptr.pix + 2) = out;
  204.         *(out_ptr.pix) = out >> 16;
  205.         
  206.         out_ptr.pix += xdim;
  207.         out = (a[1] + a[2]) >> 4;
  208.         *(out_ptr.pix + 2) = out;
  209.         *(out_ptr.pix) = out >> 16;
  210.         
  211.         out_ptr.pix += xdim;
  212.         out = (a[2] + a[3]) >> 4;
  213.         *(out_ptr.pix + 2) = out;
  214.         *(out_ptr.pix) = out >> 16;
  215.         
  216.         out_ptr.pix += xdim;
  217.         out = (a[3] + a[4]) >> 4;
  218.         *(out_ptr.pix + 2) = out;
  219.         *(out_ptr.pix) = out >> 16;
  220.         
  221.         out_ptr.pix += xdim;
  222.         out = (a[4] + a[5]) >> 4;
  223.         *(out_ptr.pix + 2) = out;
  224.         *(out_ptr.pix) = out >> 16;
  225.         
  226.         out_ptr.pix += xdim;
  227.         out = (a[5] + a[6]) >> 4;
  228.         *(out_ptr.pix + 2) = out;
  229.         *(out_ptr.pix) = out >> 16;
  230.         
  231.         out_ptr.pix += xdim;
  232.         out = (temp.word[7][col+2] + 0x20002L) >> 2; // Round
  233.         *(out_ptr.pix + 2) = out;
  234.         *(out_ptr.pix) = out >> 16;
  235. #else
  236. #   error
  237. #endif
  238.     }
  239.     return;
  240. }
  241. //  LoopFilter - assumes same line offset for input and output
  242. extern int  LoopFilter( MACROBLOCK_DESCR *mb, PICTURE *prev_pic, PICTURE *pic )
  243. {
  244.     int     row, col, status, cx, cy, pic_offset, prev_offset;
  245.     PIXEL   * source, * dest;
  246.     status = OK;
  247.     // Wrap motion vectors to allowed range
  248.     while (mb->mv_x < MV_MIN) {
  249.         mb->mv_x += MV_WRAP;
  250.     }
  251.     while (mb->mv_x > MV_MAX) {
  252.         mb->mv_x -= MV_WRAP;
  253.     }
  254.     while (mb->mv_y < MV_MIN) {
  255.         mb->mv_y += MV_WRAP;
  256.     }
  257.     while (mb->mv_y > MV_MAX) {
  258.         mb->mv_y -= MV_WRAP;
  259.     }
  260.     // Compute pointers
  261.     col = 16 * mb->x;
  262.     row = 16 * mb->y;
  263.     if (col == 0  &&  mb->mv_x < 0) {    // Pointing left of first col?
  264.         mb->mv_x = 0, status = H261_ERROR;
  265.     }
  266.     if (col == pic->y.nhor - 16  &&  mb->mv_x > 0) {  // Right of last col?
  267.         mb->mv_x = 0, status = H261_ERROR;
  268.     }
  269.     if (row == 0  &&  mb->mv_y < 0) {    // Pointing above first row?
  270.         mb->mv_y = 0, status = H261_ERROR;
  271.     }
  272.     if (row == pic->y.nvert - 16  &&  mb->mv_y > 0) {  // Below last row?
  273.         mb->mv_y = 0, status = H261_ERROR;
  274.     }
  275.     dest = pic->y.ptr + col + row * pic->y.hoffset;
  276.     source = prev_pic->y.ptr + col + mb->mv_x
  277.                     + (row + mb->mv_y) * pic->y.hoffset;
  278.     // Filter luminance
  279.     loopfilt8( source, (int)pic->y.hoffset, dest );
  280.     loopfilt8( source + 8, (int)pic->y.hoffset, dest + 8);
  281.     source += pic->y.hoffset << 3;  // Advance 8 lines
  282.     dest += pic->y.hoffset << 3;
  283.     loopfilt8( source, (int)pic->y.hoffset, dest );
  284.     loopfilt8( source + 8, (int)pic->y.hoffset, dest + 8);
  285.     // Filter chrominance
  286.     if (pic->color) {
  287.         col = 8 * mb->x;
  288.         row = 8 * mb->y;
  289.         // Truncate motion vectors for chroma towards zero
  290.         if (mb->mv_x < 0) {
  291.             cx = (mb->mv_x + 1) >> 1;
  292.         } else {
  293.             cx = mb->mv_x >> 1;
  294.         }
  295.         if (mb->mv_y < 0) {
  296.             cy = (mb->mv_y + 1) >> 1;
  297.         } else {
  298.             cy = mb->mv_y >> 1;
  299.         }
  300.         // Assuming same offset for Cr and Cb
  301.         pic_offset = col + row * pic->cb.hoffset;
  302.         prev_offset = col + cx + (row + cy) * pic->cb.hoffset;
  303.         dest = pic->cb.ptr + pic_offset;
  304.         source = prev_pic->cb.ptr + prev_offset;
  305.         loopfilt8( source, (int)pic->cb.hoffset, dest );
  306.         dest = pic->cr.ptr + pic_offset;
  307.         source = prev_pic->cr.ptr + prev_offset;
  308.         loopfilt8( source, (int)pic->cr.hoffset, dest );
  309.     }
  310.     return (status);
  311. }