mc_prediction.c
上传用户:hjq518
上传日期:2021-12-09
资源大小:5084k
文件大小:38k
源码类别:

Audio

开发平台:

Visual C++

  1. /*!
  2.  *************************************************************************************
  3.  * file mc_prediction.c
  4.  *
  5.  * brief
  6.  *    Motion Compensation
  7.  *
  8.  * author
  9.  *    Main contributors (see contributors.h for copyright, address and affiliation details)
  10.  *    - Alexis Michael Tourapis         <alexismt@ieee.org>
  11.  *
  12.  *************************************************************************************
  13.  */
  14. #include "contributors.h"
  15. #include <stdlib.h>
  16. #include <assert.h>
  17. #include <limits.h>
  18. #include <memory.h>
  19. #include <math.h>
  20. #include "global.h"
  21. #include "macroblock.h"
  22. #include "mc_prediction.h"
  23. #include "refbuf.h"
  24. #include "image.h"
  25. #include "mb_access.h"
  26. static int diff  [16];
  27. static imgpel l0_pred[MB_PIXELS];
  28. static imgpel l1_pred[MB_PIXELS];
  29. static const unsigned char subblk_offset_x[3][8][4] =
  30. {
  31.   { 
  32.     {0, 4, 0, 4},
  33.     {0, 4, 0, 4},
  34.     {0, 0, 0, 0},
  35.     {0, 0, 0, 0},
  36.     {0, 0, 0, 0},
  37.     {0, 0, 0, 0},
  38.     {0, 0, 0, 0},
  39.     {0, 0, 0, 0}, 
  40.   },
  41.   { 
  42.     {0, 4, 0, 4},
  43.     {0, 4, 0, 4},
  44.     {0, 4, 0, 4},
  45.     {0, 4, 0, 4},
  46.     {0, 0, 0, 0},
  47.     {0, 0, 0, 0},
  48.     {0, 0, 0, 0},
  49.     {0, 0, 0, 0}, 
  50.   },
  51.   { 
  52.     {0, 4, 0, 4},
  53.     {8,12, 8,12},
  54.     {0, 4, 0, 4},
  55.     {8,12, 8,12},
  56.     {0, 4, 0, 4},
  57.     {8,12, 8,12},
  58.     {0, 4, 0, 4},
  59.     {8,12, 8,12}  
  60.   }
  61. };
  62. static const unsigned char subblk_offset_y[3][8][4] =
  63. {
  64.   { 
  65.     {0, 0, 4, 4},
  66.     {0, 0, 4, 4},
  67.     {0, 0, 0, 0},
  68.     {0, 0, 0, 0},
  69.     {0, 0, 0, 0},
  70.     {0, 0, 0, 0},
  71.     {0, 0, 0, 0},
  72.     {0, 0, 0, 0}, 
  73.   },
  74.   { 
  75.     {0, 0, 4, 4},
  76.     {8, 8,12,12},
  77.     {0, 0, 4, 4},
  78.     {8, 8,12,12},
  79.     {0, 0, 0, 0},
  80.     {0, 0, 0, 0},
  81.     {0, 0, 0, 0},
  82.     {0, 0, 0, 0},
  83.   },
  84.   {
  85.     {0, 0, 4, 4},
  86.     {0, 0, 4, 4},
  87.     {8, 8,12,12},
  88.     {8, 8,12,12},
  89.     {0, 0, 4, 4},
  90.     {0, 0, 4, 4},
  91.     {8, 8,12,12},
  92.     {8, 8,12,12} 
  93.   }
  94. };
  95. /*!
  96.  ************************************************************************
  97.  * brief
  98.  *    Predict Luma block
  99.  ************************************************************************
  100.  */
  101. static inline void OneComponentLumaPrediction ( imgpel*   mpred,       //!< array of prediction values (row by row)
  102.                                                int    pic_pix_x,      //!< motion shifted horizontal coordinate of block
  103.                                                int    pic_pix_y,      //!< motion shifted vertical   coordinate of block
  104.                                                int    block_size_x,   //!< horizontal block size
  105.                                                int    block_size_y,   //!< vertical block size
  106.                                                StorablePicture *list //!< reference picture list
  107.                                                )
  108. {
  109.   int     j;
  110.   imgpel *ref_line = UMVLine4X (list->p_curr_img_sub, pic_pix_y, pic_pix_x);
  111.   width_pad  = list->size_x_pad;
  112.   height_pad = list->size_y_pad;
  113.   for (j = 0; j < block_size_y; j++) 
  114.   {
  115.     memcpy(mpred, ref_line, block_size_x * sizeof(imgpel));
  116.     ref_line += img_padded_size_x;
  117.     mpred += block_size_x;
  118.   }  
  119. }
  120. /*!
  121.  ************************************************************************
  122.  * brief
  123.  *    Predict one Luma block
  124.  ************************************************************************
  125.  */
  126. void LumaPrediction ( Macroblock* currMB,//!< Current Macroblock
  127.                      int   block_x,     //!< relative horizontal block coordinate of block
  128.                      int   block_y,     //!< relative vertical   block coordinate of block
  129.                      int   block_size_x,//!< relative horizontal block coordinate of block
  130.                      int   block_size_y,//!< relative vertical   block coordinate of block
  131.                      int   p_dir,       //!< prediction direction (0=list0, 1=list1, 2=bipred)
  132.                      int   l0_mode,     //!< list0 prediction mode (1-7, 0=DIRECT if l1_mode=0)
  133.                      int   l1_mode,     //!< list1 prediction mode (1-7, 0=DIRECT if l0_mode=0)
  134.                      short l0_ref_idx,  //!< reference frame for list0 prediction (-1: Intra4x4 pred. with l0_mode)
  135.                      short l1_ref_idx,   //!< reference frame for list1 prediction 
  136.                      short bipred_me     //!< use bi prediction mv (0=no bipred, 1 = use set 1, 2 = use set 2)
  137.                      )
  138. {
  139.   int  i, j;
  140.   int  block_x4     = block_x + block_size_x;
  141.   int  block_y4     = block_y + block_size_y;
  142.   int  pic_opix_x   = ((img->opix_x + block_x) << 2) + IMG_PAD_SIZE_TIMES4;
  143.   int  pic_opix_y   = ((img->opix_y + block_y) << 2) + IMG_PAD_SIZE_TIMES4;
  144.   int  bx           = block_x >> 2;
  145.   int  by           = block_y >> 2;
  146.   imgpel* l0pred    = l0_pred;
  147.   imgpel* l1pred    = l1_pred;  
  148.   short****** mv_array = img->all_mv;
  149.   short   *curr_mv = NULL;
  150.   imgpel (*mb_pred)[16] = img->mb_pred[0];
  151.   int  apply_weights = ( (active_pps->weighted_pred_flag  && (img->type== P_SLICE || img->type == SP_SLICE)) ||
  152.     (active_pps->weighted_bipred_idc && (img->type== B_SLICE)));
  153.   if (bipred_me && l0_ref_idx == 0 && l1_ref_idx == 0 && p_dir == 2 && is_bipred_enabled(l0_mode) && is_bipred_enabled(l1_mode))
  154.     mv_array = img->bipred_mv[bipred_me - 1]; 
  155.   switch (p_dir)
  156.   {
  157.   case 0:
  158.     curr_mv = mv_array[LIST_0][l0_ref_idx][l0_mode][by][bx];
  159.     OneComponentLumaPrediction (l0_pred, pic_opix_x + curr_mv[0], pic_opix_y + curr_mv[1], block_size_x, block_size_y, listX[LIST_0 + currMB->list_offset][l0_ref_idx]);
  160.     break;
  161.   case 1:
  162.     curr_mv = mv_array[LIST_1][l1_ref_idx][l1_mode][by][bx];
  163.     OneComponentLumaPrediction (l1_pred, pic_opix_x + curr_mv[0], pic_opix_y + curr_mv[1], block_size_x, block_size_y, listX[LIST_1 + currMB->list_offset][l1_ref_idx]);
  164.     break;
  165.   case 2:
  166.     curr_mv = mv_array[LIST_0][l0_ref_idx][l0_mode][by][bx];
  167.     OneComponentLumaPrediction (l0_pred, pic_opix_x + curr_mv[0], pic_opix_y + curr_mv[1], block_size_x, block_size_y, listX[LIST_0 + currMB->list_offset][l0_ref_idx]);
  168.     curr_mv = mv_array[LIST_1][l1_ref_idx][l1_mode][by][bx];
  169.     OneComponentLumaPrediction (l1_pred, pic_opix_x + curr_mv[0], pic_opix_y + curr_mv[1], block_size_x, block_size_y, listX[LIST_1 + currMB->list_offset][l1_ref_idx]);
  170.     break;
  171.   default:
  172.     break;
  173.   }
  174.   if (apply_weights)
  175.   {
  176.     if (p_dir==2)
  177.     {
  178.       int wbp0 = wbp_weight[0][l0_ref_idx][l1_ref_idx][0];
  179.       int wbp1 = wbp_weight[1][l0_ref_idx][l1_ref_idx][0];
  180.       int offset = (wp_offset[0][l0_ref_idx][0] + wp_offset[1][l1_ref_idx][0] + 1)>>1;
  181.       int wp_round = 2 * wp_luma_round;
  182.       int weight_denom = luma_log_weight_denom + 1;
  183.       for   (j=block_y; j<block_y4; j++)
  184.         for (i=block_x; i<block_x4; i++)  
  185.           mb_pred[j][i] = iClip1( img->max_imgpel_value, 
  186.           ((wbp0 * *l0pred++ + wbp1 * *l1pred++ + wp_round) >> (weight_denom)) + offset); 
  187.     }
  188.     else if (p_dir==0)
  189.     {
  190.       int wp = wp_weight[0][l0_ref_idx][0];
  191.       int offset = wp_offset[0][l0_ref_idx][0];
  192.       for   (j=block_y; j<block_y4; j++)
  193.         for (i=block_x; i<block_x4; i++)
  194.           mb_pred[j][i] = iClip1( img->max_imgpel_value, 
  195.           ((wp * *l0pred++  + wp_luma_round) >> luma_log_weight_denom) + offset);
  196.     }
  197.     else // (p_dir==1)
  198.     {
  199.       int wp = wp_weight[1][l1_ref_idx][0];
  200.       int offset = wp_offset[1][l1_ref_idx][0];
  201.       for   (j=block_y; j<block_y4; j++)
  202.         for (i=block_x; i<block_x4; i++)
  203.           mb_pred[j][i] = iClip1( img->max_imgpel_value, 
  204.           ((wp * *l1pred++  + wp_luma_round) >> luma_log_weight_denom) + offset );
  205.     }
  206.   }
  207.   else
  208.   {
  209.     if (p_dir==2)
  210.     {
  211.       for   (j=block_y; j<block_y4; j++)
  212.         for (i=block_x; i<block_x4; i++)
  213.           mb_pred[j][i] = (*l0pred++ + *l1pred++ + 1) >> 1;
  214.     }
  215.     else if (p_dir==0)
  216.     {
  217.       for (j=block_y; j<block_y4; j++)
  218.       {
  219.         memcpy(&(mb_pred[j][block_x]), l0pred, block_size_x * sizeof(imgpel));
  220.         l0pred += block_size_x;
  221.       }
  222.     }
  223.     else // (p_dir==1)
  224.     {
  225.       for (j=block_y; j<block_y4; j++)
  226.       {
  227.         memcpy(&(mb_pred[j][block_x]), l1pred, block_size_x * sizeof(imgpel));
  228.         l1pred += block_size_x;
  229.       }
  230.     }
  231.   }
  232. }
  233. /*!
  234.  ************************************************************************
  235.  * brief
  236.  *    Predict one Luma block
  237.  ************************************************************************
  238.  */
  239. void LumaPredictionBi ( Macroblock* currMB, //!< Current Macroblock
  240.                         int   block_x,      //!< relative horizontal block coordinate of 4x4 block
  241.                         int   block_y,      //!< relative vertical   block coordinate of 4x4 block
  242.                         int   block_size_x, //!< horizontal block size
  243.                         int   block_size_y, //!< vertical   block size
  244.                         int   l0_mode,      //!< list0 prediction mode (1-7, 0=DIRECT if l1_mode=0)
  245.                         int   l1_mode,      //!< list1 prediction mode (1-7, 0=DIRECT if l0_mode=0)
  246.                         short l0_ref_idx,   //!< reference frame for list0 prediction (-1: Intra4x4 pred. with l0_mode)
  247.                         short l1_ref_idx,   //!< reference frame for list1 prediction 
  248.                         int   list          //!< current list for prediction.
  249.                         )
  250. {
  251.   int  i, j;
  252.   int  block_x4  = block_x + block_size_x;
  253.   int  block_y4  = block_y + block_size_y;
  254.   int  pic_opix_x = ((img->opix_x + block_x) << 2) + IMG_PAD_SIZE_TIMES4;
  255.   int  pic_opix_y = ((img->opix_y + block_y) << 2) + IMG_PAD_SIZE_TIMES4;
  256.   int  bx        = block_x >> 2;
  257.   int  by        = block_y >> 2;
  258.   imgpel* l0pred     = l0_pred;
  259.   imgpel* l1pred     = l1_pred;
  260.   int  apply_weights = ( (active_pps->weighted_pred_flag && (img->type == P_SLICE || img->type == SP_SLICE)) ||
  261.     (active_pps->weighted_bipred_idc && (img->type == B_SLICE)));  
  262.   short   ******mv_array = img->bipred_mv[list]; 
  263.   short   *mv_arrayl0 = mv_array[LIST_0][l0_ref_idx][l0_mode][by][bx];
  264.   short   *mv_arrayl1 = mv_array[LIST_1][l1_ref_idx][l1_mode][by][bx];
  265.   imgpel (*mb_pred)[16] = img->mb_pred[0];
  266.   OneComponentLumaPrediction (l0_pred, pic_opix_x + mv_arrayl0[0], pic_opix_y + mv_arrayl0[1], block_size_x, block_size_y, listX[0+currMB->list_offset][l0_ref_idx]);
  267.   OneComponentLumaPrediction (l1_pred, pic_opix_x + mv_arrayl1[0], pic_opix_y + mv_arrayl1[1], block_size_x, block_size_y, listX[1+currMB->list_offset][l1_ref_idx]);
  268.   if (apply_weights)
  269.   {
  270.     int wbp0 = wbp_weight[0][l0_ref_idx][l1_ref_idx][0];
  271.     int wbp1 = wbp_weight[1][l0_ref_idx][l1_ref_idx][0];
  272.     int offset = (wp_offset[0][l0_ref_idx][0] + wp_offset[1][l1_ref_idx][0] + 1)>>1;
  273.     int wp_round = 2*wp_luma_round;
  274.     int weight_denom = luma_log_weight_denom + 1;
  275.     for   (j=block_y; j<block_y4; j++)
  276.       for (i=block_x; i<block_x4; i++)
  277.         mb_pred[j][i] = iClip1( img->max_imgpel_value,
  278.         ((wbp0 * *l0pred++ + wbp1 * *l1pred++ + wp_round) >> weight_denom) + offset);
  279.   }
  280.   else
  281.   {
  282.     for   (j=block_y; j<block_y4; j++)
  283.       for (i=block_x; i<block_x4; i++)
  284.         mb_pred[j][i] = (*l0pred++ + *l1pred++ + 1) >> 1;
  285.   }
  286. }
  287. /*!
  288.  ************************************************************************
  289.  * brief
  290.  *    Predict (on-the-fly) one component of a chroma 4x4 block
  291.  ************************************************************************
  292.  */
  293. void OneComponentChromaPrediction4x4_regenerate (
  294.                                  imgpel*     mpred,      //!< array to store prediction values
  295.                                  int         block_c_x,  //!< horizontal pixel coordinate of 4x4 block
  296.                                  int         block_c_y,  //!< vertical   pixel coordinate of 4x4 block
  297.                                  short***    mv,         //!< motion vector array
  298.                                  StorablePicture *list,
  299.                                  int         uv)         //!< chroma component
  300. {
  301.   int     i, j, ii, jj, ii0, jj0, ii1, jj1, if0, if1, jf0, jf1;
  302.   short*  mvb;
  303.   int     f1_x = 64/img->mb_cr_size_x;
  304.   int     f2_x=f1_x-1;
  305.   int     f1_y = 64/img->mb_cr_size_y;
  306.   int     f2_y=f1_y-1;
  307.   int     f3=f1_x*f1_y, f4=f3>>1;
  308.   int     list_offset = img->mb_data[img->current_mb_nr].list_offset;
  309.   int     max_y_cr = (int) (list_offset ? (img->height_cr >> 1) - 1 : img->height_cr - 1);
  310.   int     max_x_cr = (int) (img->width_cr - 1);
  311.   int     jjx, iix;
  312.   int     mb_cr_y_div4 = img->mb_cr_size_y>>2;
  313.   int     mb_cr_x_div4 = img->mb_cr_size_x>>2;
  314.   int     jpos;
  315.   imgpel** refimage = list->imgUV[uv];
  316.   for (j=block_c_y; j < block_c_y + BLOCK_SIZE; j++)
  317.   {
  318.     jjx = j/mb_cr_y_div4;
  319.     jpos = (j + img->opix_c_y)*f1_y;
  320.     for (i=block_c_x; i < block_c_x + BLOCK_SIZE; i++)
  321.     {
  322.       iix = i/mb_cr_x_div4;
  323.       mvb  = mv [jjx][iix];
  324.       ii   = (i + img->opix_c_x)*f1_x + mvb[0];
  325.       jj   = jpos + mvb[1];
  326.       if (active_sps->chroma_format_idc == 1)
  327.         jj  += list->chroma_vector_adjustment;
  328.       ii0  = iClip3 (0, max_x_cr, ii/f1_x);
  329.       jj0  = iClip3 (0, max_y_cr, jj/f1_y);
  330.       ii1  = iClip3 (0, max_x_cr, (ii+f2_x)/f1_x);
  331.       jj1  = iClip3 (0, max_y_cr, (jj+f2_y)/f1_y);
  332.       if1  = (ii&f2_x);  if0 = f1_x-if1;
  333.       jf1  = (jj&f2_y);  jf0 = f1_y-jf1;
  334.       *mpred++ = (if0 * jf0 * refimage[jj0][ii0] +
  335.                   if1 * jf0 * refimage[jj0][ii1] +
  336.                   if0 * jf1 * refimage[jj1][ii0] +
  337.                   if1 * jf1 * refimage[jj1][ii1] + f4) / f3;
  338.     }
  339.   }
  340. }
  341. /*!
  342.  ************************************************************************
  343.  * brief
  344.  *    Retrieve one component of a chroma 4x4 block from the buffer
  345.  ************************************************************************
  346.  */
  347. void OneComponentChromaPrediction4x4_retrieve (imgpel*        mpred,      //!< array to store prediction values
  348.                                  int         block_c_x,  //!< horizontal pixel coordinate of 4x4 block
  349.                                  int         block_c_y,  //!< vertical   pixel coordinate of 4x4 block
  350.                                  short***    mv,         //!< motion vector array
  351.                                  StorablePicture *list,
  352.                                  int         uv)         //!< chroma component
  353. {
  354.   int     j, ii, jj;
  355.   short*  mvb;
  356.   int     jjx;
  357.   int     right_shift_x = 4 - chroma_shift_x;
  358.   int     right_shift_y = 4 - chroma_shift_y;
  359.   int     jpos;
  360.   int     pos_x1 = block_c_x >> right_shift_x;
  361.   int     pos_x2 = (block_c_x + 2) >> right_shift_x;
  362.   int     ipos1 = ((block_c_x + img->opix_c_x    ) << chroma_shift_x) + IMG_PAD_SIZE_TIMES4;
  363.   int     ipos2 = ((block_c_x + img->opix_c_x + 2) << chroma_shift_x) + IMG_PAD_SIZE_TIMES4;
  364.   imgpel**** refsubimage = list->imgUV_sub[uv];
  365.   imgpel *line_ptr;
  366.   int jj_chroma = ((active_sps->chroma_format_idc == 1) ? list->chroma_vector_adjustment : 0) + IMG_PAD_SIZE_TIMES4;
  367.   width_pad_cr  = list->size_x_cr_pad;
  368.   height_pad_cr = list->size_y_cr_pad;
  369.   for (j=block_c_y; j < block_c_y + BLOCK_SIZE; j++)
  370.   {
  371.     jjx = j >> right_shift_y; // translate into absolute block (luma) coordinates
  372.     jpos = ( (j + img->opix_c_y) << chroma_shift_y ) + jj_chroma;
  373.     mvb  = mv [jjx][pos_x1];
  374.     ii   = ipos1 + mvb[0];
  375.     jj   = jpos  + mvb[1];
  376.     line_ptr = UMVLine8X_chroma ( refsubimage, jj, ii);
  377.     *mpred++ = *line_ptr++;
  378.     *mpred++ = *line_ptr;
  379.     mvb  = mv [jjx][pos_x2];
  380.     ii   = ipos2 + mvb[0];
  381.     jj   = jpos  + mvb[1];
  382.     line_ptr = UMVLine8X_chroma ( refsubimage, jj, ii);
  383.     *mpred++ = *line_ptr++;
  384.     *mpred++ = *line_ptr;
  385.   }
  386. }
  387. /*!
  388.  ************************************************************************
  389.  * brief
  390.  *    Retrieve one component of a chroma block from the buffer
  391.  ************************************************************************
  392.  */
  393. static inline 
  394. void OneComponentChromaPrediction ( imgpel* mpred,      //!< array to store prediction values
  395.                                    int    pic_pix_x,      //!< motion shifted horizontal coordinate of block
  396.                                    int    pic_pix_y,      //!< motion shifted vertical  block
  397.                                    int     block_size_x,   //!< horizontal block size
  398.                                    int     block_size_y,   //!< vertical block size                                      
  399.                                    StorablePicture *list, //!< reference picture list
  400.                                    int         uv)         //!< chroma component
  401. {
  402.   int     j;
  403.   imgpel *ref_line = UMVLine4X (list->imgUV_sub[uv], pic_pix_y, pic_pix_x);
  404.   width_pad_cr  = list->size_x_cr_pad;
  405.   height_pad_cr = list->size_y_cr_pad;
  406.   for (j = 0; j < block_size_y; j++) 
  407.   {
  408.     memcpy(mpred, ref_line, block_size_x * sizeof(imgpel));
  409.     ref_line += img_cr_padded_size_x;
  410.     mpred += block_size_x;
  411.   }
  412. }
  413. /*!
  414.  ************************************************************************
  415.  * brief
  416.  *    Predict an intra chroma 4x4 block
  417.  ************************************************************************
  418.  */
  419. static inline
  420. void IntraChromaPrediction4x4 (Macroblock* currMB, //! <-- Current Macroblock
  421.                                int  uv,            //! <-- colour component
  422.                                int  block_x,       //! <-- relative horizontal block coordinate of 4x4 block
  423.                                int  block_y)       //! <-- relative vertical   block coordinate of 4x4 block
  424. {
  425.   int j;
  426.   imgpel (*mb_pred)[16]       = img->mb_pred[ uv ];
  427.   imgpel (*curr_mpr_16x16)[16] = img->mpr_16x16[uv][currMB->c_ipred_mode];
  428.   //===== prediction =====
  429.   for (j=block_y; j<block_y + BLOCK_SIZE; j++)
  430.     memcpy(&mb_pred[j][block_x],&curr_mpr_16x16[j][block_x], BLOCK_SIZE * sizeof(imgpel));
  431. }
  432. /*!
  433.  ************************************************************************
  434.  * brief
  435.  *    Predict one chroma block
  436.  ************************************************************************
  437.  */
  438. void ChromaPrediction ( Macroblock* currMB, // <-- Current Macroblock
  439.                        int   uv,            // <-- colour component
  440.                        int   block_x,       // <-- relative horizontal block coordinate of block
  441.                        int   block_y,       // <-- relative vertical   block coordinate of block
  442.                        int   block_size_x,  // <-- relative horizontal block coordinate of block
  443.                        int   block_size_y,  // <-- relative vertical   block coordinate of block                        
  444.                        int   p_dir,         // <-- prediction direction (0=list0, 1=list1, 2=bipred)
  445.                        int   l0_mode,       // <-- list0  prediction mode (1-7, 0=DIRECT if l1_mode=0)
  446.                        int   l1_mode,       // <-- list1 prediction mode (1-7, 0=DIRECT if l0_mode=0)
  447.                        short l0_ref_idx,    // <-- reference frame for list0 prediction (if (<0) -> intra prediction)
  448.                        short l1_ref_idx,    // <-- reference frame for list1 prediction 
  449.                        short bipred_me      // <-- use bi prediction mv (0=no bipred, 1 = use set 1, 2 = use set 2)
  450.                        )    
  451. {
  452.   int  i, j;
  453.   int  block_x4     = block_x + block_size_x;
  454.   int  block_y4     = block_y + block_size_y;
  455.   int  pic_opix_x   = ((img->opix_c_x + block_x) << 2) + IMG_PAD_SIZE_TIMES4;
  456.   int  pic_opix_y   = ((img->opix_c_y + block_y) << 2) + IMG_PAD_SIZE_TIMES4;
  457.   int  bx           = block_x >> 2;
  458.   int  by           = block_y >> 2;
  459.   imgpel* l0pred     = l0_pred;
  460.   imgpel* l1pred     = l1_pred;
  461.   short****** mv_array = img->all_mv;    
  462.   int max_imgpel_value_uv = img->max_imgpel_value_comp[1];
  463.   int uv_comp = uv + 1;
  464.   imgpel (*mb_pred)[16] = img->mb_pred[ uv_comp];
  465.   int  apply_weights = ( (active_pps->weighted_pred_flag && (img->type == P_SLICE || img->type == SP_SLICE)) ||
  466.     (active_pps->weighted_bipred_idc && (img->type == B_SLICE)));
  467.   if (bipred_me && l0_ref_idx == 0 && l1_ref_idx == 0 && p_dir == 2 && is_bipred_enabled(l0_mode)  && is_bipred_enabled(l1_mode))
  468.     mv_array = img->bipred_mv[bipred_me - 1]; 
  469.   //===== INTRA PREDICTION =====
  470.   if (p_dir==-1)
  471.   {
  472.     IntraChromaPrediction4x4 (currMB, uv_comp, block_x, block_y);
  473.     return;
  474.   }
  475.   //===== INTER PREDICTION =====
  476.   switch (p_dir)
  477.   {
  478.   case 0:
  479.     OneComponentChromaPrediction (l0_pred, pic_opix_x + mv_array[LIST_0][l0_ref_idx][l0_mode][by][bx][0], pic_opix_y + mv_array[LIST_0][l0_ref_idx][l0_mode][by][bx][1], block_size_x, block_size_y, listX[0+currMB->list_offset][l0_ref_idx], uv);
  480.     break;
  481.   case 1: 
  482.     OneComponentChromaPrediction (l1_pred, pic_opix_x + mv_array[LIST_1][l1_ref_idx][l1_mode][by][bx][0], pic_opix_y + mv_array[LIST_1][l1_ref_idx][l1_mode][by][bx][1], block_size_x, block_size_y, listX[1+currMB->list_offset][l1_ref_idx], uv);
  483.     break;
  484.   case 2:
  485.     OneComponentChromaPrediction (l0_pred, pic_opix_x + mv_array[LIST_0][l0_ref_idx][l0_mode][by][bx][0], pic_opix_y + mv_array[LIST_0][l0_ref_idx][l0_mode][by][bx][1], block_size_x, block_size_y, listX[0+currMB->list_offset][l0_ref_idx], uv);
  486.     OneComponentChromaPrediction (l1_pred, pic_opix_x + mv_array[LIST_1][l1_ref_idx][l1_mode][by][bx][0], pic_opix_y + mv_array[LIST_1][l1_ref_idx][l1_mode][by][bx][1], block_size_x, block_size_y, listX[1+currMB->list_offset][l1_ref_idx], uv);
  487.     break;
  488.   default:
  489.     break;
  490.   }
  491.   if (apply_weights)
  492.   {
  493.     if (p_dir==2)
  494.     {
  495.       int wbp0 = wbp_weight[0][l0_ref_idx][l1_ref_idx][uv_comp];
  496.       int wbp1 = wbp_weight[1][l0_ref_idx][l1_ref_idx][uv_comp];
  497.       int offset = (wp_offset[0][l0_ref_idx][uv_comp] + wp_offset[1][l1_ref_idx][uv_comp] + 1)>>1;
  498.       int wp_round = 2*wp_chroma_round;
  499.       int weight_denom = luma_log_weight_denom + 1;
  500.       for   (j=block_y; j<block_y4; j++)
  501.         for (i=block_x; i<block_x4; i++)
  502.           mb_pred[j][i] =  iClip1( max_imgpel_value_uv,
  503.           ((wbp0 * *l0pred++ + wbp1 * *l1pred++ + wp_round) >> (weight_denom)) + (offset) );
  504.     }
  505.     else if (p_dir==0)
  506.     {
  507.       int wp = wp_weight[0][l0_ref_idx][uv_comp];
  508.       int offset = wp_offset[0][l0_ref_idx][uv_comp];
  509.       for   (j=block_y; j<block_y4; j++)
  510.         for (i=block_x; i<block_x4; i++)
  511.           mb_pred[j][i] = iClip1( max_imgpel_value_uv, (( wp * *l0pred++ + wp_chroma_round) >> chroma_log_weight_denom) +  offset);
  512.     }
  513.     else // (p_dir==1)
  514.     {
  515.       int wp = wp_weight[1][l1_ref_idx][uv_comp];
  516.       int offset = wp_offset[1][l1_ref_idx][uv_comp];
  517.       for   (j=block_y; j<block_y4; j++)
  518.         for (i=block_x; i<block_x4; i++)
  519.           mb_pred[j][i] = iClip1( max_imgpel_value_uv, ((wp * *l1pred++ + wp_chroma_round) >> chroma_log_weight_denom) + offset);
  520.     }
  521.   }
  522.   else
  523.   {
  524.     if (p_dir==2)
  525.     {
  526.       for   (j=block_y; j<block_y4; j++)
  527.         for (i=block_x; i<block_x4; i++)
  528.           mb_pred[j][i] = (*l0pred++ + *l1pred++ + 1) >> 1;
  529.     }
  530.     else if (p_dir==0)
  531.     {
  532.       for (j=block_y; j<block_y4; j++)
  533.       {
  534.         memcpy(&(mb_pred[j][block_x]), l0pred, block_size_x * sizeof(imgpel));
  535.         l0pred += block_size_x;
  536.       }
  537.     }
  538.     else // (p_dir==1)
  539.     {
  540.       for (j=block_y; j<block_y4; j++)
  541.       {
  542.         memcpy(&(mb_pred[j][block_x]), l1pred, block_size_x * sizeof(imgpel));
  543.         l1pred += block_size_x;
  544.       }
  545.     }
  546.   }
  547. }
  548. /*!
  549.  ************************************************************************
  550.  * brief
  551.  *    Predict one chroma 4x4 block
  552.  ************************************************************************
  553.  */
  554. void ChromaPrediction4x4 ( Macroblock* currMB, // <-- Current Macroblock
  555.                            int   uv,           // <-- colour component
  556.                            int   block_x,      // <-- relative horizontal block coordinate of 4x4 block
  557.                            int   block_y,      // <-- relative vertical   block coordinate of 4x4 block
  558.                            int   p_dir,        // <-- prediction direction (0=list0, 1=list1, 2=bipred)
  559.                            int   l0_mode,      // <-- list0  prediction mode (1-7, 0=DIRECT if l1_mode=0)
  560.                            int   l1_mode,      // <-- list1 prediction mode (1-7, 0=DIRECT if l0_mode=0)
  561.                            short l0_ref_idx,   // <-- reference frame for list0 prediction (if (<0) -> intra prediction)
  562.                            short l1_ref_idx,   // <-- reference frame for list1 prediction 
  563.                            short bipred_me     // <-- use bi prediction mv (0=no bipred, 1 = use set 1, 2 = use set 2)
  564.                            )   
  565. {
  566.   int  i, j;
  567.   int  block_x4  = block_x + BLOCK_SIZE;
  568.   int  block_y4  = block_y + BLOCK_SIZE;
  569.   imgpel* l0pred     = l0_pred;
  570.   imgpel* l1pred     = l1_pred;
  571.   short****** mv_array = img->all_mv;
  572.   int max_imgpel_value_uv = img->max_imgpel_value_comp[1];
  573.   int uv_comp = uv + 1;
  574.   imgpel (*mb_pred)[16] = img->mb_pred[uv_comp];
  575.   int     list_offset = currMB->list_offset;
  576.   
  577.   int  apply_weights = ( (active_pps->weighted_pred_flag && (img->type == P_SLICE || img->type == SP_SLICE)) ||
  578.     (active_pps->weighted_bipred_idc && (img->type == B_SLICE)));
  579.   if (bipred_me && l0_ref_idx == 0 && l1_ref_idx == 0 && p_dir == 2 && is_bipred_enabled(l0_mode)  && is_bipred_enabled(l1_mode) )
  580.     mv_array = img->bipred_mv[bipred_me - 1]; 
  581.   //===== INTRA PREDICTION =====
  582.   
  583.   if (p_dir==-1)
  584.   {
  585.     IntraChromaPrediction4x4 (currMB, uv_comp, block_x, block_y);
  586.     return;
  587.   }
  588.   //===== INTER PREDICTION =====
  589.   switch (p_dir)
  590.   {
  591.   case 0: // LIST_0
  592.     (*OneComponentChromaPrediction4x4) (l0_pred, block_x, block_y, mv_array[LIST_0][l0_ref_idx][l0_mode], listX[LIST_0 + list_offset][l0_ref_idx], uv);
  593.     break;
  594.   case 1: // LIST_1
  595.     (*OneComponentChromaPrediction4x4) (l1_pred, block_x, block_y, mv_array[LIST_1][l1_ref_idx][l1_mode], listX[LIST_1 + list_offset][l1_ref_idx], uv);
  596.     break;
  597.   case 2: // BI_PRED
  598.     (*OneComponentChromaPrediction4x4) (l0_pred, block_x, block_y, mv_array[LIST_0][l0_ref_idx][l0_mode], listX[LIST_0 + list_offset][l0_ref_idx], uv);
  599.     (*OneComponentChromaPrediction4x4) (l1_pred, block_x, block_y, mv_array[LIST_1][l1_ref_idx][l1_mode], listX[LIST_1 + list_offset][l1_ref_idx], uv);
  600.     break;
  601.   default:
  602.     break;
  603.   }
  604.   if (apply_weights)
  605.   {
  606.     if (p_dir==2)
  607.     {
  608.       int wbp0 = wbp_weight[0][l0_ref_idx][l1_ref_idx][uv_comp];
  609.       int wbp1 = wbp_weight[1][l0_ref_idx][l1_ref_idx][uv_comp];
  610.       int offset = (wp_offset[0][l0_ref_idx][uv_comp] + wp_offset[1][l1_ref_idx][uv_comp] + 1)>>1;
  611.       int wp_round = 2 * wp_chroma_round;
  612.       int weight_denom = luma_log_weight_denom + 1;
  613.       for (j=block_y; j<block_y4; j++)
  614.         for (i=block_x; i<block_x4; i++)
  615.           mb_pred[j][i] =  iClip1( max_imgpel_value_uv,
  616.           ((wbp0 * *l0pred++ + wbp1 * *l1pred++ + wp_round) >> (weight_denom)) + (offset) );
  617.     }
  618.     else if (p_dir==0)
  619.     {
  620.       int wp = wp_weight[0][l0_ref_idx][uv_comp];
  621.       int offset = wp_offset[0][l0_ref_idx][uv_comp];
  622.       for (j=block_y; j<block_y4; j++)
  623.         for (i=block_x; i<block_x4; i++)
  624.           mb_pred[j][i] = iClip1( max_imgpel_value_uv, (( wp * *l0pred++ + wp_chroma_round) >> chroma_log_weight_denom) +  offset);
  625.     }
  626.     else // (p_dir==1)
  627.     {
  628.       int wp = wp_weight[1][l1_ref_idx][uv_comp];
  629.       int offset = wp_offset[1][l1_ref_idx][uv_comp];
  630.       for (j=block_y; j<block_y4; j++)
  631.         for (i=block_x; i<block_x4; i++)
  632.           mb_pred[j][i] = iClip1( max_imgpel_value_uv, ((wp * *l1pred++ + wp_chroma_round) >> chroma_log_weight_denom) + offset);
  633.     }
  634.   }
  635.   else
  636.   {
  637.     if (p_dir==2)
  638.     {
  639.       for (j=block_y; j<block_y4; j++)
  640.         for (i=block_x; i<block_x4; i++)
  641.           mb_pred[j][i] = (*l0pred++ + *l1pred++ + 1) >> 1;
  642.     }
  643.     else if (p_dir==0)
  644.     {
  645.       for (j=block_y; j<block_y4; j++)
  646.       {
  647.         memcpy(&(mb_pred[j][block_x]), l0pred, BLOCK_SIZE * sizeof(imgpel));
  648.         l0pred += BLOCK_SIZE;
  649.       }
  650.     }
  651.     else // (p_dir==1)
  652.     {
  653.       for (j=block_y; j<block_y4; j++)
  654.       {
  655.         memcpy(&(mb_pred[j][block_x]), l1pred, BLOCK_SIZE * sizeof(imgpel));
  656.         l1pred += BLOCK_SIZE;
  657.       }
  658.     }
  659.   }
  660. }
  661. /*!
  662.  ************************************************************************
  663.  * brief
  664.  *    Intra prediction of the chrminance layers of one macroblock
  665.  ************************************************************************
  666.  */
  667. void IntraChromaPrediction (Macroblock *currMB, int *mb_up, int *mb_left, int*mb_up_left)
  668. {
  669.   static int s, s0, s1, s2, s3, i, j, k;
  670.   static int ih,iv, ib, ic, iaa;
  671.   int      uv;
  672.   int      blk_x, blk_y;
  673.   int      b8,b4;
  674.   imgpel**  image;
  675.   imgpel   vline[16];
  676.   int      block_x, block_y;
  677.   int      mb_available_up;
  678.   int      mb_available_left[2];
  679.   int      mb_available_up_left;
  680.   int      mode;
  681.   int      best_mode = DC_PRED_8;  //just an initilaization here, should always be overwritten
  682.   int      cost;
  683.   int      min_cost;
  684.   PixelPos up;        //!< pixel position  p(0,-1)
  685.   PixelPos left[17];  //!< pixel positions p(-1, -1..15)
  686.   int      cr_MB_x = img->mb_cr_size_x;
  687.   int      cr_MB_y = img->mb_cr_size_y;
  688.   static imgpel (*cur_pred)[16];
  689.   static imgpel (*curr_mpr_16x16)[16][16];
  690.   static imgpel *hline;
  691.   static imgpel *img_org, *img_prd;
  692.   int      yuv = img->yuv_format - 1;
  693.   int      dc_pred_value_chroma = img->dc_pred_value_comp[1];
  694.   int      max_imgpel_value_uv  = img->max_imgpel_value_comp[1];
  695.   static const int block_pos[3][4][4]= //[yuv][b8][b4]
  696.   {
  697.     { {0, 1, 2, 3},{0, 0, 0, 0},{0, 0, 0, 0},{0, 0, 0, 0}},
  698.     { {0, 1, 2, 3},{2, 3, 2, 3},{0, 0, 0, 0},{0, 0, 0, 0}},
  699.     { {0, 1, 2, 3},{1, 1, 3, 3},{2, 3, 2, 3},{3, 3, 3, 3}}
  700.   };
  701.   for (i=0;i<cr_MB_y+1;i++)
  702.   {
  703.     getNeighbour(currMB, -1 , i-1 , img->mb_size[IS_CHROMA], &left[i]);
  704.   }
  705.   getNeighbour(currMB, 0 , -1 , img->mb_size[IS_CHROMA], &up);
  706.   mb_available_up                             = up.available;
  707.   mb_available_up_left                        = left[0].available;
  708.   mb_available_left[0] = mb_available_left[1] = left[1].available;
  709.   if(params->UseConstrainedIntraPred)
  710.   {
  711.     mb_available_up = up.available ? img->intra_block[up.mb_addr] : 0;
  712.     for (i=0, mb_available_left[0]=1; i<(cr_MB_y>>1);i++)
  713.       mb_available_left[0]  &= left[i+1].available ? img->intra_block[left[i+1].mb_addr]: 0;
  714.     for (i=(cr_MB_y>>1), mb_available_left[1]=1; i<cr_MB_y;i++)
  715.       mb_available_left[1] &= left[i+1].available ? img->intra_block[left[i+1].mb_addr]: 0;
  716.     mb_available_up_left = left[0].available ? img->intra_block[left[0].mb_addr]: 0;
  717.   }
  718.   if (mb_up)
  719.     *mb_up = mb_available_up;
  720.   if (mb_left)
  721.     *mb_left = mb_available_left[0] && mb_available_left[1];
  722.   if (mb_up_left)
  723.     *mb_up_left = mb_available_up_left;
  724.   // compute all chroma intra prediction modes for both U and V
  725.   for (uv=0; uv<2; uv++)
  726.   {
  727.     image          = enc_picture->imgUV[uv];
  728.     curr_mpr_16x16 = img->mpr_16x16[uv + 1];
  729.     // DC prediction
  730.     for(b8=0; b8<img->num_blk8x8_uv >> 1;b8++)
  731.     {
  732.       for (b4=0; b4<4; b4++)
  733.       {
  734.         block_y = subblk_offset_y[yuv][b8][b4];
  735.         block_x = subblk_offset_x[yuv][b8][b4];
  736.         blk_x = block_x;
  737.         blk_y = block_y + 1;
  738.         s=dc_pred_value_chroma;
  739.         s0=s1=s2=s3=0;
  740.         //===== get prediction value =====
  741.         switch (block_pos[yuv][b8][b4])
  742.         {
  743.         case 0:  //===== TOP LEFT =====
  744.           if      (mb_available_up)       
  745.             for (i=blk_x;i<(blk_x+4);i++)  
  746.               s0 += image[up.pos_y][up.pos_x + i];
  747.           if      (mb_available_left[0])  
  748.             for (i=blk_y;i<(blk_y+4);i++)  
  749.               s2 += image[left[i].pos_y][left[i].pos_x];
  750.           if      (mb_available_up && mb_available_left[0])  
  751.             s  = (s0+s2+4) >> 3;
  752.           else if (mb_available_up)                          
  753.             s  = (s0   +2) >> 2;
  754.           else if (mb_available_left[0])                     
  755.             s  = (s2   +2) >> 2;
  756.           break;
  757.         case 1: //===== TOP RIGHT =====
  758.           if      (mb_available_up)       
  759.             for (i=blk_x;i<(blk_x+4);i++)  
  760.               s1 += image[up.pos_y][up.pos_x + i];
  761.           else if (mb_available_left[0])  
  762.             for (i=blk_y;i<(blk_y+4);i++) 
  763.               s2 += image[left[i].pos_y][left[i].pos_x];
  764.           if      (mb_available_up)       
  765.             s  = (s1   +2) >> 2;
  766.           else if (mb_available_left[0])                    
  767.             s  = (s2   +2) >> 2;
  768.           break;
  769.         case 2: //===== BOTTOM LEFT =====
  770.           if      (mb_available_left[1])  
  771.             for (i=blk_y;i<(blk_y+4);i++)  
  772.               s3 += image[left[i].pos_y][left[i].pos_x];
  773.           else if (mb_available_up)       
  774.             for (i=blk_x;i<(blk_x+4);i++)  
  775.               s0 += image[up.pos_y][up.pos_x + i];
  776.           if      (mb_available_left[1])                     
  777.             s  = (s3   +2) >> 2;
  778.           else if (mb_available_up)                          
  779.             s  = (s0   +2) >> 2;
  780.           break;
  781.         case 3: //===== BOTTOM RIGHT =====
  782.           if      (mb_available_up)       
  783.             for (i=blk_x;i<(blk_x+4);i++)  
  784.               s1 += image[up.pos_y][up.pos_x + i];
  785.           if      (mb_available_left[1])  
  786.             for (i=blk_y;i<(blk_y+4);i++)  
  787.               s3 += image[left[i].pos_y][left[i].pos_x];
  788.           if      (mb_available_up && mb_available_left[1])  
  789.             s  = (s1+s3+4) >> 3;
  790.           else if (mb_available_up)                          
  791.             s  = (s1   +2) >> 2;
  792.           else if (mb_available_left[1])                     
  793.             s  = (s3   +2) >> 2;
  794.           break;
  795.         }
  796.         //===== prediction =====
  797.         cur_pred = curr_mpr_16x16[DC_PRED_8];
  798.         for (j=block_y; j<block_y+4; j++)
  799.           for (i=block_x; i<block_x+4; i++)
  800.           {
  801.             cur_pred[j][i] = s;
  802.           }
  803.       }
  804.     }
  805.     // vertical prediction    
  806.     if (mb_available_up)
  807.     {
  808.       cur_pred = curr_mpr_16x16[VERT_PRED_8];
  809.       //memcpy(hline,&image[up.pos_y][up.pos_x], cr_MB_x * sizeof(imgpel));
  810.       hline = &image[up.pos_y][up.pos_x];
  811.       for (j=0; j<cr_MB_y; j++)
  812.         memcpy(cur_pred[j], hline, cr_MB_x * sizeof(imgpel));
  813.     }
  814.     // horizontal prediction
  815.     if (mb_available_left[0] && mb_available_left[1])
  816.     {
  817.       cur_pred = curr_mpr_16x16[HOR_PRED_8];
  818.       for (i=0; i<cr_MB_y; i++)
  819.         vline[i] = image[left[i+1].pos_y][left[i+1].pos_x];
  820.       for (j=0; j<cr_MB_y; j++)
  821.       {
  822.         int predictor = vline[j];
  823.         for (i=0; i<cr_MB_x; i++)        
  824.           cur_pred[j][i] = predictor;
  825.       }
  826.     }
  827.     // plane prediction
  828.     if (mb_available_left[0] && mb_available_left[1] && mb_available_up && mb_available_up_left)
  829.     {
  830.       ih = (cr_MB_x>>1)*(hline[cr_MB_x-1] - image[left[0].pos_y][left[0].pos_x]);
  831.       for (i=0;i<(cr_MB_x>>1)-1;i++)
  832.         ih += (i+1)*(hline[(cr_MB_x>>1)+i] - hline[(cr_MB_x>>1)-2-i]);
  833.       iv = (cr_MB_y>>1)*(vline[cr_MB_y-1] - image[left[0].pos_y][left[0].pos_x]);
  834.       for (i=0;i<(cr_MB_y>>1)-1;i++)
  835.         iv += (i+1)*(vline[(cr_MB_y>>1)+i] - vline[(cr_MB_y>>1)-2-i]);
  836.       ib= ((cr_MB_x == 8?17:5)*ih+2*cr_MB_x)>>(cr_MB_x == 8?5:6);
  837.       ic= ((cr_MB_y == 8?17:5)*iv+2*cr_MB_y)>>(cr_MB_y == 8?5:6);
  838.       iaa=16*(hline[cr_MB_x-1] + vline[cr_MB_y-1]);
  839.       cur_pred = curr_mpr_16x16[PLANE_8];
  840.       for (j=0; j<cr_MB_y; j++)
  841.         for (i=0; i<cr_MB_x; i++)
  842.           cur_pred[j][i]= iClip1( max_imgpel_value_uv, (iaa+(i-(cr_MB_x>>1)+1)*ib+(j-(cr_MB_y>>1)+1)*ic+16)>>5);
  843.     }
  844.   }
  845.   if (!params->rdopt)      // the rd-opt part does not work correctly (see encode_one_macroblock)
  846.   {                       // since ipredmodes could be overwritten => encoder-decoder-mismatches
  847.     // pick lowest cost prediction mode
  848.     min_cost = INT_MAX;
  849.     for (i=0;i<cr_MB_y;i++)
  850.     {
  851.       getNeighbour(currMB, 0 , i, img->mb_size[IS_CHROMA], &left[i]);
  852.     }
  853.     if ( img->MbaffFrameFlag && img->field_mode )
  854.     {
  855.       for (i=0;i<cr_MB_y;i++)
  856.       {
  857.         left[i].pos_y = left[i].pos_y >> 1;
  858.       }
  859.     }
  860.     for (mode=DC_PRED_8; mode<=PLANE_8; mode++)
  861.     {
  862.       if ((img->type != I_SLICE || !params->IntraDisableInterOnly) && params->ChromaIntraDisable == 1 && mode!=DC_PRED_8)
  863.         continue;
  864.       if ((mode==VERT_PRED_8 && !mb_available_up) ||
  865.         (mode==HOR_PRED_8 && (!mb_available_left[0] || !mb_available_left[1])) ||
  866.         (mode==PLANE_8 && (!mb_available_left[0] || !mb_available_left[1] || !mb_available_up || !mb_available_up_left)))
  867.         continue;
  868.       cost = 0;
  869.       for (uv = 1; uv < 3; uv++)
  870.       {
  871.         image = pImgOrg[uv];
  872.         curr_mpr_16x16 = img->mpr_16x16[uv];
  873.         for (block_y=0; block_y<cr_MB_y; block_y+=4)
  874.           for (block_x = 0; block_x < cr_MB_x; block_x += 4)
  875.           {
  876.             for (k=0, j = block_y; j < block_y + 4; j++)
  877.             {
  878.               img_prd = curr_mpr_16x16[mode][j];
  879.               img_org = &image[left[j].pos_y][left[j].pos_x];
  880.               for (i = block_x; i < block_x + 4; i++)
  881.                 diff[k++] = img_org[i] - img_prd[i];
  882.             }
  883.             cost += distortion4x4(diff);
  884.           }
  885.       }
  886.       if (cost < min_cost)
  887.       {
  888.         best_mode = mode;
  889.         min_cost = cost;
  890.       }
  891.     }
  892.     currMB->c_ipred_mode = best_mode;
  893.   }
  894. }
  895. void ComputeResidue (imgpel **curImg, imgpel mpr[16][16], int img_m7[16][16], int mb_y, int mb_x, int opix_y, int opix_x, int width, int height)
  896. {
  897.   static imgpel *imgOrg, *imgPred;
  898.   static int    *m7;
  899.   int i, j;
  900.   for (j = mb_y; j < mb_y + height; j++)
  901.   {
  902.     imgOrg = &curImg[opix_y + j][opix_x];    
  903.     imgPred = &mpr[j][mb_x];
  904.     m7 = &img_m7[j][mb_x]; 
  905.     for (i = 0; i < width; i++)
  906.     {
  907.       *m7++ = *imgOrg++ - *imgPred++;
  908.     }
  909.   }
  910. }
  911. void SampleReconstruct (imgpel **curImg, imgpel mpr[16][16], int img_m7[16][16], int mb_y, int mb_x, int opix_y, int opix_x, int width, int height, int max_imgpel_value, int dq_bits)
  912. {
  913.   static imgpel *imgOrg, *imgPred;
  914.   static int    *m7;
  915.   int i, j;
  916.   for (j = mb_y; j < mb_y + height; j++)
  917.   {
  918.     imgOrg = &curImg[opix_y + j][opix_x];
  919.     imgPred = &mpr[j][mb_x];
  920.     m7 = &img_m7[j][mb_x]; 
  921.     for (i=0;i<width;i++)
  922.       *imgOrg++ = iClip1( max_imgpel_value, rshift_rnd_sf(*m7++, dq_bits) + *imgPred++);
  923.   }
  924. }