motion_est_template.c
上传用户:wstnjxml
上传日期:2014-04-03
资源大小:7248k
文件大小:38k
源码类别:

Windows CE

开发平台:

C/C++

  1. /*
  2.  * Motion estimation 
  3.  * Copyright (c) 2002-2004 Michael Niedermayer
  4.  *
  5.  * This library is free software; you can redistribute it and/or
  6.  * modify it under the terms of the GNU Lesser General Public
  7.  * License as published by the Free Software Foundation; either
  8.  * version 2 of the License, or (at your option) any later version.
  9.  *
  10.  * This library is distributed in the hope that it will be useful,
  11.  * but WITHOUT ANY WARRANTY; without even the implied warranty of
  12.  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
  13.  * Lesser General Public License for more details.
  14.  *
  15.  * You should have received a copy of the GNU Lesser General Public
  16.  * License along with this library; if not, write to the Free Software
  17.  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
  18.  *
  19.  */
  20.  
  21. /**
  22.  * @file motion_est_template.c
  23.  * Motion estimation template.
  24.  */
  25. //lets hope gcc will remove the unused vars ...(gcc 3.2.2 seems to do it ...)
  26. #define LOAD_COMMON
  27.     uint32_t attribute_unused * const score_map= c->score_map;
  28.     const int attribute_unused xmin= c->xmin;
  29.     const int attribute_unused ymin= c->ymin;
  30.     const int attribute_unused xmax= c->xmax;
  31.     const int attribute_unused ymax= c->ymax;
  32.     uint8_t *mv_penalty= c->current_mv_penalty;
  33.     const int pred_x= c->pred_x;
  34.     const int pred_y= c->pred_y;
  35. #define CHECK_HALF_MV(dx, dy, x, y)
  36. {
  37.     const int hx= 2*(x)+(dx);
  38.     const int hy= 2*(y)+(dy);
  39.     d= cmp(s, x, y, dx, dy, size, h, ref_index, src_index, cmp_sub, chroma_cmp_sub, flags);
  40.     d += (mv_penalty[hx - pred_x] + mv_penalty[hy - pred_y])*penalty_factor;
  41.     COPY3_IF_LT(dmin, d, bx, hx, by, hy)
  42. }
  43. #if 0
  44. static int hpel_motion_search)(MpegEncContext * s,
  45.   int *mx_ptr, int *my_ptr, int dmin,
  46.                                   uint8_t *ref_data[3], 
  47.                                   int size)
  48. {
  49.     const int xx = 16 * s->mb_x + 8*(n&1);
  50.     const int yy = 16 * s->mb_y + 8*(n>>1);
  51.     const int mx = *mx_ptr;
  52.     const int my = *my_ptr;
  53.     const int penalty_factor= c->sub_penalty_factor;
  54.     
  55.     LOAD_COMMON
  56.     
  57.  //   INIT;
  58.  //FIXME factorize
  59.     me_cmp_func cmp, chroma_cmp, cmp_sub, chroma_cmp_sub;
  60.     if(s->no_rounding /*FIXME b_type*/){
  61.         hpel_put= &s->dsp.put_no_rnd_pixels_tab[size];
  62.         chroma_hpel_put= &s->dsp.put_no_rnd_pixels_tab[size+1];
  63.     }else{
  64.         hpel_put=& s->dsp.put_pixels_tab[size];
  65.         chroma_hpel_put= &s->dsp.put_pixels_tab[size+1];
  66.     }
  67.     cmpf= s->dsp.me_cmp[size];
  68.     chroma_cmpf= s->dsp.me_cmp[size+1];
  69.     cmp_sub= s->dsp.me_sub_cmp[size];
  70.     chroma_cmp_sub= s->dsp.me_sub_cmp[size+1];
  71.     if(c->skip){ //FIXME somehow move up (benchmark)
  72.         *mx_ptr = 0;
  73.         *my_ptr = 0;
  74.         return dmin;
  75.     }
  76.         
  77.     if(c->avctx->me_cmp != c->avctx->me_sub_cmp){
  78.         CMP_HPEL(dmin, 0, 0, mx, my, size);
  79.         if(mx || my)
  80.             dmin += (mv_penalty[2*mx - pred_x] + mv_penalty[2*my - pred_y])*penalty_factor;
  81.     }
  82.         
  83.     if (mx > xmin && mx < xmax && 
  84.         my > ymin && my < ymax) {
  85.         int bx=2*mx, by=2*my;
  86.         int d= dmin;
  87.         
  88.         CHECK_HALF_MV(1, 1, mx-1, my-1)
  89.         CHECK_HALF_MV(0, 1, mx  , my-1)        
  90.         CHECK_HALF_MV(1, 1, mx  , my-1)
  91.         CHECK_HALF_MV(1, 0, mx-1, my  )
  92.         CHECK_HALF_MV(1, 0, mx  , my  )
  93.         CHECK_HALF_MV(1, 1, mx-1, my  )
  94.         CHECK_HALF_MV(0, 1, mx  , my  )        
  95.         CHECK_HALF_MV(1, 1, mx  , my  )
  96.         assert(bx >= xmin*2 || bx <= xmax*2 || by >= ymin*2 || by <= ymax*2);
  97.         *mx_ptr = bx;
  98.         *my_ptr = by;
  99.     }else{
  100.         *mx_ptr =2*mx;
  101.         *my_ptr =2*my;
  102.     }
  103.     return dmin;
  104. }
  105. #else
  106. static int hpel_motion_search(MpegEncContext * s,
  107.   int *mx_ptr, int *my_ptr, int dmin,
  108.                                   int src_index, int ref_index,
  109.                                   int size, int h)
  110. {
  111.     MotionEstContext * const c= &s->me;
  112.     const int mx = *mx_ptr;
  113.     const int my = *my_ptr;   
  114.     const int penalty_factor= c->sub_penalty_factor;
  115.     me_cmp_func cmp_sub, chroma_cmp_sub;
  116.     int bx=2*mx, by=2*my;
  117.     LOAD_COMMON
  118.     int flags= c->sub_flags;
  119.     
  120.  //FIXME factorize
  121.     cmp_sub= s->dsp.me_sub_cmp[size];
  122.     chroma_cmp_sub= s->dsp.me_sub_cmp[size+1];
  123.     if(c->skip){ //FIXME move out of hpel?
  124.         *mx_ptr = 0;
  125.         *my_ptr = 0;
  126.         return dmin;
  127.     }
  128.         
  129.     if(c->avctx->me_cmp != c->avctx->me_sub_cmp){
  130.         dmin= cmp(s, mx, my, 0, 0, size, h, ref_index, src_index, cmp_sub, chroma_cmp_sub, flags);
  131.         if(mx || my || size>0)
  132.             dmin += (mv_penalty[2*mx - pred_x] + mv_penalty[2*my - pred_y])*penalty_factor;
  133.     }
  134.         
  135.     if (mx > xmin && mx < xmax && 
  136.         my > ymin && my < ymax) {
  137.         int d= dmin;
  138.         const int index= (my<<ME_MAP_SHIFT) + mx;
  139.         const int t= score_map[(index-(1<<ME_MAP_SHIFT))&(ME_MAP_SIZE-1)] 
  140.                      + (mv_penalty[bx   - pred_x] + mv_penalty[by-2 - pred_y])*c->penalty_factor;
  141.         const int l= score_map[(index- 1               )&(ME_MAP_SIZE-1)]
  142.                      + (mv_penalty[bx-2 - pred_x] + mv_penalty[by   - pred_y])*c->penalty_factor;
  143.         const int r= score_map[(index+ 1               )&(ME_MAP_SIZE-1)]
  144.                      + (mv_penalty[bx+2 - pred_x] + mv_penalty[by   - pred_y])*c->penalty_factor;
  145.         const int b= score_map[(index+(1<<ME_MAP_SHIFT))&(ME_MAP_SIZE-1)]
  146.                      + (mv_penalty[bx   - pred_x] + mv_penalty[by+2 - pred_y])*c->penalty_factor;
  147.     
  148. #if 1
  149.         int key;
  150.         int map_generation= c->map_generation;
  151. #ifndef NDEBUG
  152.         uint32_t *map= c->map;
  153. #endif
  154.         key= ((my-1)<<ME_MAP_MV_BITS) + (mx) + map_generation;
  155.         assert(map[(index-(1<<ME_MAP_SHIFT))&(ME_MAP_SIZE-1)] == key);
  156.         key= ((my+1)<<ME_MAP_MV_BITS) + (mx) + map_generation;
  157.         assert(map[(index+(1<<ME_MAP_SHIFT))&(ME_MAP_SIZE-1)] == key);
  158.         key= ((my)<<ME_MAP_MV_BITS) + (mx+1) + map_generation;
  159.         assert(map[(index+1)&(ME_MAP_SIZE-1)] == key);
  160.         key= ((my)<<ME_MAP_MV_BITS) + (mx-1) + map_generation;
  161.         assert(map[(index-1)&(ME_MAP_SIZE-1)] == key);
  162. #endif                
  163.         if(t<=b){
  164.             CHECK_HALF_MV(0, 1, mx  ,my-1)
  165.             if(l<=r){
  166.                 CHECK_HALF_MV(1, 1, mx-1, my-1)
  167.                 if(t+r<=b+l){
  168.                     CHECK_HALF_MV(1, 1, mx  , my-1)
  169.                 }else{
  170.                     CHECK_HALF_MV(1, 1, mx-1, my  )
  171.                 }
  172.                 CHECK_HALF_MV(1, 0, mx-1, my  )
  173.             }else{
  174.                 CHECK_HALF_MV(1, 1, mx  , my-1)
  175.                 if(t+l<=b+r){
  176.                     CHECK_HALF_MV(1, 1, mx-1, my-1)
  177.                 }else{
  178.                     CHECK_HALF_MV(1, 1, mx  , my  )
  179.                 }
  180.                 CHECK_HALF_MV(1, 0, mx  , my  )
  181.             }
  182.         }else{
  183.             if(l<=r){
  184.                 if(t+l<=b+r){
  185.                     CHECK_HALF_MV(1, 1, mx-1, my-1)
  186.                 }else{
  187.                     CHECK_HALF_MV(1, 1, mx  , my  )
  188.                 }
  189.                 CHECK_HALF_MV(1, 0, mx-1, my)
  190.                 CHECK_HALF_MV(1, 1, mx-1, my)
  191.             }else{
  192.                 if(t+r<=b+l){
  193.                     CHECK_HALF_MV(1, 1, mx  , my-1)
  194.                 }else{
  195.                     CHECK_HALF_MV(1, 1, mx-1, my)
  196.                 }
  197.                 CHECK_HALF_MV(1, 0, mx  , my)
  198.                 CHECK_HALF_MV(1, 1, mx  , my)
  199.             }
  200.             CHECK_HALF_MV(0, 1, mx  , my)
  201.         }
  202.         assert(bx >= xmin*2 && bx <= xmax*2 && by >= ymin*2 && by <= ymax*2);
  203.     }
  204.     *mx_ptr = bx;
  205.     *my_ptr = by;
  206.     
  207.     return dmin;
  208. }
  209. #endif
  210. static int no_sub_motion_search(MpegEncContext * s,
  211.           int *mx_ptr, int *my_ptr, int dmin,
  212.                                   int src_index, int ref_index,
  213.                                   int size, int h)
  214. {
  215.     (*mx_ptr)<<=1;
  216.     (*my_ptr)<<=1;
  217.     return dmin;
  218. }
  219. int inline ff_get_mb_score(MpegEncContext * s, int mx, int my, int src_index,
  220.                                int ref_index, int size, int h, int add_rate)
  221. {
  222. //    const int check_luma= s->dsp.me_sub_cmp != s->dsp.mb_cmp;
  223.     MotionEstContext * const c= &s->me;
  224.     const int penalty_factor= c->mb_penalty_factor;
  225.     const int flags= c->mb_flags;
  226.     const int qpel= flags & FLAG_QPEL;
  227.     const int mask= 1+2*qpel;
  228.     me_cmp_func cmp_sub, chroma_cmp_sub;
  229.     int d;
  230.     LOAD_COMMON
  231.     
  232.  //FIXME factorize
  233.     cmp_sub= s->dsp.mb_cmp[size];
  234.     chroma_cmp_sub= s->dsp.mb_cmp[size+1];
  235.     
  236. //    assert(!c->skip);
  237. //    assert(c->avctx->me_sub_cmp != c->avctx->mb_cmp);
  238.     d= cmp(s, mx>>(qpel+1), my>>(qpel+1), mx&mask, my&mask, size, h, ref_index, src_index, cmp_sub, chroma_cmp_sub, flags);
  239.     //FIXME check cbp before adding penalty for (0,0) vector
  240.     if(add_rate && (mx || my || size>0))
  241.         d += (mv_penalty[mx - pred_x] + mv_penalty[my - pred_y])*penalty_factor;
  242.         
  243.     return d;
  244. }
  245. #define CHECK_QUARTER_MV(dx, dy, x, y)
  246. {
  247.     const int hx= 4*(x)+(dx);
  248.     const int hy= 4*(y)+(dy);
  249.     d= cmp(s, x, y, dx, dy, size, h, ref_index, src_index, cmpf, chroma_cmpf, flags);
  250.     d += (mv_penalty[hx - pred_x] + mv_penalty[hy - pred_y])*penalty_factor;
  251.     COPY3_IF_LT(dmin, d, bx, hx, by, hy)
  252. }
  253. static int qpel_motion_search(MpegEncContext * s,
  254.   int *mx_ptr, int *my_ptr, int dmin,
  255.                                   int src_index, int ref_index,                                  
  256.                                   int size, int h)
  257. {
  258.     MotionEstContext * const c= &s->me;
  259.     const int mx = *mx_ptr;
  260.     const int my = *my_ptr;   
  261.     const int penalty_factor= c->sub_penalty_factor;
  262.     const int map_generation= c->map_generation;
  263.     const int subpel_quality= c->avctx->me_subpel_quality;
  264.     uint32_t *map= c->map;
  265.     me_cmp_func cmpf, chroma_cmpf;
  266.     me_cmp_func cmp_sub, chroma_cmp_sub;
  267.     LOAD_COMMON
  268.     int flags= c->sub_flags;
  269.     
  270.     cmpf= s->dsp.me_cmp[size];
  271.     chroma_cmpf= s->dsp.me_cmp[size+1]; //factorize FIXME
  272.  //FIXME factorize
  273.     cmp_sub= s->dsp.me_sub_cmp[size];
  274.     chroma_cmp_sub= s->dsp.me_sub_cmp[size+1];
  275.     if(c->skip){ //FIXME somehow move up (benchmark)
  276.         *mx_ptr = 0;
  277.         *my_ptr = 0;
  278.         return dmin;
  279.     }
  280.         
  281.     if(c->avctx->me_cmp != c->avctx->me_sub_cmp){
  282.         dmin= cmp(s, mx, my, 0, 0, size, h, ref_index, src_index, cmp_sub, chroma_cmp_sub, flags);
  283.         if(mx || my || size>0)
  284.             dmin += (mv_penalty[4*mx - pred_x] + mv_penalty[4*my - pred_y])*penalty_factor;
  285.     }
  286.         
  287.     if (mx > xmin && mx < xmax && 
  288.         my > ymin && my < ymax) {
  289.         int bx=4*mx, by=4*my;
  290.         int d= dmin;
  291.         int i, nx, ny;
  292.         const int index= (my<<ME_MAP_SHIFT) + mx;
  293.         const int t= score_map[(index-(1<<ME_MAP_SHIFT)  )&(ME_MAP_SIZE-1)];
  294.         const int l= score_map[(index- 1                 )&(ME_MAP_SIZE-1)];
  295.         const int r= score_map[(index+ 1                 )&(ME_MAP_SIZE-1)];
  296.         const int b= score_map[(index+(1<<ME_MAP_SHIFT)  )&(ME_MAP_SIZE-1)];
  297.         const int c= score_map[(index                    )&(ME_MAP_SIZE-1)];
  298.         int best[8];
  299.         int best_pos[8][2];
  300.         
  301.         memset(best, 64, sizeof(int)*8);
  302. #if 1
  303.         if(s->me.dia_size>=2){        
  304.             const int tl= score_map[(index-(1<<ME_MAP_SHIFT)-1)&(ME_MAP_SIZE-1)];
  305.             const int bl= score_map[(index+(1<<ME_MAP_SHIFT)-1)&(ME_MAP_SIZE-1)];
  306.             const int tr= score_map[(index-(1<<ME_MAP_SHIFT)+1)&(ME_MAP_SIZE-1)];
  307.             const int br= score_map[(index+(1<<ME_MAP_SHIFT)+1)&(ME_MAP_SIZE-1)];
  308.             for(ny= -3; ny <= 3; ny++){
  309.                 for(nx= -3; nx <= 3; nx++){
  310.                     //FIXME this could overflow (unlikely though)
  311.                     const int64_t t2= nx*nx*(tr + tl - 2*t) + 4*nx*(tr-tl) + 32*t;
  312.                     const int64_t c2= nx*nx*( r +  l - 2*c) + 4*nx*( r- l) + 32*c;
  313.                     const int64_t b2= nx*nx*(br + bl - 2*b) + 4*nx*(br-bl) + 32*b;
  314.                     int score= (ny*ny*(b2 + t2 - 2*c2) + 4*ny*(b2 - t2) + 32*c2 + 512)>>10;
  315.                     int i;
  316.                     
  317.                     if((nx&3)==0 && (ny&3)==0) continue;
  318.                     
  319.                     score += (mv_penalty[4*mx + nx - pred_x] + mv_penalty[4*my + ny - pred_y])*penalty_factor;
  320.                     
  321. //                    if(nx&1) score-=1024*c->penalty_factor;
  322. //                    if(ny&1) score-=1024*c->penalty_factor;
  323.                     
  324.                     for(i=0; i<8; i++){
  325.                         if(score < best[i]){
  326.                             memmove(&best[i+1], &best[i], sizeof(int)*(7-i));
  327.                             memmove(&best_pos[i+1][0], &best_pos[i][0], sizeof(int)*2*(7-i));
  328.                             best[i]= score;
  329.                             best_pos[i][0]= nx + 4*mx;
  330.                             best_pos[i][1]= ny + 4*my;
  331.                             break;
  332.                         }
  333.                     }
  334.                 }
  335.             }
  336.         }else{
  337.             int tl;
  338.             //FIXME this could overflow (unlikely though)
  339.             const int cx = 4*(r - l);
  340.             const int cx2= r + l - 2*c; 
  341.             const int cy = 4*(b - t);
  342.             const int cy2= b + t - 2*c;
  343.             int cxy;
  344.               
  345.             if(map[(index-(1<<ME_MAP_SHIFT)-1)&(ME_MAP_SIZE-1)] == (my<<ME_MAP_MV_BITS) + mx + map_generation && 0){ //FIXME
  346.                 tl= score_map[(index-(1<<ME_MAP_SHIFT)-1)&(ME_MAP_SIZE-1)];
  347.             }else{
  348.                 tl= cmp(s, mx-1, my-1, 0, 0, size, h, ref_index, src_index, cmpf, chroma_cmpf, flags);//FIXME wrong if chroma me is different
  349.             }
  350.             
  351.             cxy= 2*tl + (cx + cy)/4 - (cx2 + cy2) - 2*c; 
  352.            
  353.             assert(16*cx2 + 4*cx + 32*c == 32*r);
  354.             assert(16*cx2 - 4*cx + 32*c == 32*l);
  355.             assert(16*cy2 + 4*cy + 32*c == 32*b);
  356.             assert(16*cy2 - 4*cy + 32*c == 32*t);
  357.             assert(16*cxy + 16*cy2 + 16*cx2 - 4*cy - 4*cx + 32*c == 32*tl);
  358.             
  359.             for(ny= -3; ny <= 3; ny++){
  360.                 for(nx= -3; nx <= 3; nx++){
  361.                     //FIXME this could overflow (unlikely though)
  362.                     int score= ny*nx*cxy + nx*nx*cx2 + ny*ny*cy2 + nx*cx + ny*cy + 32*c; //FIXME factor
  363.                     int i;
  364.                     
  365.                     if((nx&3)==0 && (ny&3)==0) continue;
  366.                 
  367.                     score += 32*(mv_penalty[4*mx + nx - pred_x] + mv_penalty[4*my + ny - pred_y])*penalty_factor;
  368. //                    if(nx&1) score-=32*c->penalty_factor;
  369.   //                  if(ny&1) score-=32*c->penalty_factor;
  370.                     
  371.                     for(i=0; i<8; i++){
  372.                         if(score < best[i]){
  373.                             memmove(&best[i+1], &best[i], sizeof(int)*(7-i));
  374.                             memmove(&best_pos[i+1][0], &best_pos[i][0], sizeof(int)*2*(7-i));
  375.                             best[i]= score;
  376.                             best_pos[i][0]= nx + 4*mx;
  377.                             best_pos[i][1]= ny + 4*my;
  378.                             break;
  379.                         }
  380.                     }
  381.                 }
  382.             }            
  383.         }
  384.         for(i=0; i<subpel_quality; i++){
  385.             nx= best_pos[i][0];
  386.             ny= best_pos[i][1];
  387.             CHECK_QUARTER_MV(nx&3, ny&3, nx>>2, ny>>2)
  388.         }
  389. #if 0
  390.             const int tl= score_map[(index-(1<<ME_MAP_SHIFT)-1)&(ME_MAP_SIZE-1)];
  391.             const int bl= score_map[(index+(1<<ME_MAP_SHIFT)-1)&(ME_MAP_SIZE-1)];
  392.             const int tr= score_map[(index-(1<<ME_MAP_SHIFT)+1)&(ME_MAP_SIZE-1)];
  393.             const int br= score_map[(index+(1<<ME_MAP_SHIFT)+1)&(ME_MAP_SIZE-1)];
  394. //            if(l < r && l < t && l < b && l < tl && l < bl && l < tr && l < br && bl < tl){
  395.             if(tl<br){
  396. //            nx= FFMAX(4*mx - bx, bx - 4*mx);
  397. //            ny= FFMAX(4*my - by, by - 4*my);
  398.             
  399.             static int stats[7][7], count;
  400.             count++;
  401.             stats[4*mx - bx + 3][4*my - by + 3]++;
  402.             if(256*256*256*64 % count ==0){
  403.                 for(i=0; i<49; i++){
  404.                     if((i%7)==0) printf("n");
  405.                     printf("%6d ", stats[0][i]);
  406.                 }
  407.                 printf("n");
  408.             }
  409.             }
  410. #endif
  411. #else
  412.         CHECK_QUARTER_MV(2, 2, mx-1, my-1)
  413.         CHECK_QUARTER_MV(0, 2, mx  , my-1)        
  414.         CHECK_QUARTER_MV(2, 2, mx  , my-1)
  415.         CHECK_QUARTER_MV(2, 0, mx  , my  )
  416.         CHECK_QUARTER_MV(2, 2, mx  , my  )
  417.         CHECK_QUARTER_MV(0, 2, mx  , my  )
  418.         CHECK_QUARTER_MV(2, 2, mx-1, my  )
  419.         CHECK_QUARTER_MV(2, 0, mx-1, my  )
  420.         
  421.         nx= bx;
  422.         ny= by;
  423.         
  424.         for(i=0; i<8; i++){
  425.             int ox[8]= {0, 1, 1, 1, 0,-1,-1,-1};
  426.             int oy[8]= {1, 1, 0,-1,-1,-1, 0, 1};
  427.             CHECK_QUARTER_MV((nx + ox[i])&3, (ny + oy[i])&3, (nx + ox[i])>>2, (ny + oy[i])>>2)
  428.         }
  429. #endif
  430. #if 0
  431.         //outer ring
  432.         CHECK_QUARTER_MV(1, 3, mx-1, my-1)
  433.         CHECK_QUARTER_MV(1, 2, mx-1, my-1)
  434.         CHECK_QUARTER_MV(1, 1, mx-1, my-1)
  435.         CHECK_QUARTER_MV(2, 1, mx-1, my-1)
  436.         CHECK_QUARTER_MV(3, 1, mx-1, my-1)
  437.         CHECK_QUARTER_MV(0, 1, mx  , my-1)
  438.         CHECK_QUARTER_MV(1, 1, mx  , my-1)
  439.         CHECK_QUARTER_MV(2, 1, mx  , my-1)
  440.         CHECK_QUARTER_MV(3, 1, mx  , my-1)
  441.         CHECK_QUARTER_MV(3, 2, mx  , my-1)
  442.         CHECK_QUARTER_MV(3, 3, mx  , my-1)
  443.         CHECK_QUARTER_MV(3, 0, mx  , my  )
  444.         CHECK_QUARTER_MV(3, 1, mx  , my  )
  445.         CHECK_QUARTER_MV(3, 2, mx  , my  )
  446.         CHECK_QUARTER_MV(3, 3, mx  , my  )
  447.         CHECK_QUARTER_MV(2, 3, mx  , my  )
  448.         CHECK_QUARTER_MV(1, 3, mx  , my  )
  449.         CHECK_QUARTER_MV(0, 3, mx  , my  )
  450.         CHECK_QUARTER_MV(3, 3, mx-1, my  )
  451.         CHECK_QUARTER_MV(2, 3, mx-1, my  )
  452.         CHECK_QUARTER_MV(1, 3, mx-1, my  )
  453.         CHECK_QUARTER_MV(1, 2, mx-1, my  )
  454.         CHECK_QUARTER_MV(1, 1, mx-1, my  )
  455.         CHECK_QUARTER_MV(1, 0, mx-1, my  )
  456. #endif
  457.         assert(bx >= xmin*4 && bx <= xmax*4 && by >= ymin*4 && by <= ymax*4);
  458.         *mx_ptr = bx;
  459.         *my_ptr = by;
  460.     }else{
  461.         *mx_ptr =4*mx;
  462.         *my_ptr =4*my;
  463.     }
  464.     return dmin;
  465. }
  466. #define CHECK_MV(x,y)
  467. {
  468.     const int key= ((y)<<ME_MAP_MV_BITS) + (x) + map_generation;
  469.     const int index= (((y)<<ME_MAP_SHIFT) + (x))&(ME_MAP_SIZE-1);
  470.     assert((x) >= xmin);
  471.     assert((x) <= xmax);
  472.     assert((y) >= ymin);
  473.     assert((y) <= ymax);
  474. /*printf("check_mv %d %dn", x, y);*/
  475.     if(map[index]!=key){
  476.         d= cmp(s, x, y, 0, 0, size, h, ref_index, src_index, cmpf, chroma_cmpf, flags);
  477.         map[index]= key;
  478.         score_map[index]= d;
  479.         d += (mv_penalty[((x)<<shift)-pred_x] + mv_penalty[((y)<<shift)-pred_y])*penalty_factor;
  480. /*printf("score:%dn", d);*/
  481.         COPY3_IF_LT(dmin, d, best[0], x, best[1], y)
  482.     }
  483. }
  484. #define CHECK_CLIPED_MV(ax,ay)
  485. {
  486.     const int x= ax;
  487.     const int y= ay;
  488.     const int x2= FFMAX(xmin, FFMIN(x, xmax));
  489.     const int y2= FFMAX(ymin, FFMIN(y, ymax));
  490.     CHECK_MV(x2, y2)
  491. }
  492. #define CHECK_MV_DIR(x,y,new_dir)
  493. {
  494.     const int key= ((y)<<ME_MAP_MV_BITS) + (x) + map_generation;
  495.     const int index= (((y)<<ME_MAP_SHIFT) + (x))&(ME_MAP_SIZE-1);
  496. /*printf("check_mv_dir %d %d %dn", x, y, new_dir);*/
  497.     if(map[index]!=key){
  498.         d= cmp(s, x, y, 0, 0, size, h, ref_index, src_index, cmpf, chroma_cmpf, flags);
  499.         map[index]= key;
  500.         score_map[index]= d;
  501.         d += (mv_penalty[((x)<<shift)-pred_x] + mv_penalty[((y)<<shift)-pred_y])*penalty_factor;
  502. /*printf("score:%dn", d);*/
  503.         if(d<dmin){
  504.             best[0]=x;
  505.             best[1]=y;
  506.             dmin=d;
  507.             next_dir= new_dir;
  508.         }
  509.     }
  510. }
  511. #define check(x,y,S,v)
  512. if( (x)<(xmin<<(S)) ) printf("%d %d %d %d %d xmin" #v, xmin, (x), (y), s->mb_x, s->mb_y);
  513. if( (x)>(xmax<<(S)) ) printf("%d %d %d %d %d xmax" #v, xmax, (x), (y), s->mb_x, s->mb_y);
  514. if( (y)<(ymin<<(S)) ) printf("%d %d %d %d %d ymin" #v, ymin, (x), (y), s->mb_x, s->mb_y);
  515. if( (y)>(ymax<<(S)) ) printf("%d %d %d %d %d ymax" #v, ymax, (x), (y), s->mb_x, s->mb_y);
  516. #define LOAD_COMMON2
  517.     uint32_t *map= c->map;
  518.     const int qpel= flags&FLAG_QPEL;
  519.     const int shift= 1+qpel;
  520. static always_inline int small_diamond_search(MpegEncContext * s, int *best, int dmin,
  521.                                        int src_index, int ref_index, int const penalty_factor,
  522.                                        int size, int h, int flags)
  523. {
  524.     MotionEstContext * const c= &s->me;
  525.     me_cmp_func cmpf, chroma_cmpf;
  526.     int next_dir=-1;
  527.     LOAD_COMMON
  528.     LOAD_COMMON2
  529.     int map_generation= c->map_generation;
  530.     
  531.     cmpf= s->dsp.me_cmp[size];
  532.     chroma_cmpf= s->dsp.me_cmp[size+1];
  533.     { /* ensure that the best point is in the MAP as h/qpel refinement needs it */
  534.         const int key= (best[1]<<ME_MAP_MV_BITS) + best[0] + map_generation;
  535.         const int index= ((best[1]<<ME_MAP_SHIFT) + best[0])&(ME_MAP_SIZE-1);
  536.         if(map[index]!=key){ //this will be executed only very rarey
  537.             score_map[index]= cmp(s, best[0], best[1], 0, 0, size, h, ref_index, src_index, cmpf, chroma_cmpf, flags);
  538.             map[index]= key;
  539.         }
  540.     }
  541.     for(;;){
  542.         int d;
  543.         const int dir= next_dir;
  544.         const int x= best[0];
  545.         const int y= best[1];
  546.         next_dir=-1;
  547. //printf("%d", dir);
  548.         if(dir!=2 && x>xmin) CHECK_MV_DIR(x-1, y  , 0)
  549.         if(dir!=3 && y>ymin) CHECK_MV_DIR(x  , y-1, 1)
  550.         if(dir!=0 && x<xmax) CHECK_MV_DIR(x+1, y  , 2)
  551.         if(dir!=1 && y<ymax) CHECK_MV_DIR(x  , y+1, 3)
  552.         if(next_dir==-1){
  553.             return dmin;
  554.         }
  555.     }
  556. }
  557. static int funny_diamond_search(MpegEncContext * s, int *best, int dmin,
  558.                                        int src_index, int ref_index, int const penalty_factor,
  559.                                        int size, int h, int flags)
  560. {
  561.     MotionEstContext * const c= &s->me;
  562.     me_cmp_func cmpf, chroma_cmpf;
  563.     int dia_size;
  564.     LOAD_COMMON
  565.     LOAD_COMMON2
  566.     int map_generation= c->map_generation;
  567.     
  568.     cmpf= s->dsp.me_cmp[size];
  569.     chroma_cmpf= s->dsp.me_cmp[size+1];
  570.     for(dia_size=1; dia_size<=4; dia_size++){
  571.         int dir;
  572.         const int x= best[0];
  573.         const int y= best[1];
  574.         
  575.         if(dia_size&(dia_size-1)) continue;
  576.         if(   x + dia_size > xmax
  577.            || x - dia_size < xmin
  578.            || y + dia_size > ymax
  579.            || y - dia_size < ymin)
  580.            continue;
  581.         
  582.         for(dir= 0; dir<dia_size; dir+=2){
  583.             int d;
  584.             CHECK_MV(x + dir           , y + dia_size - dir);
  585.             CHECK_MV(x + dia_size - dir, y - dir           );
  586.             CHECK_MV(x - dir           , y - dia_size + dir);
  587.             CHECK_MV(x - dia_size + dir, y + dir           );
  588.         }
  589.         if(x!=best[0] || y!=best[1])
  590.             dia_size=0;
  591. #if 0
  592. {
  593. int dx, dy, i;
  594. static int stats[8*8];
  595. dx= ABS(x-best[0]);
  596. dy= ABS(y-best[1]);
  597. if(dy>dx){
  598.     dx^=dy; dy^=dx; dx^=dy;
  599. }
  600. stats[dy*8 + dx] ++;
  601. if(256*256*256*64 % (stats[0]+1)==0){
  602.     for(i=0; i<64; i++){
  603.         if((i&7)==0) printf("n");
  604.         printf("%8d ", stats[i]);
  605.     }
  606.     printf("n");
  607. }
  608. }
  609. #endif
  610.     }
  611.     return dmin;    
  612. }
  613. #define SAB_CHECK_MV(ax,ay)
  614. {
  615.     const int key= ((ay)<<ME_MAP_MV_BITS) + (ax) + map_generation;
  616.     const int index= (((ay)<<ME_MAP_SHIFT) + (ax))&(ME_MAP_SIZE-1);
  617. /*printf("sab check %d %dn", ax, ay);*/
  618.     if(map[index]!=key){
  619.         d= cmp(s, ax, ay, 0, 0, size, h, ref_index, src_index, cmpf, chroma_cmpf, flags);
  620.         map[index]= key;
  621.         score_map[index]= d;
  622.         d += (mv_penalty[((ax)<<shift)-pred_x] + mv_penalty[((ay)<<shift)-pred_y])*penalty_factor;
  623. /*printf("score: %dn", d);*/
  624.         if(d < minima[minima_count-1].height){
  625.             int j=0;
  626.             
  627.             while(d >= minima[j].height) j++;
  628.             memmove(&minima [j+1], &minima [j], (minima_count - j - 1)*sizeof(Minima));
  629.             minima[j].checked= 0;
  630.             minima[j].height= d;
  631.             minima[j].x= ax;
  632.             minima[j].y= ay;
  633.             
  634.             i=-1;
  635.             continue;
  636.         }
  637.     }
  638. }
  639. #define MAX_SAB_SIZE ME_MAP_SIZE
  640. static int sab_diamond_search(MpegEncContext * s, int *best, int dmin,
  641.                                        int src_index, int ref_index, int const penalty_factor,
  642.                                        int size, int h, int flags)
  643. {
  644.     MotionEstContext * const c= &s->me;
  645.     me_cmp_func cmpf, chroma_cmpf;
  646.     Minima minima[MAX_SAB_SIZE];
  647.     const int minima_count= ABS(c->dia_size);
  648.     int i, j;
  649.     LOAD_COMMON
  650.     LOAD_COMMON2
  651.     int map_generation= c->map_generation;
  652.     
  653.     cmpf= s->dsp.me_cmp[size];
  654.     chroma_cmpf= s->dsp.me_cmp[size+1];
  655.     
  656.     for(j=i=0; i<ME_MAP_SIZE; i++){
  657.         uint32_t key= map[i];
  658.         key += (1<<(ME_MAP_MV_BITS-1)) + (1<<(2*ME_MAP_MV_BITS-1));
  659.         
  660.         if((key&((-1)<<(2*ME_MAP_MV_BITS))) != map_generation) continue;
  661.         
  662.         assert(j<MAX_SAB_SIZE); //max j = number of predictors
  663.         
  664.         minima[j].height= score_map[i];
  665.         minima[j].x= key & ((1<<ME_MAP_MV_BITS)-1); key>>=ME_MAP_MV_BITS;
  666.         minima[j].y= key & ((1<<ME_MAP_MV_BITS)-1);
  667.         minima[j].x-= (1<<(ME_MAP_MV_BITS-1));
  668.         minima[j].y-= (1<<(ME_MAP_MV_BITS-1));
  669.         minima[j].checked=0;
  670.         if(minima[j].x || minima[j].y)
  671.             minima[j].height+= (mv_penalty[((minima[j].x)<<shift)-pred_x] + mv_penalty[((minima[j].y)<<shift)-pred_y])*penalty_factor;
  672.         
  673.         j++;
  674.     }
  675.     
  676.     qsort(minima, j, sizeof(Minima), minima_cmp);
  677.     
  678.     for(; j<minima_count; j++){
  679.         minima[j].height=256*256*256*64;
  680.         minima[j].checked=0;
  681.         minima[j].x= minima[j].y=0;
  682.     }
  683.     
  684.     for(i=0; i<minima_count; i++){
  685.         const int x= minima[i].x;
  686.         const int y= minima[i].y;
  687.         int d;
  688.         
  689.         if(minima[i].checked) continue;
  690.         
  691.         if(   x >= xmax || x <= xmin
  692.            || y >= ymax || y <= ymin)
  693.            continue;
  694.         SAB_CHECK_MV(x-1, y)
  695.         SAB_CHECK_MV(x+1, y)
  696.         SAB_CHECK_MV(x  , y-1)
  697.         SAB_CHECK_MV(x  , y+1)
  698.         
  699.         minima[i].checked= 1;
  700.     }
  701.     
  702.     best[0]= minima[0].x;
  703.     best[1]= minima[0].y;
  704.     dmin= minima[0].height;
  705.     
  706.     if(   best[0] < xmax && best[0] > xmin
  707.        && best[1] < ymax && best[1] > ymin){
  708.         int d;
  709.         //ensure that the refernece samples for hpel refinement are in the map
  710.         CHECK_MV(best[0]-1, best[1])
  711.         CHECK_MV(best[0]+1, best[1])
  712.         CHECK_MV(best[0], best[1]-1)
  713.         CHECK_MV(best[0], best[1]+1)
  714.     }
  715.     return dmin;    
  716. }
  717. static int var_diamond_search(MpegEncContext * s, int *best, int dmin,
  718.                                        int src_index, int ref_index, int const penalty_factor,
  719.                                        int size, int h, int flags)
  720. {
  721.     MotionEstContext * const c= &s->me;
  722.     me_cmp_func cmpf, chroma_cmpf;
  723.     int dia_size;
  724.     LOAD_COMMON
  725.     LOAD_COMMON2
  726.     int map_generation= c->map_generation;
  727.     
  728.     cmpf= s->dsp.me_cmp[size];
  729.     chroma_cmpf= s->dsp.me_cmp[size+1];
  730.     for(dia_size=1; dia_size<=c->dia_size; dia_size++){
  731.         int dir, start, end;
  732.         const int x= best[0];
  733.         const int y= best[1];
  734.         start= FFMAX(0, y + dia_size - ymax);
  735.         end  = FFMIN(dia_size, xmax - x + 1);
  736.         for(dir= start; dir<end; dir++){
  737.             int d;
  738. //check(x + dir,y + dia_size - dir,0, a0)
  739.             CHECK_MV(x + dir           , y + dia_size - dir);
  740.         }
  741.         start= FFMAX(0, x + dia_size - xmax);
  742.         end  = FFMIN(dia_size, y - ymin + 1);
  743.         for(dir= start; dir<end; dir++){
  744.             int d;
  745. //check(x + dia_size - dir, y - dir,0, a1)
  746.             CHECK_MV(x + dia_size - dir, y - dir           );
  747.         }
  748.         start= FFMAX(0, -y + dia_size + ymin );
  749.         end  = FFMIN(dia_size, x - xmin + 1);
  750.         for(dir= start; dir<end; dir++){
  751.             int d;
  752. //check(x - dir,y - dia_size + dir,0, a2)
  753.             CHECK_MV(x - dir           , y - dia_size + dir);
  754.         }
  755.         start= FFMAX(0, -x + dia_size + xmin );
  756.         end  = FFMIN(dia_size, ymax - y + 1);
  757.         for(dir= start; dir<end; dir++){
  758.             int d;
  759. //check(x - dia_size + dir, y + dir,0, a3)
  760.             CHECK_MV(x - dia_size + dir, y + dir           );
  761.         }
  762.         if(x!=best[0] || y!=best[1])
  763.             dia_size=0;
  764. #if 0
  765. {
  766. int dx, dy, i;
  767. static int stats[8*8];
  768. dx= ABS(x-best[0]);
  769. dy= ABS(y-best[1]);
  770. stats[dy*8 + dx] ++;
  771. if(256*256*256*64 % (stats[0]+1)==0){
  772.     for(i=0; i<64; i++){
  773.         if((i&7)==0) printf("n");
  774.         printf("%6d ", stats[i]);
  775.     }
  776.     printf("n");
  777. }
  778. }
  779. #endif
  780.     }
  781.     return dmin;    
  782. }
  783. static always_inline int diamond_search(MpegEncContext * s, int *best, int dmin,
  784.                                        int src_index, int ref_index, int const penalty_factor,
  785.                                        int size, int h, int flags){
  786.     MotionEstContext * const c= &s->me;
  787.     if(c->dia_size==-1)
  788.         return funny_diamond_search(s, best, dmin, src_index, ref_index, penalty_factor, size, h, flags);
  789.     else if(c->dia_size<-1)
  790.         return   sab_diamond_search(s, best, dmin, src_index, ref_index, penalty_factor, size, h, flags);
  791.     else if(c->dia_size<2)
  792.         return small_diamond_search(s, best, dmin, src_index, ref_index, penalty_factor, size, h, flags);
  793.     else
  794.         return   var_diamond_search(s, best, dmin, src_index, ref_index, penalty_factor, size, h, flags);
  795. }
  796. static always_inline int epzs_motion_search_internal(MpegEncContext * s, int *mx_ptr, int *my_ptr,
  797.                              int P[10][2], int src_index, int ref_index, int16_t (*last_mv)[2], 
  798.                              int ref_mv_scale, int flags, int size, int h)
  799. {
  800.     MotionEstContext * const c= &s->me;
  801.     int best[2]={0, 0};
  802.     int d, dmin;
  803.     int map_generation;
  804.     int penalty_factor;
  805.     const int ref_mv_stride= s->mb_stride; //pass as arg  FIXME
  806.     const int ref_mv_xy= s->mb_x + s->mb_y*ref_mv_stride; //add to last_mv beforepassing FIXME
  807.     me_cmp_func cmpf, chroma_cmpf;
  808.     
  809.     LOAD_COMMON
  810.     LOAD_COMMON2
  811.     
  812.     if(c->pre_pass){
  813.         penalty_factor= c->pre_penalty_factor;
  814.         cmpf= s->dsp.me_pre_cmp[size];
  815.         chroma_cmpf= s->dsp.me_pre_cmp[size+1];
  816.     }else{
  817.         penalty_factor= c->penalty_factor;
  818.         cmpf= s->dsp.me_cmp[size];
  819.         chroma_cmpf= s->dsp.me_cmp[size+1];
  820.     }
  821.     
  822.     map_generation= update_map_generation(c);
  823.     assert(cmpf);
  824.     dmin= cmp(s, 0, 0, 0, 0, size, h, ref_index, src_index, cmpf, chroma_cmpf, flags);
  825.     map[0]= map_generation;
  826.     score_map[0]= dmin;
  827.     /* first line */
  828.     if (s->first_slice_line) {
  829.         CHECK_MV(P_LEFT[0]>>shift, P_LEFT[1]>>shift)
  830.         CHECK_CLIPED_MV((last_mv[ref_mv_xy][0]*ref_mv_scale + (1<<15))>>16, 
  831.                         (last_mv[ref_mv_xy][1]*ref_mv_scale + (1<<15))>>16)
  832.     }else{
  833.         if(dmin<h*h && ( P_LEFT[0]    |P_LEFT[1]
  834.                         |P_TOP[0]     |P_TOP[1]
  835.                         |P_TOPRIGHT[0]|P_TOPRIGHT[1])==0){
  836.             *mx_ptr= 0;
  837.             *my_ptr= 0;
  838.             c->skip=1;
  839.             return dmin;
  840.         }
  841.         CHECK_MV(P_MEDIAN[0]>>shift, P_MEDIAN[1]>>shift)
  842.         if(dmin>h*h*2){
  843.             CHECK_CLIPED_MV((last_mv[ref_mv_xy][0]*ref_mv_scale + (1<<15))>>16, 
  844.                             (last_mv[ref_mv_xy][1]*ref_mv_scale + (1<<15))>>16)
  845.             CHECK_MV(P_LEFT[0]    >>shift, P_LEFT[1]    >>shift)
  846.             CHECK_MV(P_TOP[0]     >>shift, P_TOP[1]     >>shift)
  847.             CHECK_MV(P_TOPRIGHT[0]>>shift, P_TOPRIGHT[1]>>shift)
  848.         }
  849.     }
  850.     if(dmin>h*h*4){
  851.         if(c->pre_pass){
  852.             CHECK_CLIPED_MV((last_mv[ref_mv_xy-1][0]*ref_mv_scale + (1<<15))>>16, 
  853.                             (last_mv[ref_mv_xy-1][1]*ref_mv_scale + (1<<15))>>16)
  854.             if(!s->first_slice_line)
  855.                 CHECK_CLIPED_MV((last_mv[ref_mv_xy-ref_mv_stride][0]*ref_mv_scale + (1<<15))>>16, 
  856.                                 (last_mv[ref_mv_xy-ref_mv_stride][1]*ref_mv_scale + (1<<15))>>16)
  857.         }else{
  858.             CHECK_CLIPED_MV((last_mv[ref_mv_xy+1][0]*ref_mv_scale + (1<<15))>>16, 
  859.                             (last_mv[ref_mv_xy+1][1]*ref_mv_scale + (1<<15))>>16)
  860.             if(s->mb_y+1<s->end_mb_y)  //FIXME replace at least with last_slice_line
  861.                 CHECK_CLIPED_MV((last_mv[ref_mv_xy+ref_mv_stride][0]*ref_mv_scale + (1<<15))>>16, 
  862.                                 (last_mv[ref_mv_xy+ref_mv_stride][1]*ref_mv_scale + (1<<15))>>16)
  863.         }
  864.     }
  865.     if(c->avctx->last_predictor_count){
  866.         const int count= c->avctx->last_predictor_count;
  867.         const int xstart= FFMAX(0, s->mb_x - count);
  868.         const int ystart= FFMAX(0, s->mb_y - count);
  869.         const int xend= FFMIN(s->mb_width , s->mb_x + count + 1);
  870.         const int yend= FFMIN(s->mb_height, s->mb_y + count + 1);
  871.         int mb_y;
  872.         for(mb_y=ystart; mb_y<yend; mb_y++){
  873.             int mb_x;
  874.             for(mb_x=xstart; mb_x<xend; mb_x++){
  875.                 const int xy= mb_x + 1 + (mb_y + 1)*ref_mv_stride;
  876.                 int mx= (last_mv[xy][0]*ref_mv_scale + (1<<15))>>16;
  877.                 int my= (last_mv[xy][1]*ref_mv_scale + (1<<15))>>16;
  878.                 if(mx>xmax || mx<xmin || my>ymax || my<ymin) continue;
  879.                 CHECK_MV(mx,my)
  880.             }
  881.         }
  882.     }
  883. //check(best[0],best[1],0, b0)
  884.     dmin= diamond_search(s, best, dmin, src_index, ref_index, penalty_factor, size, h, flags);
  885. //check(best[0],best[1],0, b1)
  886.     *mx_ptr= best[0];
  887.     *my_ptr= best[1];    
  888. //    printf("%d %d %d n", best[0], best[1], dmin);
  889.     return dmin;
  890. }
  891. //this function is dedicated to the braindamaged gcc
  892. inline int ff_epzs_motion_search(MpegEncContext * s, int *mx_ptr, int *my_ptr,
  893.                              int P[10][2], int src_index, int ref_index, int16_t (*last_mv)[2], 
  894.                              int ref_mv_scale, int size, int h)
  895. {
  896.     MotionEstContext * const c= &s->me;
  897. //FIXME convert other functions in the same way if faster
  898.     if(c->flags==0 && h==16 && size==0){
  899.         return epzs_motion_search_internal(s, mx_ptr, my_ptr, P, src_index, ref_index, last_mv, ref_mv_scale, 0, 0, 16);
  900. //    case FLAG_QPEL:
  901. //        return epzs_motion_search_internal(s, mx_ptr, my_ptr, P, src_index, ref_index, last_mv, ref_mv_scale, FLAG_QPEL);
  902.     }else{
  903.         return epzs_motion_search_internal(s, mx_ptr, my_ptr, P, src_index, ref_index, last_mv, ref_mv_scale, c->flags, size, h);
  904.     }
  905. }
  906. static int epzs_motion_search4(MpegEncContext * s,
  907.                              int *mx_ptr, int *my_ptr, int P[10][2],
  908.                              int src_index, int ref_index, int16_t (*last_mv)[2], 
  909.                              int ref_mv_scale)
  910. {
  911.     MotionEstContext * const c= &s->me;
  912.     int best[2]={0, 0};
  913.     int d, dmin; 
  914.     int map_generation;
  915.     const int penalty_factor= c->penalty_factor;
  916.     const int size=1;
  917.     const int h=8;
  918.     const int ref_mv_stride= s->mb_stride;
  919.     const int ref_mv_xy= s->mb_x + s->mb_y *ref_mv_stride;
  920.     me_cmp_func cmpf, chroma_cmpf;
  921.     LOAD_COMMON
  922.     int flags= c->flags;
  923.     LOAD_COMMON2
  924.     
  925.     cmpf= s->dsp.me_cmp[size];
  926.     chroma_cmpf= s->dsp.me_cmp[size+1];
  927.     map_generation= update_map_generation(c);
  928.     dmin = 1000000;
  929. //printf("%d %d %d %d //",xmin, ymin, xmax, ymax); 
  930.     /* first line */
  931.     if (s->first_slice_line) {
  932. CHECK_MV(P_LEFT[0]>>shift, P_LEFT[1]>>shift)
  933.         CHECK_CLIPED_MV((last_mv[ref_mv_xy][0]*ref_mv_scale + (1<<15))>>16, 
  934.                         (last_mv[ref_mv_xy][1]*ref_mv_scale + (1<<15))>>16)
  935.         CHECK_MV(P_MV1[0]>>shift, P_MV1[1]>>shift)
  936.     }else{
  937.         CHECK_MV(P_MV1[0]>>shift, P_MV1[1]>>shift)
  938.         //FIXME try some early stop
  939.         if(dmin>64*2){
  940.             CHECK_MV(P_MEDIAN[0]>>shift, P_MEDIAN[1]>>shift)
  941.             CHECK_MV(P_LEFT[0]>>shift, P_LEFT[1]>>shift)
  942.             CHECK_MV(P_TOP[0]>>shift, P_TOP[1]>>shift)
  943.             CHECK_MV(P_TOPRIGHT[0]>>shift, P_TOPRIGHT[1]>>shift)
  944.             CHECK_CLIPED_MV((last_mv[ref_mv_xy][0]*ref_mv_scale + (1<<15))>>16, 
  945.                             (last_mv[ref_mv_xy][1]*ref_mv_scale + (1<<15))>>16)
  946.         }
  947.     }
  948.     if(dmin>64*4){
  949.         CHECK_CLIPED_MV((last_mv[ref_mv_xy+1][0]*ref_mv_scale + (1<<15))>>16, 
  950.                         (last_mv[ref_mv_xy+1][1]*ref_mv_scale + (1<<15))>>16)
  951.         if(s->mb_y+1<s->end_mb_y)  //FIXME replace at least with last_slice_line
  952.             CHECK_CLIPED_MV((last_mv[ref_mv_xy+ref_mv_stride][0]*ref_mv_scale + (1<<15))>>16, 
  953.                             (last_mv[ref_mv_xy+ref_mv_stride][1]*ref_mv_scale + (1<<15))>>16)
  954.     }
  955.     dmin= diamond_search(s, best, dmin, src_index, ref_index, penalty_factor, size, h, flags);
  956.     *mx_ptr= best[0];
  957.     *my_ptr= best[1];    
  958. //    printf("%d %d %d n", best[0], best[1], dmin);
  959.     return dmin;
  960. }
  961. //try to merge with above FIXME (needs PSNR test)
  962. static int epzs_motion_search2(MpegEncContext * s,
  963.                              int *mx_ptr, int *my_ptr, int P[10][2],
  964.                              int src_index, int ref_index, int16_t (*last_mv)[2], 
  965.                              int ref_mv_scale)
  966. {
  967.     MotionEstContext * const c= &s->me;
  968.     int best[2]={0, 0};
  969.     int d, dmin; 
  970.     int map_generation;
  971.     const int penalty_factor= c->penalty_factor;
  972.     const int size=0; //FIXME pass as arg
  973.     const int h=8;
  974.     const int ref_mv_stride= s->mb_stride;
  975.     const int ref_mv_xy= s->mb_x + s->mb_y *ref_mv_stride;
  976.     me_cmp_func cmpf, chroma_cmpf;
  977.     LOAD_COMMON
  978.     int flags= c->flags;
  979.     LOAD_COMMON2
  980.     
  981.     cmpf= s->dsp.me_cmp[size];
  982.     chroma_cmpf= s->dsp.me_cmp[size+1];
  983.     map_generation= update_map_generation(c);
  984.     dmin = 1000000;
  985. //printf("%d %d %d %d //",xmin, ymin, xmax, ymax); 
  986.     /* first line */
  987.     if (s->first_slice_line) {
  988. CHECK_MV(P_LEFT[0]>>shift, P_LEFT[1]>>shift)
  989.         CHECK_CLIPED_MV((last_mv[ref_mv_xy][0]*ref_mv_scale + (1<<15))>>16, 
  990.                         (last_mv[ref_mv_xy][1]*ref_mv_scale + (1<<15))>>16)
  991.         CHECK_MV(P_MV1[0]>>shift, P_MV1[1]>>shift)
  992.     }else{
  993.         CHECK_MV(P_MV1[0]>>shift, P_MV1[1]>>shift)
  994.         //FIXME try some early stop
  995.         if(dmin>64*2){
  996.             CHECK_MV(P_MEDIAN[0]>>shift, P_MEDIAN[1]>>shift)
  997.             CHECK_MV(P_LEFT[0]>>shift, P_LEFT[1]>>shift)
  998.             CHECK_MV(P_TOP[0]>>shift, P_TOP[1]>>shift)
  999.             CHECK_MV(P_TOPRIGHT[0]>>shift, P_TOPRIGHT[1]>>shift)
  1000.             CHECK_CLIPED_MV((last_mv[ref_mv_xy][0]*ref_mv_scale + (1<<15))>>16, 
  1001.                             (last_mv[ref_mv_xy][1]*ref_mv_scale + (1<<15))>>16)
  1002.         }
  1003.     }
  1004.     if(dmin>64*4){
  1005.         CHECK_CLIPED_MV((last_mv[ref_mv_xy+1][0]*ref_mv_scale + (1<<15))>>16, 
  1006.                         (last_mv[ref_mv_xy+1][1]*ref_mv_scale + (1<<15))>>16)
  1007.         if(s->mb_y+1<s->end_mb_y)  //FIXME replace at least with last_slice_line
  1008.             CHECK_CLIPED_MV((last_mv[ref_mv_xy+ref_mv_stride][0]*ref_mv_scale + (1<<15))>>16, 
  1009.                             (last_mv[ref_mv_xy+ref_mv_stride][1]*ref_mv_scale + (1<<15))>>16)
  1010.     }
  1011.     dmin= diamond_search(s, best, dmin, src_index, ref_index, penalty_factor, size, h, flags);
  1012.     *mx_ptr= best[0];
  1013.     *my_ptr= best[1];    
  1014. //    printf("%d %d %d n", best[0], best[1], dmin);
  1015.     return dmin;
  1016. }