ratecontrol.c
上传用户:wstnjxml
上传日期:2014-04-03
资源大小:7248k
文件大小:30k
源码类别:

Windows CE

开发平台:

C/C++

  1. /*
  2.  * Rate control for video encoders
  3.  *
  4.  * Copyright (c) 2002-2004 Michael Niedermayer <michaelni@gmx.at>
  5.  *
  6.  * This library is free software; you can redistribute it and/or
  7.  * modify it under the terms of the GNU Lesser General Public
  8.  * License as published by the Free Software Foundation; either
  9.  * version 2 of the License, or (at your option) any later version.
  10.  *
  11.  * This library is distributed in the hope that it will be useful,
  12.  * but WITHOUT ANY WARRANTY; without even the implied warranty of
  13.  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
  14.  * Lesser General Public License for more details.
  15.  *
  16.  * You should have received a copy of the GNU Lesser General Public
  17.  * License along with this library; if not, write to the Free Software
  18.  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
  19.  */
  20. /**
  21.  * @file ratecontrol.c
  22.  * Rate control for video encoders.
  23.  */ 
  24. #include "avcodec.h"
  25. #include "dsputil.h"
  26. #include "mpegvideo.h"
  27. #undef NDEBUG // allways check asserts, the speed effect is far too small to disable them
  28. #include <assert.h>
  29. #ifndef M_E
  30. #define M_E 2.718281828
  31. #endif
  32. static int init_pass2(MpegEncContext *s);
  33. static double get_qscale(MpegEncContext *s, RateControlEntry *rce, double rate_factor, int frame_num);
  34. void ff_write_pass1_stats(MpegEncContext *s){
  35.     snprintf(s->avctx->stats_out, 256, "in:%d out:%d type:%d q:%d itex:%d ptex:%d mv:%d misc:%d fcode:%d bcode:%d mc-var:%d var:%d icount:%d;n",
  36.             s->current_picture_ptr->display_picture_number, s->current_picture_ptr->coded_picture_number, s->pict_type, 
  37.             s->current_picture.quality, s->i_tex_bits, s->p_tex_bits, s->mv_bits, s->misc_bits, 
  38.             s->f_code, s->b_code, s->current_picture.mc_mb_var_sum, s->current_picture.mb_var_sum, s->i_count);
  39. }
  40. int ff_rate_control_init(MpegEncContext *s)
  41. {
  42.     RateControlContext *rcc= &s->rc_context;
  43.     int i;
  44.     emms_c();
  45.     for(i=0; i<5; i++){
  46.         rcc->pred[i].coeff= FF_QP2LAMBDA * 7.0;
  47.         rcc->pred[i].count= 1.0;
  48.     
  49.         rcc->pred[i].decay= 0.4;
  50.         rcc->i_cplx_sum [i]=
  51.         rcc->p_cplx_sum [i]=
  52.         rcc->mv_bits_sum[i]=
  53.         rcc->qscale_sum [i]=
  54.         rcc->frame_count[i]= 1; // 1 is better cuz of 1/0 and such
  55.         rcc->last_qscale_for[i]=FF_QP2LAMBDA * 5;
  56.     }
  57.     rcc->buffer_index= s->avctx->rc_initial_buffer_occupancy;
  58.     if(s->flags&CODEC_FLAG_PASS2){
  59.         int i;
  60.         char *p;
  61.         /* find number of pics */
  62.         p= s->avctx->stats_in;
  63.         for(i=-1; p; i++){
  64.             p= strchr(p+1, ';');
  65.         }
  66.         i+= s->max_b_frames;
  67.         if(i<=0 || i>=INT_MAX / sizeof(RateControlEntry))
  68.             return -1;
  69.         rcc->entry = (RateControlEntry*)av_mallocz(i*sizeof(RateControlEntry));
  70.         rcc->num_entries= i;
  71.         
  72.         /* init all to skipped p frames (with b frames we might have a not encoded frame at the end FIXME) */
  73.         for(i=0; i<rcc->num_entries; i++){
  74.             RateControlEntry *rce= &rcc->entry[i];
  75.             rce->pict_type= rce->new_pict_type=P_TYPE;
  76.             rce->qscale= rce->new_qscale=FF_QP2LAMBDA * 2;
  77.             rce->misc_bits= s->mb_num + 10;
  78.             rce->mb_var_sum= s->mb_num*100;
  79.         }        
  80.         
  81.         /* read stats */
  82.         p= s->avctx->stats_in;
  83.         for(i=0; i<rcc->num_entries - s->max_b_frames; i++){
  84.             RateControlEntry *rce;
  85.             int picture_number;
  86.             int e;
  87.             char *next;
  88.             next= strchr(p, ';');
  89.             if(next){
  90.                 (*next)=0; //sscanf in unbelieavle slow on looong strings //FIXME copy / dont write
  91.                 next++;
  92.             }
  93.             e= sscanf(p, " in:%d ", &picture_number);
  94.             assert(picture_number >= 0);
  95.             assert(picture_number < rcc->num_entries);
  96.             rce= &rcc->entry[picture_number];
  97.             e+=sscanf(p, " in:%*d out:%*d type:%d q:%f itex:%d ptex:%d mv:%d misc:%d fcode:%d bcode:%d mc-var:%d var:%d icount:%d",
  98.                    &rce->pict_type, &rce->qscale, &rce->i_tex_bits, &rce->p_tex_bits, &rce->mv_bits, &rce->misc_bits, 
  99.                    &rce->f_code, &rce->b_code, &rce->mc_mb_var_sum, &rce->mb_var_sum, &rce->i_count);
  100.             if(e!=12){
  101.                 av_log(s->avctx, AV_LOG_ERROR, "statistics are damaged at line %d, parser out=%dn", i, e);
  102.                 return -1;
  103.             }
  104.             p= next;
  105.         }
  106.         
  107.         if(init_pass2(s) < 0) return -1;
  108.     }
  109.      
  110.     if(!(s->flags&CODEC_FLAG_PASS2)){
  111.         rcc->short_term_qsum=0.001;
  112.         rcc->short_term_qcount=0.001;
  113.     
  114.         rcc->pass1_rc_eq_output_sum= 0.001;
  115.         rcc->pass1_wanted_bits=0.001;
  116.         
  117.         /* init stuff with the user specified complexity */
  118.         if(s->avctx->rc_initial_cplx){
  119.             for(i=0; i<60*30; i++){
  120.                 double bits= s->avctx->rc_initial_cplx * (i/10000.0 + 1.0)*s->mb_num;
  121.                 RateControlEntry rce;
  122.                 double q;
  123.                 
  124.                 if     (i%((s->gop_size+3)/4)==0) rce.pict_type= I_TYPE;
  125.                 else if(i%(s->max_b_frames+1))    rce.pict_type= B_TYPE;
  126.                 else                              rce.pict_type= P_TYPE;
  127.                 rce.new_pict_type= rce.pict_type;
  128.                 rce.mc_mb_var_sum= bits*s->mb_num/100000;
  129.                 rce.mb_var_sum   = s->mb_num;
  130.                 rce.qscale   = FF_QP2LAMBDA * 2;
  131.                 rce.f_code   = 2;
  132.                 rce.b_code   = 1;
  133.                 rce.misc_bits= 1;
  134.                 if(s->pict_type== I_TYPE){
  135.                     rce.i_count   = s->mb_num;
  136.                     rce.i_tex_bits= bits;
  137.                     rce.p_tex_bits= 0;
  138.                     rce.mv_bits= 0;
  139.                 }else{
  140.                     rce.i_count   = 0; //FIXME we do know this approx
  141.                     rce.i_tex_bits= 0;
  142.                     rce.p_tex_bits= bits*0.9;
  143.                     rce.mv_bits= bits*0.1;
  144.                 }
  145.                 rcc->i_cplx_sum [rce.pict_type] += rce.i_tex_bits*rce.qscale;
  146.                 rcc->p_cplx_sum [rce.pict_type] += rce.p_tex_bits*rce.qscale;
  147.                 rcc->mv_bits_sum[rce.pict_type] += rce.mv_bits;
  148.                 rcc->frame_count[rce.pict_type] ++;
  149.                 bits= rce.i_tex_bits + rce.p_tex_bits;
  150.                 q= get_qscale(s, &rce, rcc->pass1_wanted_bits/rcc->pass1_rc_eq_output_sum, i);
  151.                 rcc->pass1_wanted_bits+= s->bit_rate/(1/av_q2d(s->avctx->time_base)); //FIXME missbehaves a little for variable fps
  152.             }
  153.         }
  154.     }
  155.     
  156.     return 0;
  157. }
  158. void ff_rate_control_uninit(MpegEncContext *s)
  159. {
  160.     RateControlContext *rcc= &s->rc_context;
  161.     emms_c();
  162.     av_freep(&rcc->entry);
  163. }
  164. static inline double qp2bits(RateControlEntry *rce, double qp){
  165.     if(qp<=0.0){
  166.         av_log(NULL, AV_LOG_ERROR, "qp<=0.0n");
  167.     }
  168.     return rce->qscale * (double)(rce->i_tex_bits + rce->p_tex_bits+1)/ qp;
  169. }
  170. static inline double bits2qp(RateControlEntry *rce, double bits){
  171.     if(bits<0.9){
  172.         av_log(NULL, AV_LOG_ERROR, "bits<0.9n");
  173.     }
  174.     return rce->qscale * (double)(rce->i_tex_bits + rce->p_tex_bits+1)/ bits;
  175. }
  176.     
  177. int ff_vbv_update(MpegEncContext *s, int frame_size){
  178.     RateControlContext *rcc= &s->rc_context;
  179.     const double fps= 1/av_q2d(s->avctx->time_base);
  180.     const int buffer_size= s->avctx->rc_buffer_size;
  181.     const double min_rate= s->avctx->rc_min_rate/fps;
  182.     const double max_rate= s->avctx->rc_max_rate/fps;
  183.     
  184. //printf("%d %f %d %f %fn", buffer_size, rcc->buffer_index, frame_size, min_rate, max_rate);
  185.     if(buffer_size){
  186.         int left;
  187.         rcc->buffer_index-= frame_size;
  188.         if(rcc->buffer_index < 0){
  189.             av_log(s->avctx, AV_LOG_ERROR, "rc buffer underflown");
  190.             rcc->buffer_index= 0;
  191.         }
  192.         left= buffer_size - rcc->buffer_index - 1;
  193.         rcc->buffer_index += clip(left, min_rate, max_rate);
  194.         if(rcc->buffer_index > buffer_size){
  195.             int stuffing= ceil((rcc->buffer_index - buffer_size)/8);
  196.             
  197.             if(stuffing < 4 && s->codec_id == CODEC_ID_MPEG4)
  198.                 stuffing=4;
  199.             rcc->buffer_index -= 8*stuffing;
  200.             
  201.             if(s->avctx->debug & FF_DEBUG_RC)
  202.                 av_log(s->avctx, AV_LOG_DEBUG, "stuffing %d bytesn", stuffing);
  203.             return stuffing;
  204.         }
  205.     }
  206.     return 0;
  207. }
  208. /**
  209.  * modifies the bitrate curve from pass1 for one frame
  210.  */
  211. static double get_qscale(MpegEncContext *s, RateControlEntry *rce, double rate_factor, int frame_num){
  212.     RateControlContext *rcc= &s->rc_context;
  213.     AVCodecContext *a= s->avctx;
  214.     double q, bits;
  215.     const int pict_type= rce->new_pict_type;
  216.     const double mb_num= s->mb_num;  
  217.     int i;
  218.     double const_values[]={
  219.         M_PI,
  220.         M_E,
  221.         rce->i_tex_bits*rce->qscale,
  222.         rce->p_tex_bits*rce->qscale,
  223.         (rce->i_tex_bits + rce->p_tex_bits)*(double)rce->qscale,
  224.         rce->mv_bits/mb_num,
  225.         rce->pict_type == B_TYPE ? (rce->f_code + rce->b_code)*0.5 : rce->f_code,
  226.         rce->i_count/mb_num,
  227.         rce->mc_mb_var_sum/mb_num,
  228.         rce->mb_var_sum/mb_num,
  229.         rce->pict_type == I_TYPE,
  230.         rce->pict_type == P_TYPE,
  231.         rce->pict_type == B_TYPE,
  232.         rcc->qscale_sum[pict_type] / (double)rcc->frame_count[pict_type],
  233.         a->qcompress,
  234. /*        rcc->last_qscale_for[I_TYPE],
  235.         rcc->last_qscale_for[P_TYPE],
  236.         rcc->last_qscale_for[B_TYPE],
  237.         rcc->next_non_b_qscale,*/
  238.         rcc->i_cplx_sum[I_TYPE] / (double)rcc->frame_count[I_TYPE],
  239.         rcc->i_cplx_sum[P_TYPE] / (double)rcc->frame_count[P_TYPE],
  240.         rcc->p_cplx_sum[P_TYPE] / (double)rcc->frame_count[P_TYPE],
  241.         rcc->p_cplx_sum[B_TYPE] / (double)rcc->frame_count[B_TYPE],
  242.         (rcc->i_cplx_sum[pict_type] + rcc->p_cplx_sum[pict_type]) / (double)rcc->frame_count[pict_type],
  243.         0
  244.     };
  245.     static const char *const_names[]={
  246.         "PI",
  247.         "E",
  248.         "iTex",
  249.         "pTex",
  250.         "tex",
  251.         "mv",
  252.         "fCode",
  253.         "iCount",
  254.         "mcVar",
  255.         "var",
  256.         "isI",
  257.         "isP",
  258.         "isB",
  259.         "avgQP",
  260.         "qComp",
  261. /*        "lastIQP",
  262.         "lastPQP",
  263.         "lastBQP",
  264.         "nextNonBQP",*/
  265.         "avgIITex",
  266.         "avgPITex",
  267.         "avgPPTex",
  268.         "avgBPTex",
  269.         "avgTex",
  270.         NULL
  271.     };
  272.     static double (*func1[])(void *, double)={
  273.         (void *)bits2qp,
  274.         (void *)qp2bits,
  275.         NULL
  276.     };
  277.     static const char *func1_names[]={
  278.         "bits2qp",
  279.         "qp2bits",
  280.         NULL
  281.     };
  282.     bits= ff_eval(s->avctx->rc_eq, const_values, const_names, func1, func1_names, NULL, NULL, rce);
  283.     
  284.     rcc->pass1_rc_eq_output_sum+= bits;
  285.     bits*=rate_factor;
  286.     if(bits<0.0) bits=0.0;
  287.     bits+= 1.0; //avoid 1/0 issues
  288.     
  289.     /* user override */
  290.     for(i=0; i<s->avctx->rc_override_count; i++){
  291.         RcOverride *rco= s->avctx->rc_override;
  292.         if(rco[i].start_frame > frame_num) continue;
  293.         if(rco[i].end_frame   < frame_num) continue;
  294.     
  295.         if(rco[i].qscale) 
  296.             bits= qp2bits(rce, rco[i].qscale); //FIXME move at end to really force it?
  297.         else
  298.             bits*= rco[i].quality_factor;
  299.     }
  300.     q= bits2qp(rce, bits);
  301.     
  302.     /* I/B difference */
  303.     if     (pict_type==I_TYPE && s->avctx->i_quant_factor<0.0)
  304.         q= -q*s->avctx->i_quant_factor + s->avctx->i_quant_offset;
  305.     else if(pict_type==B_TYPE && s->avctx->b_quant_factor<0.0)
  306.         q= -q*s->avctx->b_quant_factor + s->avctx->b_quant_offset;
  307.         
  308.     return q;
  309. }
  310. static double get_diff_limited_q(MpegEncContext *s, RateControlEntry *rce, double q){
  311.     RateControlContext *rcc= &s->rc_context;
  312.     AVCodecContext *a= s->avctx;
  313.     const int pict_type= rce->new_pict_type;
  314.     const double last_p_q    = rcc->last_qscale_for[P_TYPE];
  315.     const double last_non_b_q= rcc->last_qscale_for[rcc->last_non_b_pict_type];
  316.     
  317.     if     (pict_type==I_TYPE && (a->i_quant_factor>0.0 || rcc->last_non_b_pict_type==P_TYPE))
  318.         q= last_p_q    *ABS(a->i_quant_factor) + a->i_quant_offset;
  319.     else if(pict_type==B_TYPE && a->b_quant_factor>0.0)
  320.         q= last_non_b_q*    a->b_quant_factor  + a->b_quant_offset;
  321.     /* last qscale / qdiff stuff */
  322.     if(rcc->last_non_b_pict_type==pict_type || pict_type!=I_TYPE){
  323.         double last_q= rcc->last_qscale_for[pict_type];
  324.         const int maxdiff= FF_QP2LAMBDA * a->max_qdiff;
  325.         if     (q > last_q + maxdiff) q= last_q + maxdiff;
  326.         else if(q < last_q - maxdiff) q= last_q - maxdiff;
  327.     }
  328.     rcc->last_qscale_for[pict_type]= q; //Note we cant do that after blurring
  329.     
  330.     if(pict_type!=B_TYPE)
  331.         rcc->last_non_b_pict_type= pict_type;
  332.     return q;
  333. }
  334. /**
  335.  * gets the qmin & qmax for pict_type
  336.  */
  337. static void get_qminmax(int *qmin_ret, int *qmax_ret, MpegEncContext *s, int pict_type){
  338.     int qmin= s->avctx->lmin;                                                       
  339.     int qmax= s->avctx->lmax;
  340.     
  341.     assert(qmin <= qmax);
  342.     if(pict_type==B_TYPE){
  343.         qmin= (int)(qmin*ABS(s->avctx->b_quant_factor)+s->avctx->b_quant_offset + 0.5);
  344.         qmax= (int)(qmax*ABS(s->avctx->b_quant_factor)+s->avctx->b_quant_offset + 0.5);
  345.     }else if(pict_type==I_TYPE){
  346.         qmin= (int)(qmin*ABS(s->avctx->i_quant_factor)+s->avctx->i_quant_offset + 0.5);
  347.         qmax= (int)(qmax*ABS(s->avctx->i_quant_factor)+s->avctx->i_quant_offset + 0.5);
  348.     }
  349.     qmin= clip(qmin, 1, FF_LAMBDA_MAX);
  350.     qmax= clip(qmax, 1, FF_LAMBDA_MAX);
  351.     if(qmax<qmin) qmax= qmin;
  352.     
  353.     *qmin_ret= qmin;
  354.     *qmax_ret= qmax;
  355. }
  356. static double modify_qscale(MpegEncContext *s, RateControlEntry *rce, double q, int frame_num){
  357.     RateControlContext *rcc= &s->rc_context;
  358.     int qmin, qmax;
  359.     double bits;
  360.     const int pict_type= rce->new_pict_type;
  361.     const double buffer_size= s->avctx->rc_buffer_size;
  362.     const double fps= 1/av_q2d(s->avctx->time_base);
  363.     const double min_rate= s->avctx->rc_min_rate / fps;
  364.     const double max_rate= s->avctx->rc_max_rate / fps;
  365.     
  366.     get_qminmax(&qmin, &qmax, s, pict_type);
  367.     /* modulation */
  368.     if(s->avctx->rc_qmod_freq && frame_num%s->avctx->rc_qmod_freq==0 && pict_type==P_TYPE)
  369.         q*= s->avctx->rc_qmod_amp;
  370.     bits= qp2bits(rce, q);
  371. //printf("q:%fn", q);
  372.     /* buffer overflow/underflow protection */
  373.     if(buffer_size){
  374.         double expected_size= rcc->buffer_index;
  375.         double q_limit;
  376.         if(min_rate){
  377.             double d= 2*(buffer_size - expected_size)/buffer_size;
  378.             if(d>1.0) d=1.0;
  379.             else if(d<0.0001) d=0.0001;
  380.             q*= pow(d, 1.0/s->avctx->rc_buffer_aggressivity);
  381.             q_limit= bits2qp(rce, FFMAX((min_rate - buffer_size + rcc->buffer_index)*3, 1));
  382.             if(q > q_limit){
  383.                 if(s->avctx->debug&FF_DEBUG_RC){
  384.                     av_log(s->avctx, AV_LOG_DEBUG, "limiting QP %f -> %fn", q, q_limit);
  385.                 }
  386.                 q= q_limit;
  387.             }
  388.         }
  389.         if(max_rate){
  390.             double d= 2*expected_size/buffer_size;
  391.             if(d>1.0) d=1.0;
  392.             else if(d<0.0001) d=0.0001;
  393.             q/= pow(d, 1.0/s->avctx->rc_buffer_aggressivity);
  394.             q_limit= bits2qp(rce, FFMAX(rcc->buffer_index/3, 1));
  395.             if(q < q_limit){
  396.                 if(s->avctx->debug&FF_DEBUG_RC){
  397.                     av_log(s->avctx, AV_LOG_DEBUG, "limiting QP %f -> %fn", q, q_limit);
  398.                 }
  399.                 q= q_limit;
  400.             }
  401.         }
  402.     }
  403. //printf("q:%f max:%f min:%f size:%f index:%d bits:%f agr:%fn", q,max_rate, min_rate, buffer_size, rcc->buffer_index, bits, s->avctx->rc_buffer_aggressivity);
  404.     if(s->avctx->rc_qsquish==0.0 || qmin==qmax){
  405.         if     (q<qmin) q=qmin;
  406.         else if(q>qmax) q=qmax;
  407.     }else{
  408.         double min2= log(qmin);
  409.         double max2= log(qmax);
  410.         
  411.         q= log(q);
  412.         q= (q - min2)/(max2-min2) - 0.5;
  413.         q*= -4.0;
  414.         q= 1.0/(1.0 + exp(q));
  415.         q= q*(max2-min2) + min2;
  416.         
  417.         q= exp(q);
  418.     }
  419.     
  420.     return q;
  421. }
  422. //----------------------------------
  423. // 1 Pass Code
  424. static double predict_size(Predictor *p, double q, double var)
  425. {
  426.      return p->coeff*var / (q*p->count);
  427. }
  428. /*
  429. static double predict_qp(Predictor *p, double size, double var)
  430. {
  431. //printf("coeff:%f, count:%f, var:%f, size:%f//n", p->coeff, p->count, var, size);
  432.      return p->coeff*var / (size*p->count);
  433. }
  434. */
  435. static void update_predictor(Predictor *p, double q, double var, double size)
  436. {
  437.     double new_coeff= size*q / (var + 1);
  438.     if(var<10) return;
  439.     p->count*= p->decay;
  440.     p->coeff*= p->decay;
  441.     p->count++;
  442.     p->coeff+= new_coeff;
  443. }
  444. static void adaptive_quantization(MpegEncContext *s, double q){
  445.     int i;
  446.     const float lumi_masking= s->avctx->lumi_masking / (128.0*128.0);
  447.     const float dark_masking= s->avctx->dark_masking / (128.0*128.0);
  448.     const float temp_cplx_masking= s->avctx->temporal_cplx_masking;
  449.     const float spatial_cplx_masking = s->avctx->spatial_cplx_masking;
  450.     const float p_masking = s->avctx->p_masking;
  451.     const float border_masking = s->avctx->border_masking;
  452.     float bits_sum= 0.0;
  453.     float cplx_sum= 0.0;
  454.     float cplx_tab[s->mb_num];
  455.     float bits_tab[s->mb_num];
  456.     const int qmin= s->avctx->mb_lmin;
  457.     const int qmax= s->avctx->mb_lmax;
  458.     Picture * const pic= &s->current_picture;
  459.     const int mb_width = s->mb_width;
  460.     const int mb_height = s->mb_height;
  461.     
  462.     for(i=0; i<s->mb_num; i++){
  463.         const int mb_xy= s->mb_index2xy[i];
  464.         float temp_cplx= sqrt(pic->mc_mb_var[mb_xy]); //FIXME merge in pow()
  465.         float spat_cplx= sqrt(pic->mb_var[mb_xy]);
  466.         const int lumi= pic->mb_mean[mb_xy];
  467.         float bits, cplx, factor;
  468.         int mb_x = mb_xy % s->mb_stride;
  469.         int mb_y = mb_xy / s->mb_stride;
  470.         int mb_distance;
  471.         float mb_factor = 0.0;
  472. #if 0        
  473.         if(spat_cplx < q/3) spat_cplx= q/3; //FIXME finetune
  474.         if(temp_cplx < q/3) temp_cplx= q/3; //FIXME finetune
  475. #endif   
  476.         if(spat_cplx < 4) spat_cplx= 4; //FIXME finetune
  477.         if(temp_cplx < 4) temp_cplx= 4; //FIXME finetune
  478.         if((s->mb_type[mb_xy]&CANDIDATE_MB_TYPE_INTRA)){//FIXME hq mode 
  479.             cplx= spat_cplx;
  480.             factor= 1.0 + p_masking;
  481.         }else{
  482.             cplx= temp_cplx;
  483.             factor= pow(temp_cplx, - temp_cplx_masking);
  484.         }
  485.         factor*=pow(spat_cplx, - spatial_cplx_masking);
  486.         if(lumi>127)
  487.             factor*= (1.0 - (lumi-128)*(lumi-128)*lumi_masking);
  488.         else
  489.             factor*= (1.0 - (lumi-128)*(lumi-128)*dark_masking);
  490.         if(mb_x < mb_width/5){
  491.             mb_distance = mb_width/5 - mb_x;
  492.             mb_factor = (float)mb_distance / (float)(mb_width/5);
  493.         }else if(mb_x > 4*mb_width/5){
  494.             mb_distance = mb_x - 4*mb_width/5;
  495.             mb_factor = (float)mb_distance / (float)(mb_width/5);
  496.         }
  497.         if(mb_y < mb_height/5){
  498.             mb_distance = mb_height/5 - mb_y;
  499.             mb_factor = FFMAX(mb_factor, (float)mb_distance / (float)(mb_height/5));
  500.         }else if(mb_y > 4*mb_height/5){
  501.             mb_distance = mb_y - 4*mb_height/5;
  502.             mb_factor = FFMAX(mb_factor, (float)mb_distance / (float)(mb_height/5));
  503.         }
  504.         factor*= 1.0 - border_masking*mb_factor;
  505.         
  506.         if(factor<0.00001) factor= 0.00001;
  507.         
  508.         bits= cplx*factor;
  509.         cplx_sum+= cplx;
  510.         bits_sum+= bits;
  511.         cplx_tab[i]= cplx;
  512.         bits_tab[i]= bits;
  513.     }
  514.     /* handle qmin/qmax cliping */
  515.     if(s->flags&CODEC_FLAG_NORMALIZE_AQP){
  516.         float factor= bits_sum/cplx_sum;
  517.         for(i=0; i<s->mb_num; i++){
  518.             float newq= q*cplx_tab[i]/bits_tab[i];
  519.             newq*= factor;
  520.             if     (newq > qmax){
  521.                 bits_sum -= bits_tab[i];
  522.                 cplx_sum -= cplx_tab[i]*q/qmax;
  523.             }
  524.             else if(newq < qmin){
  525.                 bits_sum -= bits_tab[i];
  526.                 cplx_sum -= cplx_tab[i]*q/qmin;
  527.             }
  528.         }
  529.         if(bits_sum < 0.001) bits_sum= 0.001;
  530.         if(cplx_sum < 0.001) cplx_sum= 0.001;
  531.     }
  532.    
  533.     for(i=0; i<s->mb_num; i++){
  534.         const int mb_xy= s->mb_index2xy[i];
  535.         float newq= q*cplx_tab[i]/bits_tab[i];
  536.         int intq;
  537.         if(s->flags&CODEC_FLAG_NORMALIZE_AQP){
  538.             newq*= bits_sum/cplx_sum;
  539.         }
  540.         intq= (int)(newq + 0.5);
  541.         if     (intq > qmax) intq= qmax;
  542.         else if(intq < qmin) intq= qmin;
  543. //if(i%s->mb_width==0) printf("n");
  544. //printf("%2d%3d ", intq, ff_sqrt(s->mc_mb_var[i]));
  545.         s->lambda_table[mb_xy]= intq;
  546.     }
  547. }
  548. //FIXME rd or at least approx for dquant
  549. float ff_rate_estimate_qscale(MpegEncContext *s)
  550. {
  551.     float q;
  552.     int qmin, qmax;
  553.     float br_compensation;
  554.     double diff;
  555.     double short_term_q;
  556.     double fps;
  557.     int picture_number= s->picture_number;
  558.     int64_t wanted_bits;
  559.     RateControlContext *rcc= &s->rc_context;
  560.     AVCodecContext *a= s->avctx;
  561.     RateControlEntry local_rce, *rce;
  562.     double bits;
  563.     double rate_factor;
  564.     int var;
  565.     const int pict_type= s->pict_type;
  566.     Picture * const pic= &s->current_picture;
  567.     emms_c();
  568.     get_qminmax(&qmin, &qmax, s, pict_type);
  569.     fps= 1/av_q2d(s->avctx->time_base);
  570. //printf("input_pic_num:%d pic_num:%d frame_rate:%dn", s->input_picture_number, s->picture_number, s->frame_rate);
  571.         /* update predictors */
  572.     if(picture_number>2){
  573.         const int last_var= s->last_pict_type == I_TYPE ? rcc->last_mb_var_sum : rcc->last_mc_mb_var_sum;
  574.         update_predictor(&rcc->pred[s->last_pict_type], rcc->last_qscale, sqrt(last_var), s->frame_bits);
  575.     }
  576.     if(s->flags&CODEC_FLAG_PASS2){
  577.         assert(picture_number>=0);
  578.         assert(picture_number<rcc->num_entries);
  579.         rce= &rcc->entry[picture_number];
  580.         wanted_bits= rce->expected_bits;
  581.     }else{
  582.         rce= &local_rce;
  583.         wanted_bits= (uint64_t)(s->bit_rate*(double)picture_number/fps);
  584.     }
  585.     diff= s->total_bits - wanted_bits;
  586.     br_compensation= (a->bit_rate_tolerance - diff)/a->bit_rate_tolerance;
  587.     if(br_compensation<=0.0) br_compensation=0.001;
  588.     var= pict_type == I_TYPE ? pic->mb_var_sum : pic->mc_mb_var_sum;
  589.     
  590.     short_term_q = 0; /* avoid warning */
  591.     if(s->flags&CODEC_FLAG_PASS2){
  592.         if(pict_type!=I_TYPE)
  593.             assert(pict_type == rce->new_pict_type);
  594.         q= rce->new_qscale / br_compensation;
  595. //printf("%f %f %f last:%d var:%d type:%d//n", q, rce->new_qscale, br_compensation, s->frame_bits, var, pict_type);
  596.     }else{
  597.         rce->pict_type= 
  598.         rce->new_pict_type= pict_type;
  599.         rce->mc_mb_var_sum= pic->mc_mb_var_sum;
  600.         rce->mb_var_sum   = pic->   mb_var_sum;
  601.         rce->qscale   = FF_QP2LAMBDA * 2;
  602.         rce->f_code   = s->f_code;
  603.         rce->b_code   = s->b_code;
  604.         rce->misc_bits= 1;
  605.         bits= predict_size(&rcc->pred[pict_type], rce->qscale, sqrt(var));
  606.         if(pict_type== I_TYPE){
  607.             rce->i_count   = s->mb_num;
  608.             rce->i_tex_bits= bits;
  609.             rce->p_tex_bits= 0;
  610.             rce->mv_bits= 0;
  611.         }else{
  612.             rce->i_count   = 0; //FIXME we do know this approx
  613.             rce->i_tex_bits= 0;
  614.             rce->p_tex_bits= bits*0.9;
  615.             
  616.             rce->mv_bits= bits*0.1;
  617.         }
  618.         rcc->i_cplx_sum [pict_type] += rce->i_tex_bits*rce->qscale;
  619.         rcc->p_cplx_sum [pict_type] += rce->p_tex_bits*rce->qscale;
  620.         rcc->mv_bits_sum[pict_type] += rce->mv_bits;
  621.         rcc->frame_count[pict_type] ++;
  622.         bits= rce->i_tex_bits + rce->p_tex_bits;
  623.         rate_factor= rcc->pass1_wanted_bits/rcc->pass1_rc_eq_output_sum * br_compensation;
  624.     
  625.         q= get_qscale(s, rce, rate_factor, picture_number);
  626.         assert(q>0.0);
  627. //printf("%f ", q);
  628.         q= get_diff_limited_q(s, rce, q);
  629. //printf("%f ", q);
  630.         assert(q>0.0);
  631.         if(pict_type==P_TYPE || s->intra_only){ //FIXME type dependant blur like in 2-pass
  632.             rcc->short_term_qsum*=a->qblur;
  633.             rcc->short_term_qcount*=a->qblur;
  634.             rcc->short_term_qsum+= q;
  635.             rcc->short_term_qcount++;
  636. //printf("%f ", q);
  637.             q= short_term_q= rcc->short_term_qsum/rcc->short_term_qcount;
  638. //printf("%f ", q);
  639.         }
  640.         assert(q>0.0);
  641.         
  642.         q= modify_qscale(s, rce, q, picture_number);
  643.         rcc->pass1_wanted_bits+= s->bit_rate/fps;
  644.         assert(q>0.0);
  645.     }
  646.     if(s->avctx->debug&FF_DEBUG_RC){
  647.         av_log(s->avctx, AV_LOG_DEBUG, "%c qp:%d<%2.1f<%d %d want:%d total:%d comp:%f st_q:%2.2f size:%d var:%d/%d br:%d fps:%dn",
  648.         av_get_pict_type_char(pict_type), qmin, q, qmax, picture_number, (int)wanted_bits/1000, (int)s->total_bits/1000,
  649.         br_compensation, short_term_q, s->frame_bits, pic->mb_var_sum, pic->mc_mb_var_sum, s->bit_rate/1000, (int)fps
  650.         );
  651.     }
  652.     if     (q<qmin) q=qmin; 
  653.     else if(q>qmax) q=qmax;
  654.     if(s->adaptive_quant)
  655.         adaptive_quantization(s, q);
  656.     else
  657.         q= (int)(q + 0.5);
  658.     
  659.     rcc->last_qscale= q;
  660.     rcc->last_mc_mb_var_sum= pic->mc_mb_var_sum;
  661.     rcc->last_mb_var_sum= pic->mb_var_sum;
  662. #if 0
  663. {
  664.     static int mvsum=0, texsum=0;
  665.     mvsum += s->mv_bits;
  666.     texsum += s->i_tex_bits + s->p_tex_bits;
  667.     printf("%d %d//nn", mvsum, texsum);
  668. }
  669. #endif
  670.     return q;
  671. }
  672. //----------------------------------------------
  673. // 2-Pass code
  674. static int init_pass2(MpegEncContext *s)
  675. {
  676.     RateControlContext *rcc= &s->rc_context;
  677.     AVCodecContext *a= s->avctx;
  678.     int i;
  679.     double fps= 1/av_q2d(s->avctx->time_base);
  680.     double complexity[5]={0,0,0,0,0};   // aproximate bits at quant=1
  681.     double avg_quantizer[5];
  682.     uint64_t const_bits[5]={0,0,0,0,0}; // quantizer idependant bits
  683.     uint64_t available_bits[5];
  684.     uint64_t all_const_bits;
  685.     uint64_t all_available_bits= (uint64_t)(s->bit_rate*(double)rcc->num_entries/fps);
  686.     double rate_factor=0;
  687.     double step;
  688.     //int last_i_frame=-10000000;
  689.     const int filter_size= (int)(a->qblur*4) | 1;  
  690.     double expected_bits;
  691.     double *qscale, *blured_qscale;
  692.     /* find complexity & const_bits & decide the pict_types */
  693.     for(i=0; i<rcc->num_entries; i++){
  694.         RateControlEntry *rce= &rcc->entry[i];
  695.         
  696.         rce->new_pict_type= rce->pict_type;
  697.         rcc->i_cplx_sum [rce->pict_type] += rce->i_tex_bits*rce->qscale;
  698.         rcc->p_cplx_sum [rce->pict_type] += rce->p_tex_bits*rce->qscale;
  699.         rcc->mv_bits_sum[rce->pict_type] += rce->mv_bits;
  700.         rcc->frame_count[rce->pict_type] ++;
  701.         complexity[rce->new_pict_type]+= (rce->i_tex_bits+ rce->p_tex_bits)*(double)rce->qscale;
  702.         const_bits[rce->new_pict_type]+= rce->mv_bits + rce->misc_bits;
  703.     }
  704.     all_const_bits= const_bits[I_TYPE] + const_bits[P_TYPE] + const_bits[B_TYPE];
  705.     
  706.     if(all_available_bits < all_const_bits){
  707.         av_log(s->avctx, AV_LOG_ERROR, "requested bitrate is to lown");
  708.         return -1;
  709.     }
  710.     
  711.     /* find average quantizers */
  712.     avg_quantizer[P_TYPE]=0;
  713.     for(step=256*256; step>0.0000001; step*=0.5){
  714.         double expected_bits=0;
  715.         avg_quantizer[P_TYPE]+= step;
  716.         
  717.         avg_quantizer[I_TYPE]= avg_quantizer[P_TYPE]*ABS(s->avctx->i_quant_factor) + s->avctx->i_quant_offset;
  718.         avg_quantizer[B_TYPE]= avg_quantizer[P_TYPE]*ABS(s->avctx->b_quant_factor) + s->avctx->b_quant_offset;
  719.         
  720.         expected_bits= 
  721.             + all_const_bits 
  722.             + complexity[I_TYPE]/avg_quantizer[I_TYPE]
  723.             + complexity[P_TYPE]/avg_quantizer[P_TYPE]
  724.             + complexity[B_TYPE]/avg_quantizer[B_TYPE];
  725.             
  726.         if(expected_bits < all_available_bits) avg_quantizer[P_TYPE]-= step;
  727. //printf("%f %lld %fn", expected_bits, all_available_bits, avg_quantizer[P_TYPE]);
  728.     }
  729. //printf("qp_i:%f, qp_p:%f, qp_b:%fn", avg_quantizer[I_TYPE],avg_quantizer[P_TYPE],avg_quantizer[B_TYPE]);
  730.     for(i=0; i<5; i++){
  731.         available_bits[i]= const_bits[i] + complexity[i]/avg_quantizer[i];
  732.     }
  733. //printf("%lld %lld %lld %lldn", available_bits[I_TYPE], available_bits[P_TYPE], available_bits[B_TYPE], all_available_bits);
  734.         
  735.     qscale= av_malloc(sizeof(double)*rcc->num_entries);
  736.     blured_qscale= av_malloc(sizeof(double)*rcc->num_entries);
  737.     for(step=256*256; step>0.0000001; step*=0.5){
  738.         expected_bits=0;
  739.         rate_factor+= step;
  740.         
  741.         rcc->buffer_index= s->avctx->rc_buffer_size/2;
  742.         /* find qscale */
  743.         for(i=0; i<rcc->num_entries; i++){
  744.             qscale[i]= get_qscale(s, &rcc->entry[i], rate_factor, i);
  745.         }
  746.         assert(filter_size%2==1);
  747.         /* fixed I/B QP relative to P mode */
  748.         for(i=rcc->num_entries-1; i>=0; i--){
  749.             RateControlEntry *rce= &rcc->entry[i];
  750.             
  751.             qscale[i]= get_diff_limited_q(s, rce, qscale[i]);
  752.         }
  753.         /* smooth curve */
  754.         for(i=0; i<rcc->num_entries; i++){
  755.             RateControlEntry *rce= &rcc->entry[i];
  756.             const int pict_type= rce->new_pict_type;
  757.             int j;
  758.             double q=0.0, sum=0.0;
  759.         
  760.             for(j=0; j<filter_size; j++){
  761.                 int index= i+j-filter_size/2;
  762.                 double d= index-i;
  763.                 double coeff= a->qblur==0 ? 1.0 : exp(-d*d/(a->qblur * a->qblur));
  764.             
  765.                 if(index < 0 || index >= rcc->num_entries) continue;
  766.                 if(pict_type != rcc->entry[index].new_pict_type) continue;
  767.                 q+= qscale[index] * coeff;
  768.                 sum+= coeff;
  769.             }
  770.             blured_qscale[i]= q/sum;
  771.         }
  772.     
  773.         /* find expected bits */
  774.         for(i=0; i<rcc->num_entries; i++){
  775.             RateControlEntry *rce= &rcc->entry[i];
  776.             double bits;
  777.             rce->new_qscale= modify_qscale(s, rce, blured_qscale[i], i);
  778.             bits= qp2bits(rce, rce->new_qscale) + rce->mv_bits + rce->misc_bits;
  779. //printf("%d %fn", rce->new_bits, blured_qscale[i]);
  780.             bits += 8*ff_vbv_update(s, bits);
  781.             rce->expected_bits= expected_bits;
  782.             expected_bits += bits;
  783.         }
  784. //        printf("%f %d %fn", expected_bits, (int)all_available_bits, rate_factor);
  785.         if(expected_bits > all_available_bits) rate_factor-= step;
  786.     }
  787.     av_free(qscale);
  788.     av_free(blured_qscale);
  789.     if(abs(expected_bits/all_available_bits - 1.0) > 0.01 ){
  790.         av_log(s->avctx, AV_LOG_ERROR, "Error: 2pass curve failed to convergen");
  791.         return -1;
  792.     }
  793.     return 0;
  794. }