cabac.c
上传用户:hjq518
上传日期:2021-12-09
资源大小:5084k
文件大小:38k
源码类别:

Audio

开发平台:

Visual C++

  1. /*****************************************************************************
  2.  * cabac.c: h264 encoder library
  3.  *****************************************************************************
  4.  * Copyright (C) 2003-2008 x264 project
  5.  *
  6.  * Authors: Laurent Aimar <fenrir@via.ecp.fr>
  7.  *          Loren Merritt <lorenm@u.washington.edu>
  8.  *
  9.  * This program is free software; you can redistribute it and/or modify
  10.  * it under the terms of the GNU General Public License as published by
  11.  * the Free Software Foundation; either version 2 of the License, or
  12.  * (at your option) any later version.
  13.  *
  14.  * This program is distributed in the hope that it will be useful,
  15.  * but WITHOUT ANY WARRANTY; without even the implied warranty of
  16.  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  17.  * GNU General Public License for more details.
  18.  *
  19.  * You should have received a copy of the GNU General Public License
  20.  * along with this program; if not, write to the Free Software
  21.  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA  02111, USA.
  22.  *****************************************************************************/
  23. #include "common/common.h"
  24. #include "macroblock.h"
  25. static inline void x264_cabac_mb_type_intra( x264_t *h, x264_cabac_t *cb, int i_mb_type,
  26.                     int ctx0, int ctx1, int ctx2, int ctx3, int ctx4, int ctx5 )
  27. {
  28.     if( i_mb_type == I_4x4 || i_mb_type == I_8x8 )
  29.     {
  30.         x264_cabac_encode_decision( cb, ctx0, 0 );
  31.     }
  32.     else if( i_mb_type == I_PCM )
  33.     {
  34.         x264_cabac_encode_decision( cb, ctx0, 1 );
  35.         x264_cabac_encode_flush( h, cb );
  36.     }
  37.     else
  38.     {
  39.         int i_pred = x264_mb_pred_mode16x16_fix[h->mb.i_intra16x16_pred_mode];
  40.         x264_cabac_encode_decision( cb, ctx0, 1 );
  41.         x264_cabac_encode_terminal( cb );
  42.         x264_cabac_encode_decision( cb, ctx1, !!h->mb.i_cbp_luma );
  43.         if( h->mb.i_cbp_chroma == 0 )
  44.         {
  45.             x264_cabac_encode_decision( cb, ctx2, 0 );
  46.         }
  47.         else
  48.         {
  49.             x264_cabac_encode_decision( cb, ctx2, 1 );
  50.             x264_cabac_encode_decision( cb, ctx3, h->mb.i_cbp_chroma != 1 );
  51.         }
  52.         x264_cabac_encode_decision( cb, ctx4, i_pred>>1 );
  53.         x264_cabac_encode_decision( cb, ctx5, i_pred&1 );
  54.     }
  55. }
  56. static void x264_cabac_mb_type( x264_t *h, x264_cabac_t *cb )
  57. {
  58.     const int i_mb_type = h->mb.i_type;
  59.     if( h->sh.b_mbaff &&
  60.         (!(h->mb.i_mb_y & 1) || IS_SKIP(h->mb.type[h->mb.i_mb_xy - h->mb.i_mb_stride])) )
  61.     {
  62.         x264_cabac_encode_decision( cb, 70 + h->mb.cache.i_neighbour_interlaced, h->mb.b_interlaced );
  63.     }
  64.     if( h->sh.i_type == SLICE_TYPE_I )
  65.     {
  66.         int ctx = 0;
  67.         if( h->mb.i_mb_type_left >= 0 && h->mb.i_mb_type_left != I_4x4 )
  68.         {
  69.             ctx++;
  70.         }
  71.         if( h->mb.i_mb_type_top >= 0 && h->mb.i_mb_type_top != I_4x4 )
  72.         {
  73.             ctx++;
  74.         }
  75.         x264_cabac_mb_type_intra( h, cb, i_mb_type, 3+ctx, 3+3, 3+4, 3+5, 3+6, 3+7 );
  76.     }
  77.     else if( h->sh.i_type == SLICE_TYPE_P )
  78.     {
  79.         /* prefix: 14, suffix: 17 */
  80.         if( i_mb_type == P_L0 )
  81.         {
  82.             if( h->mb.i_partition == D_16x16 )
  83.             {
  84.                 x264_cabac_encode_decision( cb, 14, 0 );
  85.                 x264_cabac_encode_decision( cb, 15, 0 );
  86.                 x264_cabac_encode_decision( cb, 16, 0 );
  87.             }
  88.             else if( h->mb.i_partition == D_16x8 )
  89.             {
  90.                 x264_cabac_encode_decision( cb, 14, 0 );
  91.                 x264_cabac_encode_decision( cb, 15, 1 );
  92.                 x264_cabac_encode_decision( cb, 17, 1 );
  93.             }
  94.             else if( h->mb.i_partition == D_8x16 )
  95.             {
  96.                 x264_cabac_encode_decision( cb, 14, 0 );
  97.                 x264_cabac_encode_decision( cb, 15, 1 );
  98.                 x264_cabac_encode_decision( cb, 17, 0 );
  99.             }
  100.         }
  101.         else if( i_mb_type == P_8x8 )
  102.         {
  103.             x264_cabac_encode_decision( cb, 14, 0 );
  104.             x264_cabac_encode_decision( cb, 15, 0 );
  105.             x264_cabac_encode_decision( cb, 16, 1 );
  106.         }
  107.         else /* intra */
  108.         {
  109.             /* prefix */
  110.             x264_cabac_encode_decision( cb, 14, 1 );
  111.             /* suffix */
  112.             x264_cabac_mb_type_intra( h, cb, i_mb_type, 17+0, 17+1, 17+2, 17+2, 17+3, 17+3 );
  113.         }
  114.     }
  115.     else if( h->sh.i_type == SLICE_TYPE_B )
  116.     {
  117.         int ctx = 0;
  118.         if( h->mb.i_mb_type_left >= 0 && h->mb.i_mb_type_left != B_SKIP && h->mb.i_mb_type_left != B_DIRECT )
  119.         {
  120.             ctx++;
  121.         }
  122.         if( h->mb.i_mb_type_top >= 0 && h->mb.i_mb_type_top != B_SKIP && h->mb.i_mb_type_top != B_DIRECT )
  123.         {
  124.             ctx++;
  125.         }
  126.         if( i_mb_type == B_DIRECT )
  127.         {
  128.             x264_cabac_encode_decision( cb, 27+ctx, 0 );
  129.         }
  130.         else if( i_mb_type == B_8x8 )
  131.         {
  132.             x264_cabac_encode_decision( cb, 27+ctx, 1 );
  133.             x264_cabac_encode_decision( cb, 27+3,   1 );
  134.             x264_cabac_encode_decision( cb, 27+4,   1 );
  135.             x264_cabac_encode_decision( cb, 27+5,   1 );
  136.             x264_cabac_encode_decision( cb, 27+5,   1 );
  137.             x264_cabac_encode_decision( cb, 27+5,   1 );
  138.         }
  139.         else if( IS_INTRA( i_mb_type ) )
  140.         {
  141.             /* prefix */
  142.             x264_cabac_encode_decision( cb, 27+ctx, 1 );
  143.             x264_cabac_encode_decision( cb, 27+3,   1 );
  144.             x264_cabac_encode_decision( cb, 27+4,   1 );
  145.             x264_cabac_encode_decision( cb, 27+5,   1 );
  146.             x264_cabac_encode_decision( cb, 27+5,   0 );
  147.             x264_cabac_encode_decision( cb, 27+5,   1 );
  148.             /* suffix */
  149.             x264_cabac_mb_type_intra( h, cb, i_mb_type, 32+0, 32+1, 32+2, 32+2, 32+3, 32+3 );
  150.         }
  151.         else
  152.         {
  153.             static const int i_mb_len[9*3] =
  154.             {
  155.                 6, 6, 3,    /* L0 L0 */
  156.                 6, 6, 0,    /* L0 L1 */
  157.                 7, 7, 0,    /* L0 BI */
  158.                 6, 6, 0,    /* L1 L0 */
  159.                 6, 6, 3,    /* L1 L1 */
  160.                 7, 7, 0,    /* L1 BI */
  161.                 7, 7, 0,    /* BI L0 */
  162.                 7, 7, 0,    /* BI L1 */
  163.                 7, 7, 6,    /* BI BI */
  164.             };
  165.             static const int i_mb_bits[9*3][7] =
  166.             {
  167.                 { 1,1,0,0,0,1   }, { 1,1,0,0,1,0,  }, { 1,0,0 },       /* L0 L0 */
  168.                 { 1,1,0,1,0,1   }, { 1,1,0,1,1,0   }, {0},             /* L0 L1 */
  169.                 { 1,1,1,0,0,0,0 }, { 1,1,1,0,0,0,1 }, {0},             /* L0 BI */
  170.                 { 1,1,0,1,1,1   }, { 1,1,1,1,1,0   }, {0},             /* L1 L0 */
  171.                 { 1,1,0,0,1,1   }, { 1,1,0,1,0,0   }, { 1,0,1 },       /* L1 L1 */
  172.                 { 1,1,1,0,0,1,0 }, { 1,1,1,0,0,1,1 }, {0},             /* L1 BI */
  173.                 { 1,1,1,0,1,0,0 }, { 1,1,1,0,1,0,1 }, {0},             /* BI L0 */
  174.                 { 1,1,1,0,1,1,0 }, { 1,1,1,0,1,1,1 }, {0},             /* BI L1 */
  175.                 { 1,1,1,1,0,0,0 }, { 1,1,1,1,0,0,1 }, { 1,1,0,0,0,0 }, /* BI BI */
  176.             };
  177.             const int idx = (i_mb_type - B_L0_L0) * 3 + (h->mb.i_partition - D_16x8);
  178.             int i;
  179.             x264_cabac_encode_decision( cb, 27+ctx, i_mb_bits[idx][0] );
  180.             x264_cabac_encode_decision( cb, 27+3,   i_mb_bits[idx][1] );
  181.             x264_cabac_encode_decision( cb, 27+5-i_mb_bits[idx][1], i_mb_bits[idx][2] );
  182.             for( i = 3; i < i_mb_len[idx]; i++ )
  183.                 x264_cabac_encode_decision( cb, 27+5, i_mb_bits[idx][i] );
  184.         }
  185.     }
  186.     else
  187.     {
  188.         x264_log(h, X264_LOG_ERROR, "unknown SLICE_TYPE unsupported in x264_macroblock_write_cabacn" );
  189.     }
  190. }
  191. static void x264_cabac_mb_intra4x4_pred_mode( x264_cabac_t *cb, int i_pred, int i_mode )
  192. {
  193.     if( i_pred == i_mode )
  194.     {
  195.         /* b_prev_intra4x4_pred_mode */
  196.         x264_cabac_encode_decision( cb, 68, 1 );
  197.     }
  198.     else
  199.     {
  200.         /* b_prev_intra4x4_pred_mode */
  201.         x264_cabac_encode_decision( cb, 68, 0 );
  202.         if( i_mode > i_pred  )
  203.         {
  204.             i_mode--;
  205.         }
  206.         x264_cabac_encode_decision( cb, 69, (i_mode     )&0x01 );
  207.         x264_cabac_encode_decision( cb, 69, (i_mode >> 1)&0x01 );
  208.         x264_cabac_encode_decision( cb, 69, (i_mode >> 2)&0x01 );
  209.     }
  210. }
  211. static void x264_cabac_mb_intra_chroma_pred_mode( x264_t *h, x264_cabac_t *cb )
  212. {
  213.     const int i_mode = x264_mb_pred_mode8x8c_fix[ h->mb.i_chroma_pred_mode ];
  214.     int       ctx = 0;
  215.     /* No need to test for I4x4 or I_16x16 as cache_save handle that */
  216.     if( (h->mb.i_neighbour & MB_LEFT) && h->mb.chroma_pred_mode[h->mb.i_mb_xy - 1] != 0 )
  217.     {
  218.         ctx++;
  219.     }
  220.     if( (h->mb.i_neighbour & MB_TOP) && h->mb.chroma_pred_mode[h->mb.i_mb_top_xy] != 0 )
  221.     {
  222.         ctx++;
  223.     }
  224.     x264_cabac_encode_decision( cb, 64 + ctx, i_mode > 0 );
  225.     if( i_mode > 0 )
  226.     {
  227.         x264_cabac_encode_decision( cb, 64 + 3, i_mode > 1 );
  228.         if( i_mode > 1 )
  229.         {
  230.             x264_cabac_encode_decision( cb, 64 + 3, i_mode > 2 );
  231.         }
  232.     }
  233. }
  234. static void x264_cabac_mb_cbp_luma( x264_t *h, x264_cabac_t *cb )
  235. {
  236.     int cbp = h->mb.i_cbp_luma;
  237.     int cbp_l = h->mb.i_neighbour & MB_LEFT ? h->mb.cbp[h->mb.i_mb_xy - 1] : -1;
  238.     int cbp_t = h->mb.i_neighbour & MB_TOP ? h->mb.cbp[h->mb.i_mb_top_xy] : -1;
  239.     x264_cabac_encode_decision( cb, 76 - ((cbp_l >> 1) & 1) - ((cbp_t >> 1) & 2), (h->mb.i_cbp_luma >> 0) & 1 );
  240.     x264_cabac_encode_decision( cb, 76 - ((cbp   >> 0) & 1) - ((cbp_t >> 2) & 2), (h->mb.i_cbp_luma >> 1) & 1 );
  241.     x264_cabac_encode_decision( cb, 76 - ((cbp_l >> 3) & 1) - ((cbp   << 1) & 2), (h->mb.i_cbp_luma >> 2) & 1 );
  242.     x264_cabac_encode_decision( cb, 76 - ((cbp   >> 2) & 1) - ((cbp   >> 0) & 2), (h->mb.i_cbp_luma >> 3) & 1 );
  243. }
  244. static void x264_cabac_mb_cbp_chroma( x264_t *h, x264_cabac_t *cb )
  245. {
  246.     int cbp_a = -1;
  247.     int cbp_b = -1;
  248.     int ctx;
  249.     /* No need to test for SKIP/PCM */
  250.     if( h->mb.i_neighbour & MB_LEFT )
  251.     {
  252.         cbp_a = (h->mb.cbp[h->mb.i_mb_xy - 1] >> 4)&0x3;
  253.     }
  254.     if( h->mb.i_neighbour & MB_TOP )
  255.     {
  256.         cbp_b = (h->mb.cbp[h->mb.i_mb_top_xy] >> 4)&0x3;
  257.     }
  258.     ctx = 0;
  259.     if( cbp_a > 0 ) ctx++;
  260.     if( cbp_b > 0 ) ctx += 2;
  261.     if( h->mb.i_cbp_chroma == 0 )
  262.     {
  263.         x264_cabac_encode_decision( cb, 77 + ctx, 0 );
  264.     }
  265.     else
  266.     {
  267.         x264_cabac_encode_decision( cb, 77 + ctx, 1 );
  268.         ctx = 4;
  269.         if( cbp_a == 2 ) ctx++;
  270.         if( cbp_b == 2 ) ctx += 2;
  271.         x264_cabac_encode_decision( cb, 77 + ctx, h->mb.i_cbp_chroma > 1 );
  272.     }
  273. }
  274. /* TODO check it with != qp per mb */
  275. static void x264_cabac_mb_qp_delta( x264_t *h, x264_cabac_t *cb )
  276. {
  277.     int i_mbn_xy = h->mb.i_mb_prev_xy;
  278.     int i_dqp = h->mb.i_qp - h->mb.i_last_qp;
  279.     int ctx;
  280.     /* Avoid writing a delta quant if we have an empty i16x16 block, e.g. in a completely flat background area */
  281.     if( h->mb.i_type == I_16x16 && !h->mb.cbp[h->mb.i_mb_xy] )
  282.     {
  283. #ifndef RDO_SKIP_BS
  284.         h->mb.i_qp = h->mb.i_last_qp;
  285. #endif
  286.         i_dqp = 0;
  287.     }
  288.     /* No need to test for PCM / SKIP */
  289.     if( h->mb.i_last_dqp &&
  290.         ( h->mb.type[i_mbn_xy] == I_16x16 || (h->mb.cbp[i_mbn_xy]&0x3f) ) )
  291.         ctx = 1;
  292.     else
  293.         ctx = 0;
  294.     if( i_dqp != 0 )
  295.     {
  296.         int val = i_dqp <= 0 ? (-2*i_dqp) : (2*i_dqp - 1);
  297.         /* dqp is interpreted modulo 52 */
  298.         if( val >= 51 && val != 52 )
  299.             val = 103 - val;
  300.         while( val-- )
  301.         {
  302.             x264_cabac_encode_decision( cb, 60 + ctx, 1 );
  303.             if( ctx < 2 )
  304.                 ctx = 2;
  305.             else
  306.                 ctx = 3;
  307.         }
  308.     }
  309.     x264_cabac_encode_decision( cb, 60 + ctx, 0 );
  310. }
  311. #ifndef RDO_SKIP_BS
  312. void x264_cabac_mb_skip( x264_t *h, int b_skip )
  313. {
  314.     int ctx = (h->mb.i_mb_type_left >= 0 && !IS_SKIP( h->mb.i_mb_type_left ))
  315.             + (h->mb.i_mb_type_top >= 0 && !IS_SKIP( h->mb.i_mb_type_top ))
  316.             + (h->sh.i_type == SLICE_TYPE_P ? 11 : 24);
  317.     x264_cabac_encode_decision( &h->cabac, ctx, b_skip );
  318. }
  319. #endif
  320. static inline void x264_cabac_mb_sub_p_partition( x264_cabac_t *cb, int i_sub )
  321. {
  322.     if( i_sub == D_L0_8x8 )
  323.     {
  324.         x264_cabac_encode_decision( cb, 21, 1 );
  325.     }
  326.     else if( i_sub == D_L0_8x4 )
  327.     {
  328.         x264_cabac_encode_decision( cb, 21, 0 );
  329.         x264_cabac_encode_decision( cb, 22, 0 );
  330.     }
  331.     else if( i_sub == D_L0_4x8 )
  332.     {
  333.         x264_cabac_encode_decision( cb, 21, 0 );
  334.         x264_cabac_encode_decision( cb, 22, 1 );
  335.         x264_cabac_encode_decision( cb, 23, 1 );
  336.     }
  337.     else if( i_sub == D_L0_4x4 )
  338.     {
  339.         x264_cabac_encode_decision( cb, 21, 0 );
  340.         x264_cabac_encode_decision( cb, 22, 1 );
  341.         x264_cabac_encode_decision( cb, 23, 0 );
  342.     }
  343. }
  344. static NOINLINE void x264_cabac_mb_sub_b_partition( x264_cabac_t *cb, int i_sub )
  345. {
  346.     static const uint8_t part_bits[12][7] = {
  347.         {6,1,1,1,0,1,1}, // D_L0_4x4
  348.         {5,1,1,0,0,1},   // D_L0_8x4
  349.         {5,1,1,0,1,0},   // D_L0_4x8
  350.         {3,1,0,0},       // D_L0_8x8
  351.         {5,1,1,1,1,0},   // D_L1_4x4
  352.         {5,1,1,0,1,1},   // D_L1_8x4
  353.         {6,1,1,1,0,0,0}, // D_L1_4x8
  354.         {3,1,0,1},       // D_L1_8x8
  355.         {5,1,1,1,1,1},   // D_BI_4x4
  356.         {6,1,1,1,0,0,1}, // D_BI_8x4
  357.         {6,1,1,1,0,1,0}, // D_BI_4x8
  358.         {5,1,1,0,0,0},   // D_BI_8x8
  359.     };
  360.     int len;
  361.     if( i_sub == D_DIRECT_8x8 )
  362.     {
  363.         x264_cabac_encode_decision( cb, 36, 0 );
  364.         return;
  365.     }
  366.     len = part_bits[i_sub][0];
  367.     x264_cabac_encode_decision( cb, 36, part_bits[i_sub][1] );
  368.     x264_cabac_encode_decision( cb, 37, part_bits[i_sub][2] );
  369.     if( len == 3 )
  370.         x264_cabac_encode_decision( cb, 39, part_bits[i_sub][3] );
  371.     else
  372.     {
  373.         x264_cabac_encode_decision( cb, 38, part_bits[i_sub][3] );
  374.         x264_cabac_encode_decision( cb, 39, part_bits[i_sub][4] );
  375.         x264_cabac_encode_decision( cb, 39, part_bits[i_sub][5] );
  376.         if( len == 6 )
  377.             x264_cabac_encode_decision( cb, 39, part_bits[i_sub][6] );
  378.     }
  379. }
  380. static inline void x264_cabac_mb_transform_size( x264_t *h, x264_cabac_t *cb )
  381. {
  382.     int ctx = 399 + h->mb.cache.i_neighbour_transform_size;
  383.     x264_cabac_encode_decision( cb, ctx, h->mb.b_transform_8x8 );
  384. }
  385. static inline void x264_cabac_mb_ref( x264_t *h, x264_cabac_t *cb, int i_list, int idx )
  386. {
  387.     const int i8 = x264_scan8[idx];
  388.     const int i_refa = h->mb.cache.ref[i_list][i8 - 1];
  389.     const int i_refb = h->mb.cache.ref[i_list][i8 - 8];
  390.     int i_ref  = h->mb.cache.ref[i_list][i8];
  391.     int ctx  = 0;
  392.     if( i_refa > 0 && !h->mb.cache.skip[i8 - 1])
  393.         ctx++;
  394.     if( i_refb > 0 && !h->mb.cache.skip[i8 - 8])
  395.         ctx += 2;
  396.     while( i_ref > 0 )
  397.     {
  398.         x264_cabac_encode_decision( cb, 54 + ctx, 1 );
  399.         if( ctx < 4 )
  400.             ctx = 4;
  401.         else
  402.             ctx = 5;
  403.         i_ref--;
  404.     }
  405.     x264_cabac_encode_decision( cb, 54 + ctx, 0 );
  406. }
  407. static inline void x264_cabac_mb_mvd_cpn( x264_t *h, x264_cabac_t *cb, int i_list, int idx, int l, int mvd )
  408. {
  409.     static const uint8_t transition[7] = { 3,3,3,4,5,6,6 };
  410.     const int amvd = abs( h->mb.cache.mvd[i_list][x264_scan8[idx] - 1][l] ) +
  411.                      abs( h->mb.cache.mvd[i_list][x264_scan8[idx] - 8][l] );
  412.     const int i_abs = abs( mvd );
  413.     const int i_prefix = X264_MIN( i_abs, 9 );
  414.     const int ctxbase = l ? 47 : 40;
  415.     int ctx = (amvd>2) + (amvd>32);
  416.     int i;
  417.     for( i = 0; i < i_prefix; i++ )
  418.     {
  419.         x264_cabac_encode_decision( cb, ctxbase + ctx, 1 );
  420.         ctx = transition[ctx];
  421.     }
  422.     if( i_prefix < 9 )
  423.         x264_cabac_encode_decision( cb, ctxbase + ctx, 0 );
  424.     else
  425.         x264_cabac_encode_ue_bypass( cb, 3, i_abs - 9 );
  426.     /* sign */
  427.     if( mvd )
  428.         x264_cabac_encode_bypass( cb, mvd < 0 );
  429. }
  430. static inline void x264_cabac_mb_mvd( x264_t *h, x264_cabac_t *cb, int i_list, int idx, int width, int height )
  431. {
  432.     DECLARE_ALIGNED_4( int16_t mvp[2] );
  433.     int mdx, mdy;
  434.     /* Calculate mvd */
  435.     x264_mb_predict_mv( h, i_list, idx, width, mvp );
  436.     mdx = h->mb.cache.mv[i_list][x264_scan8[idx]][0] - mvp[0];
  437.     mdy = h->mb.cache.mv[i_list][x264_scan8[idx]][1] - mvp[1];
  438.     /* encode */
  439.     x264_cabac_mb_mvd_cpn( h, cb, i_list, idx, 0, mdx );
  440.     x264_cabac_mb_mvd_cpn( h, cb, i_list, idx, 1, mdy );
  441.     /* save value */
  442.     x264_macroblock_cache_mvd( h, block_idx_x[idx], block_idx_y[idx], width, height, i_list, pack16to32_mask(mdx,mdy) );
  443. }
  444. static inline void x264_cabac_mb8x8_mvd( x264_t *h, x264_cabac_t *cb, int i_list, int i )
  445. {
  446.     if( !x264_mb_partition_listX_table[i_list][ h->mb.i_sub_partition[i] ] )
  447.         return;
  448.     switch( h->mb.i_sub_partition[i] )
  449.     {
  450.         case D_L0_8x8:
  451.         case D_L1_8x8:
  452.         case D_BI_8x8:
  453.             x264_cabac_mb_mvd( h, cb, i_list, 4*i, 2, 2 );
  454.             break;
  455.         case D_L0_8x4:
  456.         case D_L1_8x4:
  457.         case D_BI_8x4:
  458.             x264_cabac_mb_mvd( h, cb, i_list, 4*i+0, 2, 1 );
  459.             x264_cabac_mb_mvd( h, cb, i_list, 4*i+2, 2, 1 );
  460.             break;
  461.         case D_L0_4x8:
  462.         case D_L1_4x8:
  463.         case D_BI_4x8:
  464.             x264_cabac_mb_mvd( h, cb, i_list, 4*i+0, 1, 2 );
  465.             x264_cabac_mb_mvd( h, cb, i_list, 4*i+1, 1, 2 );
  466.             break;
  467.         case D_L0_4x4:
  468.         case D_L1_4x4:
  469.         case D_BI_4x4:
  470.             x264_cabac_mb_mvd( h, cb, i_list, 4*i+0, 1, 1 );
  471.             x264_cabac_mb_mvd( h, cb, i_list, 4*i+1, 1, 1 );
  472.             x264_cabac_mb_mvd( h, cb, i_list, 4*i+2, 1, 1 );
  473.             x264_cabac_mb_mvd( h, cb, i_list, 4*i+3, 1, 1 );
  474.             break;
  475.     }
  476. }
  477. static int x264_cabac_mb_cbf_ctxidxinc( x264_t *h, int i_cat, int i_idx )
  478. {
  479.     /* i_ctxBlockCat: 0-> DC 16x16  i_idx = 0
  480.      *                1-> AC 16x16  i_idx = luma4x4idx
  481.      *                2-> Luma4x4   i_idx = luma4x4idx
  482.      *                3-> DC Chroma i_idx = iCbCr
  483.      *                4-> AC Chroma i_idx = 4 * iCbCr + chroma4x4idx
  484.      *                5-> Luma8x8   i_idx = luma8x8idx
  485.      */
  486.     int i_mba_xy = -1;
  487.     int i_mbb_xy = -1;
  488.     int i_nza = 0;
  489.     int i_nzb = 0;
  490.     if( i_cat == DCT_LUMA_DC )
  491.     {
  492.         if( h->mb.i_neighbour & MB_LEFT )
  493.         {
  494.             i_mba_xy = h->mb.i_mb_xy - 1;
  495.             i_nza = h->mb.cbp[i_mba_xy] & 0x100;
  496.         }
  497.         if( h->mb.i_neighbour & MB_TOP )
  498.         {
  499.             i_mbb_xy = h->mb.i_mb_top_xy;
  500.             i_nzb = h->mb.cbp[i_mbb_xy] & 0x100;
  501.         }
  502.     }
  503.     else if( i_cat == DCT_LUMA_AC || i_cat == DCT_LUMA_4x4 )
  504.     {
  505.         if( i_idx & ~10 ) // block_idx_x > 0
  506.             i_mba_xy = h->mb.i_mb_xy;
  507.         else if( h->mb.i_neighbour & MB_LEFT )
  508.             i_mba_xy = h->mb.i_mb_xy - 1;
  509.         if( i_idx & ~5 ) // block_idx_y > 0
  510.             i_mbb_xy = h->mb.i_mb_xy;
  511.         else if( h->mb.i_neighbour & MB_TOP )
  512.             i_mbb_xy = h->mb.i_mb_top_xy;
  513.         /* no need to test for skip/pcm */
  514.         if( i_mba_xy >= 0 )
  515.             i_nza = h->mb.cache.non_zero_count[x264_scan8[i_idx] - 1];
  516.         if( i_mbb_xy >= 0 )
  517.             i_nzb = h->mb.cache.non_zero_count[x264_scan8[i_idx] - 8];
  518.     }
  519.     else if( i_cat == DCT_CHROMA_DC )
  520.     {
  521.         /* no need to test skip/pcm */
  522.         if( h->mb.i_neighbour & MB_LEFT )
  523.         {
  524.             i_mba_xy = h->mb.i_mb_xy - 1;
  525.             i_nza = h->mb.cbp[i_mba_xy] & (0x200 << i_idx);
  526.         }
  527.         if( h->mb.i_neighbour & MB_TOP )
  528.         {
  529.             i_mbb_xy = h->mb.i_mb_top_xy;
  530.             i_nzb = h->mb.cbp[i_mbb_xy] & (0x200 << i_idx);
  531.         }
  532.     }
  533.     else if( i_cat == DCT_CHROMA_AC )
  534.     {
  535.         if( i_idx & 1 )
  536.             i_mba_xy = h->mb.i_mb_xy;
  537.         else if( h->mb.i_neighbour & MB_LEFT )
  538.             i_mba_xy = h->mb.i_mb_xy - 1;
  539.         if( i_idx & 2 )
  540.             i_mbb_xy = h->mb.i_mb_xy;
  541.         else if( h->mb.i_neighbour & MB_TOP )
  542.             i_mbb_xy = h->mb.i_mb_top_xy;
  543.         /* no need to test skip/pcm */
  544.         if( i_mba_xy >= 0 )
  545.             i_nza = h->mb.cache.non_zero_count[x264_scan8[i_idx] - 1];
  546.         if( i_mbb_xy >= 0 )
  547.             i_nzb = h->mb.cache.non_zero_count[x264_scan8[i_idx] - 8];
  548.     }
  549.     if( IS_INTRA( h->mb.i_type ) )
  550.     {
  551.         i_nza |= i_mba_xy < 0;
  552.         i_nzb |= i_mbb_xy < 0;
  553.     }
  554.     return 4*i_cat + 2*!!i_nzb + !!i_nza;
  555. }
  556. static const uint16_t significant_coeff_flag_offset[2][6] = {
  557.     { 105, 120, 134, 149, 152, 402 },
  558.     { 277, 292, 306, 321, 324, 436 }
  559. };
  560. static const uint16_t last_coeff_flag_offset[2][6] = {
  561.     { 166, 181, 195, 210, 213, 417 },
  562.     { 338, 353, 367, 382, 385, 451 }
  563. };
  564. static const uint16_t coeff_abs_level_m1_offset[6] =
  565.     { 227, 237, 247, 257, 266, 426 };
  566. static const uint8_t significant_coeff_flag_offset_8x8[2][63] =
  567. {{
  568.     0, 1, 2, 3, 4, 5, 5, 4, 4, 3, 3, 4, 4, 4, 5, 5,
  569.     4, 4, 4, 4, 3, 3, 6, 7, 7, 7, 8, 9,10, 9, 8, 7,
  570.     7, 6,11,12,13,11, 6, 7, 8, 9,14,10, 9, 8, 6,11,
  571.    12,13,11, 6, 9,14,10, 9,11,12,13,11,14,10,12
  572. },{
  573.     0, 1, 1, 2, 2, 3, 3, 4, 5, 6, 7, 7, 7, 8, 4, 5,
  574.     6, 9,10,10, 8,11,12,11, 9, 9,10,10, 8,11,12,11,
  575.     9, 9,10,10, 8,11,12,11, 9, 9,10,10, 8,13,13, 9,
  576.     9,10,10, 8,13,13, 9, 9,10,10,14,14,14,14,14
  577. }};
  578. static const uint8_t last_coeff_flag_offset_8x8[63] = {
  579.     0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
  580.     2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
  581.     3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4,
  582.     5, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8, 8
  583. };
  584. static const uint8_t identity[16] =
  585.     { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 };
  586. // node ctx: 0..3: abslevel1 (with abslevelgt1 == 0).
  587. //           4..7: abslevelgt1 + 3 (and abslevel1 doesn't matter).
  588. /* map node ctx => cabac ctx for level=1 */
  589. static const int coeff_abs_level1_ctx[8] = { 1, 2, 3, 4, 0, 0, 0, 0 };
  590. /* map node ctx => cabac ctx for level>1 */
  591. static const int coeff_abs_levelgt1_ctx[8] = { 5, 5, 5, 5, 6, 7, 8, 9 };
  592. static const uint8_t coeff_abs_level_transition[2][8] = {
  593. /* update node ctx after coding a level=1 */
  594.     { 1, 2, 3, 3, 4, 5, 6, 7 },
  595. /* update node ctx after coding a level>1 */
  596.     { 4, 4, 4, 4, 5, 6, 7, 7 }
  597. };
  598. static void block_residual_write_cabac( x264_t *h, x264_cabac_t *cb, int i_ctxBlockCat, int i_idx, int16_t *l, int i_count )
  599. {
  600.     const int i_ctx_sig = significant_coeff_flag_offset[h->mb.b_interlaced][i_ctxBlockCat];
  601.     const int i_ctx_last = last_coeff_flag_offset[h->mb.b_interlaced][i_ctxBlockCat];
  602.     const int i_ctx_level = coeff_abs_level_m1_offset[i_ctxBlockCat];
  603.     int i_coeff_abs_m1[64];
  604.     int UNUSED i_coeff_sign[64];
  605.     int i_coeff = 0;
  606.     int i_last  = 0;
  607.     int i_sigmap_size;
  608.     int node_ctx = 0;
  609.     int i, j;
  610.     const uint8_t *significant_coeff_flag_offset;
  611.     const uint8_t *last_coeff_flag_offset;
  612.     /* yes this is always aligned, and l[-1] exists in the cases where it's used (ac) */
  613.     for( j = i_count - 4; j >= -1; j -= 4 )
  614.         if( *(uint64_t*)(l+j) )
  615.             break;
  616.     if( i_count != 64 )
  617.     {
  618.         /* coded block flag */
  619.         int ctx = 85 + x264_cabac_mb_cbf_ctxidxinc( h, i_ctxBlockCat, i_idx );
  620.         if( j >= -1 )
  621.             x264_cabac_encode_decision( cb, ctx, 1 );
  622.         else
  623.         {
  624.             x264_cabac_encode_decision( cb, ctx, 0 );
  625.             return;
  626.         }
  627.     }
  628.     significant_coeff_flag_offset = (i_ctxBlockCat == DCT_LUMA_8x8)
  629.                                   ? significant_coeff_flag_offset_8x8[h->mb.b_interlaced]
  630.                                   : identity;
  631.     last_coeff_flag_offset = (i_ctxBlockCat == DCT_LUMA_8x8)
  632.                            ? last_coeff_flag_offset_8x8 : identity;
  633.     for( i = j; i < j+4; i++)
  634.         if( l[i] )
  635.             i_last = i;
  636.     i_sigmap_size = X264_MIN( i_last+1, i_count-1 );
  637.     for( i = 0; i < i_sigmap_size; i++ )
  638.     {
  639.         if( l[i] )
  640.         {
  641.             i_coeff_abs_m1[i_coeff] = abs(l[i]) - 1;
  642. #ifndef RDO_SKIP_BS
  643.             i_coeff_sign[i_coeff]   = l[i] < 0;
  644. #endif
  645.             i_coeff++;
  646.             x264_cabac_encode_decision( cb, i_ctx_sig + significant_coeff_flag_offset[i], 1 );
  647.             x264_cabac_encode_decision( cb, i_ctx_last + last_coeff_flag_offset[i], i == i_last );
  648.         }
  649.         else
  650.             x264_cabac_encode_decision( cb, i_ctx_sig + significant_coeff_flag_offset[i], 0 );
  651.     }
  652.     if( i == i_last )
  653.     {
  654.         i_coeff_abs_m1[i_coeff] = abs(l[i]) - 1;
  655. #ifndef RDO_SKIP_BS
  656.         i_coeff_sign[i_coeff]   = l[i] < 0;
  657. #endif
  658.         i_coeff++;
  659.     }
  660.     do
  661.     {
  662.         int i_prefix, ctx;
  663.         i_coeff--;
  664.         /* write coeff_abs - 1 */
  665.         i_prefix = X264_MIN( i_coeff_abs_m1[i_coeff], 14 );
  666.         ctx = coeff_abs_level1_ctx[node_ctx] + i_ctx_level;
  667.         if( i_prefix )
  668.         {
  669.             x264_cabac_encode_decision( cb, ctx, 1 );
  670.             ctx = coeff_abs_levelgt1_ctx[node_ctx] + i_ctx_level;
  671. #ifdef RDO_SKIP_BS
  672.             cb->f8_bits_encoded += cabac_prefix_size[i_prefix][cb->state[ctx]];
  673.             cb->state[ctx] = cabac_prefix_transition[i_prefix][cb->state[ctx]];
  674. #else
  675.             for( j = 0; j < i_prefix - 1; j++ )
  676.                 x264_cabac_encode_decision( cb, ctx, 1 );
  677.             if( i_prefix < 14 )
  678.                 x264_cabac_encode_decision( cb, ctx, 0 );
  679. #endif
  680.             if( i_prefix >= 14 )
  681.                 x264_cabac_encode_ue_bypass( cb, 0, i_coeff_abs_m1[i_coeff] - 14 );
  682.             node_ctx = coeff_abs_level_transition[1][node_ctx];
  683.         }
  684.         else
  685.         {
  686.             x264_cabac_encode_decision( cb, ctx, 0 );
  687.             node_ctx = coeff_abs_level_transition[0][node_ctx];
  688. #ifdef RDO_SKIP_BS
  689.             x264_cabac_encode_bypass( cb, 0 ); // sign
  690. #endif
  691.         }
  692. #ifndef RDO_SKIP_BS
  693.         x264_cabac_encode_bypass( cb, i_coeff_sign[i_coeff] );
  694. #endif
  695.     } while( i_coeff > 0 );
  696. }
  697. void x264_macroblock_write_cabac( x264_t *h, x264_cabac_t *cb )
  698. {
  699.     const int i_mb_type = h->mb.i_type;
  700.     int i_list;
  701.     int i;
  702. #ifndef RDO_SKIP_BS
  703.     const int i_mb_pos_start = x264_cabac_pos( cb );
  704.     int       i_mb_pos_tex;
  705. #endif
  706.     /* Write the MB type */
  707.     x264_cabac_mb_type( h, cb );
  708. #ifndef RDO_SKIP_BS
  709.     if( i_mb_type == I_PCM )
  710.     {
  711.         i_mb_pos_tex = x264_cabac_pos( cb );
  712.         h->stat.frame.i_mv_bits += i_mb_pos_tex - i_mb_pos_start;
  713.         memcpy( cb->p, h->mb.pic.p_fenc[0], 256 );
  714.         cb->p += 256;
  715.         for( i = 0; i < 8; i++ )
  716.             memcpy( cb->p + i*8, h->mb.pic.p_fenc[1] + i*FENC_STRIDE, 8 );
  717.         cb->p += 64;
  718.         for( i = 0; i < 8; i++ )
  719.             memcpy( cb->p + i*8, h->mb.pic.p_fenc[2] + i*FENC_STRIDE, 8 );
  720.         cb->p += 64;
  721.         cb->i_low   = 0;
  722.         cb->i_range = 0x01FE;
  723.         cb->i_queue = -1;
  724.         cb->i_bytes_outstanding = 0;
  725.         /* if PCM is chosen, we need to store reconstructed frame data */
  726.         h->mc.copy[PIXEL_16x16]( h->mb.pic.p_fdec[0], FDEC_STRIDE, h->mb.pic.p_fenc[0], FENC_STRIDE, 16 );
  727.         h->mc.copy[PIXEL_8x8]  ( h->mb.pic.p_fdec[1], FDEC_STRIDE, h->mb.pic.p_fenc[1], FENC_STRIDE, 8 );
  728.         h->mc.copy[PIXEL_8x8]  ( h->mb.pic.p_fdec[2], FDEC_STRIDE, h->mb.pic.p_fenc[2], FENC_STRIDE, 8 );
  729.         h->stat.frame.i_tex_bits += x264_cabac_pos( cb ) - i_mb_pos_tex;
  730.         return;
  731.     }
  732. #endif
  733.     if( IS_INTRA( i_mb_type ) )
  734.     {
  735.         if( h->pps->b_transform_8x8_mode && i_mb_type != I_16x16 )
  736.             x264_cabac_mb_transform_size( h, cb );
  737.         if( i_mb_type != I_16x16 )
  738.         {
  739.             int di = (i_mb_type == I_8x8) ? 4 : 1;
  740.             for( i = 0; i < 16; i += di )
  741.             {
  742.                 const int i_pred = x264_mb_predict_intra4x4_mode( h, i );
  743.                 const int i_mode = x264_mb_pred_mode4x4_fix( h->mb.cache.intra4x4_pred_mode[x264_scan8[i]] );
  744.                 x264_cabac_mb_intra4x4_pred_mode( cb, i_pred, i_mode );
  745.             }
  746.         }
  747.         x264_cabac_mb_intra_chroma_pred_mode( h, cb );
  748.     }
  749.     else if( i_mb_type == P_L0 )
  750.     {
  751.         if( h->mb.i_partition == D_16x16 )
  752.         {
  753.             if( h->mb.pic.i_fref[0] > 1 )
  754.             {
  755.                 x264_cabac_mb_ref( h, cb, 0, 0 );
  756.             }
  757.             x264_cabac_mb_mvd( h, cb, 0, 0, 4, 4 );
  758.         }
  759.         else if( h->mb.i_partition == D_16x8 )
  760.         {
  761.             if( h->mb.pic.i_fref[0] > 1 )
  762.             {
  763.                 x264_cabac_mb_ref( h, cb, 0, 0 );
  764.                 x264_cabac_mb_ref( h, cb, 0, 8 );
  765.             }
  766.             x264_cabac_mb_mvd( h, cb, 0, 0, 4, 2 );
  767.             x264_cabac_mb_mvd( h, cb, 0, 8, 4, 2 );
  768.         }
  769.         else if( h->mb.i_partition == D_8x16 )
  770.         {
  771.             if( h->mb.pic.i_fref[0] > 1 )
  772.             {
  773.                 x264_cabac_mb_ref( h, cb, 0, 0 );
  774.                 x264_cabac_mb_ref( h, cb, 0, 4 );
  775.             }
  776.             x264_cabac_mb_mvd( h, cb, 0, 0, 2, 4 );
  777.             x264_cabac_mb_mvd( h, cb, 0, 4, 2, 4 );
  778.         }
  779.     }
  780.     else if( i_mb_type == P_8x8 )
  781.     {
  782.         /* sub mb type */
  783.         x264_cabac_mb_sub_p_partition( cb, h->mb.i_sub_partition[0] );
  784.         x264_cabac_mb_sub_p_partition( cb, h->mb.i_sub_partition[1] );
  785.         x264_cabac_mb_sub_p_partition( cb, h->mb.i_sub_partition[2] );
  786.         x264_cabac_mb_sub_p_partition( cb, h->mb.i_sub_partition[3] );
  787.         /* ref 0 */
  788.         if( h->mb.pic.i_fref[0] > 1 )
  789.         {
  790.             x264_cabac_mb_ref( h, cb, 0, 0 );
  791.             x264_cabac_mb_ref( h, cb, 0, 4 );
  792.             x264_cabac_mb_ref( h, cb, 0, 8 );
  793.             x264_cabac_mb_ref( h, cb, 0, 12 );
  794.         }
  795.         for( i = 0; i < 4; i++ )
  796.             x264_cabac_mb8x8_mvd( h, cb, 0, i );
  797.     }
  798.     else if( i_mb_type == B_8x8 )
  799.     {
  800.         /* sub mb type */
  801.         x264_cabac_mb_sub_b_partition( cb, h->mb.i_sub_partition[0] );
  802.         x264_cabac_mb_sub_b_partition( cb, h->mb.i_sub_partition[1] );
  803.         x264_cabac_mb_sub_b_partition( cb, h->mb.i_sub_partition[2] );
  804.         x264_cabac_mb_sub_b_partition( cb, h->mb.i_sub_partition[3] );
  805.         /* ref */
  806.         for( i_list = 0; i_list < 2; i_list++ )
  807.         {
  808.             if( ( i_list ? h->mb.pic.i_fref[1] : h->mb.pic.i_fref[0] ) == 1 )
  809.                 continue;
  810.             for( i = 0; i < 4; i++ )
  811.                 if( x264_mb_partition_listX_table[i_list][ h->mb.i_sub_partition[i] ] )
  812.                     x264_cabac_mb_ref( h, cb, i_list, 4*i );
  813.         }
  814.         for( i = 0; i < 4; i++ )
  815.             x264_cabac_mb8x8_mvd( h, cb, 0, i );
  816.         for( i = 0; i < 4; i++ )
  817.             x264_cabac_mb8x8_mvd( h, cb, 1, i );
  818.     }
  819.     else if( i_mb_type != B_DIRECT )
  820.     {
  821.         /* All B mode */
  822.         int b_list[2][2];
  823.         /* init ref list utilisations */
  824.         for( i = 0; i < 2; i++ )
  825.         {
  826.             b_list[0][i] = x264_mb_type_list0_table[i_mb_type][i];
  827.             b_list[1][i] = x264_mb_type_list1_table[i_mb_type][i];
  828.         }
  829.         for( i_list = 0; i_list < 2; i_list++ )
  830.         {
  831.             const int i_ref_max = i_list == 0 ? h->mb.pic.i_fref[0] : h->mb.pic.i_fref[1];
  832.             if( i_ref_max > 1 )
  833.             {
  834.                 if( h->mb.i_partition == D_16x16 )
  835.                 {
  836.                     if( b_list[i_list][0] ) x264_cabac_mb_ref( h, cb, i_list, 0 );
  837.                 }
  838.                 else if( h->mb.i_partition == D_16x8 )
  839.                 {
  840.                     if( b_list[i_list][0] ) x264_cabac_mb_ref( h, cb, i_list, 0 );
  841.                     if( b_list[i_list][1] ) x264_cabac_mb_ref( h, cb, i_list, 8 );
  842.                 }
  843.                 else if( h->mb.i_partition == D_8x16 )
  844.                 {
  845.                     if( b_list[i_list][0] ) x264_cabac_mb_ref( h, cb, i_list, 0 );
  846.                     if( b_list[i_list][1] ) x264_cabac_mb_ref( h, cb, i_list, 4 );
  847.                 }
  848.             }
  849.         }
  850.         for( i_list = 0; i_list < 2; i_list++ )
  851.         {
  852.             if( h->mb.i_partition == D_16x16 )
  853.             {
  854.                 if( b_list[i_list][0] ) x264_cabac_mb_mvd( h, cb, i_list, 0, 4, 4 );
  855.             }
  856.             else if( h->mb.i_partition == D_16x8 )
  857.             {
  858.                 if( b_list[i_list][0] ) x264_cabac_mb_mvd( h, cb, i_list, 0, 4, 2 );
  859.                 if( b_list[i_list][1] ) x264_cabac_mb_mvd( h, cb, i_list, 8, 4, 2 );
  860.             }
  861.             else if( h->mb.i_partition == D_8x16 )
  862.             {
  863.                 if( b_list[i_list][0] ) x264_cabac_mb_mvd( h, cb, i_list, 0, 2, 4 );
  864.                 if( b_list[i_list][1] ) x264_cabac_mb_mvd( h, cb, i_list, 4, 2, 4 );
  865.             }
  866.         }
  867.     }
  868. #ifndef RDO_SKIP_BS
  869.     i_mb_pos_tex = x264_cabac_pos( cb );
  870.     h->stat.frame.i_mv_bits += i_mb_pos_tex - i_mb_pos_start;
  871. #endif
  872.     if( i_mb_type != I_16x16 )
  873.     {
  874.         x264_cabac_mb_cbp_luma( h, cb );
  875.         x264_cabac_mb_cbp_chroma( h, cb );
  876.     }
  877.     if( x264_mb_transform_8x8_allowed( h ) && h->mb.i_cbp_luma )
  878.     {
  879.         x264_cabac_mb_transform_size( h, cb );
  880.     }
  881.     if( h->mb.i_cbp_luma > 0 || h->mb.i_cbp_chroma > 0 || i_mb_type == I_16x16 )
  882.     {
  883.         x264_cabac_mb_qp_delta( h, cb );
  884.         /* write residual */
  885.         if( i_mb_type == I_16x16 )
  886.         {
  887.             /* DC Luma */
  888.             block_residual_write_cabac( h, cb, DCT_LUMA_DC, 0, h->dct.luma16x16_dc, 16 );
  889.             /* AC Luma */
  890.             if( h->mb.i_cbp_luma != 0 )
  891.                 for( i = 0; i < 16; i++ )
  892.                     block_residual_write_cabac( h, cb, DCT_LUMA_AC, i, h->dct.luma4x4[i]+1, 15 );
  893.         }
  894.         else if( h->mb.b_transform_8x8 )
  895.         {
  896.             for( i = 0; i < 4; i++ )
  897.                 if( h->mb.i_cbp_luma & ( 1 << i ) )
  898.                     block_residual_write_cabac( h, cb, DCT_LUMA_8x8, i, h->dct.luma8x8[i], 64 );
  899.         }
  900.         else
  901.         {
  902.             for( i = 0; i < 16; i++ )
  903.                 if( h->mb.i_cbp_luma & ( 1 << ( i / 4 ) ) )
  904.                     block_residual_write_cabac( h, cb, DCT_LUMA_4x4, i, h->dct.luma4x4[i], 16 );
  905.         }
  906.         if( h->mb.i_cbp_chroma &0x03 )    /* Chroma DC residual present */
  907.         {
  908.             block_residual_write_cabac( h, cb, DCT_CHROMA_DC, 0, h->dct.chroma_dc[0], 4 );
  909.             block_residual_write_cabac( h, cb, DCT_CHROMA_DC, 1, h->dct.chroma_dc[1], 4 );
  910.         }
  911.         if( h->mb.i_cbp_chroma&0x02 ) /* Chroma AC residual present */
  912.         {
  913.             for( i = 16; i < 24; i++ )
  914.                 block_residual_write_cabac( h, cb, DCT_CHROMA_AC, i, h->dct.luma4x4[i]+1, 15 );
  915.         }
  916.     }
  917. #ifndef RDO_SKIP_BS
  918.     h->stat.frame.i_tex_bits += x264_cabac_pos( cb ) - i_mb_pos_tex;
  919. #endif
  920. }
  921. #ifdef RDO_SKIP_BS
  922. /*****************************************************************************
  923.  * RD only; doesn't generate a valid bitstream
  924.  * doesn't write cbp or chroma dc (I don't know how much this matters)
  925.  * works on all partition sizes except 16x16
  926.  * for sub8x8, call once per 8x8 block
  927.  *****************************************************************************/
  928. static void x264_partition_size_cabac( x264_t *h, x264_cabac_t *cb, int i8, int i_pixel )
  929. {
  930.     const int i_mb_type = h->mb.i_type;
  931.     int j;
  932.     if( i_mb_type == P_8x8 )
  933.     {
  934.         x264_cabac_mb_sub_p_partition( cb, h->mb.i_sub_partition[i8] );
  935.         if( h->mb.pic.i_fref[0] > 1 )
  936.             x264_cabac_mb_ref( h, cb, 0, 4*i8 );
  937.         x264_cabac_mb8x8_mvd( h, cb, 0, i8 );
  938.     }
  939.     else if( i_mb_type == P_L0 )
  940.     {
  941.         if( h->mb.pic.i_fref[0] > 1 )
  942.             x264_cabac_mb_ref( h, cb, 0, 4*i8 );
  943.         if( h->mb.i_partition == D_16x8 )
  944.             x264_cabac_mb_mvd( h, cb, 0, 4*i8, 4, 2 );
  945.         else //8x16
  946.             x264_cabac_mb_mvd( h, cb, 0, 4*i8, 2, 4 );
  947.     }
  948.     else if( i_mb_type == B_8x8 )
  949.     {
  950.         x264_cabac_mb_sub_b_partition( cb, h->mb.i_sub_partition[i8] );
  951.         if( h->mb.pic.i_fref[0] > 1
  952.             && x264_mb_partition_listX_table[0][ h->mb.i_sub_partition[i8] ] )
  953.             x264_cabac_mb_ref( h, cb, 0, 4*i8 );
  954.         if( h->mb.pic.i_fref[1] > 1
  955.             && x264_mb_partition_listX_table[1][ h->mb.i_sub_partition[i8] ] )
  956.             x264_cabac_mb_ref( h, cb, 1, 4*i8 );
  957.         x264_cabac_mb8x8_mvd( h, cb, 0, i8 );
  958.         x264_cabac_mb8x8_mvd( h, cb, 1, i8 );
  959.     }
  960.     else
  961.     {
  962.         x264_log(h, X264_LOG_ERROR, "invalid/unhandled mb_typen" );
  963.         return;
  964.     }
  965.     for( j = (i_pixel < PIXEL_8x8); j >= 0; j-- )
  966.     {
  967.         if( h->mb.i_cbp_luma & (1 << i8) )
  968.         {
  969.             if( h->mb.b_transform_8x8 )
  970.                 block_residual_write_cabac( h, cb, DCT_LUMA_8x8, i8, h->dct.luma8x8[i8], 64 );
  971.             else
  972.             {
  973.                 int i4;
  974.                 for( i4 = 0; i4 < 4; i4++ )
  975.                     block_residual_write_cabac( h, cb, DCT_LUMA_4x4, i4+i8*4, h->dct.luma4x4[i4+i8*4], 16 );
  976.             }
  977.         }
  978.         block_residual_write_cabac( h, cb, DCT_CHROMA_AC, 16+i8, h->dct.luma4x4[16+i8]+1, 15 );
  979.         block_residual_write_cabac( h, cb, DCT_CHROMA_AC, 20+i8, h->dct.luma4x4[20+i8]+1, 15 );
  980.         i8 += x264_pixel_size[i_pixel].h >> 3;
  981.     }
  982. }
  983. static void x264_partition_i8x8_size_cabac( x264_t *h, x264_cabac_t *cb, int i8, int i_mode )
  984. {
  985.     const int i_pred = x264_mb_predict_intra4x4_mode( h, 4*i8 );
  986.     const int nnz = array_non_zero(h->dct.luma8x8[i8]);
  987.     i_mode = x264_mb_pred_mode4x4_fix( i_mode );
  988.     x264_cabac_mb_intra4x4_pred_mode( cb, i_pred, i_mode );
  989.     if( nnz )
  990.     {
  991.         block_residual_write_cabac( h, cb, DCT_LUMA_8x8, 4*i8, h->dct.luma8x8[i8], 64 );
  992.         *(uint16_t*)&h->mb.cache.non_zero_count[x264_scan8[i8*4]] = 0x0101;
  993.         *(uint16_t*)&h->mb.cache.non_zero_count[x264_scan8[i8*4+2]] = 0x0101;
  994.     }
  995.     else
  996.     {
  997.         *(uint16_t*)&h->mb.cache.non_zero_count[x264_scan8[i8*4]] = 0;
  998.         *(uint16_t*)&h->mb.cache.non_zero_count[x264_scan8[i8*4+2]] = 0;
  999.     }
  1000. }
  1001. static void x264_partition_i4x4_size_cabac( x264_t *h, x264_cabac_t *cb, int i4, int i_mode )
  1002. {
  1003.     const int i_pred = x264_mb_predict_intra4x4_mode( h, i4 );
  1004.     i_mode = x264_mb_pred_mode4x4_fix( i_mode );
  1005.     x264_cabac_mb_intra4x4_pred_mode( cb, i_pred, i_mode );
  1006.     block_residual_write_cabac( h, cb, DCT_LUMA_4x4, i4, h->dct.luma4x4[i4], 16 );
  1007.     h->mb.cache.non_zero_count[x264_scan8[i4]] = array_non_zero( h->dct.luma4x4[i4] );
  1008. }
  1009. static void x264_i8x8_chroma_size_cabac( x264_t *h, x264_cabac_t *cb )
  1010. {
  1011.     x264_cabac_mb_intra_chroma_pred_mode( h, cb );
  1012.     x264_cabac_mb_cbp_chroma( h, cb );
  1013.     if( h->mb.i_cbp_chroma > 0 )
  1014.     {
  1015.         block_residual_write_cabac( h, cb, DCT_CHROMA_DC, 0, h->dct.chroma_dc[0], 4 );
  1016.         block_residual_write_cabac( h, cb, DCT_CHROMA_DC, 1, h->dct.chroma_dc[1], 4 );
  1017.         if( h->mb.i_cbp_chroma == 2 )
  1018.         {
  1019.             int i;
  1020.             for( i = 16; i < 24; i++ )
  1021.                 block_residual_write_cabac( h, cb, DCT_CHROMA_AC, i, h->dct.luma4x4[i]+1, 15 );
  1022.         }
  1023.     }
  1024. }
  1025. #endif