UTF8ByteArrayUtils.java
上传用户:quxuerui
上传日期:2018-01-08
资源大小:41811k
文件大小:3k
源码类别:

网格计算

开发平台:

Java

  1. /**
  2.  * Licensed to the Apache Software Foundation (ASF) under one
  3.  * or more contributor license agreements.  See the NOTICE file
  4.  * distributed with this work for additional information
  5.  * regarding copyright ownership.  The ASF licenses this file
  6.  * to you under the Apache License, Version 2.0 (the
  7.  * "License"); you may not use this file except in compliance
  8.  * with the License.  You may obtain a copy of the License at
  9.  *
  10.  *     http://www.apache.org/licenses/LICENSE-2.0
  11.  *
  12.  * Unless required by applicable law or agreed to in writing, software
  13.  * distributed under the License is distributed on an "AS IS" BASIS,
  14.  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  15.  * See the License for the specific language governing permissions and
  16.  * limitations under the License.
  17.  */
  18. package org.apache.hadoop.util;
  19. public class UTF8ByteArrayUtils {
  20.   /**
  21.    * Find the first occurrence of the given byte b in a UTF-8 encoded string
  22.    * @param utf a byte array containing a UTF-8 encoded string
  23.    * @param start starting offset
  24.    * @param end ending position
  25.    * @param b the byte to find
  26.    * @return position that first byte occures otherwise -1
  27.    */
  28.   public static int findByte(byte [] utf, int start, int end, byte b) {
  29.     for(int i=start; i<end; i++) {
  30.       if (utf[i]==b) {
  31.         return i;
  32.       }
  33.     }
  34.     return -1;      
  35.   }
  36.   /**
  37.    * Find the first occurrence of the given bytes b in a UTF-8 encoded string
  38.    * @param utf a byte array containing a UTF-8 encoded string
  39.    * @param start starting offset
  40.    * @param end ending position
  41.    * @param b the bytes to find
  42.    * @return position that first byte occures otherwise -1
  43.    */
  44.   public static int findBytes(byte [] utf, int start, int end, byte[] b) {
  45.     int matchEnd = end - b.length;
  46.     for(int i=start; i<=matchEnd; i++) {
  47.       boolean matched = true;
  48.       for(int j=0; j<b.length; j++) {
  49.         if (utf[i+j] != b[j]) {
  50.           matched = false;
  51.           break;
  52.         }
  53.       }
  54.       if (matched) {
  55.         return i;
  56.       }
  57.     }
  58.     return -1;      
  59.   }
  60.     
  61.   /**
  62.    * Find the nth occurrence of the given byte b in a UTF-8 encoded string
  63.    * @param utf a byte array containing a UTF-8 encoded string
  64.    * @param start starting offset
  65.    * @param length the length of byte array
  66.    * @param b the byte to find
  67.    * @param n the desired occurrence of the given byte
  68.    * @return position that nth occurrence of the given byte if exists; otherwise -1
  69.    */
  70.   public static int findNthByte(byte [] utf, int start, int length, byte b, int n) {
  71.     int pos = -1;
  72.     int nextStart = start;
  73.     for (int i = 0; i < n; i++) {
  74.       pos = findByte(utf, nextStart, length, b);
  75.       if (pos < 0) {
  76.         return pos;
  77.       }
  78.       nextStart = pos + 1;
  79.     }
  80.     return pos;      
  81.   }
  82.   
  83.   /**
  84.    * Find the nth occurrence of the given byte b in a UTF-8 encoded string
  85.    * @param utf a byte array containing a UTF-8 encoded string
  86.    * @param b the byte to find
  87.    * @param n the desired occurrence of the given byte
  88.    * @return position that nth occurrence of the given byte if exists; otherwise -1
  89.    */
  90.   public static int findNthByte(byte [] utf, byte b, int n) {
  91.     return findNthByte(utf, 0, utf.length, b, n);      
  92.   }
  93. }