HTML2ASCII.java
上传用户:yadaxi
上传日期:2013-07-11
资源大小:20k
文件大小:1k
源码类别:

搜索引擎

开发平台:

Java

  1. import java.io.*;
  2. public class HTML2ASCII extends FilterInputStream
  3. {
  4. public HTML2ASCII(InputStream in){
  5. super(in);
  6. }
  7. /**
  8. Metode que llegeix d'un InputStream filtrant els tags que estan entre "<" i ">".
  9. @return retorna l'enter llegit
  10. */
  11. public int read() throws IOException{
  12. int b = in.read();
  13. boolean flag1=false, flag2=false, nocomm=false;
  14. while (b == 60){
  15. b=in.read();
  16. if(b==-1) return b;
  17. if(b==33){ //   Caracter !
  18.   b=in.read();
  19.   if(b==-1) return b;
  20.   if(b==45){ //   Caracter -
  21. b=in.read();
  22. if(b==-1) return b;
  23. if(b==45){ //   Caracter -
  24. do{
  25. b=in.read();
  26. if(b==-1) return b;
  27. if(b==45){
  28. if(flag1) flag2=true;
  29. else flag1=true;
  30. } else {
  31. if(flag1 && flag2 && b==62);
  32. else {
  33. flag1=false;
  34. flag2=false;
  35. }
  36. }
  37. }while((!flag1)||(!flag2)||(b!=62));
  38. } else nocomm=true;
  39.   } else nocomm=true;
  40. } else nocomm=true;
  41. if(nocomm) {
  42. while(b!=62){
  43. b=in.read();
  44. if(b==-1) return b;
  45. }
  46. }
  47. b=in.read();
  48. }
  49. return b;
  50. }
  51. }