TextQuery.cpp
上传用户:qdkongtiao
上传日期:2022-06-29
资源大小:356k
文件大小:5k
源码类别:

书籍源码

开发平台:

Visual C++

  1. /*
  2.  * This file contains code from "C++ Primer, Fourth Edition", by Stanley B.
  3.  * Lippman, Jose Lajoie, and Barbara E. Moo, and is covered under the
  4.  * copyright and warranty notices given in that book:
  5.  * 
  6.  * "Copyright (c) 2005 by Objectwrite, Inc., Jose Lajoie, and Barbara E. Moo."
  7.  * 
  8.  * 
  9.  * "The authors and publisher have taken care in the preparation of this book,
  10.  * but make no expressed or implied warranty of any kind and assume no
  11.  * responsibility for errors or omissions. No liability is assumed for
  12.  * incidental or consequential damages in connection with or arising out of the
  13.  * use of the information or programs contained herein."
  14.  * 
  15.  * Permission is granted for this code to be used for educational purposes in
  16.  * association with the book, given proper citation if and when posted or
  17.  * reproduced.Any commercial use of this code requires the explicit written
  18.  * permission of the publisher, Addison-Wesley Professional, a division of
  19.  * Pearson Education, Inc. Send your request for permission, stating clearly
  20.  * what code you would like to use, and in what specific way, to the following
  21.  * address: 
  22.  * 
  23.  *  Pearson Education, Inc.
  24.  *  Rights and Contracts Department
  25.  *  75 Arlington Street, Suite 300
  26.  *  Boston, MA 02216
  27.  *  Fax: (617) 848-7047
  28. */ 
  29. #include "TextQuery.h"
  30. #include <sstream>
  31. #include <string>
  32. #include <vector>
  33. #include <map>
  34. #include <set>
  35. #include <iostream>
  36. #include <fstream>
  37. #include <cctype>
  38. #include <cstring>
  39. #include <stdexcept>
  40. using std::istringstream;
  41. using std::set;
  42. using std::string;
  43. using std::getline;
  44. using std::map;
  45. using std::vector;
  46. using std::cerr;
  47. using std::cout;
  48. using std::cin;
  49. using std::ifstream;
  50. using std::endl;
  51. using std::ispunct;
  52. using std::tolower;
  53. using std::strlen;
  54. using std::out_of_range;
  55. string TextQuery::text_line(line_no line) const
  56. {
  57.     if (line < lines_of_text.size())
  58.         return lines_of_text[line];
  59.     throw std::out_of_range("line number out of range");
  60. }
  61. // read input file: store each line as element in lines_of_text 
  62. void TextQuery::store_file(ifstream &is)
  63. {
  64.     string textline;
  65.     while (getline(is, textline))
  66.        lines_of_text.push_back(textline);
  67. }
  68. // v: vertical tab; f: formfeed; r: carriage return are
  69. // treated as whitespace characters along with space, tab and newline
  70. string TextQuery::whitespace_chars(" tnvrf");
  71. // finds whitespace-separated words in the input vector
  72. // and puts the word in word_map along with the line number
  73. void TextQuery::build_map()
  74. {
  75.     // process each line from the input vector
  76.     for (line_no line_num = 0; 
  77.                  line_num != lines_of_text.size();
  78.                  ++line_num)
  79.     {
  80.         // we'll use line to read the text a word at a time
  81.         istringstream line(lines_of_text[line_num]);
  82.         string word;
  83.         while (line >> word)
  84.             // add this line number to the set;
  85.             // subscript will add word to the map if it's not already there
  86.             word_map[cleanup_str(word)].insert(line_num);
  87.     }
  88. }
  89. set<TextQuery::line_no>
  90. TextQuery::run_query(const string &query_word) const
  91. {
  92.     // Note: must use find and not subscript the map directly
  93.     // to avoid adding words to word_map!
  94.     map<string, set<line_no> >::const_iterator 
  95.                           loc = word_map.find(cleanup_str(query_word));
  96.     if (loc == word_map.end()) 
  97.         return set<line_no>();  // not found, return empty set
  98.     else
  99.         // fetch and return set of line numbers for this word
  100.         return loc->second;
  101. }
  102. void TextQuery::display_map()
  103. {
  104.     map< string, set<line_no> >::iterator iter = word_map.begin(),
  105.                                        iter_end = word_map.end();
  106.     // for each word in the map
  107.     for ( ; iter != iter_end; ++iter) {
  108.         cout << "word: " << iter->first << " {";
  109.         // fetch location vector as a const reference to avoid copying it
  110.         const set<line_no> &text_locs = iter->second;
  111.         set<line_no>::const_iterator loc_iter = text_locs.begin(),
  112.                                      loc_iter_end = text_locs.end();
  113.         // print all line numbers for this word
  114.         while (loc_iter != loc_iter_end)
  115.         {
  116.             cout << *loc_iter;
  117.             if (++loc_iter != loc_iter_end)
  118.                  cout << ", ";
  119.          }
  120.          cout << "}n";  // end list of output this word
  121.     }
  122.     cout << endl;  // finished printing entire map
  123. }
  124. string TextQuery::cleanup_str(const string &word)
  125. {
  126.     string ret;
  127.     for (string::const_iterator it = word.begin(); it != word.end(); ++it) {
  128.         if (!ispunct(*it))
  129.             ret += tolower(*it);
  130.     }
  131.     return ret;
  132. }