钜形不锈钢水箱 发表于 2022-12-27 19:49:00

哈希表之单词查找并输出其上下文

哈希表之单词查找


[*]英文文章,写入一个文本文档,作为基础测试数据。 建立一个待查关键字文件,存储待查询的单词。
[*]输入查询的单词,输出该单词的出现次数,及每个出现位置的上下文(前一句,单词/短语所在的句子,下一句)。
[*]目前只支持查询一个单词。
以下为代码:
#include #include #include#include #include #include#include #include const int HASHNUM = 29989;typedef struct Hashtable{            //哈希表结构体    char *word;    int count;    struct Hashtable * next;}Hashnode;Hashnode* hashtable;       //HASHNUMBER大小的指针数组(储存指针的数组) 作为hash表std::vectorlines;std::map wordline;   //需要使用到迭代器匹配行号所以使用map嵌套setunsigned int Hashfuntion(const char *str);void Hashinsert(char *str);void readintohash(char *path);void findquery(char *path);void getlinecplusplus(char *path,char *str);void readintohash(char *path){    char ch = {NULL};            //存储一行字符串    char *p;    FILE *fp = fopen(path,"r");    if(fp == NULL)      exit(-1);    while(( fgets(ch,sizeof (ch),fp) != NULL ))                           //读取到换行符时,或者到达文件末尾时停止    {      if(strcmp( " " , ch ) == 0)                                       //空行继续            continue;      const char *ch1 = ", \n\t.";                                    //要分割的字符(逗号、空格、换行、制表符、句号)      p = strtok(ch,ch1);                                             //用strtok函数从一行字符串中分离出每个单词,分隔符设置为(空格、逗号、换行、制表符)      while(p != NULL)      {            Hashinsert(p);            p = strtok(NULL, ch1);                              //每次找到一个分隔符后,一个空(NULL)就被放到分隔符处,strtok函数用这种方法来连续查找该字符串,此处的NULL是一个指向后面还未分割的单词的指针,因此,首次调用时,第一个元素必须指向要分解的字符串,随后调用要把元素设成NULL。      }    }    fclose(fp);}void Hashinsert(char *str){    int hashcode = Hashfuntion(str);    Hashnode *newnode;    for (newnode = hashtable; newnode != NULL ; ++newnode) {      if(strcmp(str, newnode->word) == 0){       //查找单词是否已经在hash表中了            (newnode->count)++;            return;      }    }    //如果上面没返回,也就是说hash表中没有这个单词,添加新节点,加入这个单词    newnode = new Hashnode;    newnode->count = 1;    newnode->word = (char *)malloc(strlen(str) + 1);    strcpy(newnode->word,str);    newnode->next = hashtable;      //将新生成的节点插入到hashcode为下标的链表中去    hashtable = newnode;}unsigned int Hashfuntion(const char *str){    unsigned int index = 0;    for (; *str != '\0' ; str++) {      index = index * 31 + *str;    }    return index % HASHNUM;}void findquery(char *path){    char ch = {NULL};    FILE *fp = fopen(path,"r");    std::ofstream outfile1("E:\\answer.txt");    while(fgets(ch,sizeof (ch),fp)){                  //把待查关键字读入      int hashcode2 = Hashfuntion(ch);      outfile1 word second).begin();itset != (wordline.find(str)->second).end(); itset++)    {      outfile
页: [1]
查看完整版本: 哈希表之单词查找并输出其上下文