吴昊阳

软工第四次作业:结对编程

给你一囗甜甜゛ 提交于 2019-12-01 05:36:55
软件工程第四次作业:结对编程 GIT地址 学生姓名 吴昊阳 学号 201831083104 结对伙伴 姚志昆 伙伴学号 201831081105 伙伴博客地址 一丶 PSP表格    1.解题思路描述 要求是“统计指定单词的出现频率”,那么就是要解决两个问题: 找到指定单词和计数。我们设置了指针用来查找,在查找的同时用search进行统计计数。 刚开始,小组打算分工,分别查阅资料,思考不同阶段要求,伙伴成员协作完成。 对题目要求进行分析后,题目要求为词频统计,但是要求不少,小组决定先做基础要求。 尽量利用C++标准库的功能,利用正则表达式来提取出符合需求定义的单词, 每个单词应具有最简形式、已统计数量等属性,故采用结构体的形式存储。 行数统计:以按行读取的方式读取文本文件,每次成功读取后对应的counter+1,直至文件末尾。(统计文件的有效行数:任何包含非空白字符的行,都需要统计。) 字符数统计: 统计可打印字符个数 单词统计:根据要求,只有由至少4个英文字母打头的连续英文、数字字符串才算做一个单词,并且单词实体不区别大小写字母转换大小写; 保存字符长度>=4的单词-----------使用正则表达式;去掉开头非字符的单词并计数;排序,在自定义数据结构中重载<和<=,来实现词频排序,为了实现降序排序,简单地用大于号重载了小于号。    2.设计实现过程 代码主要分为三个部分: 1