本文共 1033 字,大约阅读时间需要 3 分钟。
M2项目回顾
设想与目标
我们的软件旨在解决网上教学问答系统的数据处理问题,特别是非问答型网页的数据抽取。通过爬虫抓取网页内容,提取用户定义的标签,并生成标签预览,将数据写入数据库。
时间规划
M2项目的开发周期为4周,第一周用于制定计划。我们对数据处理组件的系统框架和功能有了清晰的了解,重点计划了数据抽取的算法设计。
团队协作
在制定计划过程中,我们通过开放的讨论和投票机制处理团队成员的不同意见。每位提出意见的成员都需要详细说明实施的难点和预期效果,以便获得团队认可。
历史反思
如果重来一遍,我们将加强团队协作,主动与其他团队沟通,合理分配任务,并避免在需求设计完成后轻易修改。
工作进展
所有原计划任务均已完成。值得注意的是,我们在抽取计算机领域标签时,发现这些标签在实际运行中使用率较低,反而增加了分析时间。尽管如此,从长远来看,这些标签仍然是必要的。
任务定义
每项任务都有明确的定义,但缺乏衡量的交付标准。整个项目过程严格遵循了计划要求。
缓冲区管理
项目中设置了最后阶段的缓冲区。在今后项目中,我们计划增加更多的缓冲区,并适当安排加班时间。
资源评估
项目所需资源充足。时间估计基于项目经理的经验,略作放大。目前的测试资源和环境已满足需求。
变更管理
所有变更及时通知团队成员。核心功能如数据流处理被视为必不可少,其余功能可根据情况推迟。
测试发布
测试计划完整,包括了功能测试和验收测试。我们使用Visual Studio的单元测试工具进行测试。软件效能方面仍有提升空间,目前处理一个网页大约需要2秒。
发布问题
在发布过程中,我们未能很好地处理字符串异常,导致部分测试不通过。
改进措施
如果重来一遍,我们将增加测试的重要性,并加强对测试计划的跟进。
设计与实现
设计工作在项目初期完成,由项目经理领导,团队成员共同参与。设计过程中没有遇到模棱两可的情况,每个细节都明确归属。
开发模式
我们采用模块开发模式,各个模块之间通过定义良好的接口进行通信。在实际运行中,这种模式可能导致信息不对称,因此在设计阶段需要加强团队内部的沟通。
测试工具
我们使用Visual Studio的单元测试工具,工具使用效果一般。
代码审查
代码审查在开发过程中进行,规范性较好,但仍有改进空间。
效率问题
信息抽取是导致最多Bug的来源,尤其是在字符处理环节。未处理好的字符串异常会引发多个问题。
项目总结
项目整体完成情况良好,但在效率和测试环节仍有提升空间。
转载地址:http://mxufk.baihongyu.com/