首页 > 技术文章 > 第二次结队作业

211806330lmy 2020-10-03 22:36 原文

第二次结对作业

作业要求 https://edu.cnblogs.com/campus/fzzcxy/2018SE1/homework/11250
作业目标 学会使用 cookie 爬虫的技巧,
作业源代码 https://gitee.com/lin-mengyan/team2/tree/master/
林梦妍 <211806330>
林晶涵 <211806328>

编码记录

需求分析时间 2h
编码时间 3-4d(未完成)

需求分析

制作网页爬虫软件,将云班课上全班的课堂完成部分的经验值爬取下来,根据经验值排序,计算出平均经验、最低经验、最高经验。

分析步骤

* 读取网页源代码

* 获取所有学生课堂完成部分的URL

* 获取学生所获得的的经验值

* 将数据排序写入score.txt

* 运行输出结果

学习和编程记录

URL地址

cookie地址

配置文件内容

以上内容参考老师在云班课上发布的资源

获取网页源代码

由此获取网页源代码,后续的方法对于获取所有学生的URL对我们来说我们来说有点难度。

获取学生信息(获取相关特征的元素)


将对应学生的经验值进行汇总排序,并计算出平均经验、最低经验、最高经验,将信息传入哈希表中,并保存到score.txt

我们在执行此步骤时,虽然生成了score.txt但是里面内容为空。

File file = new File("score.txt"); //存放数据的文件
FileWriter out = new FileWriter(file);

码云提交记录

结对感受

林梦妍:

此次作业对于我们来说比较困难,一些代码的实现不熟悉,还有由于国庆回家,不能一起面对面的讨论,所以交流起来没有那么流畅,

我们参考了老师在云班课上给的资源,慢慢开始着手写代码,但是过程中,我们代码出现了一些问题,导致那个score.txt 文档为空。

但是对于此次作业还是有一定的收获,懂得了如何从网页爬取代码,更加熟悉自己的对友,建立更深的默契。

林晶涵:

此次作业对于我们两个编程基础不是很好的人来说无疑是一种挑战,我们需求分析时间用了2 3个小时,但是每一小步需求的实现又是

一个重大考验。与上次作业不同,这次遇上国庆放假回家,大部分工作是在线上完成,所以有时候交流起来会没有方便。但是,经过上

一次磨合这次的合作还是比较默契的!此次作业是我们两个人学习不断学习的过程,尽管到最后代码都没办法完成,但是双方也都是尽

了自己的努力。

结对照片

参考资料

https://blog.csdn.net/Cyril_KI/article/details/108172515
https://www.cnblogs.com/jamaler/p/11645569.html

推荐阅读