首页 > 技术文章 > NABC for Teamproject

C705 2014-10-29 18:56 原文

   “教育是一个社会发展的支柱, 你和我能看到并理解这个博客, 教育功不可没。 高等教育的形式并不是一成不变的, 高等教育一直在演进。”邹欣老师在博客上如此写道。为了迎合信息化时代的特色,网络上的知识传播必不可少。

---关于学霸系统及小队项目的NABC:

1) N (Need 需求)

  对于数据处理这个内容来说,面对的需求是非常巨大。如今网络发展,数据量在爆发式的增长。一切以数据说话,成为当今或者未来互联网发展的趋势。如何从成千上万的资源中找出自己所需的那一个,正需要对数据进行处理,这也是如今各大小型企业所必须的工作。  

  我们小组所选择的的是数据处理这一小项,对于数据处理的用户基本需求如下:

  1.递交给用户的数据已进行处理分类,符合用户需求。

  2.用户需要一个简洁易懂的数据保存形式,能从中提取数据。

  3.需要一个能查看进程状态,数据状态的窗口或界面。  

  4.用户希望能在获得一个数据的同时能得到相似的数据。

  5.用户希望能得到一个贴近自身的方便的数据环境。  

2) A (Approach 做法)

  这个项目需要的核心技术有:网页爬取技术、自动分类技术、抽取关键词技术、翻译技术、数据库技术、动态网站开发和管理技术。

  对于我们小组所抽到的数据处理小项,需要进行工作为:

  1.将爬取到的数据进行去噪,提取关键信息,分类,整理,需要定义好爬虫获得的数据结构。

  2.设计数据库,定义网站内容结构。

  3.UI追踪进程和汇报数据。

  4.支持继续向pipeline中输入新内容。

  5.支持对英文网页翻译和标签功能。

  6.对文档相似度进行分析,并作出相应的联系与分类。

  结合我们组员的情况,我们有网页爬取技术的实践经验,关键词抽取技术和翻译技术的技术支持,并且正在学习数据库和网站开发的相关课程。因此,我们在技术上是具有显著优势的。

3) B (Benefit  好处)

  如今是一个大数据时代,庞大的数据量需要的是更加优秀的处理数据能力。无规律的数据是无法直接让用户使用的。

  数据处理的好处有如下几点:

  1.用户获得的数据是有一定的规律。

  2.更加容易让用户进行数据操作与使用。

  3.能让用户在获得一个数据时能看到自己或许所需的其他相似数据

  4.能从整理好的数据分析出许多问题的倾向,更加容易看出未来数据的发展趋势。

4) C (Competitors 竞争)

  在我们所接触的许多网络企业,如3BTA-360,baidu,tencent,alibaba,他们对于数据处理都是极为重视,并有专门处理的部门,虽然我们不能与那些大企业相竞争,但是类比下来,许多小企业甚至一些小网站,都是需要对数据进行处理,我们的竞争无处不在。

  我们的优势:

  1.团队凝聚力强,具有极为庞大的发展空间。

  2.创作自由度高,能让我们实践自己的想法。

  我们的劣势:

  1.规模小,团队实现力有限

  2.技术不够成熟,仍有待提高

  3.界面设计对于正式的网站来说比较稚嫩。

   

发布计划:

  按照大项目的计划,应与爬虫和UI界面项目整合发布成网站。

  可在发布前一段时间与其他小组先尝试整合。

 

推荐阅读