首页 > 技术文章 > BGI-College生信入门系列——1、课程概览

bgicollege 2021-11-08 11:28 原文

想学生信没有“师傅”领入门?所谓万事开头难,入门要讲究方法。我们接受知识的模式从小就被训练成以听课为主,所以看视频课自然是快速入门生信的首选方案!

目前网络上生物信息学的入门视频课程相对较少,精挑细选一番后决定安利下面2个课程:一个是华大基因学院幕序平台(http://www.x-omics.org/)的《生物信息分析员认证》,刚好双十一有认证课程的促销活动,全年最低价,感兴趣的朋友可以进入慕序平台了解活动详情。另外一个是中国大学MOOC(https://www.icourse163.org/)里面山东大学开设的《生物信息学》。

课程的讲授无一例外都是从概论开始的,了解一门课的概论,有助于我们用整体的观点理解每个知识点,最终形成一个完整的知识体系,即达成了入门的目标。下面两张思维导图是视频课的大纲。

为了更直观感受课程内容的重点,特意把这两门课程的目录制作成词云图。这下清晰明朗的展示了生信入门课需要把握的重点——测序技术、生物数据库、Linux系统和序列比对。

 

 

结合视频内容和过往的学习经验,我认为生信知识和能力体系包含以下5大模块:

01 数据

● 生信日常处理的对象就是生物数据,可以是测序获得,或公共数据库的数据。生信离不开对数据的操作,处理海量的数据文件时,往往需要调用脚本进行批量处理,批处理的前提则需要对数据的类型和数据文件的格式了如指掌。

● 前面提到处理的数据也可能来自数据库,而数据库可分为核酸数据库、蛋白数据库和专用数据库。核酸数据库和蛋白数据库又分别对应的一级和二级数据库,如一级核酸数据库NCBI、EMBL和DDBJ,这三个数据库实现了数据的交换和共享。熟悉各大公共数据库存储的数据类型和应用的场景,有助于数据分析的选择。

 

02 Linux和编程语言

● 选择Linux系统做生物信息学分析,缘于Linux系统的稳定、开源、自动化和可重复性的优势。

● 熟悉Linux的基础操作和处理数据的命令(如awk/grep/sed等)。

● 编程语言可以选择Perl或Python,达到能看懂代码的水平。

● R的绘图与统计分析。

 

03 分析流程

● 掌握组学常用的分析流程,能够独立安装分析软件和解读分析结果。

● 熟悉流程中每个环节的输入与输出。

 

04 文献阅读和检索

● 前沿文献的追踪和借鉴。

● 利用搜索引擎debug的能力。

 

05 测序和生物学背景知识

● 测序和基因组

● 基因家族

● 直系同源和旁系同源

● 系统发育

● 选择压力

 

以上是《BGI-College生信入门》系列推文的概览,后期将会围绕这5个模块进行详细介绍,期待您的关注哦~

推荐阅读