生物信息学的阶梯-初中级

生物信息学者的路标,你现在在哪里?您可以走向哪里?您该如何开始,如何阶进?生物信息专业可以从事哪些工作,适合哪些职业,如何来进行职业规划等等,带着这些问题,在下面的几个系列中,将对此进行总结,当然一己之言,不足之处还待共同讨论,仅供参考。

可以根据自己的发展方向、兴趣爱好,选择侧重点,可以选择偏向生物方面的,对于生物统计、生物化学、物理化学等学科深入学习,方向侧重于算法研究方面;另一方面可以侧重计算方面,对于linux操作系统、数据库、perl、java、web技术等深入进行学习,当然这两个方向又是互补的。不是仅仅选择一个就可以了。

生物学方面

  • 系统生物学方面,对于物种演化等有深入的理解;
  • 对于组学,比如基因组、蛋白组、代谢组、表达谱等等的理解;
  • 对于线性代数、生物统计等的深入学习;
  • 对于蛋白质的二级、三级结构,核酸的结构、物理化学性质进行深入的学习;
  •  专业英文的学习,多看外文资料。

计算机方面

  • linux操作系统的熟悉,系统的安装、环境的配置,软件的编译安装,涉及到操作系统,要学习的地方就有很多。
  • perl的学习;
  • Java、C++的学习;
  • 数据库比如mysql的初步了解,安装,建表,简单的查询;
  • Apache的了解

生物信息学

  • 学习一些算法,Blast、Cluster等比对如何实现的;
  • Blast的本地化,可以进行库对库的比对,并可以对结果进行处理;
  • 了解常用的软件,并能根据操作手册进行安装使用,并能说明你为什么要用这个软件;
  • 了解NCBI上的各个数据库,会使用BLAST的高级功能,会使用seqin提交数据;
  • 会使用bioperl,进行数据格式的转变等;

你可以做什么了

  • 画系统树,可以得到专家的认可;

推荐参考书

  • 《生物化学》
  • 《生物信息》

2 thoughts on “生物信息学的阶梯-初中级

  1. 我生物出身,科研需要而接触生物信息学,参加过几次相关培训,一直没有自己从头分析过数据。学校没有计算中心,想在自己的实验室买台服务器,能做转录组的分析,请问服务器至少应满足哪些配置?多谢。

    • 对于实验室来说,由于不用考虑失效性,对于计算花费的时间不是特别敏感,多一个小时,少一个小时,无所谓,另外就是计算量本身也不会太大,所以主要考虑的就是内存本身,而对于转来组分析来说,消耗资源的有两个分析,一个是mapping,一个是拼接,mapping对于内存要求不高,如果要做拼接,比如使用Trinity,对于内存的要求是1MB的双向测序的长度大约在76bp长度的Illumina reads需要配置1GB内存,可以根据这个规则使用转来组的数据来对内存进行一下估算,反正是多多益善。硬盘相对便宜,根据你们实验室的情况,估算一下,一般2TB就够用了。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

请启用Javascript,以完成验证!