url | public |
---|---|
02-list |
1 |
该列表分为 推荐 和 全部 两块,推荐 展示强推资料,用于学习必备的一些技能,全部 展示经过筛选的所有内容。
具体内容的选择、学习,读者需要自己根据当前自身的情况把握。
{推荐}下一级条目下不再设下一级标题。
生物信息学学习有4块核心:
- Linux操作系统知识
- 数据处理编程语言
- 统计学
- 研究背景
研究背景是工作的方向,但对于一个研究生而言课题常常由导师指定,因此该部分的学习一般是通过阅读文献和自己对于课题的探索而逐步深入的。
统计学在生物信息学乃至生物学中都是极为核心的一部分,不过当前科学界普遍存在p值的滥用和缺乏一些深厚的统计学素养,因此学习时应当额外注意对统计基本概念的理解,应当掌握假设检验、p值、置信区间、参数检验与非参数检验、多重校正等知识。这些知识可以通过大学本科的概率论与数理统计教材以及生物统计学教材获得,另可参考生物统计学与R手册。
Linux操作系统知识可以分为两块:一是基本的Linux操作与管理,可参考《鸟哥的私房菜-基础篇》进行学习;二是Linux Shell编程,用以处理文本数据流,可参考《优雅的Linux>>Shell笔记与探索》进行学习。《Linux数据处理命令工具》一文有一些重要Linux命令的讲解。
最后,学习和使用数据处理编程语言一般是工作的核心。目前主流有2门用于生信领域的语言:Python和R。学习应以其中一门为主,下面列出一些参考书目。
Python:
- 《利用Python进行数据分析》
- 《Bioinformatics with Python Cookbook》
- 《Python for Bioinformatics》
R:
- 《R for Data Science》(不推荐看中文,翻译的不好)
- 《R实战》第二版
- 《R语言编程艺术》
最后推荐一些资源仓库:
- 操作系统 - 操作系统知识与问题的方案
- 工具包与数据库 - 科研与生信分析软件(工具包)、数据库
- Markdown与Notebook - 如何进行知识的记录与分享
- 癌症研究 - 癌症研究知识、分析流程汇总
- awesome列表 - awesome以及其他的资源合集
- 线上图书 - 图书学习汇总与推荐
- 填坑笔记 - Liulab分析工作的填坑日常
- 生信入门资料集合 - 分享自生信技能树公众号,已转至百度云,链接: https://pan.baidu.com/s/1mhHd8aG 密码: vjxa
- Github入门与实战(中文版) - 链接: https://pan.baidu.com/s/1nvgJWIP 密码: ne2w
- RNA-seq Data Analysis-A Practical Approach - 链接: https://pan.baidu.com/s/1eSPD4hs 密码: y79f
- Python for Data Analysis(2nd Edition, Early Release) - 链接: https://pan.baidu.com/s/1c1UleXq 密码: s692
- 小张聊科研修炼手册 - 链接: https://pan.baidu.com/s/1jIiRXhO 密码: zu4n
- MySQL视频(尚观云) - 链接: https://pan.baidu.com/s/1pLJV7b9 密码: e6fg
- NIH的TCGA-topic大全 - 链接: https://pan.baidu.com/s/1i4CzYoH 密码: w9q4
- TCGA大文章 - 链接: https://pan.baidu.com/s/1qXY6wI4 密码: de2q
- sed与awk(修订第三版) - 链接: https://pan.baidu.com/s/1qYqPz5a 密码: 4ei4
- 北大生科院基因组学数据分析课程 - 链接:https://share.weiyun.com/5UGqR2i
- StatQuest生物统计学 - 链接:https://pan.baidu.com/s/1uOIfcsGdkTgddqzZ0-W6jQ 密码:rabg
- 中国科学技术大学计算机学院课程资源
- Unix, R and python tools for genomics and data science
- Row-oriented workflows in R with the tidyverse
- Bioinformatics one-liners
- bioconda教程中文版 - https://github.com/XSLiuLab/bioconda-tutorial
- Data Analysis for the Life Sciences - I am reading. Online link https://genomicsclass.github.io/book/
- "Python for Data Analysis" by Wes McKinney, published by O'Reilly Media
- Public data for the book Python for Bioinformatics
- The lecture slides for Coursera's Data Analysis class
- Statistical Rethinking: A Bayesian Course Using R and Stan - Statistical Rethinking course at MPI-EVA from Dec 2018 through Feb 2019
- Modern Statistics for Modern Biology - by Susan Holmes, Wolfgang Huber
- RNA-seq-analysis - RNAseq analysis notes from Ming Tang
- Informatics for RNA-seq: A web resource for analysis on the cloud
- A repository for setting up a RNAseq workflow
- DNA-seq-analysis - DNAseq analysis notes from Ming Tang
- ChIP-seq-analysis - ChIPseq analysis notes from Ming Tang
{全部}下一级条目下设下一级标题对内容进一步区分。
- 绘图
- iSlide
- 写作
- 汇报
- 海报
- 建站
NCBI
PDB
ggplot2
TBtools