url	public
02-list	1

资源列表

该列表分为推荐和全部两块，推荐展示强推资料，用于学习必备的一些技能，全部展示经过筛选的所有内容。

具体内容的选择、学习，读者需要自己根据当前自身的情况把握。

入门建议

生物信息学学习有4块核心：

Linux操作系统知识
数据处理编程语言
统计学
研究背景

研究背景是工作的方向，但对于一个研究生而言课题常常由导师指定，因此该部分的学习一般是通过阅读文献和自己对于课题的探索而逐步深入的。

统计学在生物信息学乃至生物学中都是极为核心的一部分，不过当前科学界普遍存在p值的滥用和缺乏一些深厚的统计学素养，因此学习时应当额外注意对统计基本概念的理解，应当掌握假设检验、p值、置信区间、参数检验与非参数检验、多重校正等知识。这些知识可以通过大学本科的概率论与数理统计教材以及生物统计学教材获得，另可参考生物统计学与R手册。

Linux操作系统知识可以分为两块：一是基本的Linux操作与管理，可参考《鸟哥的私房菜-基础篇》进行学习；二是Linux Shell编程，用以处理文本数据流，可参考《优雅的Linux>>Shell笔记与探索》进行学习。《Linux数据处理命令工具》一文有一些重要Linux命令的讲解。

最后，学习和使用数据处理编程语言一般是工作的核心。目前主流有2门用于生信领域的语言：Python和R。学习应以其中一门为主，下面列出一些参考书目。

Python:

《利用Python进行数据分析》
《Bioinformatics with Python Cookbook》
《Python for Bioinformatics》

R:

《R for Data Science》（不推荐看中文，翻译的不好）
《R实战》第二版
《R语言编程艺术》

最后推荐一些资源仓库：

Unix, R and python tools for genomics and data science
Bioinformatics one-liners

Roadmap

操作系统 - 操作系统知识与问题的方案
工具包与数据库 - 科研与生信分析软件（工具包）、数据库
Markdown与Notebook - 如何进行知识的记录与分享
癌症研究 - 癌症研究知识、分析流程汇总
awesome列表 - awesome以及其他的资源合集
线上图书 - 图书学习汇总与推荐
填坑笔记 - Liulab分析工作的填坑日常

云资源

生信入门资料集合 - 分享自生信技能树公众号，已转至百度云，链接: https://pan.baidu.com/s/1mhHd8aG 密码: vjxa
Github入门与实战（中文版） - 链接: https://pan.baidu.com/s/1nvgJWIP 密码: ne2w
RNA-seq Data Analysis-A Practical Approach - 链接: https://pan.baidu.com/s/1eSPD4hs 密码: y79f
Python for Data Analysis(2nd Edition, Early Release) - 链接: https://pan.baidu.com/s/1c1UleXq 密码: s692
小张聊科研修炼手册 - 链接: https://pan.baidu.com/s/1jIiRXhO 密码: zu4n
MySQL视频（尚观云） - 链接: https://pan.baidu.com/s/1pLJV7b9 密码: e6fg
NIH的TCGA-topic大全 - 链接: https://pan.baidu.com/s/1i4CzYoH 密码: w9q4
TCGA大文章 - 链接: https://pan.baidu.com/s/1qXY6wI4 密码: de2q
sed与awk（修订第三版） - 链接: https://pan.baidu.com/s/1qYqPz5a 密码: 4ei4
北大生科院基因组学数据分析课程 - 链接：https://share.weiyun.com/5UGqR2i
StatQuest生物统计学 - 链接:https://pan.baidu.com/s/1uOIfcsGdkTgddqzZ0-W6jQ 密码:rabg

Github仓库

基础学习

中国科学技术大学计算机学院课程资源
Unix, R and python tools for genomics and data science
Row-oriented workflows in R with the tidyverse
Bioinformatics one-liners
bioconda教程中文版 - https://github.com/XSLiuLab/bioconda-tutorial
Data Analysis for the Life Sciences - I am reading. Online link https://genomicsclass.github.io/book/
"Python for Data Analysis" by Wes McKinney, published by O'Reilly Media
Public data for the book Python for Bioinformatics
The lecture slides for Coursera's Data Analysis class
Statistical Rethinking: A Bayesian Course Using R and Stan - Statistical Rethinking course at MPI-EVA from Dec 2018 through Feb 2019
Modern Statistics for Modern Biology - by Susan Holmes, Wolfgang Huber

数据分析

RNA-seq-analysis - RNAseq analysis notes from Ming Tang
Informatics for RNA-seq: A web resource for analysis on the cloud
A repository for setting up a RNAseq workflow
DNA-seq-analysis - DNAseq analysis notes from Ming Tang
ChIP-seq-analysis - ChIPseq analysis notes from Ming Tang

Pipeline

NGS Pipeline

基础编程

研究背景

分析流程

统计技术

软件工具

工具开发

全部

{全部}下一级条目下设下一级标题对内容进一步区分。

学术资料

学术工具

绘图
- iSlide
写作
汇报
海报
建站

Files

02-list.md

Latest commit

History

02-list.md

File metadata and controls

资源列表

推荐

入门建议

Roadmap

云资源

Github仓库

基础学习

数据分析

Pipeline

基础编程

研究背景

分析流程

统计技术

软件工具

工具开发

全部

学术资料

学术工具

学术研究组

数据库

核心数据库

临床试验

癌症组学

其他

软件与工具包

协同工作

组学数据预处理

序列比对

变异检测

生信文件处理

差异分析

数据处理与转换

统计建模与分析

表格

绘图

编程优化

并行计算

基础编程

R

Python

Shell

Shiny

C 与 C++

Golang

Javascript、HTML 与 CSS

研究背景

癌症

免疫学

分析流程

统计技术

工具开发

R 包

Shiny

Python 包

命令行工具