admin管理员组

文章数量:1643172

SRA下载及安装

1、简介

SRA(Sequence ReadArchive)数据库是用于存储二代测序的原始数据,包括 454,Illumina,SOLiD,IonTorrent,Helicos 和 CompleteGenomics。除了原始序列数据外,SRA现在也存在raw reads在参考基因的比对信息。
根据SRA数据产生的特点,将SRA数据分为四类:

Studies-- 研究课题

Experiments-- 实验设计

Runs-- 测序结果集

Samples-- 样品信息

SRA中数据结构的层次关系为:Studies->Experiments->Samples->Runs.

Studies是就实验目标而言的,一个study 可能包含多个Experiment。

Experiments包含了Sample、DNA source、测序平台、数据处理等信息。

一个Experiment可能包含一个或多个runs。

Runs 表示测序仪运行所产生的reads。

SRA数据库用不同的前缀加以区分:

ERP或SRP表示Studies;

SRS 表示 Samples;

SRX 表示 Experiments;

SRR 表示 Runs;

2.安装 SRA Toolkit

2.1 工具下载

1.从ncbi下载sratoolkit工具,打开ncbi,到这个界面根据系统下载你需要的sratoolkit,

本文标签: 格式windowSRAToolkit