ToB企服应用市场:ToB评测及商务社交产业平台

标题: 提交高通量测序原始数据到 SRA --- 操作流程 [打印本页]

作者: 守听    时间: 2024-7-28 14:08
标题: 提交高通量测序原始数据到 SRA --- 操作流程
<blockquote class="multiquote-1" style="margin-top: 20px; margin-bottom: 20px; margin-left: 0px; margin-right: 0px; padding-top: 10px; padding-bottom: 10px; padding-left: 20px; padding-right: 10px; border-top-style: solid; border-bottom-style: solid; border-left-style: solid; border-right-style: solid; border-top-width: 1px; border-bottom-width: 1px; border-left-width: 1px; border-right-width: 1px; border-top-color: rgba(222, 198, 251, 0.4); border-bottom-color: rgba(222, 198, 251, 0.4); border-left-color: rgba(222, 198, 251, 0.4); border-right-color: rgba(222, 198, 251, 0.4); border-top-left-radius: 4px; border-top-right-radius: 4px; border-bottom-right-radius: 4px; border-bottom-left-radius: 4px; background-attachment: scroll; background-clip: border-box; background-color: rgb(246, 238, 255); background-image: none; background-origin: padding-box; background-position-x: 0%; background-position-y: 0%; background-repeat-x: no-repeat; background-repeat-y: no-repeat; background-size: auto; width: auto; height: auto; box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px; display: block; overflow-x: auto; overflow-y: auto;">   ❝   写在前面

   
由于最近在提交课题数据到 NCBI 数据库,整理了相干笔记。本着本身学习、分享他人的态度,分享学习笔记,渴望能对各人有所资助。推荐先按顺序阅读往期内容:
1. 提交高通量测序数据到 GEO --- 说明书

   
         目次

   
      
在发表文章之前去往需要将高通量测序的数据上传到 NCBI 数据库。上传的数据可以分为两类:① Raw data(fastq文件)通常上传到 SRA、② Processed data(counts matrix、RDS 等)通常上传到 GEO。本文详细介绍提交高通量测序 raw data 到 SRA 的操作流程。

  1 注册 NCBI 账号

  
起首需要登岸https://www.ncbi.nlm.nih.gov/account/注册一个 NCBI 账号,NCBI 支持用各种第三方账户举行注册:

     
    2 预备要上传的原始数据

  
新建一个文件夹,将所有需要上传的样本的原始数据放置到同一个文件中:

     
    3 填写数据信息

  
进入 NCBI 首页(https://www.ncbi.nlm.nih.gov/),按如下操作:① 选择 SRA、② 点击 Search、③ 点击 Submit to SRA、④ 点击 New submission

     
      
      
    3.1 填写提交者信息(SUBMITTER)

  
第一项要填写提交者信息,按要求填写即可,注意*为必填选项,填写完成后点击 Continue。

     
    3.2 填写一般信息(GENERAL INFO)

  
第二项要填写一般信息,如果是第一次提交 BioProject 和 BioSample 都选择 NO,Release data 发起选择靠后一些的日期,避免数据过早发布,后续可以根据课题进展修改。填写完成后点击 Continue。

     
    3.3 填写项目信息(PROJECT INFO)

  
第三项要填写项目信息,填写项目标题、项目描述,如果是第一次提交选择 NO 即可,其他部分选填,填写完成后点击 Continue。

     
    3.4 填写样本类型(BIOSAMPLE TYPE)

  
第四项要填写样本类型,比如小鼠样本,就选择 Model organism or animal,其他样本在选项中找到对应类型即可,填写完成后点击 Continue。

     
    3.5 填写样本属性(BIOSAMPLE ATTRIBUTES)

  
第五项要填写样本属性,可以选择使用内置表格编辑器,或下载Excel和TSV模板填写后上传。

     
   
以下载的Excel表格为例:

     
   
绿色为必填项(必须全部填写)蓝色为选填项(至少选填一个)黄色为可选项(可以空着)。如果任何选项的信息在你的研究中没有涉及,可以填写 "not collected"、"not applicable"、"missing"。你也可以添加恣意数目的自定义选项来完整描述你的样本信息。可以将鼠标悬停在选填名称上以查看定义,或者查看 https://www.ncbi.nlm.nih.gov/biosample/docs/attributes/。

  
填写完成后点击 Choose file 上传,然后点击 Continue。

  3.6 填写 SRA Metadata(SRA METADATA)

  
第六项要填写 SRA Metadata,同样可以选择使用内置表格编辑器,或下载Excel模板填写后上传。

     
   
以下载的Excel表格为例:

     
   
注意黄色列有下拉菜单,可让从下拉菜单中举行选择。蓝色为必填项绿色为可选项。每一个选项的填写要求如下:

  
  
填写完成后点击 Choose file 上传,然后点击 Continue。

  3.7 上传文件(FILES)

  
第七项要上传文件。

     
   
注意事项:

  
  
可以通过三种方式上传文件:

  
  
由于原始数据通常很大,一般存储在 Linux 服务器中,因此我这里使用 Aspera 命令行上传。Aspera 提供跨越洲际距离的快速上传毗连,上传速度可达 100Mb/s

  
上传步调:

    
上传乐成后,点击 Select preload folder 选择上传的文件夹,然后提交。

  
注意:上传的文件至少需要 10 分钟才气在 Select preload folder 中可供选择。请在创建文件夹后 30 天内完成提交。如果您上传文件但未提交,它们将在文件夹创建后 30 天自动删除。

  3.8 检查并提交(REVIEW & SUBMIT)

  
第八项,检查前面填写的内容,如果没有问题点击 Submit 提交。

     
   
提交后等候 NCBI 审核,SRA 编号大概需要一些时间才气处理惩罚完成,一般 24 小时之内能够完成。如果审核长时间没有完成,可以发邮件给 NCBI 扣问。如果提交表现下面三项都通过了,就表明数据上传乐成了。

     
   
     --------------- 结束 ---------------   
  
注:本文为个人学习笔记,仅供各人参考学习,不得用于任何贸易目的。如有侵权,请联系作者删除。



     
    本文由 mdnice 多平台发布

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4