论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
ToB企服应用市场:ToB评测及商务社交产业平台
»
论坛
›
主机系统
›
linux
›
单细胞转录组上游fasta文件处置惩罚
单细胞转录组上游fasta文件处置惩罚
涛声依旧在
金牌会员
|
2024-7-29 17:45:41
|
显示全部楼层
|
阅读模式
楼主
主题
833
|
帖子
833
|
积分
2499
单细胞分析上游fasta文件处置惩罚
——基于cellranger与dropseqRunner
###如果测序文件由10X genomics平台产生,则采用cellranger count的基本流程举行fasta文件的上游处置惩罚;如果测序文件由dropseq平台产生,则采用dropseqRunner软件举行处置惩罚
一、cellranger配置
1、软件安装并检察帮助文档
#安装包下载
wget -O cellranger-7.1.0.tar.gz "https://cf.10xgenomics.com/releases/cell-exp/cellranger-7.1.0.tar.gz?Expires=1694703729&Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9jZi4xMHhnZW5vbWljcy5jb20vcmVsZWFzZXMvY2VsbC1leHAvY2VsbHJhbmdlci03LjEuMC50YXIuZ3oiLCJDb25kaXRpb24iOnsiRGF0ZUxlc3NUaGFuIjp7IkFXUzpFcG9jaFRpbWUiOjE2OTQ3MDM3Mjl9fX1dfQ__&Signature=YmIZ3TsEI7VxGNIY7SdL~8oH0jr7ktjMZ48HRiLDQfcYLN4YWcs5nk0CZeKkeemvygGK3VryeHnvZpA21r2jN2YKfSeAHC03t-aDKzjctzbPvnv9UbckvrOghyxW7mH14W7uzMJJ1C9PbBo869EDRH04vxfsYGFQONCxvb~iBamTU1ZJ-6etWVioLjzb7o4-Y3v4v46nw67qf2NaPTwNXr4PIA-vFdWe9v9YhQQM6VlHR8a5crTmaM39hGC~2PatW0qlEd-DsMHeeNb34~Gr5N8XNIHv6K1VcuMq8VobqLQKxeoz3obmA23~kWkPNOSZNCVXosd0p6Ok7fUHiVUt-Q__&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA" &
复制代码
#解压文件
tar -zxvf cellranger-7.0.1.tar.gz
#把cellranger的路径加到$PATH中方便调用
vi ~/.bashrc
export PATH=”/data5/tan/zengchuanj/Software/cellranger-7.1.0/bin
PATH”
echo 'export PATH=/data5/tan/zengchuanj/Software/cellranger-7.1.0/
PATH' >> ~/.bashrc
#更新体系配置文件
source ~/.bashrc
#检察cellranger使用说明
cellranger count --help
2、参考基因组下载
#人类参考基因组数据集
wget -o human.log
https://cf.10xgenomics.com/supp/cell-exp/refdata-gex-GRCh38-2020-A.tar.gz
&
tar -xvf refdata-gex-GRCh38-2020-A.tar.gz
#mouse参考基因组数据集下载
wget -o mouse.log
https://cf.10xgenomics.com/supp/cell-exp/refdata-gex-mm10-2020-A.tar.gz
&
tar -xvf refdata-gex-mm10-2020-A.tar.gz
#测试数据集下载
wget -o sample.log 'http://cf.10xgenomics.com/samples/cell-exp/2.1.0/neurons_900/neurons_900_fastqs.tar' &
tar -xvf neurons_900_fastqs.tar #
解压
cellranger count --id=result --transcriptome=../refdata-gex-mm10-2020-A/ --fastqs=/neurons_900_fastqs --sample=neurons_900 --expect-cells=1000 --nosecondary
Attention
:#count函数参数表明
cellranger count --id=sample \
--transcriptome=/opt/refdata-cellranger-GRCh38-1.2.0 \
--fastqs=/home/scRNA/runs/HAWT7ADXX/outs/fastq_path \
--sample=mysample \
--expect-cells=1000 \
--nosecondary
# id指定输出文件存放目录名
# transcriptome指定与CellRanger兼容的参考基因组
# fastqs指定mkfastq大概自界说的测序文件
# sample要和fastq文件的前缀中的sample保持一致,作为软件识别的标志
# expect-cells指定复现的细胞数目,这个要和实行设计联合起来
# nosecondary 只得到表达矩阵,不举行后续的降维、聚类和可视化分析(反正后续要走Seurat,为了节省盘算资源,建议加上)
3、结果解读
Ref:
https:/zhuanlan.zhihu.com/p/390516422
Outputs:
- Run summary HTML: /data5/tan/zengchuanj/pipeline/cellranger/result/outs/web_summary.html
- Run summary CSV: /data5/tan/zengchuanj/pipeline/cellranger/result/outs/metrics_summary.csv
- BAM: /data5/tan/zengchuanj/pipeline/cellranger/result/outs/possorted_genome_bam.bam
- BAM index: /data5/tan/zengchuanj/pipeline/cellranger/result/outs/possorted_genome_bam.bam.bai
- Filtered feature-barcode matrices MEX: /data5/tan/zengchuanj/pipeline/cellranger/result/outs/filtered_feature_bc_matrix
- Filtered feature-barcode matrices HDF5: /data5/tan/zengchuanj/pipeline/cellranger/result/outs/filtered_feature_bc_matrix.h5
- Unfiltered feature-barcode matrices MEX: /data5/tan/zengchuanj/pipeline/cellranger/result/outs/raw_feature_bc_matrix
- Unfiltered feature-barcode matrices HDF5: /data5/tan/zengchuanj/pipeline/cellranger/result/outs/raw_feature_bc_matrix_h5.h5
- Secondary analysis output CSV: /data5/tan/zengchuanj/pipeline/cellranger/result/outs/analysis
- Per-molecule read information: /data5/tan/zengchuanj/pipeline/cellranger/result/outs/molecule_info.h5
- Loupe Browser file: /data5/tan/zengchuanj/pipeline/cellranger/result/outs/cloupe.cloupe
outs/raw_feature_bc_matrix: 这个文件夹包含原始的基因表达矩阵,每一行代表一个基因,每一列代表一个细胞。这个矩阵中的值表示每个细胞中每个基因的表达水平。这个矩阵没有经过任何的标准化或过滤。
outs/filtered_feature_bc_matrix: 这个文件夹包含经过过滤后的基因表达矩阵。在这个矩阵中,已经去除了低质量的细胞和低表达的基因。这是举行后续分析的主要输入。此文件夹包含三个文件:barcodes.tsv.gz、features.tsv.gz和matrix.mtx.gz。这些文件包含了每个细胞的条形码、每个特征的名称和每个细胞中每个特征的计数。
outs/metrics_summary.csv: 这个CSV文件包含了关于每个细胞和每个样本的一些质量控制指标,例如细胞计数、均匀基因表达水平等。
outs/web_summary.html: 这个HTML文件提供了一个交互式的可视化界面,用于检察分析的总结结果,包括细胞计数、质量控制指标、细胞类型聚类等。
outs/cloupe.cloupe: 这是一个文件,可以用于在10x Genomics的Loupe浏览器中检察和分析单细胞数据。Loupe浏览器提供了丰富的数据可视化和分析功能。
二、dropseqRunner的配置
1、conda的安装
dropseqRunner是个依赖conda和python的环境,在安装前确保自己的服务器中有与之兼容的conda与python
wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.3.1-Linux-x86_64.sh
bash Anaconda3-5.3.1-Linux-x86_64.sh
2、Dropseq的安装
wget
https://codeload.github.com/aselewa/dropseqRunner/zip/master
mv master master.zip
unzip master.zip
#创建dropseq运行的conda环境
conda env create -f environment.yaml
#每次运行dropseq前必要举行激活,不激活环境则无法调用snakemake
conda activate dropRunner
#编译,不编译无法出现主脚本
make
3、下载参考数据并构建比对索引
#这里以小鼠的为例
wget
-o mm.log
https://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/001/635/GCF_000001635.27_GRCm39/GCF_000001635.27_GRCm39_genomic.fna.gz
&
#安装处置惩罚gff文件软件
conda install gffread
#将gff文件转换为gtf文件
gffread GCF_000001635.27_GRCm39_genomic.gff -T -o mice.gtf
#建参考数据库
STAR --runThreadN 4 --runMode genomeGenerate --genomeDir reference/ --genomeFastaFiles GCF_000001635.27_GRCm39_genomic.fna --sjdbGTFfile mice.gtf
4、Dropseq使用方法
python /dropseqRunner-master/dropRunner.py --R1 SRR11799731_R1.fastq.gz --R2 SRR11799731_R2.fastq.gz --indices /dropseqRunner-master/db/reference --sample SRR11799731 --protocol drop
#主程序使用方法
#各个参数:
#R1 R2,分别是你的两个fastq文件
#--indices是刚才构建好的参考数据集
#--sample是样本前缀名
#运行完毕后用于Seurat的数据存在/sample/output/SRR11799731_0_Solo.out/Gene
三、Error自查
Attention error
:主要是下载、安装、配置上的题目
1、 dropseqRunner下载题目
#下载dropseq
git clone git@github.com:aselewa/dropseqRunner.git
cd dropseqRunner
这个题目是关于使用Git克隆dropseqRunner时出现了权限拒绝错误。错误信息是“Permission denied (publickey)”。
这个错误通常是由于缺少SSH密钥或使用了错误的SSH密钥导致的。以下是一些可能的办理方法:
查抄SSH密钥
在本地盘算机上生成SSH密钥,并将公钥添加到GitHub帐户中。可以使用以下命令查抄是否存在SSH密钥:
ls -al ~/.ssh
如果没有SSH密钥,请使用以下命令生成:
ssh-keygen -t rsa -b 4096 -C "your_email@example.com"
然后将公钥添加到GitHub帐户中。
使用HTTPS URL
使用HTTPS URL而不是SSH URL来克隆dropseqRunner。使用以下命令:
git clone https://github.com/aselewa/dropseqRunner.git
这将使用HTTPS URL克隆`dropseqRunner`,而不必要SSH密钥。
查抄GitHub帐户权限
确保你的GitHub帐户具有克隆dropseqRunner的权限。如果您没有访问权限,请接洽仓库的全部者以获取访问权限。
Ps:如果这些都办理不了,建议开始摆烂
wget登场
wget
https://codeload.github.com/aselewa/dropseqRunner/zip/master
之前以为Github仓库的master分支基本上应该是提交代码的记录,现实master是个二进制文件,后续发现现实应该是个.zip文件。
2、dropseqRunner配置题目
这一题目主要是因为environment.yaml下载错误,重新下载安装即可。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
涛声依旧在
金牌会员
这个人很懒什么都没写!
楼主热帖
MySQL基本SQL语句之高级操作
maven配置步骤及问题
Juc并发编程12——2万字深入源码:线程 ...
史上最全MongoDB之部署篇
一文读懂K-Means原理与Python实现 ...
IOS OpenGL ES GPUImage 图像黑白色调 ...
【云原生】裸金属架构之服务器安装VMWa ...
Flink-基于 DataStream API 实现欺诈检 ...
大数据ETL开发之图解Kettle工具(入门 ...
Java 2023年接地气的中高级面试题一( ...
标签云
挺好的
服务器
快速回复
返回顶部
返回列表