山海经

 找回密码
 立即注册
查看: 162|回复: 10

小鼠单细胞转录组数据之PRJNA604055

[复制链接]

1

主题

1

帖子

3

积分

新手上路

Rank: 1

积分
3
发表于 2023-3-23 16:13:22 | 显示全部楼层 |阅读模式
在  https://www.ncbi.nlm.nih.gov/sra/?term=PRJNA604055 可以看到这个数据集来源于文章:《Single-nucleus RNA-seq of mice arcuate nucleus of hypothalamus after pro-longed high fat diet》,就6个样品:
安装conda

这里推荐每个人安装自己的conda,这样的话一个服务器里面的每个用户独立操作,安装方法代码如下:
# 首先下载文件,20M/S的话需要几秒钟即可
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
# 接下来使用bash命令来运行我们下载的文件,记得是一路yes下去
bash Miniconda3-latest-Linux-x86_64.sh
#  安装成功后需要更新系统环境变量文件
source ~/.bashrc安装好conda后需要设置镜像(取决于你服务器的情况,部分网络比较好的服务器可以不设置镜像)
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/bioconda/
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes一个完整并且好用的conda真的是生产力工具。接下来就使用conda来配置mamba后设置kingfisher环境。
配置mamba后设置kingfisher环境

七八年前我写教程,尤其是多组学测序数据分析,都是从ncbi的sra数据库里面下载sra文件,然后一步步处理。很多教程还录制成为了视频上传到b站。但是读者多了之后我接受到的大家的反馈就是从ncbi的sra数据库里面下载sra文件实在是太慢了,因为我做演示的服务器在境外,所以自己压根就没有意识到这点。但是陆陆续续有小伙伴告诉我应该是使用aspera从ebi的ena数据库直接下载fastq文件即可,高速而且还少了一个sra文件转为fastq的步骤。所以后来我也开始在日常更新的公众号里面推荐这个方法,就是参考:使用ebi数据库直接下载fastq测序数据  , 需要自行配置好。但是风水轮流转,没想到,也没有过去多少年,就风水轮流转, aspera从ebi的ena数据库这个手段时灵时不灵的。现在只能是回归sra下载,见:转录组上游定量分析其实真不难,4步可定(一),从ncbi的sra数据库里面下载sra文件需要的是sra-tools这个工具套件, 如果你按照我的转录组流程配置:在全新服务器配置转录组测序数据处理环境,会发现安装的是sra-tools-2.8.0 ,后面仍然是报错,所以得指定版本,比如从github安装最新版。
慢慢的,大家在交流群提到了无论是使用sra-tools从ncbi的sra数据库里面下载sra文件,还是使用aspera从ebi的ena数据库直接下载fastq文件,都是得费劲测试和验证, 还得自己准备每个项目的全部的样品的信息,工作繁琐。所以就有了kingfisher,仅仅是需要一个项目ID,就可以自动去检索ebi的ena数据库和ncbi的sra数据库,自动合适的方式下载,非常方便。
代码如下所示:
conda install mamba
mamba init
mamba list

mamba create -n kingfisher python=3.8
mamba activate kingfisher
mamba install -c bioconda kingfisher


conda create -n kingfisher python=3.8
conda activate kingfisher
conda install -c bioconda kingfisher一行代码下载数据

kingfisher get -p PRJNA604055  -m ena-ascp ena-ftp prefetch aws-http第二天打开服务器看看,这6个10x技术单细胞样品的fq文件总共是157G的压缩后的fq文件:
ls -lh |cut -d" " -f 5-

5.6G 1月  20 11:39 SRR10992871_1.fastq.gz
21G 1月  20 12:25 SRR10992871_2.fastq.gz
5.9G 1月  20 12:36 SRR10992872_1.fastq.gz
22G 1月  20 12:59 SRR10992872_2.fastq.gz
5.8G 1月  20 13:06 SRR10992873_1.fastq.gz
22G 1月  20 13:32 SRR10992873_2.fastq.gz
5.5G 1月  20 13:39 SRR10992874_1.fastq.gz
20G 1月  20 14:06 SRR10992874_2.fastq.gz
5.8G 1月  20 14:12 SRR10992875_1.fastq.gz
22G 1月  20 14:34 SRR10992875_2.fastq.gz
5.4G 1月  20 14:38 SRR10992876_1.fastq.gz
20G 1月  20 14:51 SRR10992876_2.fastq.gz如果你熟悉10x单细胞转录组数据,就知道:

  • 首先,1-26个cycle就是测序得到了26个碱基,先是16个Barcode碱基,然后是10个UMI碱基;通常是R1文件
  • 然后,27-34这8个cycle得到了8个碱基,就是i7的sample index;通常是I1文件
  • 最后35-132个cycle得到了98个碱基,就是转录本reads(目前很多测序仪都是150bp了),通常是R2文件
也就是说R2 文件是真正的测序reads,肯定是文件最大。
所以把上面的样品名字进行合适修改后就可以走cellranger的定量流程。
cellranger的定量流程详解:

正常走cellranger的定量流程即可,代码我已经是多次分享了。参考:


  • 10X单细胞转录组原始测序数据的Cell Ranger流程(仅需800元)
  • 10X的单细胞转录组原始数据也可以在EBI下载
  • 一个10x单细胞转录组项目从fastq到细胞亚群
  • 一文打通单细胞上游:从软件部署到上游分析
  • PRJNA713302这个10x单细胞fastq实战
  • 一次曲折且昂贵的单细胞公共数据获取与上游处理
  • 只能下载bam文件的10x单细胞转录组项目数据处理
  • 不知道10x单细胞转录组样品和fastq文件的对应关系
  • 10X单细胞转录组测序数据的 SRA转fastq踩坑那些事
  • 10x的单细胞转录组fastq文件的R1和R2不能弄混哦
差不多几个小时就可以完成全部的样品的cellranger的定量流程。基础知识非常重要,我们在单细胞天地多次分享过cellranger流程的笔记(2019年5月),大家可以自行前往学习,如下:

  • 单细胞实战(一)数据下载
  • 单细胞实战(二) cell ranger使用前注意事项
  • 单细胞实战(三) Cell Ranger使用初探
  • 单细胞实战(四) Cell Ranger流程概览
  • 单细胞实战(五) 理解cellranger count的结果
回复

使用道具 举报

1

主题

38

帖子

77

积分

注册会员

Rank: 2

积分
77
发表于 2023-3-23 17:30:49 | 显示全部楼层
支持,赞一个
回复

使用道具 举报

1

主题

44

帖子

89

积分

注册会员

Rank: 2

积分
89
发表于 2023-3-24 18:32:55 | 显示全部楼层
占坑编辑ing
回复

使用道具 举报

0

主题

39

帖子

78

积分

注册会员

Rank: 2

积分
78
发表于 2023-4-8 00:27:38 | 显示全部楼层
呵呵。。。
回复

使用道具 举报

0

主题

23

帖子

45

积分

新手上路

Rank: 1

积分
45
发表于 2023-4-13 15:00:57 | 显示全部楼层
报告!别开枪,我就是路过来看看的。。。
回复

使用道具 举报

0

主题

41

帖子

80

积分

注册会员

Rank: 2

积分
80
发表于 2023-4-24 15:31:17 | 显示全部楼层
LZ敢整点更有创意的不?兄弟们等着围观捏~
回复

使用道具 举报

0

主题

31

帖子

60

积分

注册会员

Rank: 2

积分
60
发表于 2023-6-3 22:34:51 | 显示全部楼层
LZ敢整点更有创意的不?兄弟们等着围观捏~
回复

使用道具 举报

1

主题

31

帖子

63

积分

注册会员

Rank: 2

积分
63
发表于 2023-6-19 07:18:17 | 显示全部楼层
支持楼主,用户楼主,楼主英明呀!!!
回复

使用道具 举报

0

主题

30

帖子

59

积分

注册会员

Rank: 2

积分
59
发表于 2023-6-23 23:07:48 | 显示全部楼层
顶顶更健康
回复

使用道具 举报

0

主题

33

帖子

66

积分

注册会员

Rank: 2

积分
66
发表于 2023-7-5 17:21:21 | 显示全部楼层
报告!别开枪,我就是路过来看看的。。。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|山海经

Powered by Discuz! X3.4 © 2001-2012 Comsenz Inc.

GMT+8, 2025-3-15 07:04 , Processed in 0.149049 second(s), 23 queries .

快速回复 返回顶部 返回列表