rna-seq deciphering host-microbe interactions

  • RNA-seq技术以其单核苷酸水平的高分辨力成为研究宿主-微生物相互作用的主要技术,从而提高对其生理后果和作用机制的认识;
  • 根据真核生物和细菌的转录组特征的共性和差异比较了两者 RNA-seq 方案,进而从宏转录组学、互作转录组学等方面概述了跨物种 RNA-seq 方法;
  • 同时单细胞RNA-seq技术进入感染生物学领域,从单细胞水平来理解细胞异质性的决定作用;
  • 未来转录组学或将与功能基因组学等数据结合,对抗传染病和微生物疾病。

真核生物和细菌的转录组特征

尽管经过了20亿年的分离进化,原核生物和真核生物之间还是分享了基本的 RNA 类别。核糖体 RNA (Ribosomal RNAs,RNAs)在核糖体中具有高度的支架作用和酶促作用,占细菌和真核细胞 RNA 含量的80% 以上(在快速生长的细胞中大于95%)。转移 RNA (tRNA)分子将 RNA 语言(核糖核酸酶)翻译为蛋白质信息(氨基酸链) ,通常对细胞 RNA 含量贡献10% 。mRNAs 占细胞转录组总数的5% 。

细菌基因的平均长度为1kb,然而,它们通常被转录为多顺反子,从而形成跨越多个基因的长 mRNAs。

真核编码转录本是作为带有内含子和外显子的前体合成的,在细胞核中进行剪接(内含子去除) ,然后输出到细胞质中。成熟的人类 mRNAs 的平均长度约为3kb,由于哺乳动物中只存在单顺反子,所以极长的编码转录本(大于10kb)非常罕见。

  • 转录本差异

  • RNA 含量差异

这些定性和定量转录组的差异反映在当前细菌和哺乳动物标准 RNA-seq 方案中。

细菌与真核生物 RNA-seq 工作流程比较

Rna seq 实验的标准步骤是从生物样本中提纯核酸,对污染的基因组 DNA 进行酶消化,去除丰富但信息量较小的 rRNA,将剩余的转录本转化为 cDNA,对 cDNA 片段进行高通量测序,将测序结果与参考基因组序列比对,并对映射到个体基因特征的片段进行定量。

目前细菌和真核表达谱的标准都是使用 Illumina 公司技术的“短读”合成测序

1 转录组固定、细胞裂解和 RNA 提取

  • 由于转录组是出了名的不稳定,在这种情况下,RNA 的组成应该借助固定剂来保持,以阻止从头转录和 RNA 衰变。
  • 原核细胞和真核细胞的物理化学性质有很大的不同,仔细评估跨物种转录组学的裂解效率,有效和均匀地分解样品中的所有细胞类型,同时仍然足够温和,不降解细胞 RNAs。
  • 裂解物准备好->下游RNA 分离技术

2 核糖耗尽

  • 在细菌中,rRNA 通常在 cDNA 文库产生之前或期间被主动去除。

  • 在真核生物 RNA-seq 中,rna 一般是通过选择性启动多腺苷酸转录本的 cDNA 来间接耗尽的

3 cDNA 文库的制备和测序

  • 细菌 RNA-seq 中,RNA 适配器通常连接到所获得的 RNA 片段的3′端,然后通过适配器特异性引物(如流行的 NEBNext 小型 RNA 文库预备装置; 新英格兰生物实验室)作为反转录锚
  • 真核生物 mRNA 表达谱的构建通常包括增加多腺苷酸转录本,然后通过随机引发(例如 TruSeq 的受体 mRNA 试剂盒; Illumina)使 RNA 片段化和 RT

测序深度的要求也取决于 RNA-seq 实验的预期结果。尽管精确绘制转录本边界、操作子或选择性剪接结构和对低丰度转录本进行定量需要较高的测序深度,但大多数细菌和真核生物的 rna seq 研究实质上是差异表达分析,因此测序强度要小得多。

4 读对齐,归一化,量化和功能分析

  • 由于剪接是真核生物独有的分子过程,原核生物 RNA-seq 的标准读比对,节省计算量和时间,而真核生物的比对过程则依赖于剪接序列
  • 归一化
  • 功能分析:
    • 差异表达分析:DESeq2、 edgeR52和 limma/vom。
    • 全局通路分析:基因本体论(GO)或京都基因和基因组百科全书(KEGG)。
    • 此外,对于小鼠或人类 RNA-seq 数据的分析,还存在更精确的数据库,专门研究例如代谢或免疫相关基因组。

细菌 RNA-seq 在体内转录组学中的应用

为了充分利用宿主和微生物的全局表达数据,需要高分辨率的转录组图谱。然而,小鼠和人类的转录组已经很好地注释了多年,细致的转录组图谱没有给予大多数细菌。相反,细菌转录组通常是基于计算机搜索长度大于100个氨基酸的潜在开放阅读框(orf)而注释,但可能缺少短的开放阅读框、非翻译区(UTRs)或非编码 RNA 基因。

研究细菌病原体在宿主机体内的基因表达成为必要

丰富细菌转录本,“杂交选择”是指将复杂的 cDNA 样本与物种特异性的生物素化探针进行孵化,以捕获并丰富远离宿主 cDNA 背景的感兴趣的 cDNA -> 设计捕获探针

跨物种 RNA-seq 方法

研究微生物与其他微生物或与宿主细胞的联系

Metatranscriptics

基于测序的细菌群落结构分析始于宏基因组学:16S rDNA 序列分析(16S profiling) ,基因组 DNA shotgun 测序。然而,某个微生物物种或某个基因的丰度并不一定与该物种或基因在联合体中的功能贡献相关。

metatranscriptomics :对微生物内部相互作用的功能研究

得到的 DNA 和 RNA 测序数据是分开处理的,然后用宏基因组数据来归一化metatranscriptomic reads。

两种方法:参考基因组分类法,从头基因组组装基因组分类法de novo metagenome-assembled genomes (MAGs)

  • 基于参考基因组的分类器:HUMAnN2、 Kaiju87或 Kraken2。群落成员物种基本上是预先确定的,只有它们的相对丰度是未知的,例如在人类肠道微生物区系。
  • 群落中的细菌种类位置,优先采用MAGs 的新分类学分类法

对健康人体肠道微生物组的比较研究表明,与metagenomic对应部分相比,metatranscriptomic对应部分的个体化程度通常较低。而纵向分析显示,随着时间的推移,个体的metatranscriptome比metagenome变化更大,这表明微生物基因表达受到环境和营养波动的积极调节。人类肠道微生物群的组成(metagenomics)和功能(metatranscriptomics)变化也与传染病的结果有关。

Dual RNA-seq

Dual RNA-seq 同时测量基因在(细胞内或细胞外)细菌和被感染的宿主细胞或组织中的表达。

一般来说,来自被感染的寄主组织或器官的整体 RNA-seq 数据很难分析,因为改变的转录丰度代表了差异表达基因的总和和寄主细胞类型组成的改变。尽管如此,双 RNA-seq 已经成功地用于其中一些感染模型。

当测序大量组织样本,细胞类型特异性基因表达可能会丢失在平均表达谱。两种方式提高分辨率: 在测序之前,通过分离感染组织和隔离预先确定的细胞类型,或者在测序之后,利用细胞类型特定标记对异质数据进行去计算处理。

Triple RNA-seq

关于 ‘omni-RNA-seq’ 方法的探讨

总的来说,在过去的5年里,多生物体 rna seq 方法的普及程度有了巨大的提高。虽然 metatranscriptics 和dual RNA-seq 正在成为现代感染生物学的常规技术,跨物种 RNA-seq 的发展将继续考虑更多的相互作用和复杂的相互作用网络。对产生的数据进行适当的分析需要复杂的生物信息学工具,并应随后进行试验,以探索预测的多物种相互作用节点的因果关系和功能结果。在这些努力的同时,感染研究领域目前正在被单细胞转录组学的引入所动摇。

单细胞 RNA-seq

超越批量分析的新的转录组学方法来捕获和理解细胞异质性如何决定宿主-微生物相互作用的结果。

真核细胞 scRNA-seq

细胞类型特异性基因表达特征和细胞组成变化有一个全面的图谱,单细胞数据集为研究不同宿主细胞类型的异质性提供了丰富的资源。

局限性:

  • 体内 scRNA-seq 组织分离过程中空间信息的丢失 -> NICHE-seq
  • 依赖于寡核苷酸启动的 RT,从而丢失了许多非多聚腺苷酸化 RNA 类的信息,最重要的是小型真核 RNA -> Small-seq 方法

细菌 scRNA-seq

由于细菌细胞含有的 RNA19只有femtogram量,即比典型的真核细胞少100倍以上,因此需要一个灵敏的 cDNA 合成和扩增方案。目前大多数真核细胞 scRNA-seq 检测下限是每个细胞10份转录本,而细菌 scRNA-seq 协议必须考虑更低的平均拷贝数(每个细胞0.4份)。

细菌 mRNAs (半衰期在微小范围内,而真核生物的半衰期在数小时内)的内在不稳定性。

功能性细菌转录本上缺少poly A尾阻碍了基于 oligo (dT)的 RT 引发。

以上问题 -> 测序方法改进:期望 MATQ-seq、 PETRI-seq 和 microSPLiT 三个方案中步骤的技术改进和自动化将有助于细菌 scRNA-seq 成为在感染环境中研究微生物病原体的一种广泛使用的方法。

-> 感染生物学

未来:微生物疾病治疗

在寻求理解宿主-微生物相互作用引起的基因表达变化的过程中,RNA-seq 已经成为一种核心方法学。

虽然感染生物学的蛋白质中心史倾向于将 RNA-seq 研究的重点放在 mRNA 表达水平上,但人们越来越重视许多非编码转录本,这些转录本可能在感染的任何一方,即微生物和宿主发生变化。

RNA 修饰是扩展 RNA 序列分析种间相互作用范围的另一个方面。

时间和空间分辨率也必将进一步提高。新转录跟踪技术与 scRNA-seq 技术相结合,提供了病毒攻击的早期细胞反应的细粒度时间图像; 它也可以直接应用于感染细菌细胞的细胞。

RNA-seq 的最终目标是同时描述和关联单个感染宿主细胞和病原体的基因表达变化。

任何转录组学方法的一个重要的内在警告是,mRNA 水平可能不一定与分别编码的蛋白质的丰度相关。

在蛋白质水平验证 rna-seq 具有重要性:蛋白质定量,范围从低通量(对于选定的关键因子,采用 western blot 或流式细胞术)到中通量(多重 ELISA 或‘免疫 pcr’与寡核苷酸结合的抗体)到高通量。

将宿主-微生物转录组学与这些功能基因组学的数据结合起来,最终将得到可检验的假设,并提出 RNA 分子可以作为未来的生物标志物或药物靶点,用于对抗传染病和微生物疾病。

参考文献

Westermann, Alexander J., and Jörg Vogel. “Cross-species RNA-seq for deciphering host–microbe interactions.” Nature Reviews Genetics (2021): 1-18.