Cell Reports | 全套代码分享,单细胞、空间转录组,7张漂亮组合图,非常好的学习材料

张开发
2026/4/14 22:52:56 15 分钟阅读

分享文章

Cell Reports | 全套代码分享,单细胞、空间转录组,7张漂亮组合图,非常好的学习材料
科研不掉发快来这个地表最强的生信神仙网站中国银河生信云平台 立即访问https://usegalaxy.cn为什么胎儿期的肌腱受损后更容易接近无瘢痕修复而成年后的肌腱却常常走向纤维化和功能恢复不全这背后未必只是力学负荷不同更关键的可能是细胞状态和组织微环境已经换了一套程序。2026 年 4 月 28 日这篇文章发表在《Cell Reports》来自牛津大学等团队核心工作是用空间转录组、单细胞和单核转录组重建人类肌腱从胚胎到成年的细胞图谱并比较断裂后成年肌腱是否会重新进入发育样状态。今天我们就来拆解一下这篇生信文章Cellular and molecular landscapes of human tendons across the lifespan revealed by spatial and single-cell transcriptomics研究概述这项研究关注一个很具体的问题人类肌腱在发育过程中如何建立细胞谱系而这种发育程序为什么在成年损伤后不能被完整再现。作者整合了胚胎、胎儿和成年肌腱的单细胞、单核与空间转录组数据重点比较成纤维细胞、免疫细胞、血管细胞和神经相关细胞在不同年龄阶段的变化。结果显示肌腱中的非成纤维细胞群体跨生命周期相对稳定而成纤维细胞发生了最显著的状态转换成年断裂肌腱虽然出现部分发育程序回启但并没有恢复到胎儿期那种接近再生的转录状态。实验设计作者对 12-20 pcw 的人胎儿跟腱和股四头肌腱进行了单核 RNA 测序共获得 91,859 个细胞核同时对同一 20 pcw 供体的跟腱和股四头肌腱进行了 10x Visium 空间转录组测序。为了追溯发育起点研究又整合了 6-9 pcw 人胚下肢公开 scRNA-seq 与空间转录组数据用随机森林从全肢体数据中识别肌腱相关细胞再结合 RNA velocity、Palantir、CellRank、scGen、moscot 和 SCENIC 重建谱系轨迹与调控网络。成年部分则纳入 25-76 岁健康和断裂肌腱的 snRNA-seq 数据用于跨阶段整合和损伤对比分析。研究结果图 1胎儿肌腱的 snRNA-seq 与空间转录组联合分析显示12-20 pcw 期间细胞组成发生重排肌腱主体逐步由更偏向建造型的成纤维细胞群占据。图 2胎儿期成纤维细胞可分为多个空间分区明确的亚群包括主束区的 ABI3BP GAS2、KERA TNMD、CHSY3 MECOM 亚群以及疏松结缔组织和肌腱-肌肉连接区相关亚群。图 3血管、淋巴管、免疫、神经相关细胞和平滑肌/肌细胞与不同成纤维细胞亚群共同构成胎儿肌腱微环境其中巨噬细胞和部分免疫细胞主要分布在疏松结缔组织区域。图 4胚胎期分析提示 MSC precursors 可分化出 MKX 相关腱样谱系、COL6A6 相关疏松结缔组织谱系以及 RUNX2/SOX5 相关软骨谱系肌腱细胞命运在早期即开始分支。图 5胚胎与胎儿数据整合后显示不同祖细胞与胎儿期成纤维细胞亚群之间存在连续但不完全重叠的发育关系说明谱系延续与分化发散同时存在。图 6与胎儿期相比成年非成纤维细胞总体保守而成年成纤维细胞明显偏离发育阶段断裂肌腱中的 COL3A1hi 成纤维细胞仅表现出部分胎儿样特征。图 7跨阶段通路和调控网络分析表明成年成纤维细胞从高代谢、高基质合成状态转向稳态维持状态断裂肌腱则激活部分与 EMT、创伤修复相关的调控程序。数据分析生信分析文中涉及的组学技术主要包括单细胞转录组、单核转录组和空间转录组并对三类数据进行了跨阶段联合分析。1. 单细胞转录组作者使用公开的人胚胎下肢 scRNA-seq 数据作为早期发育阶段输入。原始数据经与胎儿样本一致的流程重新比对和预处理先用 scVI 处理批次效应再基于空间转录组中人工标注的肌腱区域训练随机森林分类器从全肢体细胞中筛出 4,318 个肌腱相关细胞。之后进行高变基因筛选、细胞周期回归、Leiden 聚类和 Wilcoxon 秩和检验找 marker进一步结合 RNA velocity、Palantir 和 CellRank 推断发育方向与终末命运。2. 单核转录组胎儿肌腱 snRNA-seq 原始数据先用 CellRanger 比对至 GRCh38-2020-A随后用 CellBender 去除环境 RNA并通过 velocyto 生成 spliced/unspliced 矩阵质控包括低表达基因过滤、MAD 阈值去低质量细胞、线粒体比例过滤和 scDblFinder 去双细胞。数据标准化采用 log1pPF随后用 scVI/scANVI 做整合与注释Leiden 聚类后以 Wilcoxon 秩和检验、CellMESH 和 gProfiler 辅助注释。成年 snRNA-seq 则使用scflow、kallisto|bustools、SoupX、decontX、Harmony 和 Seurat 处理再与胚胎和胎儿数据做统一整合。3. 空间转录组胎儿空间转录组采用 10x Visium对 20 pcw 的跟腱和股四头肌腱切片测序使用 SpaceRanger 比对至 GRCh38。后续在 Scanpy 和 Squidpy 中完成质控、归一化、高变基因筛选、PCA、UMAP 和 Leiden 聚类再用 Wilcoxon 秩和检验识别空间 cluster 特征。作者进一步用 cell2location 将胎儿 snRNA-seq 注释映射回空间坐标并通过 NMF 对去卷积后的丰度矩阵做无监督分解提取共定位的细胞空间模块。4. 多组学联合分析跨胚胎和胎儿阶段作者使用 scGen 与 moscot 连接不同技术平台的数据再结合 Palantir、CellRank 和 PAGA 重建连续谱系。跨胚胎、胎儿和成年阶段作者使用 scVI/scANVI 进行统一嵌入并用 CellHint 做细胞类型对齐。通路层面采用 gProfiler g:GOSt 做 GO:BP 富集调控层面使用 pySCENIC 的 GRNBoost2、ctx 和 aucell 识别 regulon比较不同年龄和损伤状态下的转录调控程序。统计分析细胞类型比例变化使用 scCODA 建模并以 FDR 控制显著性。差异表达分析中聚类 marker 主要使用 Wilcoxon 秩和检验跨时间或跨阶段的 pseudobulk 差异分析使用 DESeq2 的 LRT 和 Wald 检验。组织学定量中正态近似变量采用 ANOVA 加 Tukey 检验非正态变量采用 Kruskal-Wallis 检验加 Dunn-Bonferroni 校正。通路富集使用 Benjamini-Hochberg FDR 校正文中披露了主要统计框架但并非所有图形都给出完整参数细节。总结研究意义这项工作回答了人类肌腱在发育、成熟和损伤后细胞状态如何迁移的问题也把过去比较分散的“腱细胞异质性”概念放回到了发育时间轴上。文章最重要的补充在于它把肌腱成纤维细胞分成了具有空间定位和发育来源差异的多个亚群并提出 SCX/MKX 相关谱系与 COL6A6 相关谱系分别对应主束和疏松结缔组织等不同方向的分化程序。对临床而言这意味着成年肌腱修复不良可能不只是“再生能力弱”而是缺少能够完整回到胎儿样再生程序的细胞状态和调控网络因此后续干预或许需要针对特定成纤维细胞亚群及其调控轴而不是笼统增强纤维化修复。文章复现原始数据和代码在文中有明确提供。原始数据• 胎儿肌腱单核 RNA-seqGEOGSE317327• 胎儿肌腱空间转录组Zenodo10.5281/zenodo.18403632• 人胚胎整肢单细胞 RNA-seqArrayExpressE-MTAB-8813• 人胚胎整肢空间转录组ArrayExpressE-MTAB-10367代码• GitHub:https://github.com/AlinaKurjan/DPhilCode• Zenodo:http://www.doi.org/10.5281/zenodo.18379150中国银河生信云平台精品课程中国银河生信云平台UseGalaxy.cn致力于生信平权。海量云端算力、8000生信工具结合AI推动生信进入3.0时代数据分析从本地到云端从手工到 AI。加入交流群免费领取学习资料。左手代码右手云平台。特色生信培训助你丝滑发顶刊单细胞数据分析培训班Python/Galaxy可选不怕学不会转录组数据分析实战Galaxy| 直播回放咨询小助手usegalaxy

更多文章