在生物医学领域,现有的空间转录组降维聚类方法,比如主成分分析(PCA)和非负矩阵分解(NMF),多数是基于单细胞数据开发的,因此不一定能完全适用于空间转录组数据。这些常用的降维聚类方法通常忽略了空间转录组特有的组织空间定位信息,而仅仅依赖于表达谱进行聚类。然而,在生物组织中,相邻位置通常具有相似的细胞组成和基因表达水平。因此,将空间位置信息纳入降维聚类过程中,更有助于实现符合生物实际状态的空间聚类。
为此,SpatialPCA应运而生,它是一种专为空间转录组降维聚类而设计的工具,采用空间概率PCA(spatial probabilistic PCA)的方法,能够准确模拟组织位置之间的空间相关性结构,并在降维后的数据中保留原始空间数据的邻近性。SpatialPCA将空间位置信息作为附加输入,使用核矩阵来模拟组织位置之间的空间结构,从而生成称为空间主成分的降维主成分,这些主成分结合了空间结构信息。
在研究测试中,研究者以大脑背外侧前额叶皮层(DLPFC)的模拟数据为基础,通过手动分割皮层,确定特定细胞类型的空间位置,并创建了多种不同细胞组成的空间转录组数据。与其他现有的空间聚类方法相比,SpatialPCA在模拟数据测试中展现了更优越的检测性能。
在真实数据测试中,研究团队选用了人类DLPFC的Visium空间转录组数据,对比了多种分析工具,包括SpatialPCA、BayesSpace、SpaGCN等。结果表明,SpatialPCA生成的空间聚类结果最接近实际生物结构,其预测精度和空间域结构连续性在多种工具中都是最高的。
为了检验SpatialPCA的技术适用性,研究者还在其他技术(如Slide-seq)获取的小鼠脑组织空间转录组数据上进行测试,结果同样表明SpatialPCA的聚类结果与实际情况更加贴合。此外,通过HER2阳性乳腺肿瘤样本的测试,也证实了SpatialPCA在聚类精确性和与实际情况的贴合度上具有优势。
由于SpatialPCA计算出的空间主成分同时包含空间信息及基因表达信息,因此可依此运用一些单细胞转录组分析工具进行后续分析。例如,利用Slingshot进行肿瘤组织的轨迹推断,发现了肿瘤区域向周围组织及正常组织的轨迹,这进一步强调了相关基因在肿瘤进展和转移中的重要性。
基于SpatialPCA的建模框架,研究者还可以在新的空间位置推断基因表达水平,同时通过低分辨率样本数据构建高分辨率空间图谱。在肿瘤组织的测试中,SpatialPCA所构建的高分辨率空间图谱展现了细致平滑的特征,其聚类结果精确定位了不同组织区域的边界,显示出SpatialPCA在精准分析生物组织结构方面的独特优势。
总的来说,SpatialPCA是一款适用于空间转录组数据降维聚类的分析工具。如果您在生物医学领域的空间数据分析中遇到了分群聚类效果不理想的问题,不妨尝试人生就是博-尊龙凯时的SpatialPCA,或许会带来意想不到的好效果!