欢迎访问哈尔滨工业大学新闻网!今天是
当前位置:首页  最新发布

最新发布

哈工大靳水林教授团队提出单细胞测序数据整合新模型

2025年06月06日 新闻网 浏览次数:13

哈工大全媒体(阚思邈 周阳/文 周阳/图)近日,我校数学学院靳水林教授团队在单细胞测序数据建模与分析领域取得重要进展,解决了多生物来源数据整合建模的关键问题。研究成果以《多生物来源单细胞数据整合》(Integrating single-cell data with biological variables)为题发表在《美国国家科学院院刊》(Proceedings of the National Academy of Sciences of the United States of America: PNAS)上。

单细胞数据整合旨在通过消除数据中的批次效应,以融合不同实验批次的单细胞测序数据,对胚胎发育、组织功能及疾病机制等研究具有重要意义。然而,对于包含多生物来源的单细胞测序数据,其批次效应与生物效应极易混淆,给数据整合带来了巨大挑战。

针对上述问题,靳水林教授团队提出了一种多源生物变异的数据整合新模型——组中心化主成分分析 (group-centered Principal Component Analysis,简称gcPCA)。这一模型首次定义了多生物来源数据的组技术变异,利用生物来源的总体变异和批次内变异估计批次效应,构建了组技术变异最小化的优化模型,进而在保留多源生物变异条件下对数据进行了整合。组中心化主成分分析(gcPCA)模型在模拟和真实数据整合方面取得了优良的效果。该研究为多生物来源单细胞测序数据的有效整合提供了高效、可靠的数学模型。

 

组中心化主成分分析(gcPCA)模型

哈工大为论文唯一完成单位。靳水林教授为论文唯一通讯作者,团队博士研究生周阳为论文第一作者。该研究获得了国家自然科学基金面上项目、国家自然科学基金青年学生基础研究项目(博士研究生)、黑龙江省杰出青年基金等项目的支持。

论文链接:https://doi.org/10.1073/pnas.2416516122

责任编辑:商艳凯

审核:宋玲 李守斌

Baidu
map