学术论文
UMAP 已被广泛应用于来自不同领域的各种科学出版物中。在此,我们将重点介绍其中一小部分论文,它们展示了 UMAP 可以用于的分析深度和主题广度。这些领域涵盖了生物学、机器学习,甚至社会科学。
哺乳动物器官发生的单细胞转录组景观
从单细胞视角详细研究了小鼠胚胎的发育。UMAP 是 Monocle3 软件套件的核心组成部分,用于识别细胞类型和发育轨迹。这是发表在《自然》杂志上的一篇重要论文,展示了 UMAP 在大规模科学研究中的强大能力。

秀丽隐杆线虫胚胎发生的谱系解析分子图谱(单细胞分辨率)
这篇论文仍然属于单细胞生物学领域,研究了秀丽隐杆线虫(一种蛔虫)的发育景观。UMAP 被用于详细分析细胞的发育轨迹,从全局尺度观察,然后深入探究单个器官。结果是一系列令人印象深刻的 UMAP 可视化,揭示了细胞发育中越来越精细的结构。

使用激活图集探索神经网络
理解现代卷积神经网络的图像处理能力(及其不足!)是一项挑战。Distill 发表的这篇交互式论文旨在通过查看整个网络中的激活情况,提供一种“窥探黑箱”的方法。通过使用 UMAP 将这些高维数据映射到二维,作者可以构建一个“图集”,展示网络如何感知不同的图像。

TimeCluster:应用于时间数据的降维,用于视觉分析
这是一种有趣的时间序列分析方法,针对时间序列具有重复模式(但不一定是周期性)的情况。该方法涉及对时间序列的滑动窗口块进行降维和聚类。结果是一个映射图,其中重复的行为被暴露为循环结构。这对于对时间序列内的相似块进行聚类或查找异常值都很有用。

使用 UMAP 进行单细胞数据可视化降维
这是一篇关于将 UMAP 应用于单细胞生物学数据的早期论文。它研究了基因表达数据和流式细胞术数据,并在性能和结果质量方面将 UMAP 与 t-SNE 进行了比较。这是使用 UMAP 处理单细胞生物学数据的良好入门。

揭示大型队列中的多尺度群体结构
一篇研究群体遗传学的论文,使用 UMAP 作为可视化群体结构的方法。这产生了一些引人入胜的可视化结果,并且是采用这种可视化方法的首批论文之一。它还包括一些新颖的可视化技术,例如将 UMAP 投影到 3D,并将其作为数据点的 RGB 颜色规范,从而可以在基于样本来源地的地理地图上可视化 UMAP 结构。

理解萨里郡儿童的脆弱性
这是 UMAP 在社会学研究中的应用示例——本例研究了英属哥伦比亚省萨里郡的儿童。UMAP 在此被用作辅助一般数据分析的工具,并证明对所处理的任务有效。
