_images/logo_large.png

UMAP:均匀流形逼近与投影用于降维

均匀流形逼近与投影 (UMAP) 是一种降维技术,可以用于可视化,类似于 t-SNE,也可用于一般的非线性降维。该算法基于对数据的三个假设

  1. 数据均匀分布在黎曼流形上;

  2. 黎曼度量在局部是常数(或可以近似为常数);

  3. 流形是局部连通的。

基于这些假设,可以使用模糊拓扑结构对流形进行建模。通过寻找数据在低维空间中的投影,使其具有最接近的等效模糊拓扑结构,来找到嵌入。

关于底层数学的详细信息可以在我们的 ArXiv 论文中找到

McInnes, L, Healy, J, UMAP:均匀流形逼近与投影用于降维, ArXiv e-prints 1802.03426, 2018

您可以在github 上找到该软件。

安装

通过 conda-forge 团队的出色工作进行 Conda 安装

conda install -c conda-forge umap-learn

conda-forge 软件包可用于 linux、OS X 和 Windows 64 位系统。

PyPI 安装,前提是您已安装 numba、sklearn 及其所有依赖项(numpy 和 scipy)

pip install umap-learn

用户指南 / 教程

索引和表格