_images/logo_large.png

UMAP:均匀流形逼近与投影降维

均匀流形逼近与投影 (UMAP) 是一种降维技术,它与 t-SNE 类似,可用于可视化,也可用于一般的非线性降维。该算法基于对数据的三个假设:

  1. 数据均匀分布在黎曼流形上;

  2. 黎曼度量是局部常数(或可以近似为常数);

  3. 流形是局部连通的。

基于这些假设,可以使用模糊拓扑结构对流形进行建模。通过寻找数据的低维投影,使其具有最接近的等效模糊拓扑结构来找到嵌入。

相关数学细节可在我们在 ArXiv 上的论文中找到

McInnes, L, Healy, J, UMAP:均匀流形逼近与投影降维, ArXiv e-prints 1802.03426, 2018

您可以在github 上找到该软件。

安装

Conda 安装,通过 conda-forge 团队的杰出工作

conda install -c conda-forge umap-learn

conda-forge 包可用于 linux、OS X 和 Windows 64 位系统。

PyPI 安装,假设您已安装 numba、sklearn 及其所有依赖项(numpy 和 scipy)

pip install umap-learn

用户指南 / 教程

索引和表格