
UMAP:均匀流形逼近与投影用于降维
均匀流形逼近与投影 (UMAP) 是一种降维技术,可以用于可视化,类似于 t-SNE,也可用于一般的非线性降维。该算法基于对数据的三个假设
数据均匀分布在黎曼流形上;
黎曼度量在局部是常数(或可以近似为常数);
流形是局部连通的。
基于这些假设,可以使用模糊拓扑结构对流形进行建模。通过寻找数据在低维空间中的投影,使其具有最接近的等效模糊拓扑结构,来找到嵌入。
关于底层数学的详细信息可以在我们的 ArXiv 论文中找到
McInnes, L, Healy, J, UMAP:均匀流形逼近与投影用于降维, ArXiv e-prints 1802.03426, 2018
您可以在github 上找到该软件。
安装
通过 conda-forge 团队的出色工作进行 Conda 安装
conda install -c conda-forge umap-learn
conda-forge 软件包可用于 linux、OS X 和 Windows 64 位系统。
PyPI 安装,前提是您已安装 numba、sklearn 及其所有依赖项(numpy 和 scipy)
pip install umap-learn
用户指南 / 教程
UMAP 背景知识
UMAP 使用示例
API 参考
- UMAP API 指南
- UMAP
- ParametricUMAP
- 常用函数
compute_membership_strengths()
discrete_metric_simplicial_set_intersection()
fast_intersection()
fast_metric_intersection()
find_ab_params()
fuzzy_simplicial_set()
init_graph_transform()
init_transform()
make_epochs_per_sample()
nearest_neighbors()
raise_disconnected_warning()
reset_local_connectivity()
simplicial_set_embedding()
smooth_knn_dist()