
UMAP:均匀流形逼近与投影降维
均匀流形逼近与投影 (UMAP) 是一种降维技术,它与 t-SNE 类似,可用于可视化,也可用于一般的非线性降维。该算法基于对数据的三个假设:
数据均匀分布在黎曼流形上;
黎曼度量是局部常数(或可以近似为常数);
流形是局部连通的。
基于这些假设,可以使用模糊拓扑结构对流形进行建模。通过寻找数据的低维投影,使其具有最接近的等效模糊拓扑结构来找到嵌入。
相关数学细节可在我们在 ArXiv 上的论文中找到
McInnes, L, Healy, J, UMAP:均匀流形逼近与投影降维, ArXiv e-prints 1802.03426, 2018
您可以在github 上找到该软件。
安装
Conda 安装,通过 conda-forge 团队的杰出工作
conda install -c conda-forge umap-learn
conda-forge 包可用于 linux、OS X 和 Windows 64 位系统。
PyPI 安装,假设您已安装 numba、sklearn 及其所有依赖项(numpy 和 scipy)
pip install umap-learn
用户指南 / 教程
UMAP 背景知识
UMAP 使用示例
API 参考
- UMAP API 指南
- UMAP
- ParametricUMAP
- 有用函数
compute_membership_strengths()
discrete_metric_simplicial_set_intersection()
fast_intersection()
fast_metric_intersection()
find_ab_params()
fuzzy_simplicial_set()
init_graph_transform()
init_transform()
make_epochs_per_sample()
nearest_neighbors()
raise_disconnected_warning()
reset_local_connectivity()
simplicial_set_embedding()
smooth_knn_dist()