发布说明
关于各个版本新特性的一些说明
0.5 版本新特性
ParametricUMAP 使用神经网络学习嵌入。
AlignedUMAP 可以利用数据集之间的关系对多个嵌入进行对齐。
DensMAP 可以在嵌入中保留局部密度信息。
UMAP 现在依赖于 PyNNDescent,因此性能更快,并行度更高。
UMAP 现在支持
update方法来添加新数据并重新训练。各种性能改进和错误修复。
额外的绘图支持,包括在交互式图中进行文本搜索。
支持邻居图中的“最大距离”。
0.4 版本新特性
逆变换方法。生成原始空间中对应于嵌入空间中点的点。(感谢 Joseph Courtney)
不同的嵌入空间。支持嵌入到欧几里得空间之外的各种不同空间。(感谢 Joseph Courtney)
新度量,包括用于稀疏计数数据的 Hellinger 距离。
新的离散/标签度量,包括层级类别、计数、序数数据和字符串编辑距离。
支持邻居搜索和布局优化的并行计算。(感谢 Tom White)
支持处理重复数据样本的替代方法。(感谢 John Healy)
用于快速轻松绘图的新绘图方法。
初步支持数据框嵌入——仍处于实验阶段,但值得尝试。
支持处理稀疏数据的转换方法。
未设置随机种子时的多线程支持。
0.3 版本新特性
监督和半监督降维。支持使用标签或部分标签进行降维。
转换方法。支持将新的未见点添加到现有嵌入中。
性能改进。
0.2 版本新特性
一种新的布局算法,能够(更)正确地处理大型数据集。
性能改进。