发布说明
关于各个版本新特性的一些说明
0.5 版本新特性
ParametricUMAP 使用神经网络学习嵌入。
AlignedUMAP 可以利用数据集之间的关系对多个嵌入进行对齐。
DensMAP 可以在嵌入中保留局部密度信息。
UMAP 现在依赖于 PyNNDescent,因此性能更快,并行度更高。
UMAP 现在支持
update
方法来添加新数据并重新训练。各种性能改进和错误修复。
额外的绘图支持,包括在交互式图中进行文本搜索。
支持邻居图中的“最大距离”。
0.4 版本新特性
逆变换方法。生成原始空间中对应于嵌入空间中点的点。(感谢 Joseph Courtney)
不同的嵌入空间。支持嵌入到欧几里得空间之外的各种不同空间。(感谢 Joseph Courtney)
新度量,包括用于稀疏计数数据的 Hellinger 距离。
新的离散/标签度量,包括层级类别、计数、序数数据和字符串编辑距离。
支持邻居搜索和布局优化的并行计算。(感谢 Tom White)
支持处理重复数据样本的替代方法。(感谢 John Healy)
用于快速轻松绘图的新绘图方法。
初步支持数据框嵌入——仍处于实验阶段,但值得尝试。
支持处理稀疏数据的转换方法。
未设置随机种子时的多线程支持。
0.3 版本新特性
监督和半监督降维。支持使用标签或部分标签进行降维。
转换方法。支持将新的未见点添加到现有嵌入中。
性能改进。
0.2 版本新特性
一种新的布局算法,能够(更)正确地处理大型数据集。
性能改进。