发布说明

关于各个版本新特性的一些说明

0.5 版本新特性

  • ParametricUMAP 使用神经网络学习嵌入。

  • AlignedUMAP 可以利用数据集之间的关系对多个嵌入进行对齐。

  • DensMAP 可以在嵌入中保留局部密度信息。

  • UMAP 现在依赖于 PyNNDescent,因此性能更快,并行度更高。

  • UMAP 现在支持 update 方法来添加新数据并重新训练。

  • 各种性能改进和错误修复。

  • 额外的绘图支持,包括在交互式图中进行文本搜索。

  • 支持邻居图中的“最大距离”。

0.4 版本新特性

  • 逆变换方法。生成原始空间中对应于嵌入空间中点的点。(感谢 Joseph Courtney)

  • 不同的嵌入空间。支持嵌入到欧几里得空间之外的各种不同空间。(感谢 Joseph Courtney)

  • 新度量,包括用于稀疏计数数据的 Hellinger 距离。

  • 新的离散/标签度量,包括层级类别、计数、序数数据和字符串编辑距离。

  • 支持邻居搜索和布局优化的并行计算。(感谢 Tom White)

  • 支持处理重复数据样本的替代方法。(感谢 John Healy)

  • 用于快速轻松绘图的新绘图方法。

  • 初步支持数据框嵌入——仍处于实验阶段,但值得尝试。

  • 支持处理稀疏数据的转换方法。

  • 未设置随机种子时的多线程支持。

0.3 版本新特性

  • 监督和半监督降维。支持使用标签或部分标签进行降维。

  • 转换方法。支持将新的未见点添加到现有嵌入中。

  • 性能改进。

0.2 版本新特性

  • 一种新的布局算法,能够(更)正确地处理大型数据集。

  • 性能改进。