基于PyTorch重写sklearn,《现代大数据算法》

  • 时间:
  • 浏览:1

项目作者Daniel Han-Chen,毕业于澳大利亚新南威尔士大学,专注于AI、NLP和无监督机器学习的推荐和匹配算法。

HyperLearn是两个基于PyTorch重写的机器学习工具包Scikit Learn,它的一点模块带宽调快、需用内存更少,带宽提高了一倍。

基于HyperLearn,作者展示了如保让一点机器学习算法调快、更高效。

其中一点很酷的算法:

 ●  将会新的并行算法,非负矩阵分解的拟合时间相比sklearn减少60 % ●  Euclidean算法/余弦类似 度算法加快40% ●  LSMR迭代最小

专为大数据而设计,HyperLearn可不需用使用60 %以下的内存,并在一点模块上运行带宽提高60 %以上。将支持GPU,而且 所有模块都在并行化的。