贾扬清撰文详解Caffe2从强大的新能力

选自NvidiaBlog作者:AaronMarkham、贾扬清机器之心编译

昨天,Facebook推出了Caffe2,一个兼具表现力、速度和模块性的开源深度学习框架。它沿袭了大量的Caffe设计,可解决多年来在Caffe的使用和部署之中发现的瓶颈问题。最终,Caffe2打开了算法实验和新产品的大门。通过在内部用于各种深度学习和增强现实任务,Caffe2已经在Facebook对于规模和性能的需求上得到了锻造。同时,它为移动端应用提供了令人印象深刻的新功能,例如高级相机和即时通讯功能。英伟达作为Caffe2的开发合作者,计划对Caffe2的深度学习应用推出一系列博客文章。本文即是该系列博文的第一篇,将介绍Caffe2的深度学习基础知识,证明其灵活性和速度;本文还将介绍为什么你想要使用Caffe2、是什么使Caffe2区别于Caffe,最后还会通过一个预训练的目标分类模型给出一个Caffe2使用案例。

一次编码,任意运行

在保有扩展性和高性能的同时,Caffe2也强调了便携性。「便携性」通常使人想起overhead——它如何在诸多不同的平台上工作?overhead如何影响扩展的能力?Caffe2当然已把这些考虑在内,其从一开始就以性能、扩展、移动端部署作为主要设计目标。Caffe2的核心C++库能提供速度和便携性,而其Python和C++API使你可以轻松地在Linux、Windows、iOS、Android甚至RaspberryPi和NVIDIATegra上进行原型设计、训练和部署。也许你会问:物联网呢?Caffe2将适用于大量设备。尽管你并不想在物联网设备上训练网络,但你可以在其上面部署训练好的模型。

当GPU可用时,Caffe2也不会错失这个良机。在Facebook和英伟达的合作下,Caffe2已经可以充分利用英伟达GPU深度学习平台。Caffe2可使用最新的英伟达深度学习SDK库——cuDNN、cuBLAS和NCCL——来实现高性能、多GPU加速训练和推理。

绝大多数内置函数都可根据运行状态在CPU模式和GPU模式之间无缝切换。这意味着无需额外编程即可享用深度学习超级加速的便利。这引出了Caffe2激动人心的另一个方面:多GPU和多主机处理。Caffe2使并行化网络训练变得简单,现在实验和扩展对你而言也非常简单。

最近的ImageNet训练基准使用了64块最新的英伟达GPU和ResNet-50神经网络架构。Facebook工程师实现的Caffe2的data_parallel_model(


转载请注明:http://www.aierlanlan.com/cyrz/3030.html

  • 上一篇文章:
  •   
  • 下一篇文章: 没有了