Paddle v0.11.1a2 发布了,PaddlePaddle (PArallel Distributed Deep LEarning 并行分布式深度学习)是百度研发的深度学习平台,具有易用,高效,灵活和可伸缩等特点,为百度内部多项产品提供深度学习算法支持。 本次更新主要带来了性能增益和存储优化,更新内容如下: 配置和环境: model: SE-ResNet-150 Input: 3 x 224 x 224 batch_size: 25 CentOS 6.3, Tesla P40, single card. 优化前后对比 优化前 SpeedMemory Fluid(before)1.95 sec/iter18341 MB PyTorch1.154 sec/iter13359 MB Fluid/PyTorch1.68981.3729 速度优化后 SpeedMemory Fluid(opti_speed)1.45 sec/iter17222 MB PyTorch1.154 sec/iter13359 MB Fluid/PyTorch1.25651.2892 存储优化后 SpeedMemory Fluid(opti_mem)1.93 sec/iter14388 MB PyTorch1.154 sec/iter13359 MB Fluid/PyTorch1.67241.0770 整体性能提升 issue 详情: #8990 训练时删除 GPU 内存 [WIP] 来自 C ++ 的 Feed 数据 添加基本的 RecordIO API Polish C++ Reader operators 添加 DoubleBuffer Reader 发布主页 下载地址: Source code (zip) Source code (tar.gz) Paddle v0.11.1a2 发布,百度深度学习开源平台下载地址