产品概述

DeepNEX是联想自主研发的一款深度学习私有云平台。为从事深度学习研究的科研人员提供“全面、极简化、个性化”的使用环境。帮助用户解决深度学习开发和训练过程中计算资源短缺、集群环境配置复杂、资源管理缺失等问题,使其专注于自身的科研业务,更加方便、高效地进行深度学习相关的研发。

产品架构
产品特性
  • 简单易用

    简约的用户使用界面,为用户提供一个简单易用的开发环境,最大化提升用户使用体验

  • 清晰可视

    提供统一的图形界面来简化深度学习的操作,用户在一个界面下即可进行数据管理、程序调试与作业提交、模型优化与训练、模型评估等日常深度学习研究工作

  • 稳定高效

    个性化深度学习环境秒级部署与启动,经联想内部用户充分测试并经过实践检验,确保平台在各种条件下的稳定运行

  • 安全性高

    产品在逻辑上对不同用户的使用环境进行了彻底隔离,保证用户隐私和数据安全

产品功能
  • 丰富的深度学习框架

    融合Tensorflow,Pytorch,Keras ,MxNet,Caffe等多个主流深度学习框架,并支持自定义扩展,满足不同用户的使用需求和习惯。

  • 易用的工具集

    提供基于Jupyter的Web和console界面,集成Python开发环境、文件管理、文本编辑、Shell终端等功能,为用户提供一个简单易用的开发环境。

  • 分布式计算作业管理

    支持多机多卡运行作业,根据作业信息自动创建虚机,结束后资源自动回收。提供作业提交、排队、挂起、取消、状态查看等功能。

  • 灵活的GPU资源调度

    支持独享、共享等多种GPU资源调度策略,满足用户在不同场景的需求。

  • 友好的可视化界面

    集成并优化了Tensorboard可视化组件,为用户提供深度学习可视化工具。

  • 直观的状态监控

    用户实时查看系统资源使用状态,包括CPU、GPU、内存和存储空间的使用情况。

  • 完善的用户管理

    产品支持管理员通过web界面对用户/组进行管理,包括集群用户/用户组的创建、显示、修改和删除以及用户可使用资源的授权与限制。

  • 统一的镜像管理

    支持管理员对镜像进行管理及维护。包括公共镜像的创建、删除及配置,对用户自建镜像进行发布审批与维护等功能。

  • 开放的计费功能

    产品支持采集各个用户资源使用情况,包括GPU、CPU、内存资源及存储资源的使用量。并提供接口供外部系统获取上述资源使用数据,客户可利用接口定制计费功能。

应用场景&典型案例

典型案例:

某高校深度学习教科平台

需求背景

  • 科研经费有限,无法配备足够的GPU工作站集群
  • 希望低成本建设一套可共享、多租户的可调度GPU的平台
  • 对深度学习有研究渴望,希望找合作共建实验室

客户收益

  • 有限预算下实现更高资源利用率,支持深度学习实验室数十人共享使用
  • 将部分历史闲置的图站改造成深度学习的工位,也可远程供调用,极大地节省了成本
  • 封装了多种深度学习框架和丰富的demo应用案例,全面支持学生的课程学习与实验实训
  • 与客户战略合作,成立联合深度学习实验室。共享资源,联想数据智能科学家担任客座讲师

某超算中心

需求背景

  • 某超算中心为世界领先的超级计算中心,承担支撑国家高新产业和现代服务业,数字城市建设以及多个科研领域的任务。目前该超算中心被应用于城市抗震减灾、基因组学研究与应用、药物设计、生物分子动力学模拟、数字媒体和动漫渲染、舆情监控、应急智能决策等方面。该超算中心急需提供深度学习所需的GPU计算资源。

客户收益

  • 为用户提供了多种主流深度学习框架,支持多用户场景
  • 兼容该超算中心的某云和大数据平台
  • 开箱即用,免安装部署;丰富的监控信息,运维简单
  • 平台支持线性扩展,满足高负载需求,可根据实际需求添加新的节点
  • 为客户提供软硬一体维保服务,高效便捷

忘记密码?