首页 - 关于我们 - 新闻活动 - 数据驱动智能制造:让AI在云上起舞

数据驱动智能制造:让AI在云上起舞

2020-12-10新闻

随着全球制造业数字化、网络化、智能化的步伐不断加快,工业大数据逐渐成为制造业与新一代信息技术深度融合的落脚点之一,大数据技术与企业应用的融合是制造企业提升效率、降低成本和提高质量的重要手段。


为了帮助更多的企业了解大数据技术及其在企业的应用融合,e-works智能制造学院于12月3日下午14:00-16:30举办了以“大数据工业应用”为主题的线上研讨会。

在本次研讨会中,IBM带来了“数据驱动智能制造:让AI在云上飞舞”的专题分享。

其中,IBM系统部大中华区存储总经理吴磊解析了数字化转型“第二篇章”给存储带来的挑战,以及IBM存储解决方案如何简化企业上云之旅,提高数据效率,加速AI交付,赋能决策,同时满足安全合规要求,保证业务的连续性;

IBM存储和软件定义基础架构资深销售顾问将军华、IBM系统部技术经理刘鑫以及IBM实验室技术经理虞东海则具体案例出发,以人工智能与某IT独角兽企业为例,分别从项目背景、项目方案设计及项目落地实施等方面具体介绍了IBM存储解决方案如何帮助该企业实现存储架构转型,帮助其应对混合多云及AI环境下的数据存储与管理挑战,解决数据竖井、分布式数据管理等难题,赋能智能制造,让AI在云上起舞。

以下是精华内容分享。

1、数字化转型“第二篇章”给存储带来的挑战


IBM系统部大中华区存储总经理吴磊指出,如今越来越来越多的企业已经开始注重简单迁移与创新,而无论是从传统的数据中心完成数据的迁移,还是对混合多云环境下的数据进行管理,企业都需确保数据的安全、业务的无缝连接与不间断,以及传统业务的现代化改造,这对数据的一致性及业务逻辑的一致性都提出了非常高的要求,IBM将这种转型称之为数字化转型“第二篇章”。IBM认为,在数字化转型“第二篇章”,企业将面临三件重要的事情,即完成云之旅、构建更智能的企业和确保网络安全与弹性,这同时也对存储提出了新的挑战。
image.png
图1 数字化转型第二篇章对存储的挑战

首先,如何降低存储成本。随着5G、4K、8K大数据的爆炸性增长,非结构数据都是以PB、EB甚至ZB的速度增长,在这种环境下对企业对客户成本的增加非常巨大。其次,如何打破数据孤岛。由于结构化数据存放于传统的生产系统中,非结构化数据存储存放于新的对象存储甚至混合多云环境下,如何打通传统的生产系统和混合多云环境,打破各种不同的信息孤岛,对企业而言非常重要。

此外,在数字化转型“第二篇章”,企业还面临着如何提升数据读写速度,如何实现不同存储位置的快速读取,如何针对结构化、非结构化数据,经常使用的热数据、以及温数据和长期保管不使用的冷数据进行分门别类存放等诸多挑战。

2、IBM存储,化繁为简


针对数字化转型“第二篇章”对存储带来的各种挑战,IBM也推出了存储解决方案以及屡获殊荣的存储产品,涵盖面向混合多云的存储、面向AI的存储和,以及网络弹性与现代化保护。无论是针对传统的块存储、对象存储、文件存储,还是针对AI大数据,IBM都提供了非常丰富的软件和硬件的产品,并为企业提供充分自由的选择。
image.png
图2 IBM屡获殊荣的存储产品组合

而对于混合多云环境下,对企业存储数据与存储平台提出的要求,吴磊则指出,企业存储数据与存储平台应具备敏捷性、过渡性、云环境、数据压缩与除重、加密等特性。
image.png
图3 混合多云环境下存储平台需具备的能力

此外,他还通过分享IBM携手民泰银行进行IT架构创新,以及IBM携手百度智能云应对海量冷数据管理这2个具体案例,指出IBM能够化繁为简,通过简单的IBM存储,让数据变得不简单,让数据发挥出最大的价值。而且,无论是传统的集中式数据中心的存储解决方案,还是混合多云的纯分布式存储解决方案,IBM都可为企业带来安全、可靠、可扩展且合规的数据存储平台,并帮助其提高数据存储性能,降低运维时间与运维成本。

3、IBM存储助力某IT独角兽落地智能驾驶


某IT独角兽成立于2015年,创立伊始即率先提出聚焦边缘 AI 芯片方向,围绕人工智能、边缘计算芯片在物联网领域的应用,提供智能驾驶与智能物联网解决方案,如今已发展成为人工智能与物联网领域的独角兽企业。然而,随着该企业的规模越来越大,业务越来越多,由此也产生了海量的数据。一方面,该企业需要将这些海量数据保存起来,以作为提升自身产品竞争力的核心要素;另一方面,由于该企业对数据的需求并不是在成立第一天就能达到如今的规模,随着数据量越来越大,这些海量数据如何存储和管理,如何打破数据竖井、提升存储性能、降低存储成本,也成为该企业在高速发展过程中的面临的问题与挑战。

这是因为,在过去的发展过程中,该企业都是按照项目的方式来部署数据结构与存储平台,但数据平台间缺乏流转和打通,由此形成了一个个数据竖井和信息孤岛。而且,过去该企业都是用开源软件来构建内部的分布式存储平台,随着数据量增长至PB级,该企业也面临着如何在存储平台扩展的同时,也能确保存储性能不下降的问题。此外,该企业也面临着较大的存储成本压力,该企业也迫切需要在更好地管理数据的同时,也降低数据存储的成本。

为此,IBM与该企业保持密切沟通,并不断讨论完善存储解决方案。从IBM与该企业进行沟通交流到方案测试与方案确定,再到该企业下决心采购IBM的存储解决方案,历时约9个月,最终IBM与该企业一起通过不断修改迭代,确定了以Spectrum Scale为核心的数据平台解决方案。

4、IBM存储解决方案三大着眼点, 赢得客户认可


据IBM系统部技术经理刘鑫介绍,IBM所提供的存储解决方案,有三个着眼点,是客户(某IT独角兽)非常认可,也非常看重的。

一是,可构建统一的数据存储与管理平台,并且可保证平台扩展的同时,数据规模及存储性能也能同步扩展。由于数据竖井、信息孤岛问题严重,该客户希望搭建一个统一的数据存储与管理平台,能将所有数据整合在一起,按需调用。同时,该企业也希望这一数据存储与管理平台具备足够的扩展能力,能保证在平台扩展时,数据规模及性能水平也能同步扩展。而IBM Spectrum Scale作为一款源自高性能运算的产品,具有非常强大的扩展能力和性能水平。

IBM在实际客户中已部署了超过数千个节点的Spectrum Scale集群,可提供2 TB以上的并发吞吐能力,规模也可以达到数百甚至上千PB,这款产品给了该客户很大信心,可支撑其未来进一步的数据规模增长,且能保证在规模增长情况下,数据平台也具备足够的性能水平。
image.png
图4 IBM为某IT独角兽提供的存储解决方案
二是,可提供跨磁盘、磁带的全局命名空间以及磁带存储,帮助降低成本。传统的存储扩展方式是,按照数据增长的规模,不断地增加磁盘,提升存储空间,然而实际上约有80%以上的数据都是不常用的冷数据或温数据,这类数据如果用磁盘介质来存储,成本非常高。而IBM则能够提供磁带介质来存储不常用的冷数据或温数据,帮助企业降低成本。但随之而来的问题在于,磁带介质存储的数据需要用专用软件读取和写入,这就使得将磁带数据整合到企业整个数据生命周期的难度或门槛较高。而IBM Spectrum Scale恰恰能解决这些问题。它可提供全局命名空间和统一访问接口,并能将数据从磁盘无缝迁移到磁带,完全无需人工干预。这也就为客户大大减轻了管理压力,通过将磁带介质引入到客户整体的数据存储环境中,可实现从磁盘到磁带的数据的无缝、无感知地迁移,也降低了存储成本。

三是,可在混合多云环境下,实现数据的随需调度,随需取用。该客户尤其依赖于多云架构,这是因为需要购买公有云上的GPU资源用于AI模型训练,但在公有云上进行AI模型训练,除了需要GPU资源之外,数据也是必不可少的,而且数据也需要跟随GPU资源的变化来调用,这就给数据调用带来了难题。在以前,该客户往往是将整个项目的数据拷贝到公有云上,不仅占用大量云上存储空间和带宽,而且也非常耗时。IBM Spectrum Scale则可实现多云之间数据的随需调度。借助IBM SpectrumScale,企业只需调用当前训练任务所需的数据,这样不仅节约云上存储空间和带宽,也能以最快的方式响应AI训练需求,极大地提高了企业运转效率。

5、破解三大技术难点,IBM助AI在云上起舞


在以IBM Spectrum Scale为核心的存储解决方案得到该客户的认可后,如何将整套方案落地和实施,则成为摆在IBM面前的另一道难题。据IBM实验室技术经理虞东海介绍,在项目实施过程中,IBM实施团队主要遇到了三方面的技术难点:一是项目工期紧,对项目管理要求较高;二是涉及技术点多,技术实施难度较大,这又具体包括:虽然每个技术点IBM都有实施经验与案例,但将所有技术点整合应用于该客户的特殊环境中,在全球范围内还属首次,且客户要求边上线边实施;IBM Spectrum Scale有数百个参数可调整,而且功能强大,实现同一个目标有多种实现方式,这使得对数百个参数进行调优,以及确定哪种实现方式最适合客户的运行环境相对比较困难。三是整个项目的技术落地方案,与IBM现有的解决方案相比,还存在一些差距和空白,需要实施团队开发相应工具和软件来完成。

为此,IBM抽调了实验室专家团队来进行项目的具体落地与实施,同时还有IBM在印度、美国等地的技术后援团队为项目实施保驾护航,最终实现了IBM存储解决方案的实施和落地。具体而言,针对项目工期紧的问题,IBM实施团队通过合理分配资源和时间,同时管理多个子任务、并行实施,准时完成了项目的实施落地,也展现出专业的项目管理能力。针对涉及技术点多,技术实施难度较大的问题,IBM实施团队化整为零,采取先从各个技术点分别突破,再从整体上去突破的方式;在项目管理上为了达到客户边上线边实施的要求,尽量做到未雨绸缪,将所有可能需要停机进行的配置都提前分析并完成配置,而对于不确定因素,则采取在实验室搭建相同测试环境的策略,最终通过整合现有经验及谨慎尝试,实现复杂架构的建设首例。

针对Spectrum Scale数百个参数调优的问题,IBM实施团队通过将Spectrum Scale各个模块的专家组合在一起,并利用来自印度、美国等地的实验室开发团队的力量,通力协作,调优数百个参数,最终使Spectrum Scale平台在客户的环境里完美运行。此外,IBM实施团队也通过集结丰富的专业人才共同分析,以及本着服务至上的精神,为客户提供客制化方案,最终完成了项目的实施与落地,使客户业务能更好地发展,更好地为其客户提供优质的产品与服务。

总的来说,大数据作为一种新资源,可帮助企业获得竞争优势,让企业做出更好的决策、更加深入地与客户互动、利用新的收入来源。随着数字化转型进入“第二篇章”,企业也步入混合多云环境,数据量和数据价值不断增长,构建统一的数据存储与管理平台,提升平台存储性能,降低数据存储成本,正成为快速获得洞察力的关键。而实际上,无论是对于拥有海量数据的企业,还是对于即将拥有海量数据的企业,IBM Spectrum Scale及IBM磁带库的完美组合,都是一套帮助企业构建低成本、高扩展、易管理的持久数据生命平台的解决方案,而且它可灵活选择、自由组合,帮助企业解决数据竖井、分布式数据管理等难题,赋能智能制造,让 AI 在云上起舞。