澎湃Logo
下载客户端

登录

  • +1

西部数据和伙伴的故事(三):面对海量数据,看分布式存储如何一一化解

2023-02-13 11:57
来源:澎湃新闻·澎湃号·湃客
字号

如今,数据与土地、劳动力、资本、技术并称为五大生产要素,数据成为数字经济发展的重要引擎。作为数据的承载者存储设备也在不断进化,从传统的集中式存储到现在的分布式存储,不断助力数据价值的释放。

至顶科技推出的系列访谈节目《论存储新技术 道数据新价值》,继续邀请西部数据和他的伙伴一起聊聊数据的故事。本期节目,深信服存储业务首席架构师高蒙、西部数据渠道技术总监季少丰和至顶科技总经理高飞一起探讨企业数据呈现的新变化、海量数据带来的新挑战,以及深信服如何基于分布式存储赋能客户更好的释放数据价值等话题。

话其因  企业业务数据呈现三大变化

今天越来越多的智能设备以及新应用如区块链、机器学习训练和AI等产生大量的数据,据IDC预测到2025年,全球数据量将达到175ZB,其中我国将产生41ZB的数据。于此同时,对于企业而言,数据已经成为企业的核心资产,推动着企业的业务创新与可持续发展。

“从人文和经济角度而言,数据具有重要意义,数据不仅是数字经济的引擎,是数字化时代的“石油”资源,同时,数据存储也是在记录新的人类文明。” 西部数据渠道技术总监季少丰谈到。

深信服存储业务首席架构师高蒙根据多年的客户实践分享了当前企业数据呈现的三大变化,即数据爆炸式增长、对存储性能诉求越来越高以及对数据安全越来越重视。

第一个变化是数据越来越多。互联网和新应用让数据呈现爆炸式增长,包括自动驾驶、IC芯片设计、光伏等产业,数据增长的速度极快。“以自动驾驶为例,客户每天增长的数据量以TB计算,曾经有客户直接一次性购买10PB的可扩展容量。所以数据存储产品的第一个使命是提供极致的扩展性。” 高蒙讲道。

第二个变化是对存储性能诉求越来越高。新的应用除了产生海量的数据,还体现在对存储性能诉求上。例如,IC芯片设计行业的客户,无论是在以小文件为主的前端计算场景,还是以大文件、大IO为主的后端计算场景,都提出了需要与本地盘相近的性能诉求。

第三个变化是更高的安全性。随着大数据分析和AI技术的发展,数据对于用户来讲,越来越重要。用户对数据的安全性,也提出了更高的要求。根据Cybersecurity Ventures的报告,到2031年,全球勒索软件造成的损失预计将超过2650亿美元,每两秒就会发生一起勒索软件攻击事件。对于存储产品而言,保护客户的数据安全,也是一项重要的使命。

究其源  数据存储面临的挑战

企业数据的变化趋势,也给当前数据存储带来一定挑战。深信服作为一家专注于企业级安全、云计算及IT基础设施的产品和服务供应商。在存储产品(包括超融合和存算分离的EDS产品)所覆盖的客户群体中,发现目前数据存储主要有以下三点挑战:

挑战一、如何提升非结构化数据服务的性能,尤其是文件系统的性能。随着数据量或者文件数量的爆发式增长,现有的存储系统面临巨大挑战,之一就是无法有效的支撑海量的文件数量。“新兴应用场景产生的数据超过80%是非结构化数据,比如自动驾驶行业中从前端数据汇总到后端HPC大数据分析,几乎都是文件和对象的使用场景。因此对存储系统的性能提出了更高的挑战。” 高蒙讲到。

挑战二、如何提升数据生命周期管理的灵活性和快速扩容能力。传统的企业存储系统产品,一般拥有5年的生命周期,之后需要客户购买延保,甚至需要迁移数据。五年之后,客户可能会面临海量数据迁移的场景,迁移数据会给企业带来高昂的成本。除了成本,企业客户还希望能够快速实现系统灵活的扩容,包括快速灵活的扩盘,或者扩节点,甚至是扩不同型号的盘或者服务器。

挑战三、能耗的挑战。“双碳”目标已经成为当今世界最为紧迫的使命,建设绿色低碳数据中心成为必然方向,在数据的全生命周期内最大限度地节约能耗是大势所趋。所以数据存储产品也需要深度思考,包括采用更节能的闪存介质等来实现节能高效的利用存储设备,降低资源开销。

西部数据渠道技术总监季少丰也分享了自己的观察,除了容量、性能以及绿色低碳之外,TCO成本负担的加重也是当前企业存储面临的挑战。“更低的单位容量成本($/TB),这是数据中心的存储运营成本的关键指标。当然还有更少的电力和冷却成本,以及安装、监控和管理维护等费用。” 季少丰补充道。

述其果  分布式架构成为解决之道

自从上世纪90年代,EMC发布了世界上第一款现代高端存储产品Symmetrix之后,存储产品的发展一直是以scale up(纵向扩展)为主,即每一代新产品的目标是如何利用更好的硬件,提供更高的性能、更高的可靠性和更高的容量。

但是当进入互联网时代,随着新兴应用的兴起,海量数据的产生,通过scale out(横向扩展)的方式,将更多的节点组合成集群,通过分布式的架构实现了更优的存储服务。

为了支持惊人数据量的增长、不断扩大的云架构规模和帮助企业通过数据了解自身的潜能,西部数据技术和产品创新也在不断推陈出新。针对客户面临的存储新的挑战,深信服与西部数据联合解决方案的应对之道是通过分布式存储和以软件定义来满足客户对于扩展性和灵活性的需求。结合西部数据在闪存与HDD领域拥有独特优势,双方联合推出的分布式存储解决方案具备强大的性能优势,优异的稳定性和可用性,高度贴合不同行业存储需求。

目前西部数据在深信服超融合产品上大量应用了4T,6T和8T 中等容量硬盘,以及12-18TB等大容量硬盘,通过西部数据的分层存储方案和深信服深入合作,针对近线和云计算细分市场,以及大规模云存储,在成本、性能、能耗和扩展之间取得平衡,给不同的数据分层配置不同等级的存储介质选择。

“为了支撑分布式存储服务商创造更大的价值,西部数据带来的存储架构创新和垂直整合解决方案,引入分层存储的概念,使用高性能的存储介质来存储需要频繁访问的热数据和极热数据,使用成本与性能均衡的存储介质来存储温数据,将无需频繁访问的冷数据和极冷数据存储在大容量、 低成本、性能相对较低的存储介质中,以灵活地满足不同应用场景的需求。” 季少丰谈到。

比如广东某医疗客户,采购深信服大量超融合服务器,配置西部数据企业级6T硬盘,与之前搭载的硬盘相比,表现出更好的稳定性和可靠性,没有出现集中多块硬盘故障的案例;某综合现代大型企业集团2022年5月采购深信服大量超融合服务器,新设备刚部署就遇到大量硬盘故障,经过协调,客户端换成西部数据的企业级8T硬盘,年化故障率明显改善,等等…...

看其势  探讨未来发展趋势

访谈最后,双方还探讨了今后的市场趋势和合作方向。高蒙表示,深信服分布式存储在未来3年内将聚焦在新介质和非结构数据管理两个方向。在新介质的盘控配合和可靠性上与西部数据展开更紧密的合作。季少丰表示,面向云计算和云存储,西部数据推出具有氦气封装技术,能量辅助记录,三级寻轨定位系统,以及OptiNAND融合闪存架构的大容量硬盘。

同时西部数据推出的企业级SSD SN650, 也是针对云数据中心、软件定义以及扩展架构量身定制, 能够在高性能的前提下提供更高容量(15.36TB),帮助深信服在存储架构中的充分体现NVMe的价值,从而在高容量工作负载(例如对象存储)下,获得每个SSD的最低TCO成本。

可以看到,随着西部数据与深信服在2022年的8月份签署了战略合作协议,双方将达成战略合作,以进一步沟通双方深层次业务需求,共同探索数字存储领域的更多可能性。当前西部数据DC560 20TB HDD和SN650 SSD已经送样到深信服联合开发测试。相信西部数据的大容量、高性能、高可靠性的企业级硬盘产品与深信服的超融合、分布式存储进行深度整合,能够通过软件系统的优化最终实现整体性能、可靠性和性价比的提升。

欢迎观看完整版视频,了解更全面的内容:https://www.zhiding.cn/special/westerndigital_2022_Sangfor

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈