泡泡网DIY攒机频道 PCPOP首页      /      DIY攒机     /      新闻    /    正文

宝存科技姜海:用匠心精神打造企业级SSD

  近期,宝存科技产品研发副总姜海先生接受了国内媒体专访,不仅介绍了宝存科技新一代企业级固态硬盘,而且还解答了不少关于企业级SSD的相关知识以及行业发展现状,干货颇多,对企业级SSD感兴趣的朋友们不容错过。

宝存科技产品研发副总——姜海先生

  宝存科技着力打造国产企业级SSD品牌

  宝存科技是一家中国本土公司,注册在上海,着力打造国产企业级SSD品牌,立足并服务中国的数据中心及存储市场。2011年创立,2015年由SMI收购成为全资子公司。 最开始做的是已经规模部署的PCIe SSD,它是Open Channel的前身。

  宝存科技新一代PCIe4.0企业级SSD将于今年12月份全面推出

  谈到宝存科技的产品,Gen3在大的数据中心都有比较规模的商用,Gen4的产品SP4E和SP4X包括NVMe标品、ZNS(Zoned Namespace)、Open Channel都会在12月全面的推出, SP4E容量包括1.92T/3.84T/7.68T, SP4X包括 1.6T、3.2T和6.4T.Gen5的产品也在规划和部署,规划在2022年底推出PCle5.0产品,预期会有更加亮眼的表现。

  宝存科技的企业级SSD目前全部采用SMI主控

  宝存自从被收购之后开始使用SMI主控,从PCle3.0到现在的PCIE4.0以及即将推出的PCle5.0的主控。近两年,Gen3的产品有比较规模的部署,Gen4的产品今年会全面推出,Gen5产品也在开发中。

  整体来讲,宝存科技作为国产自有品牌及对企业级SSD的长期坚定的投入,依托自己的稳定供应的企业级主控(包括即将出来全新企业级Gen5主控),一线大厂的批量部署经验,在NAND掌控、管理、纠错方面的丰富经验, 有对企业级应用深入的理解,在定制优化领域软件、固件的垂直整合的扎实理解和共同开发经验,经过打磨的SSD验证及生产、质量把控体系,稳定供应保障,坚持为本土企业级存储及数据中心提供快速、优质的本地化、定制化技术服务。

  宝存科技在行业内拥有6大优势

  (1)稳定的长期的主控供应是宝存的一个优势。SMI在消费类市场上已经有非常好的成绩和市场的影响力,同时SMI在企业级主控和投入上也非常坚定,尤其是在Gen5这一块是完全采用全新的架构,有母公司的全力支持,尤其是在近两年业界缺芯片的情况下,宝存科技依然能够保证主控稳定的供应。

  (2)宝存科技能提供全套的SSD解决方案。具备从主控到固件一直到驱动、产品验证及和生产质量把控,在完整方案的垂直整合上经验充足。

  (3)第三个优势是,NAND Flash的使能和管理上属于宝存科技很大的强项,宝存科技对于NAND的迭代及管理的各方面技术,都有非常扎实的成功经验和案例。

  (4)第四个优势是超过十年的一线大厂规模部署经验。做企业级SSD需要5至10年以上经验,不管是稳定性、可靠性,各方面都需要点点滴滴的积累,才能达到企业级标准。这意味着,在打磨企业级SSD从一开始就需要在软硬件架构设计、功耗、稳定度以及白盒、黑盒的验证,整套质量体系要做的非常的完整,才能达到高品质的要求。十年企业级产品部署中,宝存科技积累到了非常宝贵的经验和教训,使宝存科技的性能品质逐渐沉淀成为企业级高规格,应对整个数据中心对企业级SSD的可靠性、稳定性和性能要求。数据中心对年化故障率要求为千分之二点五,这是非常高的要求,宝存科技一直不懈的以匠心精神致力于打磨我们的企业级SSD水准。

  (5)第五点是和一线大厂在应用定制化领域(Open Channel)有非常成功的案例,并且近两年已经得到非常规模的量产。定制化领域中有蛮特殊的要求,需要在软件层级、固件层级、主控层级、硬件方面都需要和客户做协作,垂直整合上需要非常扎实的理解和客户共同的开发经验以及对上层应用和对底层的实现的充分理解,包括对各种NAND Flash掌控能力,各方面的要求是非常高的。这些经验都充分在宝存科技正在开发Gen4 Zoned Namespace 产品有充分的体现。

  (6)第六点,对于宝存科技来讲整个商业模式会根据客户和合作伙伴的诉求提供弹性化的本土服务,可以提供整盘,也可以根据客户的需求做一些定制化Turnkey方案,甚至可以支持客户做一些半定制化方案的部分(有一些部分宝存科技提供,有一些部分由客户自己开发)。

  宝存科技企业级SSD的发展趋势

  在未来,包括5G、AI、自动驾驶、万物互联、元宇宙的概念是在国家大基建推动浪潮之下,整个数据中心会持续的扩张,也会带来更多的企业级诉求。PCIeSSD会渐渐取代SATA SSD,容量会持续的增大。另外是SSD在温热数据层会渐渐取代HDD,即使在冷数据层的话,基于QLC的 SSD也会取得一些份额。宝存科技看到企业级的SSD封装形态是以U.2作为主流,后续PCle5.0整个封装形态会进入到E3.S,因为新的封装形态在散热方面、功耗方面、性能方面会优于U.2。

  另外NVMe标准演化在命令集、命名空间类型、传输方式渐渐成熟,基于数据中心和企业存储的spec有融合的趋势,进一步推动标准化及第三方的认证,新的spec像Facebook,Microsoft,HP及DellEMC定义的ClouldSSD Spec囊括了数据中心和企业存储必备的各个维度的要求。在标准化的框架下,也吸纳了Zoned Namespace, KV namespace允许针对应用的优化及定制化。企业级SSD除了需要保证7x24高效稳定的工作,保证高可用性及数据完整性外,稳定优异的QoS延迟之外,需要能支持云原生分布式存储,性能要能随容量及功耗线性增长。宝存后续企业级SSD会跟进CPU在Gen4/Gen5的迭代节奏,除了在NVMe标品持续发力之外,延续在针对应用优化的定制化领域包括Zoned Namespace及Open Channel持续支援一线数据中心的软硬一体化优化进程。最近宝存科技发布了Gen4 SP4E/SP4X NVMe 标盘,OCS/ZNS Gen4的盘也会在近期全面进入可量产阶段。

  随着QLC的在性能、层数逐步改进,QLC SSD的成本的渐渐降低,大容量QLC SSD会渐渐在一些层面上和一定程度上在冷数据上获取HDD的份额。QLC SSD在retention上尤其是offline retention过长上存在数据恢复的问题,这种取代必需要求系统不掉电或掉电时间可控。宝存科技与各家数据中心都在这些领域调研QLC SSD系统化落地的机会。

  宝存科技看到PCle4.0部分数据中心从2021年下半年逐渐开始部署PCle4.0 SSD,整体上来讲PCIe 4.0SSD本身采用在今年和明年会是大的趋势,因为整体来讲不管CPU频率和本身各个计算资源的能力,以及网络的速度都在同步的提升,所以我们看到大家导入PCle4.0的态度是比较积极的,只是有一些供应链导致PCle4.0导入速度受到影响,但整体的趋势是不变的。宝存的Gen4 SSD SP4E/SP4X会在12月全面推出,宝存科技看到Gen4 SSD在各方面包括功能性能、QoS都比Gen3做了很多优化。PCle5.0服务器的引入会在明年的Q1左右,整体上看到PCle5.0规模的部署会从2023年开始,寶存PCle5.0产品是2022年底提供CS,整个量产的节奏是适配服务器规模部署的节奏。

  如何看待SSD的顺序读写性能在不断提升,而随机读写性能却提升不明显?

  首先第一个点顺序读写性能是明显提升的,顺序读写性能应该是最容易做的关卡,随机性能要是能够提升,主要是主控,包括算法上需要革新的设计,这个设计本身来讲首先你的CPU数量及处理能力要够。第二个部分包括对NAND的plane数也是有要求的,随着NAND的密度增大之后,需要AIPR保证同一个DIE能够接受多个数据并发。对NAND的选择,通道数和主主控各个控制层面、数据层面都必须不是瓶颈,才能够在随机性能上进步。之所以看到SSD随机性能没有进步的话,是因为主控的架构没有发生太大的变化。

  宝存科技看好PCle5.0的发展前景

  宝存科技近期把PCle4.0的产品性能比Gen3有非常大的提升,大家可以关注具体的spec在PCle5.0时整个来讲,包括最近的OCP也在展示新的PCle5.0平台,PCle5.0可以看到在明年Q1就会陆续推出作为样品,整个PCle5.0可以看到不仅是存储、网速、加速卡、内存的扩展各方面东西,都会往PCle5.0量级上靠,宝存科技对PCle5.0的前景是非常看好的。从技术领域来讲,为什么宝存觉得PCle5.0好呢?首先是PCle5.0的主控也是全新打造的,完全真正意义上主控的架构,宝存科技在功能的丰富性上面或者性能的竞争力上面,以及包括QoS服务质量上,还是能耗比各个维度,包括对最新功能支持程度上,宝存科技认为都是处于领先的主控,所以我们预期在PCle5.0产品大家一定会看到比较亮眼的表现。

  整个PCle5.0中可以看到CPU存储的结构体系,包括高速缓存、加速卡、GPU、DPU、SSD速率进一步提升,性能各方面的优化。包括这些性能增加了之后,整个功耗也增加了以后,里面意味着U.2会向E3.S演化,也是为了在功耗散热方面有更多的优化,甚至会看到后面会用液冷的方式实施。所以后面看到PCle5.0伴随的不仅仅是硬件架构的变化,甚至会促使到软硬件协同一体,包括云计算的存储、基础架构上都会发生比较大的变化。这个变化在2023年以后才能真正把PCle5.0变化的实质动能呈现出来。

  宝存科技在未来不会推出M.2和SATA接口的企业级SSD

  这两个领域不会是未来的趋势,宝存科技会比较集中在PCIe,SP4E和SP4X的Gen4 SSD的尺寸形态是U.2,PCle5.0是SP5E、SP5X这个部分产品会有U.2渐渐向EWXE3.S过度。(英)E1.S Gen4在北美现在用的比较多,国内Gen4 SSD主流是U.2,在Gen5会向E3.S演化,SATA接口盘会渐渐被PCIE SSD取代,因为它的介质是一样的,成本是类似的,SATA的接口本身却限制了盘的性能,所以它被PCIE SSD取代是大势所趋。

  关于IFPS

  IFPS是随着元宇宙一起提出来的,整个协议可以允许你的文件和数据是一种去中心化的方式进行存储,可以通过特定的CID确定文件的内容本身对于安全性和多副本访问的可靠性上面,这是蛮好的提升。但是这个概念,到目前为止更多停留在概念和初始发动的阶段,没有形成很成熟的生态。对于企业级的SSD来讲并不影响SSD部署的部分,因为这个部分整体概念是上层,文件系统和数据进行切分和存储的概念。对于SSD本身来讲老老实实的把数据能够支持存储,它的性能可靠性能够把持得住,另外里面也设置到分层存储的概念能够支持得到,整体上来讲这个部分不涉及到底层存储的硬盘实际的创新和操作。

  关于元宇宙

  说实话这是一个新的概念,元宇宙、星际文件系统和区块链有一些相关的概念,在大基建基础上看到元宇宙是万物互联和数据随时能够访问,可能对传统数据中心的架构会产生一些冲击和演化。但是对存储本身会产生哪些挑战,会有演化的诉求。但这个时间点不敢评论有哪些机遇和挑战,相信这个概念的产生是先对上层基础架构的定义会产生很大的冲击,之后才会到底层硬件布局、存储布局、软件协同部分。至于会产生什么样的变化,需要一些时间才能慢慢的沉淀出来。

  关于PLC闪存

  宝存科技现在还没有做过任何PLC的样品,当然也谈不上相关测试数据和寿命的评点。整体来讲,企业级存储的整个探索和布局当前是集中在TLC/QLC上的,甚至QLC只是集中在温冷数据上的布局,QLC在企业级使用中是最开始的阶段。PLC的企业级探索为时尚早。整体看下来PLC它比QLC只多了25%的容量,但它的寿命、误码率(擦写次数及数据保持上都会远远弱于QLC)和性能的表现会远远弱于PLC以及,即使现在,所以PLC估计到2025年才会真正进入到企业级视野,同时PLC要用到企业级也需要非常强劲的主控来适配,包括误码的纠错能力及性能保障。在PLC无法承载企业级的性能诉求的情况下,上面一定要有其他层级比较高性能的部分作为缓存。所以现在PLC应该是初期概念的阶段,包括样品的部分还没有看到,所以估计要到2024年底、2025年初才可能看到PLC企业级的东西出来。

  再稍微补充一下,QLC相当于一个存储门含四个点,它的电压总共是16级。PLC相当于一个门电路中放的是5个比特(bit),意味着它的电压要分成32个层级,才能区别出5个比特,一个单元要存储32个不同等级的电压,意味着精确的控制,里面的电子数量工艺要求非常高,也很容易出现问题。PLC在企业级中有几个部分需要做,一个是主控上需要非常强劲,第二个部分上面因为有一些更强劲的存储介质来做PLC的缓存。

  关于宝存科技企业级SSD的散热技术

  Gen4 SSD包括软硬件在设计架构的初期是考虑到封装形态和U2功耗的限制,所以整体上来讲这个部分的功耗及发热量会满足数据中心及企业存储的要求。通常在企业级应用,有比较完备的功耗散热系统比如U.2盘会有一个金属外壳,盘片包括在内部选择和设计上都会根据热学原理进行仿真和优化,包括导热贴能够把热传导到外壳上面,外壳通过液冷或者环境里面的风把它给带走。整体上来讲,宝存科技看到在Gen4的状况之下,其实对于散热来讲并没有产生质的增加和变化,最新的散热技术没有太大的要求。将来看到PCle5.0会看到散热技术一些新的要求,包含新的封装形态E3.S/E3.L可以超过U.2的25瓦,可以到40瓦到70瓦性能、功耗及散热上(比如从风冷变成液冷)需要较多的考量。

  关于企业级SSD数据安全方面的策略

  整体上来讲,现在SSD通常支持加密的部分。加密通常来讲有两方面加密的概念,第一方面是数据加密,数据本身通过密钥的方式加密,必须要拿到钥匙才能解出来。另外涉及到芯片加密的概念,即使数据加密了,但是别人把中间的固件篡改了,它是完全有机会把你的数据读走的,所以里面涉及到芯片加密,一开始运作时必须要检测硬件/固件是不是原生厂商的,如果有破坏的话完全没有办法启动。整体上来讲数据安全方面,如果在终端层级上存在这两个问题,数据加密和芯片加密,现在大家更多做的东西是数据加密,但是芯片加密上还需进一步完善。

  关于宝存科技在存储产品寿命和可靠性方面的举措

  企业级SSD对寿命本身有明确的定义。整体来讲存储产品的寿命,最多的东西来决定于所有硬件部件寿命最短板地方,现在看起来整体讲要看寿命的话,更重要的因素是在于NAND的寿命上。除了对硬件本身的寿命要有一定的要求外,其他靠主控和固件怎么尽量延展它的寿命,大家已经比较熟悉了延展寿命有一些磨损均衡、NAND管理算法和超强的纠错能力,还配合了保证寿命的同时怎么样保证性能和QoS,为了数据不丢就会去重试,这些重试会对性能进行影响。可靠性涵盖的东西比较多,设计软硬件做架构设计的时候的综合考量,另外主控内部的设计在各个数据路径和控制路径上都要有一些各方面的保护,甚至需要有一些端到端的保护防止静默数据丢失的状况,掉电保护,过温保护,主控、固件件设计,BOM(包括NAND)选择,测试质量把控、生产把关,能够把软、硬和偶然出现的问题都给清除掉,主控的检错能力及固件错误处理算法和,这是统一考虑的东西。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
2人已赞

关注我们

泡泡网

手机扫码关注