欢迎光临
我们一直在努力

哪家的云服务器服务好、性价比高、比较稳定、值得推荐?

谢邀,利益相关,云服务商从咱这买硬盘。

云服务,作为一种软硬件一体的服务,和其他大型集群软件一样,都面临着磁盘失效导致服务中断的潜在风险。毕竟磁盘作为持久化介质,是任何大型系统都需要用到的。而云系统由于其大规模,高使用量,高突发性能特点,其安全性和稳定性更是头等大事。对于云系统来说,和单一任务系统,比如火车票订票系统12306这些虽然有高并发,但是峰值可预测,可提前准备的系统不同,云系统承载了不同的,各种各样的业务系统,这些系统的峰值各不相同,甚至于可能累积,其变化的幅度和复杂度都毫无规律,这样一来,云系统的预测难度就更大了,而成为最终环节的数据持久化环节-磁盘储存,必须有一个同时兼具效率和稳定的管理系统,如此,才能满足整个系统的安全性和稳定性。

在服务器系统当中,任何一个环节出现了问题,都会造成重大损失,但是,其中最为关键的,还是传统的三大块,即CPU,内存,和磁盘。由于硬件技术本身的特性,磁盘的运维又和CPU,内存有些较大的区别。CPU和内存的集成度更高,更加“一体化”,任何一个内部损坏,都会导致CPU和内存完全失去功能,所以在硬件层面,增加多组热备份硬件或者冷备份硬件来保证有效性,在上层,云系统通常通过虚拟化层来统一调用有效硬件资源,这个层很容易判断和阻断损坏的CPU和内存,因为这两者的状态只有简单的两种,好或者坏。而磁盘,它内部的不同部件更多,磁盘有很多部分组成,本身有控制电路,有磁头,有磁盘,有防震,有伺服,我们知道,越是独立部件多,其损坏的可能性越高。

在实际操作当中,CPU和内存通常通过冗余来解决损坏问题,这点上,磁盘也有类似的冗余概念,叫做RAID,但是,CPU和内存,是非持久化设备,即使崩溃,也不会影响到数据的储存,只是影响当时的吞吐量,也就是处理速度。而磁盘就不同了,磁盘的错误当中,有一种磁片物理错误,这是由磁盘的物理特性所决定的,磁片本身并非只有两种状态,坏或者好,还有一种中间态,部分磁片位置物理损坏了,虽然暂时系统仍然可用,但是持续下去就会发生不可弥补的损失。如果磁盘坏了,数据就丢失了。所以,除了土豪才能够承受的“大量冗余”以外,一般的操作,都是要增强磁盘的可运维性的。只有磁盘的可运维性上升了,才可以大量减少磁盘的意外损坏,进而减少系统的意外宕机和数据损坏,可以说,磁盘安全,是整个系统当中,最为重要的基础之一。

前面我们讲,磁盘,由于他的物理特性,导致了他和CPU,内存不同的性质,尤其是在于物理损坏这个方面,磁盘的失效,更难以被普通监控系统察觉。同时,为了提高系统可用性,在冗余的同时,必须要能够提前预测磁盘的错误,这样才能最大程度上防止意外停机事故,因此,我们结合了大数据和机器学习等最新尖端科技,提出了数据中心云系统智能报警系统,这是一种基于希捷独创的FRAM日志技术的报警系统。

现在,就来为大家揭秘这项黑科技!

FARM的全称为Field Accessibility Reliability Metrics,最早于2018年OCP峰会上提出,它的字面意思是 “终端客户可方便获取的硬盘可靠性指标”,是一种让用户以极其简单的方法获取硬盘全方面参数的日志。FARM的目的在于让云计算用户以此建立基于机器学习的健康监控或者预测模型,以及实时直观地获取数据中心中每一块硬盘的健康状况。

在目前的硬盘运维实践中,硬盘的数据采集主要基于SMART体系(Self-Monitoring Analysis and Reporting Technology,即自动检测分析及报告技术)。它能分析并预警硬盘可能发生的问题。 SMART体系自投入使用已有25年时间,可涵盖10多项的参数。

FARM是对SMART体系的重大改良。FARM本身获取方便,参数覆盖广,可以说是超级加强版的SMART。FARM的120多项参数包含了硬盘更加底层的传感器和磁头级别的相关参数,以及飞行高度、工作负载、环境等使用状况的参数,并且已经在多个希捷产品上实施,给硬盘做详细的“全身体检”。

FRAM技术通过三个方向,共同拱卫磁盘安全。

首先它通过精心设计的日志结构来获取磁盘的运行信息,在仅为96KB的区间当中,共分6个分页进行日志数据的储存,

其次,它通过简单的,人机可读的日志进行输出,可以让运维人员和运维软件充分了解磁盘的状况。同时希捷也提供了预编译的日志获取及解析工具,,支持常见的操作系统,减少客户的二次开发负担,充分降低成本。这样子,磁盘的日志,就可以一目了然地被运维人员所了解。

最后,通过应用最新的大数据和深度学习技术,在收集到的日志的基础上,我们精心调整了参数,训练了智能模型,从而能够帮助运维人员,精准地预测磁盘失效点。

FRAM日志技术,为运维人员带来了革命性的提升,由过去的事前冗余,事后发现,尽快处理这种消极防御,转变为提早预测,弹性布局的积极防御。一改兵来将挡,水来土掩的运维模式,将磁盘错误防御在发生之前。

这种提前防御主要体现在两个方面。

其一是运维效率的整体提升,其二是可靠性的整体提升。效率很容易理解,如果硬盘坏了,首先你要发现,发现了以后要物理拆下来,换一块新的上去,再开机,很多时候,还要重新安装一些系统或者软件,这就非常慢,效率很低。而我们提出了新的24小时在线概念,也就是提前预测损坏,在系统没有因为磁盘崩溃之前就预测出磁盘的损坏,就可以提前在常规停机的时候予以更换,就不会造成意外停机。

同样的可靠性也是如此。我们技术人员对于一个系统的有效性,通常用意外停机时间来表达,也就是系统可用性:9的个数。我们讲,一年当中一个系统90%的时间是可用的,只有10%是意外停机时间,这个叫做一个9,对应的,差不多是一年当中会有一个半月时间是意外停机的。而云服务商的磁盘可靠性,一般需要在5个九以上也就是99.999%的可靠性,也就是一年当中,只能有五分钟意外停机时间。如果没有提前预测能力,再厉害的运维工程师,24小时不睡觉等在机房里,也很难在五分钟内换上一块新硬盘吧。

就云服务提供商来说,一般都采用DCIM进行系统维护,也就是数据中心实时监控系统(Data Center Real-Time monitoring system)这当中,硬盘健康监控子模块扮演着重要的角色。通过FARM定期对硬盘的健康数据抓取,实时监控硬盘的健康状态,从消极等待错误转换成积极预测错误,新一代的硬盘健康监控模块在FRAM的加持下,能够发挥最大的作用。一旦发现有任何异常,便会及时采取措施,提醒客户重新设计工作负载,未雨绸缪,保护关键业务的延续性。

希捷FRAM技术彷佛给磁盘装上了最强的护盾,坚实地护卫着系统和数据的安全。数据安全是判断云服务的重要条件,谁不想用更安全,更稳定的服务器呢?希捷正在与国内知名云服务商积极展开合作,大家选择云服务器的时候,请认准FRAM技术支持哦。

赞(0)
版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
文章名称:哪家的云服务器服务好、性价比高、比较稳定、值得推荐?
文章链接:https://www.jmwz.net/7170.html
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址