整合多层存储，混合存储阵列的成本精简之道

TechTarget · 公众号 · 科技媒体 · 2018-01-10 13:58

正文

请到「今天看啥」查看全文

实时的事务处理大数据。 实时数据通常具备活跃和持久的特性；当用户执行搜索、销售分析或其它动作时，数据库或其他使用实时数据的应用程序也会同时驱动数据流转。自动化分层软件通常会尽量将所有活跃数据保留在尽可能高的层，但是管理员可能希望单独指定一些数据库、分区或数据卷，让这些数据集中保存在一个特定的层，以确保某些应用获得低延迟。如果某些数据在一段时间内不再活跃，这些数据将向较低级的存储层迁移。

对于大数据、数据湖或其他大型数据集，将数据保存在云中的举措值得尝试，分层体系就可根据需要在热、温、冷云存储之间移动数据。

典型的文件服务器数据。 存储在文件服务器上的常见数据类型，包括文本、文字处理数据、电子表格和演示幻灯片，这些数据很少需要闪存的速度。文档或文件被加载到用户终端后，用户输入数据的带宽通常只是每秒几个字符的数量级别，根本不需要亚微秒的响应时间。即使正在渲染的特效或光线追踪图形、或正在编译的大型程序的性能都受到CPU或图形处理能力的限制，数据访问的速度并不是瓶颈。例外情况即使存在也不会太多，完全可以由管理员单独处理。

数据流。 数据流的关键定义是：可预测和连续性，因此数据流不需要闪存的低延迟和随机存取能力。即使是被大量用户同时访问的流式传输数据也非常容易对付，无需使用大量Flash就能获得最优化的性能。另外，数据流通常意味着文件尺寸和数量都很大，因此数据流会大量占用和消耗存储空间，并成为低层存储的理想负载类型。

虚拟系统数据。 与流式数据相比，闪存存储的最适合的负载应该是虚拟服务器和虚拟桌面基础架构（VDI）。这些数据类型可以充分利用闪存的低延迟特性，并提供重复数据删除功能，因为许多虚拟机（VM）与其他虚拟机之间具备极高的数据重复比例。例如，一个拥有100个Windows虚拟机的VDI系统中，每个客户机可能和其它虚拟机有99％的相同数据，可实现的重复数据删除率接近100：1，因此100个虚拟机只需占用比1个虚拟机略多一点的存储空间。闪存存储速度足以支持重复数据删除并轻松处理典型的VDI部署的峰值负载，例如，用户在上午8点登录，在中午注销午餐，下午1点重新登录，并在下午5点重新登录。