正文
实时的事务处理大数据。
实时数据通常具备活跃和持久的特性;当用户执行搜索、销售分析或其它动作时,数据库或其他使用实时数据的应用程序也会同时驱动数据流转。自动化分层软件通常会尽量将所有活跃数据保留在尽可能高的层,但是管理员可能希望单独指定一些数据库、分区或数据卷,让这些数据集中保存在一个特定的层,以确保某些应用获得低延迟。如果某些数据在一段时间内不再活跃,这些数据将向较低级的存储层迁移。
对于大数据、数据湖或其他大型数据集,将数据保存在云中的举措值得尝试,分层体系就可根据需要在热、温、冷云存储之间移动数据。
典型的文件服务器数据。
存储在文件服务器上的常见数据类型,包括文本、文字处理数据、电子表格和演示幻灯片,这些数据很少需要闪存的速度。文档或文件被加载到用户终端后,用户输入数据的带宽通常只是每秒几个字符的数量级别,根本不需要亚微秒的响应时间。即使正在渲染的特效或光线追踪图形、或正在编译的大型程序的性能都受到CPU或图形处理能力的限制,数据访问的速度并不是瓶颈。例外情况即使存在也不会太多,完全可以由管理员单独处理。
数据流。
数据流的关键定义是:可预测和连续性,因此数据流不需要闪存的低延迟和随机存取能力。即使是被大量用户同时访问的流式传输数据也非常容易对付,无需使用大量Flash就能获得最优化的性能。另外,数据流通常意味着文件尺寸和数量都很大,因此数据流会大量占用和消耗存储空间,并成为低层存储的理想负载类型。
虚拟系统数据。
与流式数据相比,闪存存储的最适合的负载应该是虚拟服务器和虚拟桌面基础架构(VDI)。这些数据类型可以充分利用闪存的低延迟特性,并提供重复数据删除功能,因为许多虚拟机(VM)与其他虚拟机之间具备极高的数据重复比例。例如,一个拥有100个Windows虚拟机的VDI系统中,每个客户机可能和其它虚拟机有99%的相同数据,可实现的重复数据删除率接近100:1,因此100个虚拟机只需占用比1个虚拟机略多一点的存储空间。闪存存储速度足以支持重复数据删除并轻松处理典型的VDI部署的峰值负载,例如,用户在上午8点登录,在中午注销午餐,下午1点重新登录,并在下午5点重新登录。