作为存储巨头,EMC自然也不会放弃大数据这块“大蛋糕”。EMC Greenplum大数据一体机的出现离不开EMC对Greenplum的收购。Greenplum是一个采用shared-nothing的大规模并行处理(Massive Parallel Process,MPP)架构的数据库产品,可灵活增加节点实现横向扩展,帮助控制成本和性能,对于大数据下的BI等大数据应用都有较好支持。
Greenplum数据库可以运行在普通的硬件服务器上,利用大量的并行处理来同时查询大数据集,无论对于虚拟化,云还是大数据分析,这都是一个非常重要的前提。目前Greenplum的数据库产品包括传统的Greenplum Database和Greenplum HD(Hadoop),前者用来应对企业结构化数据,后者可以将非结构化数据导入Greenplum中进行存储和分析。
EMC Greenplum 大数据一体机
Greenplum Chorus与Greenplum Database以及Greenplum HD共同组成了EMC的统一大数据分析平台(UAP)。Greenplum Chorus为数据科学家(Data Scientist)提供了一个统一的大数据分析界面,不同的分析人员可以登录Chorus创建个人的分析沙盒,根据各自的需求进行分析。Greenplum Chorus还是一个开放的平台,可以对第三方的分析工具进行整合,用户可以使用其他产品在Chorus的协作平台上进行分析。
Greenplum Chorus是全世界第一个基于协作分析的大数据平台。Greenplum Chorus将在今年晚些时候正式开源。
标签:磁盘阵列