据相关报道,英特尔注资7.4亿美元买下Cloudera 18%的股权。Cloudera近期也推出支持内存式(In-memory)大数据技术的Hadoop企业发行版。从IDC方面了解,作为英特尔策略性的投资,不管是在服务器和数据中心上投入Cloudera都是有帮助的。特别在大数据或是数据存储的需求上,英特尔此举有助于存储上的发展。
Cloudera截图
相较于前一版本的CDH 4.6,CDH 5.0内建更多的Hadoop Ecosystem功能模块,例如,Cloudera搜寻引擎(Cloudera Search)整合Apache Solr的搜寻功能,可以达到实时全文索引与搜寻的效果。另外,Cloudera Enterprise 5也内建审查管理,能够提供企业关于使用者存取数据的相关记录报告。
此外,Cloudera Impala让存储在Hadoop上可以有MPP(Massively Parallel Processing)SQL的互动查询功能。随着Cloudera Search与Cloudera Impala而来的简易使用性,让Hadoop由具有普遍需求性的搜寻与SQL查询功能进到企业市场,将让企业拥抱大数据应用的门槛降低。为此,也将带动企业在Hadoop新工具培训与顾问服务的需求。
CDH 5.0提供In-memory大数据处理技术
在功能上,CDH 5.0也新增Apache Spark,提供内存式大数据处理技术。CDH 5.0除了包含Hadoop 2版本(MapReduce v2 over YARN)外,也可以让使用者启动并兼容MapReduce v1模式,但新旧模式并不能够同时执行于同一集群节点上。
可见,整体而言,所有内建的Hadoop Ecosystem模块均有版本更新,在性能、安全性以及稳定性上都有进步。英特尔与合作伙伴在2014年年底推出新一代产品且在其中整合CDH 5.0。