作者：贾凯强

如何保证Hadoop数据湖不变成“数据洪水”

2016-07-11 05:54:00 [ 中关村在线原创 ] 暂无评论

　　数据湖的提出距今已经有了几年时间了，特别是在当今时代中，基于Hadoop建立的数据湖在大数据处理中占有的位置越来越重要。但是如何保证数据湖不像南方水灾一样泛滥，依然是一个耐人寻味的话题。

如何保证Hadoop数据湖不变成“数据洪水”
数据湖已满，如何防泛滥

　　数据湖洪水泛滥

　　数据湖十分灵活，同时具备可扩展和低成本的特点。其最初建立的目的十分简单，就是将所有形式的数据集中在同一处，这些数据包括了结构化数据、非结构化数据以及半结构化数据。这些数据可以是日志文件、点击流、邮件、图像、音频视频或者文本文件。

数据湖中数据类型繁杂

　　在这些数据中，非结构化和半结构化数据占据了很大一部分，但是由于我们的处理能力不同，一些数据可能在数据湖中存储了很长时间而不能被处理掉，这样就会一直积攒下来保留的现在。

　　诚然，数据湖可以帮助处理各种形式的数据，这其中以结构化数据为主。而且数据湖具备数据库的大部分特质，可以提供数据查询、结构化数据处理报告等业务。数据湖的最大价值在于数据利用、探索大数据的价值，预测未来结果并为企业提出相关建议，进而指导企业的进一步决策和行动。

“数据洪”一触即发

　　但是，问题也就发生在这里。因为基于Hadoop部署的数据湖的能力并不足以应付一切，而用户对数据湖又疏于管理。数据量随时间而增加，数据湖开始泛滥，进而有逐步发展成洪水的趋势。数据不能得到有效的分配，“数据洪”随时可能冲溃堤坝，水漫金山。

标签：Hadoop 数据系统数据库

1 2 下一页本页阅读全文收藏

提示：支持键盘“← →”键翻页

关注企业中心微信公众号
微信号：ZOL企业

关注排行榜

产品品牌

1
华为Taishan 2280(鲲鹏920 5220*2/32GB/960GB*2固态)￥33000

商家数：43家评论数：0条立即购买
2
超聚变FusionServer 2288H V5￥12199

商家数：59家评论数：0条立即购买
3
浪潮英信NF5280M6￥19399

商家数：64家评论数：1条立即购买
4
HP ProLiant DL380 Gen10(879938-B21)￥39800

商家数：47家评论数：0条立即购买
5
H3C UniServer R4900 G3（Xeon Bronze 3204/16GB/600GB）￥17099

商家数：50家评论数：0条立即购买
6
联想ThinkSystem HR650x价格面议

商家数：73家评论数：0条立即购买
7
浪潮CS5260H2（海光5380*2/256GB/960GB*2+16TB*3）￥77292

商家数：61家评论数：0条立即购买
8
超聚变FusionServer 2288H V6价格面议

商家数：59家评论数：5条立即购买
9
浪潮NF5468M7 (Xeon Gold 6430*2/64GB/960GB*2+4TB*3/24GB显卡*4)33.54万

商家数：52家评论数：0条立即购买
10
超聚变KUNLUN昆仑 2280(鲲鹏920 32核*2/64GB/4TB*3/双电)￥38000

商家数：47家评论数：0条立即购买

<li class=" top  current ">
        								<em class="num">1</em>
        								<div class="hd"><a href="//detail.zol.com.cn/server/inspur/">浪潮</a><span class="hd-info">共322款</span></div>
        								<div class="info-box">
        									<a href="//detail.zol.com.cn/server/inspur/" class="pic"><img src="https://2d.zol-img.com.cn/manu_photo/20.jpg" alt="浪潮" title="浪潮" width="160" height="80"></a>
        								</div>
        							</li><li class=" top ">
        								<em class="num">2</em>
        								<div class="hd"><a href="//detail.zol.com.cn/server/huawei/">华为</a><span class="hd-info">共178款</span></div>
        								<div class="info-box">
        									<a href="//detail.zol.com.cn/server/huawei/" class="pic"><img src="https://2d.zol-img.com.cn/manu_photo/613.png" alt="华为" title="华为" width="160" height="80"></a>
        								</div>
        							</li><li class=" top ">
        								<em class="num">3</em>
        								<div class="hd"><a href="//detail.zol.com.cn/server/lenovo/">联想</a><span class="hd-info">共1212款</span></div>
        								<div class="info-box">
        									<a href="//detail.zol.com.cn/server/lenovo/" class="pic"><img src="https://2d.zol-img.com.cn/manu_photo/160.png" alt="联想" title="联想" width="160" height="80"></a>
        								</div>
        							</li><li class="">
        								<em class="num">4</em>
        								<div class="hd"><a href="//detail.zol.com.cn/server/dell/">戴尔</a><span class="hd-info">共407款</span></div>
        								<div class="info-box">
        									<a href="//detail.zol.com.cn/server/dell/" class="pic"><img src="https://2d.zol-img.com.cn/manu_photo/21.jpg" alt="戴尔" title="戴尔" width="160" height="80"></a>
        								</div>
        							</li><li class="">
        								<em class="num">5</em>
        								<div class="hd"><a href="//detail.zol.com.cn/server/chaojubian/">超聚变</a><span class="hd-info">共42款</span></div>
        								<div class="info-box">
        									<a href="//detail.zol.com.cn/server/chaojubian/" class="pic"><img src="https://2d.zol-img.com.cn/manu_photo/58207.jpg" alt="超聚变" title="超聚变" width="160" height="80"></a>
        								</div>
        							</li><li class="">
        								<em class="num">6</em>
        								<div class="hd"><a href="//detail.zol.com.cn/server/h3c/">H3C</a><span class="hd-info">共111款</span></div>
        								<div class="info-box">
        									<a href="//detail.zol.com.cn/server/h3c/" class="pic"><img src="https://2d.zol-img.com.cn/manu_photo/1818.jpg" alt="H3C" title="H3C" width="160" height="80"></a>
        								</div>
        							</li><li class="">
        								<em class="num">7</em>
        								<div class="hd"><a href="//detail.zol.com.cn/server/hp/">惠普</a><span class="hd-info">共194款</span></div>
        								<div class="info-box">
        									<a href="//detail.zol.com.cn/server/hp/" class="pic"><img src="https://2d.zol-img.com.cn/manu_photo/223.jpg" alt="惠普" title="惠普" width="160" height="80"></a>
        								</div>
        							</li><li class="">
        								<em class="num">8</em>
        								<div class="hd"><a href="//detail.zol.com.cn/server/suma/">中科可控</a><span class="hd-info">共59款</span></div>
        								<div class="info-box">
        									<a href="//detail.zol.com.cn/server/suma/" class="pic"><img src="https://2d.zol-img.com.cn/manu_photo/56921.jpg" alt="中科可控" title="中科可控" width="160" height="80"></a>
        								</div>
        							</li><li class="">
        								<em class="num">9</em>
        								<div class="hd"><a href="//detail.zol.com.cn/server/powerleader/">宝德</a><span class="hd-info">共135款</span></div>
        								<div class="info-box">
        									<a href="//detail.zol.com.cn/server/powerleader/" class="pic"><img src="https://2d.zol-img.com.cn/manu_photo/681.jpg" alt="宝德" title="宝德" width="160" height="80"></a>
        								</div>
        							</li><li class="">
        								<em class="num">10</em>
        								<div class="hd"><a href="//detail.zol.com.cn/server/thinkserver/">ThinkServer</a><span class="hd-info">共441款</span></div>
        								<div class="info-box">
        									<a href="//detail.zol.com.cn/server/thinkserver/" class="pic"><img src="https://2d.zol-img.com.cn/manu_photo/34895.jpg" alt="ThinkServer" title="ThinkServer" width="160" height="80"></a>
        								</div>
        							</li>

文章推荐

最新文章相关文章

<li class="top">
						<em class="num">1</em>
						<div class="hd"><a href="//server.zol.com.cn/974/9747355.html" target="_blank" alt="Rambus通过新一代CryptoManager安全IP解决方案增强数据中心与人工智能保护">Rambus通过新一代CryptoManager安全IP解决方案增强数据中心与人工智能保护</a></div>
					</li>
	                <li class="top">
						<em class="num">2</em>
						<div class="hd"><a href="//server.zol.com.cn/971/9717823.html" target="_blank" alt="HPE ProLiant Gen12发布，为千行百业提供智算动力">HPE ProLiant Gen12发布，为千行百业提供智算动力</a></div>
					</li>
	                <li class="top">
						<em class="num">3</em>
						<div class="hd"><a href="//server.zol.com.cn/926/9264729.html" target="_blank" alt="安森美将收购碳化硅JFET技术，以增强其针对AI数据中心的电源产品组合">安森美将收购碳化硅JFET技术，以增强其针对AI数据中心的电源产品组合</a></div>
					</li>
	                <li class="">
						<em class="num">4</em>
						<div class="hd"><a href="//server.zol.com.cn/970/9707846.html" target="_blank" alt="IBM与X-Power宣布共建创新中心，助力中国制造企业数字化转型">IBM与X-Power宣布共建创新中心，助力中国制造企业数字化转型</a></div>
					</li>
	                <li class="">
						<em class="num">5</em>
						<div class="hd"><a href="//server.zol.com.cn/981/9811231.html" target="_blank" alt="英特尔打造零售门店“最强大脑”，点亮零售行业智慧升级">英特尔打造零售门店“最强大脑”，点亮零售行业智慧升级</a></div>
					</li>
	                <li class="">
						<em class="num">6</em>
						<div class="hd"><a href="//server.zol.com.cn/956/9564470.html" target="_blank" alt="边缘计算AI升级加速，Armv9边缘AI计算平台引领物联网性能变革!">边缘计算AI升级加速，Armv9边缘AI计算平台引领物联网性能变革!</a></div>
					</li>
	                <li class="">
						<em class="num">7</em>
						<div class="hd"><a href="//server.zol.com.cn/923/9238970.html" target="_blank" alt="英特尔企业AI一体化方案重磅发布， 以端到端解决方案助力行业智能化发展">英特尔企业AI一体化方案重磅发布， 以端到端解决方案助力行业智能化发展</a></div>
					</li>
	                <li class="">
						<em class="num">8</em>
						<div class="hd"><a href="//server.zol.com.cn/924/9244911.html" target="_blank" alt="中国大陆芯片设备第三季度销售额同比增长17%">中国大陆芯片设备第三季度销售额同比增长17%</a></div>
					</li>
	                <li class="">
						<em class="num">9</em>
						<div class="hd"><a href="//server.zol.com.cn/983/9831385.html" target="_blank" alt="英特尔携手壳牌打造浸没式液冷认证方案，助力数据中心迈向高效未来">英特尔携手壳牌打造浸没式液冷认证方案，助力数据中心迈向高效未来</a></div>
					</li>
	                <li class="">
						<em class="num">10</em>
						<div class="hd"><a href="//server.zol.com.cn/983/9831367.html" target="_blank" alt="Qorvo® Matter™ 解决方案新增三款QPG6200系列SoC">Qorvo® Matter™ 解决方案新增三款QPG6200系列SoC</a></div>
					</li>

互动沙龙