作者：贾凯强

如何保证Hadoop数据湖不变成“数据洪水”

2016-07-11 05:54:00 [ 中关村在线原创 ] 暂无评论

　　抗洪还得靠管理

　　那么数据湖要如何才能避免成为数据洪的悲剧呢？首先应该从根本上改变传统对数据湖的看法。把数据湖当作一个整体库存来管理是存在问题的，对于管理人员来讲，基于数据类型需要把数据湖分成一个个的区，分别处理管理。

如何保证Hadoop数据湖不变成“数据洪水”
基于Hadoop的数据湖需要分类

　　基于Hadoop的数据湖的区域划分归类对其而言十分重要。管理者需要对其需要提取的数据进行原始数据的保留，并且对其进行元数据标记，标明数据源、数据类型等。当被提取的数据处理完毕之后要对其统一规划并进行后续处理。

　　如果用户需要选择一些特定应用程序的数据，那么可以通过收集、转换，将来自不同数据源的数据全部带走并进行处理。最后，在处理工作完成后可以通过数据轨迹、处理日志等工具对处理过程进行审核，保障数据处理的完成度。

数据分类管理

　　这些问题说起来简单，但是做起来却是一件相当麻烦的事情。这要求企业拥有一套十分成熟的数据提取工具，用于数据转化、分类、标记以及其他任务。

　　而且不仅仅是企业关注这一问题，在Apache的Hadoop社区也有好多团队在致力于开发此类工具。事实上，此类工具更趋向于数据管理专业，这些对于企业来讲并不熟悉。而好消息是，一些相关的生态链已经在Hadoop领域开始形成，相信解决数据湖管理难题的工具将在不久后出现。

上一页 1 2 本页阅读全文收藏

提示：支持键盘“← →”键翻页

关注企业中心微信公众号
微信号：ZOL企业

关注排行榜

产品品牌

1
浪潮CS5280H211.25万

商家数：52家评论数：0条立即购买
2
超聚变FusionServer 2288H V5￥12199

商家数：53家评论数：0条立即购买
3
华为Taishan 2280(鲲鹏920 5220*2/32GB/960GB*2固态)￥33000

商家数：39家评论数：0条立即购买
4
联想问天 WR3220 G2(Xeon Silver4310/32G/960G固态)￥18235

商家数：52家评论数：0条立即购买
5
戴尔易安信PowerEdge R750 机架式服务器（Xeon Gold 6330*2/32GB*2/900GB*2）￥62404

商家数：60家评论数：1条立即购买
6
H3C UniServer R4900 G5价格面议

商家数：46家评论数：0条立即购买
7
浪潮英信NF5280M6￥19399

商家数：55家评论数：1条立即购买
8
超聚变KUNLUN昆仑 2280(鲲鹏920 32核*2/64GB/4TB*3/双电)￥38000

商家数：44家评论数：0条立即购买
9
超聚变FusionServer 2288H V6价格面议

商家数：53家评论数：5条立即购买
10
浪潮CS5260H2（海光5380*2/256GB/960GB*2+16TB*3）￥77292

商家数：52家评论数：0条立即购买

<li class=" top  current ">
        								<em class="num">1</em>
        								<div class="hd"><a href="//detail.zol.com.cn/server/inspur/">浪潮</a><span class="hd-info">共397款</span></div>
        								<div class="info-box">
        									<a href="//detail.zol.com.cn/server/inspur/" class="pic"><img src="https://2d.zol-img.com.cn/manu_photo/20.jpg" alt="浪潮" title="浪潮" width="160" height="80"></a>
        								</div>
        							</li><li class=" top ">
        								<em class="num">2</em>
        								<div class="hd"><a href="//detail.zol.com.cn/server/lenovo/">联想</a><span class="hd-info">共1318款</span></div>
        								<div class="info-box">
        									<a href="//detail.zol.com.cn/server/lenovo/" class="pic"><img src="https://2d.zol-img.com.cn/manu_photo/160.png" alt="联想" title="联想" width="160" height="80"></a>
        								</div>
        							</li><li class=" top ">
        								<em class="num">3</em>
        								<div class="hd"><a href="//detail.zol.com.cn/server/huawei/">华为</a><span class="hd-info">共180款</span></div>
        								<div class="info-box">
        									<a href="//detail.zol.com.cn/server/huawei/" class="pic"><img src="https://2d.zol-img.com.cn/manu_photo/613.png" alt="华为" title="华为" width="160" height="80"></a>
        								</div>
        							</li><li class="">
        								<em class="num">4</em>
        								<div class="hd"><a href="//detail.zol.com.cn/server/chaojubian/">超聚变</a><span class="hd-info">共43款</span></div>
        								<div class="info-box">
        									<a href="//detail.zol.com.cn/server/chaojubian/" class="pic"><img src="https://2d.zol-img.com.cn/manu_photo/58207.jpg" alt="超聚变" title="超聚变" width="160" height="80"></a>
        								</div>
        							</li><li class="">
        								<em class="num">5</em>
        								<div class="hd"><a href="//detail.zol.com.cn/server/h3c/">H3C</a><span class="hd-info">共119款</span></div>
        								<div class="info-box">
        									<a href="//detail.zol.com.cn/server/h3c/" class="pic"><img src="https://2d.zol-img.com.cn/manu_photo/1818.jpg" alt="H3C" title="H3C" width="160" height="80"></a>
        								</div>
        							</li><li class="">
        								<em class="num">6</em>
        								<div class="hd"><a href="//detail.zol.com.cn/server/dell/">戴尔</a><span class="hd-info">共411款</span></div>
        								<div class="info-box">
        									<a href="//detail.zol.com.cn/server/dell/" class="pic"><img src="https://2d.zol-img.com.cn/manu_photo/21.jpg" alt="戴尔" title="戴尔" width="160" height="80"></a>
        								</div>
        							</li><li class="">
        								<em class="num">7</em>
        								<div class="hd"><a href="//detail.zol.com.cn/server/suma/">中科可控</a><span class="hd-info">共67款</span></div>
        								<div class="info-box">
        									<a href="//detail.zol.com.cn/server/suma/" class="pic"><img src="https://2d.zol-img.com.cn/manu_photo/56921.jpg" alt="中科可控" title="中科可控" width="160" height="80"></a>
        								</div>
        							</li><li class="">
        								<em class="num">8</em>
        								<div class="hd"><a href="//detail.zol.com.cn/server/thinkserver/">ThinkServer</a><span class="hd-info">共469款</span></div>
        								<div class="info-box">
        									<a href="//detail.zol.com.cn/server/thinkserver/" class="pic"><img src="https://2d.zol-img.com.cn/manu_photo/34895.jpg" alt="ThinkServer" title="ThinkServer" width="160" height="80"></a>
        								</div>
        							</li><li class="">
        								<em class="num">9</em>
        								<div class="hd"><a href="//detail.zol.com.cn/server/hp/">惠普</a><span class="hd-info">共194款</span></div>
        								<div class="info-box">
        									<a href="//detail.zol.com.cn/server/hp/" class="pic"><img src="https://2d.zol-img.com.cn/manu_photo/223.jpg" alt="惠普" title="惠普" width="160" height="80"></a>
        								</div>
        							</li><li class="">
        								<em class="num">10</em>
        								<div class="hd"><a href="//detail.zol.com.cn/server/sugon/">中科曙光</a><span class="hd-info">共74款</span></div>
        								<div class="info-box">
        									<a href="//detail.zol.com.cn/server/sugon/" class="pic"><img src="https://2d.zol-img.com.cn/manu_photo/1032.png" alt="中科曙光" title="中科曙光" width="160" height="80"></a>
        								</div>
        							</li>

文章推荐

最新文章相关文章

<li class="top">
						<em class="num">1</em>
						<div class="hd"><a href="//server.zol.com.cn/1037/10371211.html" target="_blank" alt="英特尔Gaudi 2E AI加速器为DeepSeek-V3.1提供加速支持">英特尔Gaudi 2E AI加速器为DeepSeek-V3.1提供加速支持</a></div>
					</li>
	                <li class="top">
						<em class="num">2</em>
						<div class="hd"><a href="//server.zol.com.cn/998/9986368.html" target="_blank" alt="全新Dell PowerProtect Data Domain All-Flash，助力企业实现卓越网络弹性">全新Dell PowerProtect Data Domain All-Flash，助力企业实现卓越网络弹性</a></div>
					</li>
	                <li class="top">
						<em class="num">3</em>
						<div class="hd"><a href="//server.zol.com.cn/1006/10062995.html" target="_blank" alt="台达参与第十六届“绿色发展 低碳生活”主题对话  获颁 2025 年度低碳案例">台达参与第十六届“绿色发展 低碳生活”主题对话  获颁 2025 年度低碳案例</a></div>
					</li>
	                <li class="">
						<em class="num">4</em>
						<div class="hd"><a href="//server.zol.com.cn/1064/10642137.html" target="_blank" alt="云端算力再进阶：英特尔至强处理器驱动阿里云实例创新">云端算力再进阶：英特尔至强处理器驱动阿里云实例创新</a></div>
					</li>
	                <li class="">
						<em class="num">5</em>
						<div class="hd"><a href="//server.zol.com.cn/1018/10181566.html" target="_blank" alt="戴尔科技数据分层策略，现代化存储的智胜之道">戴尔科技数据分层策略，现代化存储的智胜之道</a></div>
					</li>
	                <li class="">
						<em class="num">6</em>
						<div class="hd"><a href="//server.zol.com.cn/998/9985155.html" target="_blank" alt="超聚变TechX“数生智能，构建AI算存共同体”">超聚变TechX“数生智能，构建AI算存共同体”</a></div>
					</li>
	                <li class="">
						<em class="num">7</em>
						<div class="hd"><a href="//server.zol.com.cn/992/9923947.html" target="_blank" alt="星云智联智能网卡ASIC芯片点亮成功，筑牢数据中心互联技术基石！">星云智联智能网卡ASIC芯片点亮成功，筑牢数据中心互联技术基石！</a></div>
					</li>
	                <li class="">
						<em class="num">8</em>
						<div class="hd"><a href="//server.zol.com.cn/1022/10225560.html" target="_blank" alt="加速多行业AI应用！旭祥携多款AI服务器重磅亮相WAIC 2025">加速多行业AI应用！旭祥携多款AI服务器重磅亮相WAIC 2025</a></div>
					</li>
	                <li class="">
						<em class="num">9</em>
						<div class="hd"><a href="//server.zol.com.cn/1075/10755994.html" target="_blank" alt="思科推出全新统一边缘平台 赋能分布式代理型AI工作负载">思科推出全新统一边缘平台 赋能分布式代理型AI工作负载</a></div>
					</li>
	                <li class="">
						<em class="num">10</em>
						<div class="hd"><a href="//server.zol.com.cn/1064/10642137.html" target="_blank" alt="云端算力再进阶：英特尔至强处理器驱动阿里云实例创新">云端算力再进阶：英特尔至强处理器驱动阿里云实例创新</a></div>
					</li>

互动沙龙