服务器
    作者:贾凯强

    动不起来的大数据都是发酵中的垃圾

         [ 中关村在线 原创 ] 暂无评论

      大数据的概念炒作一向厉害,很多公司有着海量的数据流,有着大把的客户和资金,技术也足以进行处理大数据,但是大数据之所以能够成功炒作上位,是因为其能动性,一切动不起来的大数据都是发酵中的垃圾。

    动不起来的大数据都是发酵中的垃圾

      动态数据采集以求真

      大数据在数据采集的环节常常忽略实际的数据采集环境问题。尽管在互联网环境中,采集环境很少受到大幅的波动影响,但是一旦涉及行业特征则很难保障。

      大数据在行业中应用时会受到协同性、跨尺度、多因素、因果性和机理性等影响,这就使得数据采集时必须入乡随俗,贴切真实的应用场景。而不是简单的从接触到数据采集点时的单一数据,这种数据对于全面分析事件形成原因存在着一定的误差导向因素。

      解决这一问题的办法在于行业应用中,针对某一业务目标可以动用整个企业甚至行业链中的相关资源协同助阵,将不同时间尺度的信息集成采集,参考多种可能造成数据改变的因素和产生原因,进行多层次的数据采集并且实现数据来源的真实性和丰富性。

    动不起来的大数据都是发酵中的垃圾
    数据采集需要全面

      同时,数据的采集不应当是阶段性的,而应该让采集的数据保持动态。一直以来大数据的分析过程都是一个冗长的过程,数据采集、管理、处理、存储、分析到应用的整个流程不仅漫长,而且很难做到实时处理,这样的一个结果就是数据库中的数据很容易被迫过气,导致分析偏差。

    提示:支持键盘“← →”键翻页
    本文导航

    周关注排行榜

    产品品牌

    文章推荐

    互动沙龙

    相关内容 网友评论 返回首页
    专家咨询