如何丰富数据?把你的数据和世界其他地方的数据连接起来,如果你的传感器、你的网站、你的智能手机上接收了数据的话,首先你要保证它是清洁的、准确的。然后你会发现一些附加数据,与你所要分析的相关数据,你可以把自己的数据和Web数据整合起来,从中得到洞察。
连接数据集市产生更多价值
如果你是从事销售行业,有一些地区客户希望看到自己的业绩表现如何,但是这不仅仅关乎自己的销售业绩,还需要看自己公司内部同事的业务如何,你自己做得比他们好还是比他们差;或许你还需要看一下其他的公司,其中有一些是你的竞争对手、有一些是你的合作伙伴,他们做的如何?你比他们做的好还是差?有什么不同点;或许你还想看一些全世界的数据,全世界是加速还是放缓、软着陆还是硬着陆?这对于你将会产生什么影响?实际上,我们需要端到端的数据,这些才会得到洞察,创造价值。
数据集市。在Windows Azure上有一个数据集市,这是一个非常与众不同的概念。数据集市意味着什么呢?如果你是一家公司,如果你是Forrester Research,或者是咨询事务所,或者是制造商,或许你有一些对于其他公司非常有意义的价值,将你称之为一个内容提供方,可以把这些数据放到微软数据集市上为其他公司所用,无论是免费还是你自己定下的价格,它取决于应用模式和价值。还有开发商,如果他们希望用这些数据的话,可以在Windows Azure平台上定制这些数据,并且应用数据。现在我们在Windows Azure上有几千的数据提供商,联合国数据、世界银行,甚至一些中国的内容提供商,这是微软平台一个与众不同的特征,数据集市是一个多赢的结构,无论是对于开发商还是从事信息的各个方面来说。
对任何种类、任何大小、任何来源数据的洞察力。对每一个数据提供洞察力,不仅对CTO、CIO、CEO提供洞察力,不管他们在哪里、不管他们用的是什么设备,这都是我们平台独特创造的一个地方。可能现在还有很多人不太记得二十年前E-mail,在大学教授中才有E-mail,而学生中是没有E-mail的。现在商业智能也只是在最高层中的领导中才有使用,不可能在任何一个组织的员工中都有这样的工具,也不可以每天都应用。我们也希望他们能够在所有的数据中提供这样的洞察力,不管是关系型的,还是非关系型的,还有流线型的。事实上,还有很多这样的数据融入到这个平台中,这也成为我们这个平台重要的组成部分之一。
孙博凯:现在还有一些新的工作机会也因为大数据而产生出来,现在在IT行业当中,我们有数据科学家,在北京有很多这样的工作岗位正在招聘人员。所以说,我们必须要为各种终端用户提供合适的工具,他们并不是科技人员,他们只是商业情报的分析人员,我们也需要给他们提供这样的工具,我们也需要为数据科学家提供这样的数据。
通过熟悉的工具,为所有用户提供对数据的洞察力。
当你谈到这些不同的人员,数据科学家可能有博士的学位,他们对数据科技有很深的了解,他们能够分析很多这样的数据,并且利用这样的工具来分析数据。微软也与很多的工具提供商进行合作,来让数据科学家能够在世界的其他地方运用其他的平台进行工作。
商业智能专业人员,我之前也与这样的人员进行工作过,但是他们都还是希望有更加互动的工具,使他们能够对数据进行切割,能够更加实时地对数据有更深入的了解。他们可能不一定像数据科学家那样处理数据那么大,但是他们处理的数据也是具有相当大容量的,并且他们希望以实时的方法进行分析。
还有一些业务分析人员,还有一些商业分析人员,他们也是处理数据,希望Powerpiovot来分析数据。Powerpiovot是为商业人员提供一种分析,人们可以分析汽车的数据,他们有汽车、销售,根据季度进行分析,这是完全根据网络进行分析的数据,它是非常互动并且流畅的工具。(播放视频)这是为商业人员提供的平台,可以看到不同的车型,有紧凑型,有SUV,在底部有商业分析人员正在给大家展示销售额,并且为不同类型的车进行分析,它可以改变容量并且进行分析。我们给用户提供的体验是独一无二的,并且是为这些商业智能人员。chart中有很多的模式,比如你想看第三季度,你就点击一下,这是非常实时的,然后数据就会进行实时的改变。现在正在给大家展示一个不同的图表,下面的数据是市场销售额,在上面我们可以看到每一个数据所对应的油价,可以看到油价不断上涨或者下跌的时候,不同车型的销售额也就会随之上涨或者下跌。
所以,之前我也说过,这并不是你自己的数据,而是将你的数据与世界相连,如果油价上涨的话,在三个月之后新能源车的价格就会上升,这都是你能够在几分钟之内得到的数据,这是非常互动的数据。希望大家能够了解我们所提供这样工具的原因,因为在最终是关于数据它的容量、它的大小与其他数据相互的连接。