您当前的位置:首页 > 新闻资讯 > 最新要闻

杜平:八类数据可产生真正的大数据价值

时间:2015-11-10 11:28:30  来源:人民网  作者:
        五中全会谈到的信息化创新发展的工作,看起来着墨不多,但是实际上对于我们国际国内的经验做了总结。下一步要贯彻落实好。 
  拓展网络经济空间这里面有一个实施国家大数据战略,形成信息资源开放共享。在创新宏观调控方式里面提到一句话:运用大数据技术,提高经济运行,信息及时性和准确性。这两点的交集是大数据的概念。大数据这几年在社会上已经引起很多的关注,而且在实践上有很多的时效性已经显示出来,不像早些年大家还在讨论这个概念,还在考虑它是否可以在中国这片土地上茁壮成长。现在看起来,它已经是现实。就我自己所从事的工作来讲,我觉得有三个问题我们要关注。
  第一,大数据的发展没有基础设施无法实现,我们没有新的数据库技术,没有云计算这样一些东西也谈不上。所以,基础设施,可能很多地方容易走弯路,大家都认为,既然搞这个,我们都要建IDC,前几年搞智慧城市、搞数据库中间,基本上各地都想抢这班车。我想对于基础设施,我们可能现在要考虑一个新的路径和思路,就是创新。可能是共建共享共买服务,或者向第三方购买服务,用云的方法或用公有云来解决。 
  第二,我觉得最重要的可能是数据源,数据源及获取的方式问题如果不解决,我们会走很长一段时间的弯路。我觉得数据源可能有八类,每一类都不一样。 
  第一类,政府信息,部门之间是共享的问题。这个我们采取的办法现在是通过建立一些综合联动数据交换平台,这两年来,国务院也有明确要求,建一些公共的数据交换平台,要求打通部门之间的信息孤岛,要求上下可以联动。 
  第二类就是政府公共数据公开,无论是政府机构,或者准政府机构,包括我们一些科研院所、大学,或者我们执行国有公共职能,他们形成的公共资源,这个可能是要依法依规,脱敏解密以后要公开,而且要采取基本免费的方式。 
  第三类应该是商务数据,这个现在比较活跃的,商务数据比较多,这个可以考虑有价转让、同质交换、协议共享等等。因为毕竟商务数据是在商务生产者过程中间形成的,有成本进去,不是政府的投资。 
  第四类就是互联网数据,这个我们比较熟悉,现在做的最热闹的可能就是这个,各种各样的舆情分析都是基于互联网数据,因为它是公开的。我们现在真正推动的大数据的使用,就是运用互联网,大量的互联网数据,形成了不同的算法,最后形成不同的产品。 
  第五类是通讯数据。无论是包括移动电话,包括微信等等,这种数据可能需要加密获取,运用的时候脱敏。路径都可以研究。 
  第六类是空间地理数据,我们自己承担国家空间地理信息库的建设中间发现,应该分类,基础信息的公开,专业化的信息可以采取协议获取的方式,或者如果你要做加工增值,还可以做个成本,可以去出售。 
  第七类是物联网数据,现在越来越多的,无论是工业数据,包括智能家电、智能交感,凡是通过传感器形成的,我觉得这种数据也是要分一下类,一类是政府公共的,通过公共监测获取的数据可能也要公开,如果不是,是企业家、企业自己形成的,通过平台上形成的,可能这种数据我们还得去购买,或者通过协议。 
  第八类是金融数据,目前采取的是征信体系里面,做信用评级的采取的是准入获取。使用上是受到限制的,叫应用受限。 
  这些数据可以产生真正大数据价值的,不是统计,被统计的我个人理解不叫大数据。大数据是没有被统计过的,我们值得研究一下这个事情。 
  第三个大的问题是大数据的挖掘,我觉得这个我不再说了,今天在座的很多企业家可能都会谈到这个,现在的技术是非常多样化,就是投入产出问题,就是怎么样根据需求来打包,形成最好的产品,通过营销出去,这个完全是一个市场竞争。但是,在市场竞争里面应该也有规则,我觉得还要相应建立一套规则,建立一套标准体系,如果实现共享的话,这个接口、标准不要五花八门,也对我们的监管部门,比如说我们网信办对数据的监管也要考虑一下统一的标准,也好监管。当然,大数据挖掘的产生应该是使用者付费。
 
栏目更新
栏目热门

关于我们 | 联系我们 | 版权声明 | 广告服务