美国在2009年就已经建立了官方公共数据资源分享平台Data.gov,推动大数据平台的建设,至今已全面开放了40万美国联邦政府原始数据文件,涵盖了联邦政府所有行政部门在运营管理过程中采集、生产或转换而来的各类非保密数据,涉及农业、气象、金融、就业、人口统计、交通、等近五十个分类,有效改善了全社会对联邦政府相关数据资料的收集与利用,促进政府效能的提高。该平台为美国2012年全面启动“大数据的研究和发展计划”提供了重要支撑,成为政府施政的主要工具之一。
我国不少地方政府也开始重视大数据的运用,搭建大数据服务平台,在数据的公开、共享方面进行尝试和探索。广东省2012年12月在全国率先启动大数据战略,起草《广东省实施大数据战略工作方案》,准备在财政、环保、招投标等领域率先开展数据公开试点,通过互联网等形式开放数据;上海市发布《上海推进大数据研究与发展三年行动计划(2013-2015年)》,将重点选取医疗卫生、食品安全、终身教育、智慧交通、公共安全、科技服务等具有大数据基础的领域,建设大数据公共服务平台,促进大数据技术成果惠及民众。
因此,尽早布局意味着抓住发展先机,大数据平台建设将对未来我省经济社会发展产生全局性影响。
浙江省公共政策研究院副院长蔡宁等认为我省搭建大数据平台的现实问题不应仅在于平台建设的本身,更应注重支撑平台运行的数据应用和智力支持,具体现实条件与问题罗列如下:
1.平台建设的整体架构问题
搭建大数据平台,旨在加速提升对相关数据的利用程度和运用能力,全面提高政府决策的科学性和精准性,提高政府管理水平。这需要将大数据平台建设作为省级战略的重要组成部分。
2.平台数据的来源问题
我省政府各个部门都拥有自己的数据库,储存了大量原始数据,也都建了网站,公开了一些公共数据。但海量数据分布在各个职能部门,并没有汇集一起形成数据池以挖掘它的潜在应用价值。还有一些部门将数据作为部门的私有财产,也有基于安全、隐私等各种因素的考虑,不愿将自己拥有的数据公开、共享。由此,各部门的数据集成了封闭的“信息孤岛”,数据开放、共享、整合和运用程度低下。如何让各部门的数据更开放、更透明,以平台为载体高度汇聚,形成大规模数据集,是我省大数据平台建设亟待解决的问题之一。
3.数据的挖掘与应用问题。
当前言论、图表、图片、视频等半结构化或非结构化数据越来越丰富,增长速度也越来越快,传统的结构化数据分析方法已无法适应处理庞大且形式多样的数据信息需求。大数据分析对于各部门的数据分析能力提出了全新的要求。此外,如何突破各部门在数据分析上各自为政的局限,满足大数据应用所要求的跨部门、跨行业的联合分析也是不能回避的问题。
4.大数据应用的人才支撑。
人才是开展大数据挖掘的战略性资源和关键性因素。大数据分析需要具有数学、统计学和计算机编程等知识背景的综合性人才。缺乏高水平的大数据研究机构,复合型的数据分析人才相对匮乏,整个行业人才发展不平衡,是我省大数据平台建设与高效运行的又一大障碍。
对此,蔡宁教授等为进一步推动关于我省大数据平台建设的进程,通过结合国内外先进经验,提出以下3点对策建议:
1.加强宏观规划,做好平台建设的顶层设计
大数据平台建设应借鉴美国和广东省的经验,建议尽早落实有关责任部门牵头进行专项研究,通盘考虑我省大数据平台建设与大数据应用发展问题,做好宏观规划,加强组织建设和制度设计,明确具体抓总部门,制定详尽建设方案,引导和推动各部门、各行业参与到大数据平台的建设和应用中来。
2.突破观念鸿沟,推动数据公开和共享
大数据的根本红利来源于“开放和共享数据”。只有突破观念鸿沟,增强共享意识,才能让数据这种生产要素自由流动,为数据挖掘及利用奠定基础。建议省政府打破部门壁垒,建立跨部门、跨领域的数据协同开放机制,抓取、汇聚各职能部门所有非涉密、碎片化的公共数据,以平台为载体向社会各界全面开放数据,促使数据资源横向和纵向共享,实现“孤岛”数据高效互联互通。
3.鼓励第三方机构和社会力量进行数据挖掘与分析
大数据在应用中才能体现价值。建议首先在由我省统计部门牵头,整合、组建大数据研究机构,全面开展大数据研究的同时,鼓励高校、科研机构、社会组织和企业利用大数据平台中的数据资源开展数据挖掘与分析,依托社会力量开发高质量数据应用工具,充分激活大数据潜在价值。其次,鼓励多部门数据联合分析,发挥数据集规模效应和溢出效应,为基于跨部门因素考虑的综合决策提供参考,真正实现“数据决策”。同时,加强数据挖掘和分析人才队伍建设,在高校内专门开设大数据研究和应用的相关课程,培养下一代的“数据科学家”。