大数据已经成为当前媒体上最热门的信息技术词汇之一。
然而,对于何谓“大数据”,目前尚无一个统一的定义。如果将大数据比喻成一棵树,麦肯锡强调数据集,像是大数据深入地下的根;著名研究机构高德纳(Gartner)强调资产和增值,恰如大数据树上绽放的鲜艳花朵;牛津大学数据科学家、畅销书作家迈尔-舍恩伯格强调分析方法,可以应用于不同的情境,相当于大数据的枝干。
对于上海而言,大数据具有无限的魅力:它挺立于IT产业的高端,吸引着产业和资本的无数眼球;它枝藤蔓延,广泛应用于各行业的应用和创新,不经意间就掀起一场行业变革的风暴——对于正处在转型发展中的上海来说,它的到来适逢其时。
大数据和决策制定
上海是海量数据的信息枢纽,大数据对于上海要重点发展的先进制造业和现代服务业以及传统服务业与信息化的深度融合的先行先试,率先迈向智慧城市这一目标,与国内其他城市相比有着迥然不同的重大意义。
作为一项通用技术,大数据所影响的不是某个特定行业,而会波及所有行业。但在初期,对不同行业的影响存在差异。那些率先迈入数据密集型、基于知识创新、个性化要求高的行业,如金融、保险、医疗、零售、电信等有机会先行一步。
在后工业社会中,大数据并非孤军挺进,智能技术支持决策制定需要有相应的经济和社会环境支持,包括服务经济占主导(尤其信息服务业)、专业技术阶层的优越地位和理论知识的首要位置(反映在研发投入上)。
从上海这几方面的发展看,2011年第三产业占比达到60%,信息产业增加值(制造加服务)占GDP比重达9.9%;国有企事业单位专业技术人员占比为61.3%;全年用于研究与试验发展(R&D)经费支出占GDP比重达到3.16%。这些指标数据与全球同类城市如新加坡、香港等相比并不落后,为大数据的推广和应用奠定了基础。
借助于大数据辅助决策是后工业社会的典型特征,也是其基本要求。
作为特大型的国际都市,上海一直强调以创新驱动来解决诸多城市发展中面临的问题。但是创新驱动是个复杂的系统工程,需要借助科学理性的决策。而决策必须基于上海的现实,如市场竞争格局、辐射力,市民消费习惯、收入水平,人口统计、地理空间等,这些数据的总和构成上海发展可资利用的大数据。没有一个科学的、系统的数据分析方法,很多决策质量将很难真正上水平,而且可能蕴藏着巨大的误判风险。
大数据和IT产业升级
上海要走在全国的最前列,就必须抓住大数据发展的机遇,把握住大数据这一IT产业的关键。
从近年来国际大型IT企业的频频收购活动也可以察觉出大数据是IT产业的关键这一动向。
IBM在将一些硬件业务出售给像联想这样的公司的同时,也加大了对软件公司收购的力度,包括著名的智能软件Cognos和分析软件公司SPSS等。
谷歌收购了Measure Map统计分析程序、 深度搜索应用公司Tranformic、网站流量分析和统计公司Urchin等,都跟大数据直接相关。亚马逊、Facebook等公司也都在富有远见地布局大数据产业。
抓住大数据发展的机遇,上海不仅仅需要相应的智能化技术,还需要对行业或城市管理有深入的理解,它构成了整个IT产业链中知识最为密集的环节,占据着行业的高端。
在IT产业中,基于大数据的商业机会主要掌握在两类公司手中:一类是IBM、微软、惠普等公司提供“硬件+软件+数据”的整体解决方案,以平台性为特征,提供基础服务;另一类是以Facebook、亚马逊和谷歌等公司为代表,基于海量的用户信息,提供精准营销和个性化广告推介等活动。此外,新兴的创业公司通过出售数据和服务有针对性地提供单个解决方案,在特定行业和区域复制前两类公司的大数据服务模式。
从国内来看,上海IT产业在人才、技术研发、与国际接轨的信息通信基础设施等方面已经形成了一定的优势。电子信息产品制造业总产值和就业人数居上海六大支柱产业之首;信息服务业的产值在服务业中排名达到第五。但在这貌似光鲜的高科技产业背后,仍然存在产业链层次偏低的问题。IT业内程序员、维修、销售服务等工作被讥称为“IT民工”,其体力劳动量远大于脑力劳动量,处于这一产业链的低端。
从大数据的启用到最终价值的创造,是一连串的事件,需要观念的转变、大数据知识的传播、基础设施、人才、法律等基础条件。目前,这些构成了制约上海发展大数据产业的四大瓶颈。
观念瓶颈:根据Gartner的IT生命周期理论,目前正处于对于大数据认识的泡沫化阶段,需要有一个价值理性回归过程。作为决策层,既不要盲目跟风,更不要轻易否定其价值。这时候,尤其需要冷静下来思考:大数据的出现对于经济社会有何种影响,如何影响本行业,对此我们准备好了吗?当前制度与之适应性如何,需要进行何种变革和创新,甚至提交到立法层面来解决?在如何利用大数据方面,站在城市层面,是否可能形成一个战略规划,明确基础数据的良好治理机制,以保障数据的“流动性”和“可获取性”?政府可以为市场提供哪些服务和支撑,等等。从目前“小数据”的开发利用来看,上海仍存在较严重的数据“孤岛”现象,共享的观念还远没有普及,数据管理的制度仍需健全。面对大数据时代的新浪潮,形势不容乐观。
能力瓶颈:上海企业信息化水平参差不齐,很多大型企业如宝钢、电气集团等信息化应用相当成熟,管理水平在逐渐向国外一流公司看齐。但仍有相当比例企业,尤其是中小型企业信息化水平欠佳。据市经信委的调查,约70%的中小企业没有专职IT人员,管理仍停留在经验层面,拍脑袋决策的事情不在少数。这将很难培育出大数据的能力。虽然中国的技术方面也落于人后,但最大的障碍在于技术的应用和管理能力。上海必须重视提升企业信息化管理能力,夯实好基础。
法律瓶颈:在互联网环境下,哪些数据开发行为属于合理开发,仍缺乏一个相应的法律规定,对个人信息保护也无法可依。加之人为造成的信息不对称成为一些部门利益的重要来源,导致立法进程迟迟不能启动。相关法规缺位一个直接结果就是,信息服务产业发展出现了逆向激励:对于个人信息合理的开发受制种种约束,而信息滥用者借助于种种暗箱操作,反而逃避了监督。这种环境下,推动大数据这个金矿的开发,存在非常大的法律风险。
文化瓶颈:各类组织,包括企业、公共服务机构对大数据知识的了解和技术掌握,有个学习过程。从长远看,根本性障碍还在于对基于数据的决策抱怀疑态度的决策文化。这既与数据本身质量不高有关,也与人们认识世界的方式分不开。反映到决策上,往往更加相信直觉,而不重视数字。尽管上海具有相对开明睿智的城市文化,但决策的科学性和透明性方面仍有改善的空间。
推进措施和建议
上海是中国经济、贸易、金融、航运等领域海量数据的集散地,具备得天独厚的大数据优势。在推动大数据发展问题上,上海可以大有作为,这体现在路径选择、环境营造、基本保障等三个维度。
从路径选择看,可以将从上而下和从下而上两种方式结合。
从下而上,强调以小型应用和微创新为突破口,撬动大数据的发展。上海可以从应用端出发,以小型应用和微创新为突破口,引爆行业的大数据发展。如可以鼓励医院、教育等公共服务部门、现有金融保险、航运企业、大型制造企业、零售等数据量丰富的行业龙头企业,以大数据为纽带,各自开展微创新,激活整个产业链的创新能力。微创新的作用在于不断尝试和改进,找到一个更好的服务模式,进一步激发大的创新。如能基于高质量的大数据分析,创新效果会更好,成本会更低。同时随着应用的深入,自然而然对其他部门数据提出共享需求,最终有助于不同部门之间数据的共享。
从环境营造上,上海可以从内外部两方面着力,推进大数据的发展。
从内部看,上海应着重激发基于大数据的创业创新精神。大数据产业链主要是一些国际大数据公司所主导,目前上海没有可以与之相匹敌的企业,只能依赖于细分市场和特定环节的突破,激发出中小型创业型企业的创新精神,培育一批基于数据的决策的创新型企业及中小型创业型企业,通过市场竞争拼出一条血路。
从外部看,主要还是通过筑巢引凤构建大数据产业链高地。上海享有地域、技术、人才、市场、行政效率和透明度高等多种优势,IT产业集群优势也非常明显,借此可广泛吸引国内外企业将大数据行业分析中心设在上海,就地应用和试点,作为上海战略性新兴产业和现代服务业发展的重点支持对象。
保障机制方面,主要涉及立法突破、人才培育和决策文化等三方面。
其中,在大数据立法上有所突破,是关键一环。大数据立法并不是孤立的,而是应放在计算机和互联网信息安全和保护这一大的框架下,在地方层面,灵活借鉴各先进国家和城市经验,规定对信息利用的合理边界,保护个人信息不被滥用。另外,根据迈尔-舍恩伯格的建议,大数据年代记忆已经成为一种常态,为了对公民隐私进行保护,应该有一种遗忘机制。而这一机制类似于档案的销毁,也应有法有依,否则后果会很严重。
同时,人才是技术研发和市场应用的基础。据麦肯锡的估计,仅在美国,大数据技术人才缺口达14万-19万,管理人才150万。上海应开始重视对大数据专业人才的培育,还要意识到国际性人才争夺战的激烈性,既要培育出人才,更要留得住人才。最直接相关的专业有两大类:第一类是大数据技术研发人才,主要为计算机科学和技术专业;第二类是数据分析和管理人才,主要包括信息系统和信息管理专业、数理统计专业等。
最后,还要倡导基于大数据的决策文化。近年来,上海在努力建设智慧城市中已经应用了大数据的理念,但仍存在一些凭经验和直觉决策的区域。大数据的决策本质特征是公开透明和科学理性,这可以改进政府与民众的互信,倡导这一决策文化可以有效改变公信力不足的不利局面,深化上海服务型政府建设。
(作者赵付春系上海社会科学院信息所副研究员、博士)
来源:《东方早报》 2103年6月4日 上海经济评论3