案由:
大数据并不是新鲜的名词,大数据实际上是指某个现象所有可能表现结果的总和或集合,也就是总体。大数据可以是一维的,也可以是多维的,可以是政治、经济、社会或自然界等不同领域不同现象分类存在。随着信息技术的高速发展和互联网的广泛应用,大数据的存储、传播和计算已有了坚实的物质基础,人类每时每刻的经济社会活动、生产实践和科学研究等会带来各种各样的大数据,数据可以海量,但比起无限总体而言,人们在不同时期能够得到的大数据也只不过是个大样本,是总体的代表,是推断总体的可靠依据。广东是经济大省,人口过亿,是大数据产生最早最多的地方,大数据已是最热门的话题,但对大数据的概念和作用还很模糊,从大数据当前和长远的意义来看,大数据面临一些关键问题必须解决,否则,大数据积累越多越像垃圾堆放,会成为负担,难以产生本应产生的效应。存在的关键问题有:
一、缺乏统一的数据标准。由于政府对各行各业数据的标准缺乏统一的规定,部分领域虽有数据规定也未必规范,同一内容在不同领域不同层次可能有不同的定义,不同领域不同层次的单位采集数据只为一些短期任务或例行公事,导致数据碎片化、孤岛化,直接影响数据采集的质量,更不利于数据的关联与分析。
二、数据应用效率不高。数据采集和应用最多的部门是省市各级统计局,统计局的数据所涉及的领域和内容有限,只涉及经济社会部分现象的发生结果,没有最大可能的包含所有够采集到的信息,另一方面,只供逐级汇总,向各级政府提供简单的统计报表,很少有规律性的、及时性的数据分析,很难看到经济运行的明确规律,不能为单位及个人提供科学的定量的决策依据。至于其它部门,其它行业,数据的采集规范程度低,数据应用更少。
三、数据分析人才缺乏。数据标准的设计和数据分析需要既懂专业知识又具备统计学的复合人才,统计学是大数据设计、采集、分析各过程必备的知识,而我省目前高等教育里只有极少的专业包含统计课程,专门的统计专业招生人数也有限,统计教育严重落后于实践的需求,势必影响大数据的充分应用。
建议:
一、统一大数据标准。尽快由政府牵头,行业主导,设计统一的数据标准,各行业数据既可以独立采集作为数据子集,又可以根据分析需求把行业之间的数据兼容合并,体现数据的规范性和灵活性。
二、推广大数据应用。大数据汇总统计只是最初级的应用,应该着眼于分析大数据的发展变化规律,探索不同现象大数据之间的发展变化关系和规律,为人们各种活动提供定量的科学决策依据。
三、大力支持和发展统计教育。对我省高等教育和中等职业教育的各非统计学专业课程体系增加应用统计学课程,同时在各学校增加统计学专业教育,对社会专业人士进行统计学继续教育,以提高统计学应用技术,从而为大数据分析和应用培养需求意识和足够的技术保障。
提案人:张丕德