主题:【原创】大数据与郑国渠 -- zw
大数据与死数据
为什么,在得知贵州还开办了大数据交易中心,也许是全球第一个
会觉得无比别扭??
连续发布了blog《大数据与郑国渠》、《大数据与黑天鹅》...
在blog中,笔者曾经提到:
积累的数据,一个连pm2.5、耕地面积,都是国家机密的政府,再多的数据,缺乏流动与共享,也是死数据,有意义吗?
4月30日,一周后,黑天鹅又一次出现:《中国科学家难以获取高质量的国内数据科学》
大数据是互联网、后资讯时代的产物。
而互联网的核心只有两个字:free(免费)+open(开放)
纽约的大学生,利用市政府的开放数据库,可以轻松制作出全市的犯罪热点分布图
而我们,就连专业科学家,都无法获得一手的数据,更何况商业应用了、BI开发。
也许,贵州的大数据交易中心,改为免费的、开源的数据共享中心,能够有一个华丽转身。
国内政府强推大数据,提升为国家战略的另外两个“潜在”考虑,可能是:
::基于大数据、信息科技的新型“计划经济”,个人对经济不熟悉,但直觉上觉得不靠谱,至少目前没看到有这方面的理论体系,而成熟的理论体系,是项目成功的基本要素。
有了成熟的理论体系,未必一定成功,没有,绝对是失败
::建立类似1984的社会管理体系,这个更加不靠谱,网络危机公关的经典手法就是,采用大量的关联信息,淹没负面新闻。
一组(10台)电脑,每天可以发布上亿条信息(包括填写验证码),可以模拟千万级的用户数据。
大数据的通道是互联网,数据、信息是一次性消费产品,可以零成本传播、复制,互联网的核心只有两个字:free(免费)+open(开放)
积累的数据,一个连pm2.5、耕地面积,都是国家机密的政府,再多的数据,缺乏流动与共享,也是死数据,有意义吗?
http://www.solidot.org/story?sid=43883
上海海事大学的Zheng Wan在《自然》上发表文章称,中国科学家越来越难以获得高质量的国内数据,认为这一情况可能阻碍科研和创新。他说,大部分公共数据被政府部门控制,其中一些加强了对数据的垄断,使得中国研究人员难以获取这些数据。人文科学的研究人员受影响最大,但数据访问的限制正扩大到环境科学和公共健康等领域,原因是数据具有政治敏感性。即使数据公开了,其质量也令人担忧,最明显的一个例子是全国的GDP数据和各省公布的GDP数据之间存在显著差距,国家统计局称数据差异是数据收集方法的不同导致的。在文章最后,Zheng Wan谈论了互联网审查,称Google学术搜索被屏蔽对他的工作影响非常大。
- 相关回复 上下关系8
🙂百度只喜欢做表面功夫 1 zw 字566 2015-06-07 07:34:21
🙂5分钟教你怎样使用OpenCV写程序 乔治·奥威尔 字290 2015-06-08 03:40:49
🙂会调用opencv,不等于明白算法原理 2 zw 字469 2015-06-08 03:58:10
🙂大数据与死数据
🙂大数据是核武器 1 乔治·奥威尔 字120 2015-04-29 21:54:45
🙂大数据有个关键词,叫实时 zw 字147 2015-04-30 04:12:51
🙂总体上支持,某些观点不太赞成。 3 随性自在 字1780 2015-04-22 02:33:06
🙂这个标准并非高不可攀 zw 字587 2015-04-22 19:17:12