——维克托·迈尔·舍恩伯格《大数据时代》导读我们生活在社会中,就不得不同数据打交道。
我们也是数据的一部分,不论我们想不想与大数据牵扯到一起,数据都会找到我们,覆盖我们。
大数据时代已经来临,如何从海量数据中发现知识,寻找隐藏在大数据中的模式、趋势和相关性,揭示社会现象与社会发展规律,以及可能的商业应用前景,值得我们深思。
作者简介······················《大数据时代》的作者维克托·迈尔·舍恩伯格,被誉为“大数据商业应用第一人”。他是十余年潜心研究数据科学的技术权威,是最早洞见大数据时代发展趋势的数据科学家之一,也是最受人尊敬的权威发言人之一。他曾先后任教于世界最著名的几大互联网研究学府,现任牛津大学网络学院互联网治理与监管专业教授。他的学术成果斐然,有一百多篇论文公开发表在《科学》《自然》等著名学术期刊上,他同时也是哈佛大学出版社、麻省理工出版社、通信政策期刊、美国社会学期刊等多家出版机构的特约评论员。他是备受众多世界知名企业信赖的信息权威与顾问。他的咨询客户包括微软、惠普和IBM 等全球顶级企业,由他的公司开发的病毒通用程序,成为当时奥地利最畅销的软件产品。
1991 年,舍恩伯格跻身奥地利软件企业家前5 名之列,2000 年被评为奥地利萨尔斯堡州的年度人物。所著《大数据时代》一书是开国外大数据系统研究的先河之作,而在这之前,他已经在《经济学人》上和数据编辑肯尼斯·尼尔- 库克耶一起,发表了长达14 页的大数据专题文章,这篇文章也成为最早洞见大数据时代趋势的文章之一。
写作背景
《大数据时代》这本书之所以面世,除了因为作者本身是大数据研究的先锋外,还因为传统的小数据思维已经不再适合当时的社会与生产力发展,经济的快速发展决定了对大数据的研究成为必然,同时,大数据的发展也会改变我们的思维与生活。就像维克托·迈尔·舍恩伯格在书中前瞻性地指出的一样,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型。
内容解读
下面来大概介绍一下本书的内容。首先说明什么是大数据。作者提出了大数据三原则:第一,大数据它不是随机样本,而是全体数据;第二,大数据不是精确性的,而是混杂性的;第三,大数据彼此不是因果关系,而是相关关系。
第一,什么是“不是随机样本,而是全体数据”?以往我们做一个大规模的统计,一般都是通过随机的方式。打个比方,我们小时候做的统计题会这么问:小明从一个池塘里随机捞了200 条鱼,把这200 条鱼全部做上标记后放回到了池塘里,过了两天小明又随机捞上来200 条鱼,结果发现这200 条鱼里只有2 条有标记。请问,这个池塘里大约一共有几条鱼呢?
答案很简单,200 乘200 除2,那么可以证明这个池塘里边有2 万条鱼,这个就是我们以往所使用的随机的调查方法。
在哪儿?首先,我们想把一个调查做到绝对随机是做不到的。此外,它的随机性究竟做得怎么样,没法验算。其次,随机误差就算再小,哪怕0.1%,对于一些研究也是致命的,比如研究房子会不会塌,需要的是百分之百的数据而非有误差的数据。最后,随机性调查是无法深入信息的,比如选举,我们可以说,有多少女性支持谁,有多少纽约人是支持这个,我们只能大概做到这么一个粗糙的范围了。再往下做,除非专门设计问卷。但如果去做一个大的问卷,把分门别类做得太细的话,就涉及一个很大的问题,就是随机性没了。没有了随机性,调查数据也就不准确了。所以这是一个悖论,我们在数据调查过程中,很容易出现无法细分的问题,因此我们无法深入数据本身。应该说随机性数据它只提供一张模糊的照片,要想细看非常困难。
大数据就排斥了这种方式,采用的是全体数据。书中有一个案例,就是美国两个计算机达人,通过十一年努力,分析了日本相扑比赛6.4 万场,发现了一个惊天的秘密——相扑比赛有人在暗中操纵。日本大相扑影响很大,而且这个行业很封闭,都是师傅带徒弟,所以即使出现了腐败案件,别人一般人很难插手。而且这些人都很聪明,通过数据看,关键场次胜负是很正常的,大概也就是五五开。可是一些边缘场次就不一样,譬如说一个人应该一年打15 场比赛,前14 场他是7 胜7 负。另一个人前14 场是8胜6 负,这两个人比结果会如何?如果7 胜8 负,那可能他就要被淘汰,可能他就不能在这个大联盟中生存了。那么另一个人已经8 胜6 负了,所以他输了也无所谓。所以在这种情况下,往往就是7 胜7 负那个人获胜。
可能很多人就说,这个7 胜7 负那个人他有动力呀,他一定要赢啊,不赢明年他就没法参加大联赛了,只能参加低级联赛了,所以他要拼呢,这样他自然就胜率高一些。但是这个胜率能有多高啊?按这两个数据达人计算,即使双方斗志不一样,那么胜率的差距也不应该超过25%,这都是统计出来的。事实证明,双方这个差距很大,所以这样就揭出了一个惊天的秘密,导致整个日本相扑界发生了“大地震”,很多人引咎辞职。日本和美国隔着太平洋,这两个研究者也不懂相扑比赛,也没有实际去调查。只是通过数据分析,就证明了中间存在着黑幕,这个就是全数据的力量。
谷歌翻译。IBM 做机器翻译做了将近10 年,累计了300 万句英语,可是没做成,最后不得不放弃了,因为太难了,由于语言有双关性,因此一个词不放到具体语境中就搞不懂。怎么去理解这个具体的语境,机器的智力是做不到的。谷歌采取了一个非常简单的方式,就是大量地提供语料,总共大概有950 亿句。这是由网友提供的,每天大家都在问,其实你输入一个英文单词翻译成中文经常是不准确的,你很不满意,但是大家不断地把这些意见汇集起来,这个规则都是自动修改的。打一个最简单的比方,如果50% 的人不满意,那所有的这个规则就算错的,如果说超过50% 的人满意,那么这个规则就保存下来。因为积累了950 亿句英语的句子,所以谷歌翻译在今天为止比我们已知的任何一个翻译软件都更准确,虽然它不是完全正确,但是已经做到我们能做到的极致了。这个就证明了精确性并不重要,混杂性才重要。
第三,什么是“不是因果关系,而是相关关系”?我们一般说的要有规律有逻辑性,其实这个就是所谓的因果关系。相关性则不需要逻辑,譬如说吃泡菜可能会引发胃癌,到目前为止没有原理解释,也没有充分的证明,但是可以通过一些数据来证明,吃泡菜的人中间可能有60% 的人得了胃癌,那么不吃泡菜的人可能只有40%,通过对比得出结论:吃泡菜可能致癌,这就是所谓的相关性。相关性到目前为止很难用因果去解释,但它可能暗含某种因果关系。有一个案例,亚马逊刚开始创业的时候,为了推销书,组织了20 个书评人,天天写书评,可是20 个人能写多少?而且这个成本也太高了。所以亚马逊后来干脆看哪个书点击率高,直接按点击率来做推荐榜,而不再依靠书评人。书评人很不高兴,觉得这能够判断准确吗?
这个就被称为“人和鼠标的战争”。那么事实证明,鼠标赢了。自从亚马逊采取了这种方法以后,销量增加了100 倍,其中1/3 来自读者推荐系统。
我们过去希望一些专家提供专业意见,在这个时代,因为成本太高就没有价值了。
数据本身可能比规律还重要。提出这个观点的是达尔文的表弟高尔顿。
高尔顿是人类学家,他最早提出通过人的头骨大小就能判断他是优秀民族的身高和我们前臂长度有关。为什么会这样?他也解释不了,所以很长时间,大家认为这就是个笑话。可是我们如果从统计的角度看,就会发觉高尔顿这个说法是正确的,所以我们要明白,因果关系往往表现了一个人的洞察力,表现了一个人的智慧,这是人类理性的一个最高点,但是,因果关系是我们在数据不够的情况下,依据少量数据而形成的一种认知,这种认知正确不正确要通过实践反复去证明,这个就需要很多的钱,时间和精力。所以我们说,用因果的角度去思维问题,也容易给人类带来一种误导。
作者不仅向我们介绍了什么是大数据,还详细阐述了大数据时代会带来的好处与弊端,来告诉我们该以怎样的态度面对大数据时代的到来。
我们了解大数据,最重要的意义是帮助我们建立大数据思维。在今天社会中,可能大数据思维比大数据本身更有价值。比如Facebook,通过近10 亿用户每天发出的几亿条微博,把人们的想法、情绪、沟通等数据化。
大数据还有很多很多的优势,比如说我们在大数据时代可以通过数据创新来给自己创造经济利益。
大数据时代还可能会对我们的生活产生更多消极的影响,比如说我们今天活在一个摄像头时代。到处都是摄像头,奥威尔在《一九八四》那本小说中,就说我们是活在一个被监视的社会中。
人类因为有了大数据,就可以预测犯罪。譬如说这个罪犯已经关在监狱了,刑满该释放了。于是有人就发明了一套大数据,通过罪犯在监狱的表现、生活等来预测他会不会再犯罪。这个数据最后证明,75% 是准确的。
可这就涉及一个问题,还有25% 不准确啊。如果说这个罪犯刑满了但被预测还有再犯罪的可能,然后就被继续关着了,那肯定不公平,毕竟人家没犯罪啊。
此外,大数据时代意味着个人隐私丧失,我们说大数据,绝大多数还是数据大亨把握着。如果国家没有一个法律,没有一个文化鼓励,特别是政府如果还没有带头做好数据开放的话,那么各公司也不做好。如果他们把握了一些大数据,把握了人们的隐私,就会给你添加无穷的麻烦,比如你到中介租房,那么就会有无数租房中介给你打电话,因为它把你这个数社会的博弈,只有好的社会、好的社会规则才能使大数据时代真正落实,让它变得好处大于害处。那么如何去进行博弈呢?本书的作者认为,个人可以适当放弃一点隐私权,只要这个大数据给我们带来的益处更多就行。
但是要防止它的坏处,只靠立法与规则是行不通的,它最终需要一个社会结构性的力量,比如说文化是否健康,是否存在着一个权力制衡的良好运行的体系等。只有这些体系是存在的,我们才可能更好地适应大数据的时代,才能更好激发出大数据时代给我们人类创造的机会。
评价与心得
读完本书我认为最有价值的一点,就是它提出一个很重要的问题——我们很多人是无法收集到大数据的,那么在大数据时代,我们是不是只是看客?其实不是的。因为大数据公司分三种,一种是收集数据,一种是处理数据,还有一种是可以利用大数据思维去很好地运用这些数据。如果信息开放,你不一定需要有最好的技术,也不需要有非常大的数据设计能力,你也可以从大数据时代中赚到钱。比如说淘宝,每天都诞生着几百万笔、甚至上千万笔的生意,如果你把它收集起来,进行数据挖掘,这个技术不需要很复杂,那么你就能够形成自己的服务方式。
大数据正把我们变成新的物种。首先,大数据改变了我们的思维方式,让我们从因果关系的串联思维变成了相关关系的并联思维。其次,大数据改变了我们的生产方式,物质产品的生产退居次位,信息产品的加工将成为主要的生产活动。最后,大数据改变了我们的生活方式,我们的精神世界和物质世界都将构建在大数据之上。大数据不仅仅是一门技术,更是一种全新的商业模式,它与云计算共同构成了下一代经济的生态系统。一切皆信息。
我震撼于作者提出的大数据时代带来的思维、生活、工作上的大变革的同时,也不禁有一点小小的疑问。
首先,书中说不是随机样本,而是全体数据。但是获取全数据的可能性很小,难度也高。作者拿人口普查来做例子,可是直到目前为止,除非还是得用随机样本。
其次,数据从来都是混杂的,我们做统计的时候都知道要混杂数据,不可能做到完全精确的数据。我们绝大多数判断都是建立在混杂数据上,所以也没必要突出说大数据它就是混杂数据,不是精确数据。因为哪怕小数据,它也具有混杂性。
最后,对于因果关系和相关关系的说法。我了解到有很多人对此有质疑,认为这是人类的倒退,人类之所以有今天,就是因为我们善于从复杂的现象中抽象出因果关系来,这是我们人类伟大的能力。如果否定了它,那人和动物的区别就没了。很多人就说,现在就出现了一堆数据美学家,把数据表格做得很漂亮,总结出很多规律来。但是实际一操作,这些相关性不存在,让人无法去决策。
打个很简单的比方,我们到淘宝上买东西,假如我买了一本书,那么下回我再去,淘宝给我推荐的肯定是书,而且跟我上回买的书是有点相关的,但是我上次买书了为什么我这次就一定要买书呢?再者说万一我上次是帮别人买的呢?我在银行存了一笔钱,银行就会三天两头给我打电话问做理财吗?保险吗?等等。这个大数据渐渐变成一种大数据骚扰。
所以大数据时代,否定了它的因果关系,只看相关关系,到底能不能成立呢?大数据时代中逻辑思维真的变成可有可无了吗?我反倒认为大数据时代更加需要逻辑思维。
教师点评
《大数据时代》这本书是国外大数据研究的先河之作,该书认为大数据的核心就是预测,大数据将为人类生活创造前所未有的可量化的维度,已经成为了新发明和新服务的源泉。魏梦欣同学阅读思路清晰,有精确的内容体会。首先,从介绍作者出发,探索了书籍的写作背景,很好地掌握了作者的写作目的。其次,详细地阐述了核心论点——大数据的三个原则,表达了自己的想法,解读了相关理论。最后,魏梦欣同学很好地表达了自己对阅读书籍后的收获和心得。
关于制度与自由的结合
——詹姆斯·布坎南《自由、市场与国家》导读随着改革开放的深入,无论是在理论方面,还是实践方面,如何处理政府与市场之间的关系都是人们关注的焦点,同时也直接关系我国的改革方向。目前,我国国有经济成分所占比例在不断地减小,加入了更多的所有制成分。不断深化国有企业改革,大力发展混合所有制经济成为了大的方向。如何更好地发挥国家的宏观调控作用与市场自行的调节机制,促进经济的发展,成为一个亟待解决的课题。詹姆斯·布坎南在《自由、市场与国家》这本书中,提出了公共选择理论,给了我们很大的启示。
作者简介
詹姆斯·布坎南,美国著名经济学家、公共选择学派的代表人物、1986 年诺贝尔经济学奖得主。布坎南最著名的理论就是公共选择理论。
1983 年布坎南当选为美国经济学会资深会员。
公共选择的理论形成过程:1955 年至1956 年,布坎南在意大利进行了为期一年的研究,受到了欧洲财政学派的影响,使他进一步坚定了纳特建立了研究政治经济学和社会哲学的托马斯·杰斐逊中心,在此期间逐步奠定了公共选择理论的基础。1962 年,布坎南发表了公共选择理论的奠基著作——《赞同的计算》(与戈登·塔洛克合著),并与塔洛克一起创建了公共选择学会并出版了名为《公共选择》的杂志。1969 年以后,布坎南在弗吉尼亚理工学院任教,与塔洛克一起创建和领导了公共选择研究中心。1982 年他随该研究中心迁到弗吉尼亚的乔治·梅森大学,任该校经济学教授。该大学被认为是公共选择理论的大本营。
布坎南最重要的学术贡献是提出了公共选择理论,将经济学中的理性人假设带入了政治学分析之中,从而掀起了政治学的方法论革命。
写作背景
第二次世界大战后,凯恩斯理论成为西方经济学界的主导理论,受凯恩斯理论的影响,西方各国纷纷加强了国家对经济的干预。在一定的时间里面确实建立一个有效的发展机制,让西方经济得到了快速的恢复。但随着国家干预经济力量的增强,政府职能和政府规模也不断扩大,其结果是政府机构不断膨胀,政府资源浪费,国家干预陷入困境,导致了政府职能处于一种失灵状态,不但无法促进经济的发展,反而起到了阻碍作用。为了寻找一种新的理论适应经济的发展趋势,以及协调市场与国家调控的平衡点,布坎南写了本书。
内容解读
对经济起到调控作用的手段,包括国家的宏观调控以及市场自行的调节,布坎南在本书中对这两种手段进行了阐释,同时也对其中的各个学派观点的利弊进行了分析,将两者之间的联系做了系统的阐释,从而提出了公共选择理论。因此本书也是19 世纪80 年代著名的政治经济学文献。本书主要分为四个部分:
第一部分对不同的选择观点进行了阐释。在对自由社会主义者以及反的结果的人应该就是选择决策者的人。一种观点是认为市场通过内部机制的自我调节,完全可以适应经济的发展。这种观点过分突出了市场的自我调节。另一种是认为需要国家的作用,由国家出面建立相应的经济发展机制,但是没有明白的提出两者的平衡点。由此布坎南提出了公共选择理论,试图导找那个平衡点,从而奠定了整个公共选择理论的基础,第二部分对市场秩序进行了全新的认识。古典经济学者认为,认为市场秩序从本质上说是一种自发的秩序,是市场运行的协调性。强调个人的行动可以协调起来,不需要国家插手,国家只起到保护伞的作用。布坎南认为更深层次的市场秩序应该是指市场运行所需要的法律—政治秩序(包含着某种特定含义的个人之间的权力与所有权分配的)。市场秩序建立的难点不在于表层次的秩序,而在于建立深层次的秩序结构,应该将政府在秩序的制定上的作用充分发挥出来。市场本身是可以建立一定的秩序,比如说利率、分配制度等,但市场本身具有私利性,需要的是不断谋取利润,因此这种秩序无论如何都是不公平,不公正的。而政府代表的更多人的意志,在这种条件下,应该发挥自身的政治优势,将政治带入经济当中,不断地完善秩序,促进公平公正。
第三部分讲述了公共选择理论以及政治的重要性。公共选择的主要前提是“一致同意”原则。将公平公正的理念深入到每个市场的参与主体,达到一致同意之后,自然会减少冲突与矛盾,从而井然有序地发挥市场要素的活力。实现这一目标的重要手段就是走民主政治这一条道路。政治是一种运用协定和契约来解决个人评价和个人利益冲突的过程。从根本上讲是以制度上的民主和大多数人的意志来衡量政治上以及经济的公平公正。
第四部分对个人以及政府行为进行了剖析。个人程度上让自己的利益最大化,是有一定的自私性,因此是无法真正意义上的实现公共意志,而政府会在很大程度上推进这个历程。这强调了政府行为的重要性。并不是所有的政府行为都是可以推动这项历程的。布坎南通过对历史的分析,总结出了三种政府行为,分别为慈善的专制者、“拥有独立利益的巨物”和西方的民主政府模式。通过对比,认为西方的民主政治模式更符合对经济制度下的共产主义更能推动政治经济的共同选择。
评价与心得
读完这本书之后,我对公共选择理论有了一定的理解,也对市场与国家对经济发展所起到的作用有了进一步的了解。
公共选择理论的理念应该是强调公平公正。只要是机会平等,那么不管结果如何都是公平的。从更严格的意义上说,应该把能力作为决定一个人的分配份额的最重要因素。例如贫富差距在不断地增大,这种现象的形成,首要的因素是制度规则起点是不公平的,权力层是封闭的,无权无势的人无法进入决策层,普通大众没有利益表达和获取渠道,首先没有自由权,因此资源是通过特权向少数人集中。这种不公平的现象会很影响社会的稳定。此外我国提倡以按劳分配为主,多种分配方式并存的分配制度,目的在于消除这种层级之间的壁垒,体现公平公正,充分调动市场参与者的积极性,刺激市场要素的活力,维护市场的稳定,从而促进经济的发展。
公共选择是尊重大多数人的意志。决定成功的往往是能否代表更多人的意志,而不是以个人或少数人的利益为根本。这一点从制度的更替上就可以展现。封建社会—资本主义社会—社会主义社会,每次的制度更迭都是因为阶级矛盾的爆发,而造成这种矛盾的主要原因就是阶级之间的对立性,利益的对立。压迫、剥削的本质是为了维护少数人的利益,不是公共选择。随着人们意识的解放,对于物质文化的需求不断增加,这种之间的不平衡,就会加剧矛盾,从而造成社会动荡。不断地削弱生产资料的私有化程度,满足大多数人的利益,将大多数人的意志展现在经济发展当中,成为共识与社会发展的大趋势。
完成公共选择的手段是实现制度下的自由,制定符合自由的制度。没有规矩,不成方圆。自由也不是完全的放任不管,任其自生自灭。经济的发展对于国家来讲是头等大事,不能完全的脱离政治对其的控制,否则会造成一场灾难。比如说在二次工业革命之后,随着生产技术的不断更新,达到垄断。此时资本家已经不断地控制市场,长此以往,爆发了经济大危机。生产严重过剩,但是大多数人却生活贫苦,高通货膨胀。这就是因为没有了政府的参与,完全依靠市场对于经济的调节,因此说建立良好的社会经济政治行为都需要有一定的规则。市场参与者需要有市场的约束,个人有行业的约束,国家有公民的约束,这一切目的都不是在反方面削弱相应的力量,而是为了建立一个更好的让更多人所认可的经济氛围。比如说中国改革开放以来的经济形势的变化。由大力发展公有制经济,国有经济改革,再到以公有制为主体,多种混合所有制经济并存的经济制度,都是政府在不断地制定相应的规则,同时也接受市场反馈的信号,将政治因素带入经济管理当中,更好地为经济活动服务。同时市场上的问题也要反馈给政治。打造市场的自主调节与国家的宏观调控相协调的发展前景,这是寻找市场自主调节与国家宏观调控平衡点的最佳方式。
教师点评
武迎港同学通过读《自由、市场与国家》一书,有了自己的心得与感悟,进行了关于制度与自由相结合的思考,针对如何发挥国家的宏观调控作用与市场自行的调节机制这一课题,他从本书提到的公共选择理论中受到了很大启发。
从武迎港同学的读后感中可以看出,他对该书进行了比较深入细致的阅读,介绍了本书的作者、写作背景和主要内容。介绍了作者詹姆斯·布坎南和他最著名的理论——公共选择理论以及这一理论的形成过程;介绍了本书写于政府职能处于一种失灵状态,经济发展受阻的背景之下;介绍了四个部分的主要内容:对不同的选择观点进行了阐释;对市场秩序进行了全新的认识;分析了公共选择理论以及政治的重要性;对个人以及政府行为进行了剖析。该生读完本书之后对公共选择理论有了一定的理解,首先,他认为公共选择理论应该强调机会平等,并且应该把能力作为决定一个人的分配份额的最重要因素;其次,公共选择要尊重大多数人的意志;最后,他提出完成公共选择的手段是实现制度下的自由,制定符合自由的武迎港同学通过阅读本书发现了市场自主调节与国家宏观调控平衡点的最佳方式,这对他将来的学业和工作必将起到一定的影响作用。
(撰稿人:武迎港 指导教师:王秀玲)