2019读的书

  • 大设计
  • 为什么:关于因果关系的新科学
  • 事实 Factfulness

大设计

霍金对当代物理学的科普性综述。本书被人批评的有两点,一个是对于科普来说太不友好了,另一个是翻译。我看下来感觉倒还好,很多概念虽然只说了寥寥数语,但基本是什么意思都了解了,余下的便不求甚解,反正再仔细解释下去我也听不明白。我看的这本是2018年印的,里面翻译问题已经微调了许多,豆瓣上列举的很多傻翻译都改过了,现在虽然仍旧不像人说的话,但好歹绝大部分句子都能看懂。本书一些有意思的概念:

  • (p26)世间万物都受物理定律支配,包括人的思想和行为,从这个角度来说并无自由意志可言。但没有办法同时观测到大脑内部每一个分子的状态,复杂性使得用物理定律来做出预测变得不可能。因此我们使用有效理论,把基本物理过程概括到一些更高层的概念,直接研究这些概念的作用和变化会更容易。比如化学就是一种有效理论,心理学、经济学也是,自由意志属于有效理论中的一种概念。

  • (p35)依赖于模型的实在论:一个物理理论和世界图像是一个模型(通常具有数学性质)和一组蒋这个模型的元素与观测相连接的规则,不存在与图像或理论无关的实在概念。实在论是顺从人的本性和直觉的,但它在量子物理中受挫,在被观察前,粒子只是一团概率而已。依赖模型的实在论,其实是一种反实在论。夸克没人能看到,在自然中也无法独立存在,那它属于实在吗?对于依赖模型的实在论来说,夸克模型可以解释所有实验结果,也能预测将要做的实验结果,那就够了。

  • (p42)好模型的特征:
    1. 是优雅的;
    2. 包含很少任意或者可调整的元素;
    3. 和全部已有观察一致并能做出解释;
    4. 对将来的观测做详细的预言,如果预言不成立,观测就能证伪这个模型。

  • (第四章) 量子力学里包含基本的随机性,按照费恩曼的历史求和观念,双缝实验里,粒子采取通过双缝、连接起点到终点的每一种走法,之所以形成干涉条纹,是由于不同路径的之间的相位差。所以在量子世界里,如果不进行观察,那历史(粒子到底怎么走的)就和未来一样是不确定的。如果在缝上装摄像头,干涉现象就会消失,观察到粒子通过某条缝就排除了其他路径的历史。整个宇宙也是具有每一个可能的历史,每个历史有其自身的概率,我们对现状的观察会影响它的过去并确定宇宙的不同历史。

  • (第五章)牛顿定理、麦克斯韦方程、广义相对论等都是经典物理中的定律,不适用于量子领域。因此需要寻找所有自然规律的量子版本,称为量子场论。自然力可分四类:引力、电磁力、弱核力、强核力。量子引力论是最难的。M理论(终极理论最有希望的候选者)不是一个单一理论,是多个理论组成的理论网络。每个理论描述宇宙的一个方面,在它们适用范围交叠之处,可以互相符合。

  • 人择原理不仅适用于为何地球适合人类诞生,也适用于我们宇宙的参数为何适宜人类存在。

为什么:关于因果关系的新科学

读之前期望很高,作者是图领奖得主、贝叶斯网络发明人,却放弃概率模型,用20年时间发展研究了描述因果的科学,这样的人物写一本因果模型的科普书,应该是非常透彻的。然而作者写科普的水平非常一般,行文晦涩,不知是否是翻译的问题;节奏诡异,漫谈历史的时候循循善诱,切入正题后反而思路跳跃;一些关键概念没有前因后果突然出现,让人看的云里雾里;为了减少公式,强行用文字描述,却更加难懂。

最令人反感的是一直在 diss 其他流派的统计学家,Pearl 老爷子应该是觉得自己的因果模型很重要,但目前仍然影响力有限。他将原因归结为主流统计学派的排挤。每举个例子都要绘声绘色讲上一番,讲多了就有点祥林嫂的感觉。但凡历史上谁做的东西和他沾点边的,就奉别人为因果模型的英雄。对别人研究的点评,老是来一句“如果他们当时用了我的因果模型,这问题早就解决了”云云,就算因果模型真的先进,也是站在前人们的肩膀上,在山顶自然看得清哪条路好走,对于当年还在山下的科研人员,就算走了弯路,也不应说这种风凉话。

我一直想看到因果图是否可以通过算法从数据中学习得到,但本书并未涉及。作者在展现因果模型优越性的各种例子里,都是直接先给出因果图再进行计算,这使得比较并不公平,因为被他拿来做反例的统计方法,并没有那些先验的知识,所以书里展现的优势,有一部分是来自额外的信息。这就是所谓的思维胜于数据?在很多实际问题中,人类专家也没办法画出正确且完备的因果图,研究该怎么进行呢。

我的理解,作者是希望让因果图成为统计研究中的一种通用语言,在因果图适合的领域内,如社科、经济、健康等等,以后发表论文最好都以因果模型来分析数据、作为推断依据。但正因为需要借助人类思维,因果模型没法像深度学习那样工业化、平民化地利用起当今世界上的强大算力,而是更倾向于传统机器学习里倚重 domain knowledge 的方法。然而世界上真正等待 AI 去解决的问题,大多是复杂到人类专家力有不逮的程度,所以我最期待的是神经网络可以普适地从数据里学出因果图,并进行因果推断,可以关注一下这方面的论文。

另外,本书介绍了一些有趣的统计现象、谬误、悖论,在实际应用中也是需要注意的:

  • 荒谬相关:两组逻辑上没有关系的数据,碰巧产生了可能是非常强的相关性。数据采集种类越丰富,数据量越少(例如都是年度数据),这种情况越容易发生。Spurious Correlations网站就收集了很多例子。

  • 异质总体数据带来的伪相关:混合两组不同种类、但有相同特征的数据,会带来错误的相关性。例子:男性头骨的长度和宽度没有相关性,女性也是,但是将男女的数据放在一起时,长和宽突然有很高的相关性了。原因是长的头骨更可能是男性的,那同样也会更宽。

  • 对撞偏倚 / 辩解效应 explain-away effect:A -> B <- C,如果 A 和 C 都是 B 的因,即使本来 A 和 C 完全独立,但在控制 B 之后,A 和 C 出现负相关。例子:A=才华,C=美貌,B=成为名人,假设 成为名人不需要既有才华又有美貌,只需具备其中一个就足够了。也就是说,一方面,如果某位名人是一个演技极佳的演员,那么光是这一点就足以“辩解”他的成功了,他也就不需要比普通人更漂亮。另一方面,如果另一位名人是一个糟糕的演员,那么他获得成功的唯一原因就是他长得好看。因此,如果我们已知“名人=1”,那么才华和美貌就是负相关的,即使二者在一般人的总体数据中并不相关。

  • 剂量—响应效应 dose-response effect: 如果物质 A 会导致生物反应 B,则通常而言(但不是百分之百),更大剂量的 A 会导致更强的反应 B。

  • 辛普森逆转:两次实验中 B 的成功率都比 A 高,但把两次的数据合在一起之后,A 的成功率更高。一个人为构造的极端例子如下:发生的原因通常是样本数据量的不匹配,导致虽然 A / B > a / b 且 C / D > c / d, 然而 (A + C) /(B + D) > (a + c) /(b + d) 却不成立。

事实 Factfulness

本书全篇同时叙述着两层内容,第一层通过数据刷新我们的世界观:当前世界的整体生活条件比我们想象得好得多,极度贫困的人口在50年间从50%降到9%,大部分人口处于中等收入水平,全世界预期寿命70岁,儿童疫苗接种率80%,等等……证明我们对世界的认知有系统性错误;第二层论述为何会有这样的认知误差?讲了十个理由:

  • 一分为二: 不能简单的把国家分为穷国和富国,按人均日收入可以分出四个收入等级:$2, $2$8, $8$32, $32。当你生活在第四级的时候,所有生活在第三级、第二级和第一级的人看起来是一样贫穷,事实上每一级之间的差距都是巨大的。
  • 负面思维: 50年来持续进步的收入水平,无法作为新闻被我们看到,媒体和社会活动家依赖夸张的事情来吸引人们关注,更倾向于报导坏消息。看到更多坏消息,可能是因为现在媒体和监控太发达,更容易找到这些事情。而即使是坏消息,也要去看他发展的趋势,是否持续在改善。想了解好消息,需要主动去寻找数据。
  • 直线思维: 不要假设数据的增长一直是沿直线的,可能是指数,更可能在到达一定高度后变为水平。例如人口增长,联合国预测未来人口增长速度放缓,2100年达到110亿。原因是经济水平提高,生育率(妇女一生中生育子女的总数)下降,从1960年的5降至目前的2.5。全世界来看,未来几十年15~60之间的中年人增长是最明显的,发达国家由于平均寿命长、生育率低,老龄化严重。中国则由于计划生育政策,现在也面临老龄化问题。
  • 恐惧本能: 风险 = 危险程度 × 发生的可能。媒体会挑选可怕的事情来报导,但我们要看到概率。感受到恐惧的时候,要冷静下来再做决断。
  • 规模错觉: 应该把有限的资金投入小学、护士教育和疫苗注射上面,而不是急于建造宏伟的医院。医院能救的人非常有限,基础卫生设施才是提升健康水平的关键。“在极度贫困状态下,你不可能也不应该把事情做得完美。如果你这么做,你就是在从其他更需要这些资源的地方窃取资源。” 这句话可以应用到一切资源有限的情形,有时候我们会太关注自己眼前的事,忘记从全局角度去找到最重要的事。牢记二八原则,投入最大资源到最重要的那几项。不能轻信绝对数字,要看比例,或者纵向和过去比较,再做判断。
  • 以偏概全: 不要用个例去概括整体,尤其面对大集体,要考虑其中的不同类别;当不同类别里有共性时,考虑自己的分类方法是否准确。不同国家里收入水平相近的家庭,生活情况也相近,所以应该按照收入区分而非地域。不要当别人是傻瓜,当发现自己不能理解的情况时,要仔细思考背后的原因。
  • 命中注定: 社会科学中,那些最基本的知识都有可能很快过时。几十年可以让一个社会发生翻天覆地的变化,我们以前得到的对世界的认知,现在很可能已经不适用了,所以需要不停更新自己的知识。
  • 单一视角: 不能因为手里有锤子就满世界找钉子,要习惯去发现与自己不一样的观点,反思自己想法的不足,多角度去理解问题和寻找答案。世界是复杂的,要当心那些宣扬简单理念和简单解决方案的人。这里谈到了自由民主,似乎人们都相信民主会带来美好生活,事实是大多数获得了巨大的经济进步和社会进步的国家并非民主国家。与其把民主当作一种取得进步的手段,还不如把民主当作国家奋斗的目标。
  • 归咎他人: 寻找原因,而不是寻找坏人。寻找系统,而不是寻找英雄。真正做了好事的是组织结构和科学技术。
  • 情急生乱: 面对越急迫的危机时越是要冷静,注意不要采取过激行为。警惕那些有偏见的社会活动家,比如很多环保人士,为了获得注意,习惯性地恐吓大众。作者提出的未来世界面临的最大风险:全球性传染病、金融崩溃、第三次世界大战、气候变化、极度贫困、以及未知风险。

很精彩也很诚恳的一本书,从实例、数据,到背后的分析都令人信服。写作的对象应该是西方发达国家的人们,让他们看清当今世界已经不同于他们一直以来的观念了。作为中国人,我们是经历过社会飞速发展过程的,纵使这样,我仍然低估了世界其他地方的发展速度。从纯利益的角度来说,那些最大的市场已经在我们视线之外飞速成形了。最近看了数据我才发现,印度的NSE已经超过CME成为世界上交易量最大的衍生品交易所,巴西的B3也是非常活跃。对于制造业和零售业,也应该把眼光放在那些曾经贫穷的国家和地区。

作者们建立的网站也有许多有趣的数据:gapminder.org。里面的 dollar street 将全世界的家庭按照收入排在一起,值得一看。