在SnowLeopard上安装MacFusion

人类的大脑就是如此：一生都在不停地犯各式各样的错误，同时还对本身保持一个较高水平的评价。之所以犯错误，是由人类的大脑运作方式决定的，这几乎是无法避免的。比如人类有一种本能化思维方式：类比[ii]——也就是说，习惯于将自己先前总结出来的规律，施加在未知但看起来相似的事物上，而不事先考虑同样的规律是不是起作用，同样，大脑也不去辨别这两种情形是不是真的“相似”。这其中的“道理”大约是这样的：“卷心菜的味道不错，圆生菜和卷心菜长得差不多，那么圆生菜的味道应该也差不多？”举个程序员们喜闻乐见的例子：你在emacs里按Ctrl-X,C按得挺熟练觉得很爽，于是到了gedit和notepad里八成也会试试看灵光与否，或者到win32 cmd下敲find -exec/xargs，或者到LISP里写visitor，或者到Python里写GetSubString(index1, index2, step)函数……在这方面，成年人和婴儿的区别仅在于知识库中积累的数据不一样多而已（所以成年人才不再去尝试已消化过的食物的味道[iii]）。在用类比去探索时，我们不认为这有什么不对，但是在已经探索过的人群看来，这非常可笑并且没有必要。

试错法也是人类重要的思维方式[iv]。其中的“道理”大约是：“我不知道是不是行得通，但是做错了代价也不大，所以我想试试看”。低幼儿童会用剪刀去剪房间里的所有物体，其实也是一种试错。前面举的emacs的例子，也可以说是在试错。面对重要的东西，我们往往不会去试错[v]，但问题在于每个人对于“重要与否”的评估存在着差异，导致对待同一个事物，某人觉得不重要，可以试错；但另外一个人就会对这种试错非常反感，甚至愤怒。

通常来说，在面对未知事物的时候，我们的第一印象往往是错误的，但我们会（自以为是地）认为自己是正确的。随着对事物的更多了解，每一时刻我们都会（不自觉地）修正自己对事物的看法，但每一次我们都会认为自己完全了解该事物了，认为自己达到终极正确了，同时也会忽略自己刚刚还在犯错误这一事实。这其中的“道理”大约是这样的：“我已经修正了足够多的错误了，那么这里面就不会再有大问题了吧？”在软件开发中，程序员面对BUG也经常如此。心理学中的名词“面试者错觉”(interview illusion)就是在总结这样的一种现象，因为在企业面试的时候，这种现象最显著。

归因错误（更确切地：fundamental attribution error）也是人类易犯的思维错误。其典型特征是：将好的结果归功于自己，将坏的结果归罪于别人。比如：约会迟到，那是因为堵车太厉害；如果准时到达，那是因为自己是一个讲信誉的人，故而“能够有计划地处理一切意外情况从而做到守时”。类似地还有：如果自己不守交通法（比如在“白实线”并线），那是因为有急事需要赶路；如果看到别人同样地行为，则是认为对方是一个“没有素质的人”。再回来头说软件公司的例子：处在组织中任何位置的人，包括CEO、VP、PM、Lead、QA & developer，也都会犯这种错误：一旦出了问题，大官儿会将问题推给小官儿，小官儿推给程序员，程序员推给外部条件，比如语言有缺陷，OS不稳定，SDK出BUG，Partner还延期……等等等等。如果最后成功了，程序员则会说“其实都是我们干的活儿”，CEO会说“那是因为我领导有方”，中层managers会说“CEO什么实际事情都不管，程序员们全都太懒，都是（因为）我们这些最难做人的中层经理们在不停地push”……

人类的趋利避害本能，导致思维模式中不可避免地会有将“必要条件”当“充分条件”的现象，比如放置很久的食物并不一定都腐败变质了，但我们都会选择扔掉。更进一步地，我们会将既不充分也不必要的条件也当作充分条件。比如我们在黑夜里会异常小心，虽然“黑夜”与“犯罪”既不充分也不必要；或者，看到别人手中拿着刀子，首先想到的是“不要伤害到我”。其实动物们也何尝不是如此。如果羚羊会说话，它大概会这样告诉你：“这里闻起来有狮子的味道，我不确定这里是不是有狮子，但是喝过水之后赶紧跑掉总没有坏处。”为什么不会有严格按逻辑推理行动的羚羊呢？比如一只这样思考的羚羊：“这里闻起来有狮子的味道，但这有可能是已经走开的狮子留下的；‘有狮子的味道’仅仅是‘有狮子’的必要条件，并不充分（甚至可能不必要），如果看到狮子了（充分条件），那我就会逃跑，否则我就待在河边喝水……”由于进化方向的随机性，究竟有没有这样的羚羊我们无法判断[vi]，但是我们观察到现在的世界上并没有这样的羚羊。我们可以认为：即使曾经有过这样讲逻辑的羚羊，它们也已经灭绝了，因为比起“正常”的羚羊来，这种羚羊没有生存优势。对于羚羊的正确选择是：不严格遵守逻辑，按照“未来预期最大化”和“未来风险最小化”的原则行事。这是一种合理且最优的生存策略，是一种rational choice in an uncertain world（感谢Pongba提供）。在自然选择中生存下来的我们人类，也是同样：严格的逻辑思维不可能是天生的，只能依靠后天的训练。

类似这样的例子还可以举出很多很多……所有的这些本能地、习惯成自然的思维方式（包括但不限于刚刚提及的），会导致这样一种（显而易见的）结果：我们在面对不了解的领域的时候，往往会出现认知上的偏差（以上的说理并不充分。如果有人不认同我也很正常。我也无法做到充分说理，因为我的这一份大脑无法真正说服别人的那一份大脑，除非两者在思想和认识上已经有一定的共同基础）。这些认识上的偏差会导致很多问题。将这些偏差列举出一些来，也正是我写此文的目的。

不要盲目质疑权威[vii]
可能是大家过去都被无良的“权威”欺骗了很多年吧（在某些方面还被欺骗着）。在当今的年代，质疑权威变成了一种时尚（比如屡有民科的种种质疑见诸报端）。但对于懂得如何求知的人，有一条原则还是一直没有变化的：在发表与主流相反的观点前，要多作调查和思考。不要凭自己的直觉去胡乱质疑[viii]。因为在“绝大多数情况下，你都不太可能是遇该问题的幸运第一人”。如果仅凭直觉去质疑，往往会闹出笑话。甚至伟大如爱因斯坦者，在他做出过巨大成就的物理学上，曾经靠直觉指导学术研究，高举反对量子物理的大旗，但还是被无情地击败（Aspect experiment），被后人作为了反面典型，甚至有人笑称： “如果爱因斯坦自191x年开始以钓鱼为业度过余生，对科学界也没有任何损失”。[ix]

再举几个例子。比如，下面的这个科学事实[x]，它和多数（未受正确汽车安全教育的）人的直觉相违悖：

a)仅使用安全气囊而不系安全带，会增加死亡和受伤的可能性。

b)安全气囊仅在与安全带一起使用时才能最大程度地挽救生命。

c)安全气囊对儿童有致命的伤害作用。

参考资料：安全带能将乘员的头部伤害减少6成，安全带+安全气囊一起能减少8成（数据来源：NHTSA）。同时，安全气囊造成儿童死亡率上升35%（数据来源：IIHS）。

又比如：近视的遗传率为90%（标准的说法为0.9）。也就是说，一个人到底近视与否，在90%的程度上是由他的父母的基因决定的。

再比如，我们平时“尝”到的各种味道，除掉有限的五种味道之外[xi]，其它的都是由鼻子“闻”到而不是舌头“尝”到的。这五种舌头可以感受的味道为：酸、甜、苦、咸、鲜（一部分的上腭也可以识别这些味道）。除此之外，其它的味道都是被鼻子“闻”到的（蒸发后的唾液携带着少量食物分子进入鼻腔从而被闻到）。吃芥末的感受会让人真实体会到这一过程。

还比如，我们直觉上认为大部分为黑色的屏幕会省电，而且传统的CRT屏幕也是这样的。但是对于新型的LCD显示器，屏幕颜色对于省电则变得基本上无关紧要，因为LCD是靠背光照明，无论屏幕颜色是黑是白，它的背光是一直全开的。如果想要追究起来，白色屏幕比黑色屏幕会更省电，因为黑色屏幕是要通过电压驱动液晶分子才能得到的，而白色屏幕是未驱动时的“本来面目”（仅对TN而言的；IPS/OLED则是黑色省电）。想要让LCD显示器省电，关闭它才是王道（手动关闭/自动超时关闭）。

对于权威，不是不能质疑，事实上，许多开创性的理论都是经过质疑权威而发明的。质疑应该通过批判性思维产生，其基础则是知识和实验。关于批判性思维在这里不讲太多，请参考托马斯·杰斐逊编写的学生誓言：我保证使用我的批评才能。我保证发展我的独立思想。我保证接受教育，从而使自己能够自作判断（卡尔·萨根：http://www.cnread.net/cnread1/kpzp/s/sagen/mgcm/025.htm）。

不要放大局部经验
“不要将局部经验（或经历）当成普遍事实”。单讲这一句话不会有太多的人反对，但具体到了某件事情上，这种思维缺陷就容易出现了。每个人都有自己特定的经历，大脑会将这些经历总结归纳成经验和规律，并且不自觉地用它当成金科玉律去衡量接触到的新事物[xii]。对于我们的大脑来说，新事物都是不那么可信的——至少不如自己的经验可信。如果新事物和自己的已有经验冲突，多半我们是要去怀疑它。在怀疑的过程中，因为有了“一票否决/证伪”这样一个逻辑利器，我们的大脑更倾向于相信自己的旧有经验。举个鲜活一点的例子：一个朋友生了小孩后，经常和她的婆婆（来自某省落后的乡村）发生冲突，而冲突的内容几乎都是在育儿方法上。比如有一次，婆婆坚持要给孩子的屁股上擦香油，说如果不这样做的话，长大之后会“屙不净屎”。我想多数人看到这里会觉得比较有趣，也不会认为婆婆的这种“经验”是正确的。但从婆婆的角度来看，这是她大半辈子攒下来的经验，是她的长辈和亲朋代代相传、奉为圭皋的经验，也是她在儿子身上“试验”成功的经验。而媳妇采用的育儿方式是新事物，那是她不愿意去相信和接受的东西。婆婆的“逻辑”大约是这样的：“你说你那方法科学，那怎么还有生出来就活不了的？你说我的方法不科学，我不还是把我儿子养活这么大了？”[xiii]

回到程序员的问题上，这种应用局部经验的情形也不少。比如：“我上次这样试验过，行不通的”，或者“我这样编译过，没问题的”。“行不通”是因为什么行不通？是方法有错还是环境在干扰[xiv]？“编译过没问题”，是表面上没问题还是真的没问题，是编译器的特性还是标准中的规定[xv]？

个人经验和科学理论的冲突是不可避免的，关于如何处理这种冲突，可以按科学界通用的证据原则去处理。并且，证据原则中有如下一些证据强弱的判断式：双盲>单盲，盲法>不盲，试验>观察，随机试验>非随机试验，对照实验>无对照实验，前瞻性观察>回顾性观察，系统性观察>非系统性观察( 个案系列、个案、经验)，“个案系列”>个案，专业人员观察>非专业人员观察（上面这段话是引用的，从笔记里Ctrl-Y的，出处忘了）。

不要捍卫一知半解
我们都不必要、也不可能在所有领域内都做到深入了解，像“全才”一类的称呼离现在这个社会越来越遥远了（毕竟早已不是达芬奇所处的年代了）。不管你了解多少个领域，在一个领域上了解得有多深入，都不可能覆盖到所有的知识领域。所以，出现对某个领域一知半解的情况，是一个很正常的事情。比如程序员们都懂一点颜色的表示法——如何用RGB值组成颜色（做过视频处理的人估计还懂ycrcb）。但是如果用Chromatology的高度去要求，估计没有几个人能够合格了（比如D65光源的意义……）。

或者用生活中的例子：一般人都会使用相机，在不少论坛里还能碰上许多“摄影爱好者”或者职业摄影师。但你要是搬出《大不列颠摄影教程》跟他探讨镜头的像场性质（场曲、边缘解像等）、慧差、球差、色差（两种）等性质，那么多数人都会变哑巴[xvi]。

或者另一个例子：几年前，在LCD显示器刚刚开始普及时，很多人都在谈论面板的反应时间，厂商也在想方设法提高该指标，但是有多少人知道反应时间是如何定义的？真正的响应是不是按标注的反应时间？（http://www.tomshardware.com/cn/953,review-953-5.html）

再举一个例子，在中国有不少人会开车，在有些国家多数人都会开车。但是如果你去讨论“主减速比”、“传动比”和“刹车点”、“走线”、“换档时机”，估计多数人会感到难以理解，只有少数竞速爱好者会喜欢这样的话题。但他们也只是比普通人多知道了那么一点儿点儿，比如多数竞速爱好者对于自动变速箱中的“锁止离合器”都没有任何概念。（再比如：铝合金副车架的晶间腐蚀）

多数人对自己存在的不足，在内心深处是能够感觉到的。如果自己能够坦然面对，一般也不会有人嘲笑你（以下情况暂且不计：1、懂得太少又想冒充高手；2、遇到有人格缺陷的高手）。但是这里面有一个“面子”问题，一个人“丢了面子”就想要“找回来”。所以才会发生这样的事情：如果一个人感觉到自己在知识上被打败了，那么他就会设法从其它方面“找回面子”（往往是用诡辩）。比如，如果你和一个纯C语言的“高手”讨论OO，那么他多半会用OO的缺陷和误用来反驳，或者用OO语言中的缺陷来反驳（如执行速度太慢，或语言太复杂，以致于“为了避免复杂性也要用C”，嘻嘻），以此方式来掩饰他在OO上的不足。或者当你去和一个汇编高手讨论LISP语言的威力，那么他多半会用执行速度来避开讨论的中心，或者用“本质上来讲都是图灵机（或者本质上都不是图灵机——因为内存不是无限）”来试图抹杀差异。

（多说一句：“从本质上来说都是……”这种red herring非常好用，诱惑性极强，一个想要理性辩论的人需要努力抵制这种诱惑，like what Gabriel Gray(Syler) did。我曾见过一个用“本质论”的高手，唉……）

一知半解不可怕，可怕的是“捍卫一知半解”（特别地：当一个人在一个小圈子里是“话语领袖”的时候）。作为理性的求知者，要平稳自己的心态，摆正自己的位置，别去计较一时言语上的得失，或者说：“不要太小心眼儿”

不要扩展专家地位
学问讲究深入，市场讲究niche，所以才有刚刚说的“不要捍卫一知半解”。同样的，这一条要说的也是类似的观点，只不过是从另外的一个角度去谈。

在某一领域是专家，换了领域之后多数情况就是白丁，在这种情况下，千万不要把自己还视作专家。例如：北京师范大学教授刘里远，先后就读于儿科专业、生理专业、运动生理专业、生理专业。曾做过三年临床内科医生。这样的“专家”，在周老虎案件中的“专家地位”，就完全可以无视。

人云亦云不是事实
有强烈好奇心的人是少数，几乎没有好奇心的人也是少数。多数人对于自己了不解的领域还是有一部分求知欲望的。即使少数没什么求知欲望的，也会被各种宣传手段强行灌输某些方面的“知识”。对不了解的领域，这些“知识”的积累可能来自于口口相传，可能来自于学校和培训，可能来自于广播电视报纸网站等各种媒体，甚至可能来自于传销、推销人员的灌输。事实上，经过这些传播途径，有许多错误的说法广为流传，正所谓“谎言重复一千遍就是真理”（http://en.wikipedia.org/wiki/Joseph_Goebbels）。我想每个敬业的人，对于自己的专业都会有较深程度的了解，但是毕竟社会分工太过细化，大部分人的知识仅限于自己了解的领域，对不了解的领域，往往不会随时以严谨地态度去审视，而是很容易地就去接受。一不小心，我们就会“中招”，成为错误说法的信徒和奴隶，并将其发扬和传播到更多的人。

比如“微波炉会破坏掉80%的营养”的说法。如果我们了解一点点关于人体的知识，明白人究竟需要什么样的营养，或者说什么才叫“营养”，这种伪科学的说法就不攻自破了[xvii][xviii]。（人类所需的营养，主要是醣，蛋白，脂肪，这三者的比例相加接近100%。剩下的一点点比例是少量的维生素和微量的矿物质）

再比如“肯德鸡没有营养”的说法，也是常见的一种以讹传讹。即使不按照前面的分析法，用常理去推断也能搞明白——肯德鸡的食物是由以下的原料制成的：小麦、牛肉、鸡肉、蔬菜、土豆、玉米、青豆、鸡蛋黄、色拉油、黄瓜、腌制蔬菜、胡萝卜、奶油、巧克力、可乐（主要是水，还有少量的糖）、固体橙汁和咖啡饮料等。如果有人说馒头夹鸡腿“没营养”，我想肯定有人会想“用大嘴巴抽丫儿的”。但如果说汉堡“没营养”，为什么许多人就相信了呢？

这类的例子还有很多，比如国内对“亚健康”的概念的炒作，还有国内多年来对狂犬病的恶意误导（http://www.who.int/mediacentre/factsheets/fs099/en/index.html）……

回到编程的方面，也有不少的例子。比如：熟悉stack的人不了解continuation，熟悉heap的人不了解GC，熟悉过程式编程的人不了解declarative，熟悉OO的人不了解函数式编程，熟悉CreateThread的人不了解pthread_create，熟悉visitor的人不了解multimethod，熟悉observer的不了解:after，熟悉ON_PAINT的人不了解signal/slot，熟悉QBoxLayout的人不了解wxBoxSizer……不了解该领域的人所发表的“高论”，对于熟悉的人来说，往往会觉得很傻很天真。如果缺乏涵养，难免会冷嘲热讽，导致对方敌意地反唇相讥，最终发展成一场面子战争。

那么，如何区分某种广为流传的说法是不是真实可信的？其实很简单，还是用批判性的思维去审核，多查资料，多做功课。“不寻常的见解需要不寻常的证据”（e.g. 毒品成瘾和越战士兵的研究）。如果一个（骇人听闻的）说法在流传，要先去检验一下它有没有证据。如果没有证据，姑且当笑话听好了。如果有证据，要求证一下是不是可重复的（被其它机构独立做出相同的实验结果），再去查阅相关的批判，从中了解到更多情况，多思考，最后再得出自己的结论。（如果自己的结论与主流学术界背道而驰，那么要多加小心，因为主流学术界犯错误的概率，远小于我们作为一个门外汉而犯错误的概率）

P.S. 相比一般的科学实验，计算机“科学”方面的实验做起来就容易多了，所以我们其实可以自己动手检验广为流传的许许多多的观点（比如JAVA VM的效率之类的。http://shootout.alioth.debian.org/）

想象猜测不是事实
对于不了解的领域，我们的大脑也不会停止想象和猜测，想象和猜测不是坏事，许多发明就是这么来的。只不过如果仅仅想象和猜测，但不做功课，那就是臆测了。常见的形式有：“人家专业XX师都是……样子的”或者“这所以做出XXXX事情，肯定是因为……”，再或者“之所以数据显示是这样子，是因为……”[xix]。这样的判断，离开了数据的支持，只能说是一句空话，没有任何意义[xx]。

比如在TopLanguage讨论组（http://groups.google.com/group/pongba/），前几天就发生了某些人对摄影师和闯红灯者的判断失误。在这里并不是要指责曾经判断失误的人，只是用来说明：人的大脑一不小心就会犯错（我的大脑也是一样。所以我才去不停地求证，一切靠统计数据——可信的数据）。

又比如：关于“将头伸出车窗，在某些情况下会导致受伤”这个判断，大家基本上会认同。但究竟是什么原因导致受伤？此时的想象和臆测就不管用了，需要数字来说话。但作为人类，我们当然不可能选择随机双盲法去做试验（同样，也不可能用大量婴儿去做“三鹿氰胺”的毒理/病理实验），所以只能看统计数字并加以归纳。虽然我们通常会认为：将头伸出车窗后，被其它车辆撞击/被树枝广告牌刮伤的可能性是最大的，但是对常这样做的宠物狗的统计结果表明，因飞行物和飞溅物撞击的受伤比例其实最高。同时，电动车窗受伤的报告数字也在警示人们，这种看似不起眼的危险其实发生的比率也很高（不仅仅儿童，许多成年人也是电动窗的受害者）。

再举一个例子（这个例子离多数人的生活有点远，但它正好是我的兴趣爱好。在这种情况下拿出来用于佐证应该也算是合适的）：有一种格斗比赛叫做综合格斗（MMA），这种格斗的规则相当开放（它继承自古罗马斗兽场的精神）：允许脚踢、膝撞、拳打、肘击，允许各种摔法，允许使用各种关节技（中国俗称擒拿），允许使用各种绞技（勒脖子令对方窒息），并且，即使一方已被打倒在地也不会中断比赛，而是允许另一方的选手用脚踩、足球踢（将对方脑袋当球踢）、或者骑在身上用拳打头或者用膝撞头[xxi]（不要与WWE混淆，WWE仅仅是有剧本的表演）……单单听我描述，可能你会认为这种比赛相当残忍，而且伤亡率会相当地高。但是根据统计数字，伤亡率上来讲，看似残忍的综合格斗远比足球、橄榄球等运动要安全。

如果想要避免（或修正）错误的想象和猜测，有一个好办法：批判性地思考，同时一定要多看实验数字[xxii]。

不要预设他人的未知
一个人可能不了解某个领域，但这不代表其他人也不了解。或者，一个人仅仅对某个领域有浅层次的认识，但这并不代表别人也是一样（别人可能在此领域浸淫多年）。所以，不要将自己的未知等同于别人的未知，更不要因此就（甚至故意地）说问题是“不可知”的。举个典型例子：堆积大量的术语和名词，用来说明“这个不是你我能够明白的”，甚至说“不是xx研究能够解决的”……

到底应该如何去做？
简短总结一下：对不了解的领域，要多思考再发言。思考形式应该是critical thinking，要基于对知识的掌握，基于实验和数字。不要自以为是，不要凭空思考，不要随便下结论。

P.S. 讲起道理来谁都会讲，做起来却很难不犯错。所以我们要随时自醒。引用一句话：魔鬼在细节中。

附：不成立的证明
必要条件不可证明

这个道理很明白，但中国人却容易在这方面犯糊涂，导致这方面大大小小的例子很多：

1)钢产量高是工业发达的标致，所以我们必须要大炼钢铁，赶超英美。

2)奥林匹克奖牌多是体育发达的标志，所以我们必须要多拿奖牌，赶超俄美。

3)通过了ISO 9000认证表明工作流程是标准化的，所以我们必须要努力通过ISO 9000。

4)用C++/Java编写的优良软件中常常会出现模式，所以我们必须要努力使用模式。

5)CMM认证体现出……所以我们必须要……

有的时候，这种联系并不都是“必要条件”，而仅仅是相关。但即使相关度为1的，也有不必要也不充分的情况（比如相关的这两个项目都由共同的某个原因所决定。二者都是结果，互相之间无因果关系）。举个例子：有些人会用这样的“逻辑”来论证：“在长安俱乐部有年卡的律师，应该都是名律师吧……”

如果必要条件被当成充分条件来反驳，那就更是一笔糊涂帐了，虽然表面上看起来“还挺有道理“的。例如：

论坛ID_A：只有找出良好的抽象，才能做好软件。

论坛ID_B：放屁！傻B！谁告诉你只要找出抽象就能做好软件了？你雇一堆白痴程序员加一个白痴经理试试？

（关键字提示：“只要……就”和“只有……才”）

问题实验不可证明

理论需要实验来证明。但如果实验有问题，那这种理论的可信度就要受到怀疑了。

许多人可能都听说过“可乐杀精”、“中（成）药能杀病毒”，并且将这些说法广为传播。其实，“可乐杀精”和“中药杀病毒”的试验是这样做的：1、将精液置入试管，然后倒入可乐，静置几小时，然后观察到的结果表明活动精子的数量减少了。2、将病毒培养液置入试管，然后倒入中药制剂，过若干时间后观察到病毒有大批死亡。

对科学试验方法有些了解的人，看到这里就会明白这种试验是多么地靠不住。对于不了解科学实验的基本原则的人，我这里多说两句：这些试验没有进行对比，从而导致了错误的归因和解释（应该随机双盲）。试想：如果倒入的不是可乐、中药，而是白开水、食盐、吊白块、漂白粉，或者什么都不放，会有什么结果？实际上，精子的活性离体并不长久，而且需要弱碱环境（可乐为酸性），而病毒在离体后特别容易灭活（作过病毒培养的人都知道对培养基和温湿度的严格要求）。真正的原因，在没有做对比试验的时候会藏匿起来很难发现。如果有了对比实验，为了解释实验结果，就不得不去寻找真*相[xxiii]，从而也就减少了犯错误的可能性（比如这样的对比试验：培养皿中未加入任何中药制剂，只是在桌上放了2小时，然后病毒也大量灭活了）。当然，如果没有对比的试验是故意设计的，那就是另外一回事了。

这方面的例子还有很多，随便找几个：

例子1：在一个汽车论坛中有人这样来证明“开空调影响刹车”：车辆静止怠速，将刹车踏板踩下，然后打开空调，发现踏板变软了，由此证明：开空调会影响刹车。

（刹车一般采用真空助力泵，长时间踩下刹车踏板，会漏气而导致“变软”。所以开不开空调，长时间踩刹车踏板都会“变软”）

例子2：有人说，可乐是酸性的，会导致骨髂中的钙质大量流失。实验设计如下：用酸液去浸泡人的骨骼标本，经过一段时间后发现骨头变软而且有很大的弹性，再进行光谱分析，发现里面的钙质已经大量减少。

（可乐是喝到消化道里的，不可能直接接触骨骼。人的胃中有大量的胃液，其主要成分是盐酸，盐酸比可乐的酸性和腐蚀性要强多了，可以直接融化钢铁）

例子3：《郑玉巧育儿经（婴儿卷）》。其中有一节“新生儿有感情吗”中提到这样的一个案例（第92页）：

“医学上有这样一个例子，非常令人吃惊：一个刚刚出生的女婴，无论如何也不吃妈妈的奶，却吃其他产妇的奶。经过多次试验，仍然如此，这使医护人员大惑不解。经过仔细调查，医护人员了解到，这位新生妈妈在怀孕初期，就极力想把胎儿打掉，直到分娩前，还很不情愿接受这个孩子。没想到，孩子出生后竟拒绝吃妈妈的奶！她宁愿吃别的妈妈的奶。如果胎儿不能领会母爱，这一切又怎样解释呢？”（本例引用自XYS网友文章，未考证与原书文字是否精确一致）

（错误的归因。这种错误很可能是由于作者的预设立场而产生的）

题外话：这样的实验，对于没有批判性思维的人，具有相当大的蒙骗性。人们习惯于接受错误的解释，这也正是宗教生存的土壤。

[i] 动物试验表明人类的近亲黑猩猩，以及善于群交的矮黑猩猩都有意识
[ii] 实验表明动物也是经常运用类比法去探索

[iii] 异食癖的不计在内，中医信奉者服用“人中黄”的也暂且不算

[iv] 在中国老一辈的程序员中，用试错法去学习知识、去编程的，也是在有人在

[v] 凡事有例外，年纪稍大的可以回想一下著名的“摸着石头过河”——10亿人的试错

[vi] 同理也无法判断是不是会进化出一只“喜羊羊”和“灰太狼”来

[vii] 同样，也不要盲目相信权威。

[viii] 所谓主流，就是说不包括中国国内的学术界

[ix] 有人说我这样写是贬低爱因斯坦。其实我写的这些都是真实情况，只不过有人习惯于将伟大的人的方方面面都搞成金光闪闪的，见不得别人批评，更有甚者不了解情况就妄下结论。其实爱因斯坦对自己的每次论战失败也都是承认的，只不过他总不服输，他从直觉上认为“老头子不掷骰子”，“一种内在的声音告诉我它并不是真实的”，认为量子物理一定在某个基础的东西上错了。爱因斯坦终其半生之力，也没有战胜量子物理，在死后还被阿斯派克特实验证明是错的（“实在性”和“定域性”只能二选一。无论如何选，爱因斯坦都是错的，因为他认为世界既是定域的，又是实在的）。许多人认为“爱因斯坦对量子物理的批评促进了量子物理的发展”，我想，理智的人都会承认这一点，但这也掩盖不了如下的事实：爱因斯坦在量子物理上犯了错误，而且一错就是几十年。如果按顺序排列的话，也应该先说爱因斯坦错了，然后再说他的错误其实也是“有一定的积极作用”的。（听着咋那么像中学历史课本评价农民起义泥？）爱因斯坦的朋友，和爱因斯坦同时代的科学家保罗·埃伦费斯特可以批评爱因斯坦的顽固，当面对着爱因斯坦宣称要以爱因斯坦为耻，因为爱因斯坦表现得像“早年容忍不了相对论的那些人”，当时埃伦费斯特手中还没有任何证据据明爱因斯坦是错的，我们这些握有可信证据的后人，难道就不能批评爱因斯坦了么？

[x]之所以称其为科学事实，说明它可检验，可解释，可预测

[xi]很多年前认为是四种，所有较早的书中也说是四种，如《裸女》

[xii] 如果这种“金科玉律”已经被一个群体所广泛接受，那么它看起来就“更接近于真理”，如朝鲜，柬埔寨，1984……，还有这一篇报道：http://www.gmw.cn/content/2007-05/14/content_605779.htm

[xiii] 现代医学将发达国家的平均寿命提高到了70多岁，而在此之前，这些国家的平均寿命均没有超过40岁。其中，现代医学对婴儿存活率的提高是非常显著的。如果想要检验，可以试着去找一些50岁以上的人，问问他们的兄弟姐妹夭折过多少。或者参考以下数据：中国在2007年婴儿死亡率（IMR）为15.3人/一千人，（这相当于美国1960年的水平，美国在2002年婴儿死亡率为7.0人/一千人）。与最早有记录的数据比较一下：在1915年的美国，婴儿死亡率为99.9人/一千人；中国的婴儿死亡率在1958年为80.8/一千人，也就是说，当时有将近十二分之一的婴儿是活不下来的（在1948年，则有五分之一婴儿会死掉）

[xiv]编译器BUG，OS出错，内存刷新失败，宇宙射线……

[xv] 比如嵌套类的访问权限和friend声明

[xvi] 有些人会倾向于将“职业”看成更“懂行”、更“专业”。其实这二者没什么必然的决定关系，而且在很多行业均是如此。其实，职业只代表以此为业，能达到职业最低标准即可。懂得多少则在于个人修为。

[xvii]不是所有的非科学都是伪科学，但是如果它明明不是科学，还非要宣称自己的科学的，这样它才算成是伪科学

[xviii] 即使对食物中的微量营养进行检测，用微波炉烹调也是有益无害。比如《美国食品科学》中记录了这样的实验结果：微波炉烹饪方法比传统烹饪方法维生素C损耗减少20％，维生素B1损耗减少40％。中国食品卫生监督部门以前也作过类似的检测分析，卷心菜经微波炉烹饪，维生素C的损耗率为4.76％，而传统烹饪方法导致的损耗率却为19.04％。另外，食品中矿物质、氨基酸的存有率也比其他烹饪方法高得多。如用微波炉烹饪蹄膀，八种必需氨基酸为微波加热前的98.6％

[xix]在国内的汽车论坛，我差不多是最早推广宣传IIHS的统计报告的。当时有很多人看到我列出的数据后感到不爽（因为他们喜欢的车型的伤亡率很高，他们批判的车型的伤亡率却很低），于是他们就找出各种理由批判。在这些种理由中，没有一个站得住脚的，比如说“伤亡高是因为保有量大”，其实原始数字就是折合的百万辆车的伤亡率，或者说“某些车型的伤亡率高是因为旧款多”，其实原始数据已经标明了生产年份……IIHS是一个比较严谨的机构，早就考虑了种种情况，将数据梳理到合理才发表的，而且发表的文件中也有注明。这些人很可能是没有仔细看数据，就凭着自己的喜好开始了想象与猜测，所以才会犯下如此多的低级错误（刚才最后这一句话也是我想象的，嘻嘻）

[xx] 如果不依靠数据的话，甚至许多专业领域内浸淫多年的资深人士，对事情的判断也常常会出错

[xxi]网上某些所谓“铁笼中的黑市拳”的照片，其实就是来自于一个叫UFC的综合格斗赛事

[xxii] 要警惕玩弄数字的诡辩者

[xxiii] 我知道“真*相”二字在国内大多数可“自由发言”的地方是屏蔽的，所以要用间隔符号。

PyCon2013 有意思的幻灯

March 24, 2013March 24, 2013 zhanxw Leave a comment

Interesting slides from PyCon 2013
今年PyCon在加州的Santa Clara召开。我虽然没去，但一如既往的关心。
挑出和我相关的一些有意思的幻灯，在此分享。

1. BeautifulCode
Raymond Hettinger是一个善用Python的高手，他的code非常简洁，有Python的风味。
这个幻灯里，他介绍很多Python中常用的简洁的写法，包括怎么用iterator， list comprehension.
我感觉有意思的是defaultDict （不需要再用dict.get()), decorator（修饰方法，类比CSS）和context（干净的获取和释放资源）

原始链接

2. Python: A “Toy” Language

David Beazley是一个Python作家，对Python GIL有过详细的介绍，以前写过如何把Generator组合成一个workflow的幻灯。
现在在芝加哥教Python。这个人擅长Python的教学，并能给出有趣的例子。这次也不例外，他介绍了如何用Python和Shapeoko （包括Arduino）来组装并使用CNC （数控机床？）。这个例子告诉我们Python可以做计算机程序之外很有用的应用。

原始链接

3. Awesome Big Data Algorithms

作者是MSU的老师。这个Blog的背景是土壤Genetics。因为土壤中的genetics比单纯人的DNA更复杂，数据量更大，因此需要Big Data Algorithm。这个幻灯介绍三种算法：SkipList, HyperLogLog, Bloom filter（CountMin Sketch）。

SkipList是一种基于链表的数据结构，相对羽平衡二叉树，这个算法的优点是更好的支持并发操作。本质上，SkipList是一个分层次的链表。在最底层，链表元素按顺序排列。在更高的层次，（按照概率）简历一部分低层的数据的索引。这种数据结构在查找时非常有效：从高层开始查找，直到最底层顺序查找，整个查找是log（N）

HyperLogLog是应用于大数据的算法，用来计算一个很大集合的基数（即合理总共有多少不相同的元素）。大致思路是用一组相互独立的哈希函数依次处理输入，然后对哈希值分块计数：对高位统计有多少连续的0；用低位的值当做数据块。比如:011000|01，就是高位有3个连续的0，低位是1，就表示第一个数据块。因为连续观测的三个0的概率大约是1/8，所以对数据块1来讲，可以把计数乘8，作为集合基数的估计。因为低位可能有0，1，2，3这四种数值，总基数可以取上述4中技术的几何平均数。在HyperLogLog中，具体的还有一些系数可以调整，使得估计更准确。
这片Blog详细介绍了HyperLogLog算法，图文并茂。

BloomFilter或CountMin Sketch是两个不同的算法，但又有紧密联系。相似之处是两个算法都需要一族独立的哈希函数。不同之处是处理的问题不同。对BloomFilter,在预处理阶段对每一个特定的输入算出所有哈希函数的值，并在这些值上做出标记。最后，当查找一个特定的输入是否出现过，只需查找这一系列的哈希函数对应值上有没有标记。对于BloomFilter，可能有False Positive，但不可能有False Negative。此外，BloomFilter可看做查找一个数据有或者没有的数据结构（数据的频率是否大于1）。CountMin Sketch在BloomFilter的基础上更进一步，它可用来估算某一个输入的频率（不局限于大于1）。具体思路是对哈希函数值对应的sketch上计数（对BloomFilter则只是标记是或否）。最后估计频率的时候，对每个估算出的频率取最小值。

原始链接

4. Why you should use Python 3 for text processing

这个讲座关注的Python3，而不是现在我使用的Python2.7.3。但在Python社区，有时好的功能会从版本3移植回版本2。
这个讲座介绍了Python3里面的新功能，例如ChainMap，startswith（tuple作为参数），unicode支持，textwrap模块（可以方便的排版）和email模块。

原始链接

用pip安装Matplotlib (Mac)

March 15, 2013March 15, 2013 zhanxw Leave a comment

Install matplotlib using pip (Mac)

在Mac OSX下安装matplotlib并不简单（比如Linux可以用apt-get，Windows可以直接下载Binary build），因为matplotlib需要一些底层库(例如freetype，pygtk，而pygtk又需要gobject, gobject需要cairo）。

这里总结一下我在Mac OSX下安装Matplotlib的经验。

首先安装MacPorts，具体参见Install MacPorts.

然后安装py27-pygtk

 port install py27-pygtk

然后把pygtk的路径添加到PYTHONPATH里：

export PYTHONPATH=$PYTHONPATH:/opt/local//Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/

最后用pip安装

alias pipInstall='pip install  --install-option="--prefix=/Users/zhanxw/python" '
export CC=/opt/local/bin/g++; export CFLAGS=; export LDFLAGS= ; pipInstall -U matplotlib

这里要指定GCC编译器的路径，否则系统默认用gcc 4.2版编译。
还需要清除CFLAG和LDFLAGS，不然安装的时候不用pkg-config，也就得不到gtk库文件的位置。

额外两个tip：

【1】安装pip需要先安装setuptools
【2】一个命令升级所有pip安装的软件：

  pip freeze --local | grep -v '^\-e' | cut -d = -f 1  | xargs pip install -U

此外如何在Mac OSX下用源码安装numpy和scipy？
这里有官网的说明。
特别注意的是，编译numpy和scipy要用gcc 4.0版。
另外scipy还需要cython （pip install cython）

发布Python程序

January 17, 2013January 17, 2013 zhanxw Leave a comment

发布Python程序

Distribute Python script

最近需要把一个Python程序发布给其他学校的Collaborators使用，发现最主要的问题是版本不兼容：我使用的是Python 2.7版本，但其他学校可能使用2.5或者更老的2.4版本。因为我使用了大量新版的特有功能，直接把代码发布给对方是没法让对方使用的。因为老版本的Python不支持2.7版里的函数比如：os.SEEK_SET, all(), str.format() 。解决方法有两个：

1. 使用Freeze之类的工具

在Python source code里有一个Tools文件夹，里面有freeze这个工具。他可以把Python代码编译成C语言中的Python。这种方式可以解决简单的脚本，但复杂的脚本这种方法可能会带来其他的错误。

2. 重写代码

这是最根本的解决方法，把新版本特有的函数重新定义，或者用另一种方法实现。比如all()

# all is a keyword since Python 2.7                                                                                                                                                  
try:
    all
except:
    def all(iterable):
        for element in iterable:
            if not element:
                return False
            return True

有一个工具可以检查当前的Python的向前兼容性：

https://github.com/ghewgill/pyqver

检查checkVCF.py的结果如下所示：

/net/fantasia/home/zhanxw/rvtests/rvMeta/sftp.clean/checkVCF/checkVCF.py
2.5 all
2.4 set, generator expression
2.3 logging, sum, enumerate

就是说我使用了2.5特有的all()函数，如果想在2.4版的Python上运行，需要重新定义all()函数。
类似的，set(), generator expression是2.4版才加入的特性，如果要支持2.3版本，就必须改写这两个地方。