智力测验类似于估计某块地玉米质量时所做的工作,你在地里四处走动,随意地到处摘取一些玉米穗,当剥开并研究了大约100颗玉米穗时,你就能对整块地的质量大致有数。当已知两块地的质量不同,这些信息已经足够对它们的质量进行比较了。但如果两块地的质量接近,你就得摘取更多的玉米穗,并始终采用某种精确的质量标准来给它们划分等级。
我们可以定量地衡量你的样本以多大的精度代表总体,那就是:可能误差和标准误差。
假设你要完成一项丈量任务,即通过步测栅栏来了解几块地的大小。你要做的第一件事自然是检查丈量体系的准确性,通过多次步量后量出自认为的100码,你发现平均而言有3码的误差。这意味着,有一半的试验是你离开真实100码的距离在3码之内,而另一半试验是你与真实100码的距离在3码之上。
毫无意义的工作(2)
这样一来,在测量100码时,你的可能误差是3码,或者说3%。从此之后,每次被你步量测出的100码应该被记录成100±3码。
(大多数统计工作者更倾向于使用另一个类似的误差度量工具:标准误差。全部实验中将有2/3的试验落在加减1个标准误差的范围内,而不是刚好1/2的比例,人们还认为标准误差的数学处理更方便。出于分析目的的考虑,在这里我们还是坚持使用可能误差,并将其运用到斯坦福…比内测试中。)
假设智力测验的可能误差为3%,与我们假定的步量任务具有相同的可能误差。这与智力测验的好坏无关,而只是反映了测验与它所要测试的内容具有怎样的一致性。这样彼德的智商更全面的表达是98±3,琳达的智商则是101±3。
这说明彼德的智商以相等的机会落在95~101中任何一点上,并且大于或者小于98的可能性完全一样。同样,琳达的智商落在98~104范围内的可能性也不过50%。从中你会很快发现:有1/4的可能性彼德的智商将超过101,这与琳达的智商低于98的可能性相同。这样看来,彼德的智商并不低于而是高于琳达的智商,它们之间还有3分的差距。
我们的结论是:对待智力测验以及许多其他类似的抽样结果应注意它的范围。正常的智商不应该只是100这样一个数值,而应是诸如90~110的一个范围。将处于这个范围的孩子与低于或高于此范围的孩子进行比较时会得出一些有用的结论。但比较相差不大的两个数据则毫无意义。你必须在脑中牢记这个加减符号,即使(特别是当)它没有明确给出。
在所有抽样研究中都有误差,忽略这些误差将导致一些愚蠢的举动。那些把读者调查奉若神明的杂志编辑,是因为他们不了解调查。对于一篇有40%男性读者喜爱的文章与另一篇只有35%男性读者喜爱的文章,他们会刊载更多类似于前者的作品。
对于杂志而言,40%与35%读者人数的差异是很重要的,但抽样调查形成的差别却并不一定是真实的。出于成本的考虑,读者人数调查的实际样本,特别是已经扣除了那些从来不读该杂志的人后,也许只有几百人。对于一本女性杂志,样本中的男性读者会很少。当这些人又根据他们的回答:“全部读了”、“读了大部分”、“读了一部分”以及“没看”这篇文章而被划分成四组后,35%男性读者的结论也许仅仅建立在几个人基础之上。隐藏在这个看似显著的数据背后的误差可能会很大,依靠它抉择的编辑并没能抓住一根救命的稻草。
为了一个数学上可论证,但是却小得没有意义的差别,人们有时会费尽力气。这种行为藐视了一句古训:只有当差别有意义时才能称之为差别。我们可以看一个相关的案例:老黄金(Old Gold)香烟公司利用一个毫无价值的结论制造了大量喧闹并大赚了一笔。
故事起源于《读者文摘》(Readers Digest)某编辑的一个偶然想法。该编辑自己抽烟,而且他并不认为各种品牌的香烟完全相同。他的杂志开始行动起来,聘请了一些实验室人员对不同品牌香烟的烟雾展开了分析。杂志刊登了最终结果,列出每种品牌香烟的烟雾中尼古丁以及其他有害物质的含量。在详尽的数据支持下,该杂志声明:所有品牌的香烟是一样的,无论你吸的是什么牌子的香烟,不会有任何差异。
也许你会认为,对于香烟生产厂商和那些为香烟杜撰崭新广告词的家伙而言,这是一个有力的打击,它还将引爆关于平缓喉痛和对胸部有益的广告索赔案。但某些人却有了其他发现,在一长串具有相同有害物质的品牌名单上,总有一个排在最后,这就是“老黄金”牌香烟。于是,电报漫天飞舞,大幅广告以最大的字体刊登在报纸上。广告的标题和副本仅仅提到,由一家国家级杂志主持的实验证明“老黄金”牌香烟在不良物质,以及尼古丁含量方面“排名最后”,任何关于各个品牌的差异并不显著的文字甚至是暗示都被省略了。
最后,“老黄金”公司被通知“中止并停止”使用这个具有误导性的广告。但这并不要紧,他们早已获得了足够的好处。
本章小结:
◆我们可以定量地衡量你的样本能以多大的精度代表总体,那就是:可能误差和标准误差。
◆在所有抽样研究中都有误差,忽略这些误差将导致一些愚蠢的举动。
◆只有当差别有意义时才能称之为差别。
txt电子书分享平台
令人惊奇的图形
第五章 令人惊奇的图形
人们对于数字似乎有一种天生的畏惧,当汉普蒂?汤普蒂(Humpty Dumpty)译者注:Humpty Dumpty在英语俚语中是指“又矮又胖的人”。充满自信地告诉爱丽斯(Alice),他能熟练地驾驭文字时,恐怕没有多少人能将同样的自信延伸到对数字的掌握上。也许早期的数学经验对我们造成了心灵的创伤。
不管什么原因,当作者渴望自己的书有人读,广告商希望自己的广告能促进商品的销售,出版商希望自己的书或杂志畅销时,数字产生了真正的问题。很多情况下,表格中的数字是禁用的,而文字又不能达到很好的效果,这个时候解决的方法就只有一种:画图。
最简单的统计图形是直线类图形。在显示趋势时,直线图形非常有用。而对于趋势,人们总是津津乐道于了解它、发现它、分析它,甚至预测它。下面,我们将用图形来显示国民收入怎样在一年内实现了10%的增长。
首先,在纸上用相互垂直的直线画出许多小方格。然后,在横轴的底部注明月份,在纵轴旁标上数字,单位是“十亿美元”。在图中点出每个月的国民收入,再用直线将这些点连接起来,你的图形看起来像这样:
这张图清晰地显示了一年来的变化,而且变化是逐月反映出来的。然而画图者很快就会发现,由于图形纵轴从原点即“0”开始,并且整张图形是按比例绘制的,虽然看上去的确上升了10%——一个了不起的上涨趋势,但是却并不振奋人心。如果你所要做的仅仅是传递信息,那么目的已经达到了。但假如你希望利用图形赢得一场争论、让读者大吃一惊、促使某项行动,或者向他人推销货物等,它就缺乏渲染的效果了。试试把图形的底部抹去,这样不是更好吗?(如果某个爱挑剔的家伙反对这种有误导的变动,你可以理直气壮地指出,这样做节省纸张。)数据是相同的,所以图形也相同,除了图形给人留下的印象不同之外,没有进行任何的伪造。但是粗心的读者现在所看到的是国民收入直线在12个月内上升很快,几乎占据了半张图形,不过,这其实仅仅是因为图表的大部分都已被抹去。就像语法课上遇到的省略句,它们也能被“理解”。但是,眼睛却不能“理解”被抹去的部分,这才导致微小的上升最终变成了惊人的增长。
既然已经开始行骗,那么就别急着金盆洗手。你还有比之好得多的方法,它能使朴实的10%的增长率看上去比100%的增长率更让人振奋。只需要改变横坐标与纵坐标的比例关系,将纵坐标的每一个刻度缩减为原来的1 /10即可,没有人规定不能这么做,而这将会产生一张更加完美的图形。
它真的令人震惊!不是吗?任何看到这幅图的人都会强烈地感觉到在国家的各条经济命脉上正快速地积累着大量的财富。这相当于将“国民收入增长了10个百分点”改写成“国民收入惊人地攀升了10个百分点”。显然图形比文字更有效,因为图形中不存在任何形容词和副词来破坏它所具有的客观性幻觉,而且谁也无法指责你。
你还会有一些著名的或至少是受人尊敬的同伴。某家新闻杂志采用同样的方法来表现证券市场创了新高,他们将图形的底部截去,使得图形中的增长比实际情况更加令人欢欣鼓舞。在一则关于哥伦比亚煤气公司(Columbia Gas System)的广告中有一张复制的、 “来自最新年报”的图形,如果仔细阅读图中的数字并进行分析,你将发现10年来生活指数上升了60%,而汽油成本下降了4个百分点。这是一张不赖的图形,但是对这家公司而言显然还不够理想,于是他们将图形顶部截至90%的刻度(纵坐标没有断层,也没有任何文字说明来提示所做的变化),以至于单纯通过观察得出的结论是:生活指数是原来的3倍,而汽油成本则下降了1/3。
为了罗列公众反对工资增长的意见,钢铁公司使用了类似的误导性图形。然而它根本称不上是新方法,人们很早就揭露了其不完善之处,并刊登在许多地方,而不仅仅是统计专业者使用的技术刊物中。早在1938年,《丹斯评论》(Dun’s Review)的某个编辑就曾经摘录了一张类似的统计图,该图形出现在一则鼓吹华盛顿广告业的广告中,图形的标题是:“政府支出急剧上升!”尽管图中的折线与标题中