第一章:
经验之谈:
观察的数量太少、选择偏差、确认偏差、不准确
更好的做法-统计方法:
收集数据,使用大型全国性调查的数据
描述性统计,计算能总结数据的统计量
探索性数据分析,寻找模式、差异和其他能解决问题的而特征
假设检验,评判影响是否真实
估计,样本推断整体
术语:
经验之谈 个人随意收集的证据
直观效应 表示发生了某种有意思的事情的度量或汇总统计量
人为 由于偏差、测量错误或其他错误导致的直观效应
队列 一组被调查者
横断面研究 收集群体在特定时间点的数据的研究
字段 数据库中组成记录的变量名称
纵贯研究 跟踪群体,随着时间推移对同一组人反复采集数据的研究
过采样 为避免样本量过少,而增加某个子群体代表的数量
总体 要研究的一组事物,通常是一群人
原始数据 未经或只经过很少的检查 计算或解读而采集和重编码的值
重编码 通过对原始数据进行计算或者其他逻辑处理得到的值
记录 数据库中关于一个人或其他对象的信息的集合
代表性 如果人群中的每个成员都有同等的机会进入样本,那么这个样本就具有代表性
被调查者 参与调查的人
样本 总体的一个子集,用于收集数据
统计显著 若一个直观效应不太可能是由随机因素引起的,就i是统计显著的
汇总统计量 通过计算将一个数据集归结到一个数字,而这个数字能表示数据的某些特点
表 数据库中若干记录的集合