简介
目录
目 录
译者序
作者介绍
推荐序
前言
致谢
第1章 导论1
1.1 简介1
1.2 本书的组织结构1
1.3 如何使用本书2
1.3.1 应该使用何种检验2
1.3.2 我需要多大的样本量5
1.3.3 你不必手动计算6
1.4 本章要点6
1.5 本章思考题6
1.6 本章思考题答案6
1.7 参考资料7
第2章 量化用户研究8
2.1 什么是用户研究8
2.2 用户研究的数据8
2.3 可用性测试9
2.3.1 样本量9
2.3.2 代表性和随机性9
2.3.3 用户研究的三种研究类型11
2.3.4 数据收集11
2.3.5 任务完成率12
2.3.6 可用性问题12
2.3.7 任务时间13
2.3.8 出错数13
2.3.9 满意度评分14
2.3.10 复合分数14
2.4 A/B测试14
2.5 调查数据15
2.5.1 等级量表15
2.5.2 净推荐值15
2.5.3 评论和开放性数据16
2.6 需求收集16
2.7 本章要点16
2.8 参考资料17
第3章 我们的估算到底有多准确18
3.1 简介18
3.1.1 置信区间=误差幅度的两倍18
3.1.2 置信区间提供了精确度和位置19
3.1.3 置信区间的三个组成要素19
3.2 完成率的置信区间19
3.2.1 置信区间的历史20
3.2.2 Wald区间:对于小样本来说太不靠谱了20
3.2.3 精确置信区间21
3.2.4 Wald校正区间:增加两次成功与两次失败21
3.2.5 完成率的点估计…23
3.2.6 遭遇可用性问题的置信区间24
3.3 等级量表和其他连续性数据的置信区间25
3.3.1 任务时长数据的置信区间27
3.3.2 任务时长均值还是任务时长中位数28
3.3.3 几何平均数28
3.3.4 大样本任务时长的置信区间30
3.3.5 围绕中位数的置信区间30
3.4 本章要点32
3.5 本章思考题33
3.6 本章思考题答案33
3.7 参考资料34
第4章 我们达到或超过目标了吗35
4.1 简介35
4.2 单侧检验和双侧检验38
4.3 完成率与基准的比对39
4.3.1 小样本检验39
4.3.2 大样本检验42
4.4 满意度评分与基准的比对43
4.5 任务时间和基准的比对47
4.6 本章要点51
4.7 本章思考题51
4.8 本章思考题答案52
4.9 参考资料55
第5章 不同设计之间有统计学差异吗56
5.1 简介56
5.2 比较两个平均值(等级量表和反应时)56
5.2.1 组内比较——配对t检验57
5.2.2 比较任务时长59
5.2.3 组间比较(双样本t检验)61
5.2.4 t检验的假设65
5.3 比较完成率、转换率以及A/B测试66
5.3.1 组间比较66
5.3.2 组内比较74
5.4 本章要点82
5.5 本章思考题84
5.6 本章思考题答案86
5.7 参考资料90
第6章 关于样本量大小的总结性研究91
6.1 简介91
6.1.1 我们为何要关注91
6.1.2 可用性研究的类型至关重要92
6.1.3 总结性可用性测试样本量预估的基本原则92
6.2 预估数值93
6.3 比较数值99
6.4 如何控制变异性104
6.5 二项置信区间样本量的估计105
6.5.1 大样本的二项样本量估计105
6.5.2 小样本的二项样本量估计106
6.5.3 与基准比例相比较的样本量109
6.6 卡方检验的样本量预估(独立比例)111
6.7 McNemar精确检验的样本预估(配对比例)114
6.8 本章要点117
6.9 本章思考题119
6.10 本章思考题答案120
6.11 参考资料123
第7章 关于样本量大小的形成性研究125
7.1 简介125
7.2 使用发现问题的概率模型来估计形成性用户研究的样本量125
7.2.1 著名方程:P(x≥1)=1-(1-p)n125
7.2.2 从1-(1-p)n中推导出样本量估计方程127
7.2.3 使用表格计划形成性用户研究样本量129
7.3 二项概率模型的假设130
7.4 模型的附加应用131
7.4.1 估计多重问题或其他事件的复合p值131
7.4.2 校正小样本p的复合评估值132
7.4.3 估计可发现的问题数和未被发现的问题数136
7.5 影响p值的是什么138
7.6 什么是合理的目标问题发现率138
7.7 调解“神奇的数字5”和“8还不够”140
7.7.1 一段历史——20世纪80年代141
7.7.2 又一段历史——20世纪90年代141
7.7.3 “神奇的数字5”的起源142
7.7.4 “8还不够”——一个调解方法144
7.8 更多关于二项概率公式及其小样本校正147
7.8.1 二项概率公式的起源147
7.8.2 紧缩校正是如何起作用的149
7.9 针对问题发现的其他统计模型151
7.9.1 对问题发现使用二项分布模型的批评151
7.9.2 扩展的二项分布模型152
7.9.3 捕获-再捕获模型153
7.9.4 在计划形成性用户研究时为什么不用其他模型153
7.10 本章要点156
7.11 本章思考题158
7.12 本章思考题答案159
7.13 参考资料159
第8章 标准化的可用性问卷163
8.1 简介163
8.1.1 什么是标准化的问卷163
8.1.2 标准化可用性问卷的优点163
8.1.3 什么样的标准化可用性问卷是有用的164
8.1.4 标准化问卷的质量评估:信度、效度和灵敏度165
8.1.5 其他项目的特征166
8.2 后续研究的调查问卷167
译者序
作者介绍
推荐序
前言
致谢
第1章 导论1
1.1 简介1
1.2 本书的组织结构1
1.3 如何使用本书2
1.3.1 应该使用何种检验2
1.3.2 我需要多大的样本量5
1.3.3 你不必手动计算6
1.4 本章要点6
1.5 本章思考题6
1.6 本章思考题答案6
1.7 参考资料7
第2章 量化用户研究8
2.1 什么是用户研究8
2.2 用户研究的数据8
2.3 可用性测试9
2.3.1 样本量9
2.3.2 代表性和随机性9
2.3.3 用户研究的三种研究类型11
2.3.4 数据收集11
2.3.5 任务完成率12
2.3.6 可用性问题12
2.3.7 任务时间13
2.3.8 出错数13
2.3.9 满意度评分14
2.3.10 复合分数14
2.4 A/B测试14
2.5 调查数据15
2.5.1 等级量表15
2.5.2 净推荐值15
2.5.3 评论和开放性数据16
2.6 需求收集16
2.7 本章要点16
2.8 参考资料17
第3章 我们的估算到底有多准确18
3.1 简介18
3.1.1 置信区间=误差幅度的两倍18
3.1.2 置信区间提供了精确度和位置19
3.1.3 置信区间的三个组成要素19
3.2 完成率的置信区间19
3.2.1 置信区间的历史20
3.2.2 Wald区间:对于小样本来说太不靠谱了20
3.2.3 精确置信区间21
3.2.4 Wald校正区间:增加两次成功与两次失败21
3.2.5 完成率的点估计…23
3.2.6 遭遇可用性问题的置信区间24
3.3 等级量表和其他连续性数据的置信区间25
3.3.1 任务时长数据的置信区间27
3.3.2 任务时长均值还是任务时长中位数28
3.3.3 几何平均数28
3.3.4 大样本任务时长的置信区间30
3.3.5 围绕中位数的置信区间30
3.4 本章要点32
3.5 本章思考题33
3.6 本章思考题答案33
3.7 参考资料34
第4章 我们达到或超过目标了吗35
4.1 简介35
4.2 单侧检验和双侧检验38
4.3 完成率与基准的比对39
4.3.1 小样本检验39
4.3.2 大样本检验42
4.4 满意度评分与基准的比对43
4.5 任务时间和基准的比对47
4.6 本章要点51
4.7 本章思考题51
4.8 本章思考题答案52
4.9 参考资料55
第5章 不同设计之间有统计学差异吗56
5.1 简介56
5.2 比较两个平均值(等级量表和反应时)56
5.2.1 组内比较——配对t检验57
5.2.2 比较任务时长59
5.2.3 组间比较(双样本t检验)61
5.2.4 t检验的假设65
5.3 比较完成率、转换率以及A/B测试66
5.3.1 组间比较66
5.3.2 组内比较74
5.4 本章要点82
5.5 本章思考题84
5.6 本章思考题答案86
5.7 参考资料90
第6章 关于样本量大小的总结性研究91
6.1 简介91
6.1.1 我们为何要关注91
6.1.2 可用性研究的类型至关重要92
6.1.3 总结性可用性测试样本量预估的基本原则92
6.2 预估数值93
6.3 比较数值99
6.4 如何控制变异性104
6.5 二项置信区间样本量的估计105
6.5.1 大样本的二项样本量估计105
6.5.2 小样本的二项样本量估计106
6.5.3 与基准比例相比较的样本量109
6.6 卡方检验的样本量预估(独立比例)111
6.7 McNemar精确检验的样本预估(配对比例)114
6.8 本章要点117
6.9 本章思考题119
6.10 本章思考题答案120
6.11 参考资料123
第7章 关于样本量大小的形成性研究125
7.1 简介125
7.2 使用发现问题的概率模型来估计形成性用户研究的样本量125
7.2.1 著名方程:P(x≥1)=1-(1-p)n125
7.2.2 从1-(1-p)n中推导出样本量估计方程127
7.2.3 使用表格计划形成性用户研究样本量129
7.3 二项概率模型的假设130
7.4 模型的附加应用131
7.4.1 估计多重问题或其他事件的复合p值131
7.4.2 校正小样本p的复合评估值132
7.4.3 估计可发现的问题数和未被发现的问题数136
7.5 影响p值的是什么138
7.6 什么是合理的目标问题发现率138
7.7 调解“神奇的数字5”和“8还不够”140
7.7.1 一段历史——20世纪80年代141
7.7.2 又一段历史——20世纪90年代141
7.7.3 “神奇的数字5”的起源142
7.7.4 “8还不够”——一个调解方法144
7.8 更多关于二项概率公式及其小样本校正147
7.8.1 二项概率公式的起源147
7.8.2 紧缩校正是如何起作用的149
7.9 针对问题发现的其他统计模型151
7.9.1 对问题发现使用二项分布模型的批评151
7.9.2 扩展的二项分布模型152
7.9.3 捕获-再捕获模型153
7.9.4 在计划形成性用户研究时为什么不用其他模型153
7.10 本章要点156
7.11 本章思考题158
7.12 本章思考题答案159
7.13 参考资料159
第8章 标准化的可用性问卷163
8.1 简介163
8.1.1 什么是标准化的问卷163
8.1.2 标准化可用性问卷的优点163
8.1.3 什么样的标准化可用性问卷是有用的164
8.1.4 标准化问卷的质量评估:信度、效度和灵敏度165
8.1.5 其他项目的特征166
8.2 后续研究的调查问卷167
用户体验度量:量化用户体验的统计学方法(原书第2版)
光盘服务联系方式: 020-38250260 客服QQ:4006604884