医学统计的几个基本概念
1.总体与样本
总体 总体是根据研究目的所确定的同质观察单位的全体。
样本 从总体中随机抽取进行研究的部分个体称为样本。
常用的随机抽样方法有以下四种:
(1)单纯随机抽样 每个抽样单位被选人样本的概率相等。应用于抽样范围不大,内部分布较均匀的抽样。
(2)系统抽样 又称等距离抽样或机械抽样。优点是简便易行,易得到按比例分配的样本;缺点是当总体的观察单位按顺序有周期变化趋势时,将产生明显偏性,难以准确估计抽样误差大小。
(3)分层抽样 适用于内部组成不甚均匀的总体,便于对不同层分别抽样;可对不同层进行独立分析,还可在各层之间进行比较研究。
(4)整群抽样 适用于群问差异较小的情况。抽取的“群”越多,误差越小。
2.误差 为测得值与真值之差或样本指标与总体指标之差。可分为系统误差和抽样误差。
(1)系统误差 在搜集资料过程中,由于仪器不准、标准试剂未经校正、操作方法不规范、诊断标准与治疗方法掌握不统一等确定原因,使观察结果呈倾向性偏大或偏小,这种无统计规律性的误差称为系统误差。应通过严格技术措施消除或减少系统误差。
(2)抽样误差 包括随机测量误差和抽样误差,随机测量误差是由于观测中存在着随机测量变异,而造成同一对象多次测定结果之差。改善测量手段和测量条件,可将随机测量误差降低到允许范围。抽样误差是指消除了系统误差,并把随机测量误差控制在较小范围内,但由于总体内各个体之间存在变异,样本内各个体变异情况和总体内各个体变异情况不会恰好相同,这种由抽样造成的样本指标与总体指标之差称抽样误差。抽样误差有统计规律性。
3.变量
被观察对象的特征称之为观察指标,如病人的性别、年龄、呼吸、血压等,这些观察指标在统计学上统称为变量。因对不同的人进行观察,可得到不同的测定值。
4.计量资料与计数资料
(1)计量资料 又称定量资料或数值变量资料。用定量方法对每一观察单位的某项指标进行测量,所测得的数值组成的资料。一般有度量衡单位,多为连续性变量。
(2)计数资料 又称定性资料或分类资料。将观察单位按性质或类别分组,然后清点各组观察单位个数所得的资料。
等级资料是介于上述两种资料之间的半定量资料。