【摘要】 背景 健康素养与健康状况密切相关,目前国内研究多倾向于运用多维度、多条目的健康素养测评工具, 尚缺少简便且有效的健康素养测评工具。目的 简化健康素养量表并在中国人群中进行心理测量学检验。方法 从“中 国家庭健康指数调查(2021 年)”数据中选择 18 岁及以上人群作为本研究的调查对象,依据纳入与排除标准,最终 纳入 7 449 份数据,并随机分为 2 个样本集,其中样本集 1 共 3 680 份,样本集 2 共 3 769 份。对调查对象进行一般资 料问卷、12 条目健康素养量表(HLS-SF12)、领悟社会支持量表(PSSS)、家庭健康量表(FHS-SF)调查。应用经 典测量理论以及项目反应理论中的 Mokken 模型对 HLS-SF12 原条目进行筛选,并对精简后的量表进行信效度等验证 性分析。结果 使用经典测量理论和 Mokken 模型分别简化出 1 个 9 条目版本的量表(HLS-SF9)和 1 个 4 条目版本 的量表(HLS-SF4)。HLS-SF9 与 HLS-SF4 均无天花板效应、地板效应,二者的 Cronbach's α 系数分别为 0.913 和 0.842, 折半信度分别为 0.871 和 0.815。HLS-SF4 经探索性因子分析提取出 1 个公因子,累积方差贡献率为 67.813%,各条目 的因子载荷量均 >0.81。HLS-SF9 经验证性因子分析结果显示 χ2 /df=10.844、拟合优度指数(GFI)=0.985、调整拟合 优度指数(AGFI)=0.971、规范拟合指数(NFI)=0.986、比较拟合指数(CFI)=0.987 和近似误差均方根(RMSEA) =0.051。相关性分析结果显示,HLS-SF9、HLS-SF4 与 PSSS 呈正相关(r=0.367、0.292,P<0.001),与 FHS-SF 呈正 相关(r=0.340、0.237,P<0.001)。HLS-SF9 对 HLS-SF12 的效标效度的一致性水平(ICC)(95%CI)为 0.989(0.988~0.999), HLS-SF4 效标效度的 ICC(95%CI)为 0.892(0.886~0.899)。结论 简化后的健康素养量表具有良好的信效度,是能 够快速测评中国人群健康素养的有效工具,研究者可根据研究精度(HLS-SF9)或测评时间(HLS-SF4)的需求采取 针对性选择。
【关键词】 健康素养;条目筛选;经典测量理论;Mokken 模型;12 条目健康素养量表
健康素养系个体获取、理解健康信息以保障、推进 自身健康建设的能力[1]。WHO 强调,健康素养作为一 种认知能力和社会技能水平的象征[2],是健康的重要 决定因素[2-3]。健康素养水平的限制易让公众难以完整 地认识、了解疾病,难以实现对医疗资源的高效、充分 利用,特别是影响慢性病患者的自我疾病管理,从而导 致较差的服药依从性,甚至增加住院率与死亡率[4-6]。 我国《“健康中国 2030”规划纲要》强调居民的健康 素养情况是战略目标的核心内容,提升健康素养水平应 成为健康教育、患者管理和健康促进等方面的重要构 成[7],这就要求个人要充分了解并使用健康信息,以 便充分管理自身的健康问题,降低社会成本。因此,一 个能客观、全面且准确测评健康素养的工具是开展此类 研究的前提。 随着健康素养领域得到国内外学者的关注,用于 测量公众的健康素养工具研发活跃,目前常用成年人功能健康素养测试(Test of Functional Health Literacy in Adult,TOFHLA)、欧洲健康素养调查(the European Health Literacy Survey Questionnaire,HLS-EU-Q) 等 问 卷[8-9]。 结 合 以 上 研 究,DUONG 等[10] 在 HLSEU-Q47 的基础上,编制了适用于评估亚洲国家公众 健康素养的 12 条目健康素养量表(Short-form Health Literacy Survey Questionnaire,HLS-SF12), 以 良 好 的 信效度支持了 HLS-EU-Q47 的原始架构。我国学者多 使用国家卫生健康委员会制定的“全国居民健康素养监 测调查问卷”,随着对健康素养研究的深入,陆续有学 者研发了针对特殊人群的健康素养评估工具[11-13]。 目前课题研究中多倾向于多维度、多条目的测评工 具,力争全面化评估受测者的临床或心理特质,但随之 应用,冗长的工具也出现了一定的不足:问卷中题目过 多,使得受访者作答时间较长,作答耐心降低,作答认 真度下降,问卷的真实性可靠性难以保障;同时易使受访者产生隐私受侵的心理,增加受访者的心理负担[14]。 而简短版量表则能较大程度上规避以上弊端,同时缩减 问卷填写时间,利于推广受访人群与应用领域。此外, 简短的健康素养评估工具可被纳入患者就诊评估等评估 问卷,快速筛查出健康素养有限的群体,便于实施针对 性的健康教育,评估干预效果[8,15]。 考虑到我国在健康素养领域缺失简便的测评工具, 本研究尝试对 HLS-SF12 进行简化研究,这将有助于在 更大规模的人群或临床环境中对健康素养进行简单而准 确的评估,为今后的干预研究提供参考依据。 1 对象与方法 1.1 研究对象 “中国家庭健康指数调查(2021 年)”于 2021- 07-10—09-15 开展,采用多阶段抽样的方法,纳入中 国 23 个省和 5 个自治区的省会、4 个直辖市,并用随 机数字表法在每个省、自治区的非省会地级行政区中各 抽取 2~6 个城市,共 120 个城市。每个城市至少招募 1 位调查员或 1 支调查团队。调查员需基于“2021 年第 七次全国人口普查结果”的数据结果,使所获得样本 的性别、年龄、城乡分布基本符合人口特征。“中国 家庭健康指数调查(2021 年)”纳入标准:(1)年龄 ≥ 12 岁;(2)具有中华人民共和国国籍;(3)中国 常住人口(年外出时间≤ 1 个月);(4)自愿参加研 究,填写知情同意书;(5)可自行完成网络问卷调查 或在调查员帮助下完成问卷调查;(6)了解问卷每个 条目所表达的含义。排除标准:(1)意识不清、精神 异常者;(2)正在参加其他类似研究课题者;(3)不 愿合作者。问卷回收后由两人背靠背进行逻辑检查和数 据筛选。本研究已通过暨南大学伦理委员会伦理审查 (JNUKY-2021-018)。“中国家庭健康指数调查(2021 年)”共调查居民 11 668 例,回收有效问卷 11 031 份, 有效回收率为 94.54%。从数据中选择≥ 18 岁人群作为 本研究的受测对象,最终纳入 7 449 份数据,并随机分 成 2 个样本集,其中样本集 1 共 3 680 份,样本集 2 共 3 769 份。 1.2 方法 1.2.1 一般资料问卷:由研究者编制,内容包括调查对 象的性别、年龄、民族、户口类型、居住地类型、最高 学历情况、婚姻状况、家庭人均月收入等。 1.2.2 HLS-SF12:DUONG 等[10]编制的适用于公众健 康素养测量的 HLS-SF12 分为 3 个维度,分别是卫生保 健、疾病预防、健康促进,共 12 个条目,采用 4 级评 分(1= 非常困难,2= 困难,3= 容易,4= 非常容易), 使 用 公 式 计 算 标 准 化 健 康 素 养 指 数(health literacy index,HL 指数),指数范围为 0~50,指数越高代表健 康素养水平越高。计算公式为 HL 指数 =(平均值 -1) ×(50/3),其中平均值是每个个体所有参与项目的平 均值,1 是平均值的最小可能值(此时指数的最小值为 0),3 是平均值,50 是指数的最大值。DUONG 报告 HLS-SF12 的 Cronbach's α 系数 >0.70,卫生保健分量 表的 Cronbach's α 系数为 0.49~0.72,疾病预防分量表 的 Cronbach's α 系数为 0.64~0.77,健康促进分量表的 Cronbach's α 系数为 0.59~0.81,内部一致性指标良好。 经原作者授权,施测时采用汉化后的 HLS-SF12 中文 版[16]。本研究中该量表在数据集 1 的 Cronbach's α 系 数为 0.932,数据集 2 的 Cronbach's α 系数为 0.933,总 数据集的 Cronbach's α 系数为 0.932。 1.2.3 领 悟 社 会 支 持 量 表(Perceived Social Support Scale,PSSS)由 ZIMET 等[17]开发,PSSS 分为家庭支 持、朋友支持和他人支持 3 个维度,每个维度含 4 个条 目,共 12 个条目。量表选项从“极不同意”至“极同意” 赋分为 1~7 分,得分越高领悟到的社会支持越丰富。本 研究中该量表在数据集 2 的 Cronbach's α 系数为 0.947, 总数据集的 Cronbach's α 系数为 0.948。 1.2.4 家庭健康量表(Family Health Scale Short-Form, FHS-SF)由 CRANDALL 等[18]编制,用于测评家庭健 康功能,由 WANG 等[19]汉化翻译。该量表分 4 个维度, 共 10 个条目。题项为“非常不同意”至“非常同意”(1~5 分),其中第 6、9、10 题为反向计分。总量表得分越 高表示家庭健康水平越好。本研究中该量表在数据集 2 的 Cronbach's α 系数为 0.845,总数据集的 Cronbach's α 系数为 0.846。 1.3 简化方法 1.3.1 通过经典测量理论(classical test theory,CTT) 在项目分析时常用的 4 种方法:项目间残差相关法、相 关系数法、项目 - 总体相关系数法(corrected item-total correlation,CITC)、独立样本 t 检验法对原量表的每个 条目进行分析。 (1)项目间残差相关法计算各项目与其余项目残 差相关之和,保留项目之间残差相关最小的,表现为项 目残差的 MI 值相加[20]。 (2)相关系数法是计算各条目与量表总得分的皮 尔逊相关系数,选取量表中单个条目得分与量表总分的 相关系数的绝对值较大的且存在显著的统计意义的条 目[21]。 (3)CITC 法根据量表的内部一致性筛选条目,通 过计算总量表或单个维度的 Cronbach's α 系数,比较 删除某一条目后 Cronbach's α 系数的变化。如果某条 目去掉后总量表或单个维度的 Cronbach's α 系数有明 显升高,表明应当删除,因为该条目的存在会降低量表 或维度的内部一致性,反之则保留[22]。 (4)独立样本 t 检验法首先将量表总分由高到低 排列,高分组为总分最高的 27%,低分组为总分最低的27%,随后进行独立样本 t 检验,若结果显示高低分两 组被试在某条目上平均得分不存在显著性差异,则应当 删除该条目[23]。 1.3.2 项目分析理论(item response theory,IRT)的简 化方法——Mokken 模型[24],Mokken 模型属于非参数 项目反应理论,与参数项目反应理论相比,其提出更适 应实际情景、更有弹性的框架,还更适宜短量表使用[25]。 利用 R 语言的“Mokken”包对健康素养量表全量表进 行分析,包括对所有条目的单维性检验、局部独立性检 验、单调性检验。 (1) 利 用 自 动 项 目 选 择 算 法(automated item selection procedure,AISP)检验量表单维性,AISP 实施时, 从 c=0 开始,到 c=0.55 结束,步长 0.05。当 c 值越大时, 如果测验是单维的,可能会出现以下 3 个阶段:绝大部 分或全部条目合并为 1 个量表;形成 1 个容量较小的量 表;形成 1 个或几个小量表,同时许多项目被删除[26]。 (2) 利 用 同 质 性 系 数(homogeneity coefficients) 检查条目设置是否合理。同质性系数分为 3 类:项目 对(Hij)、项目(Hi )和量表(Hs)。同质性系数 H 值 越高,测验所得总分对被试潜在特质的排序越准确, Mokken 依据自身经验,认为 Hij 必须 >0,Hi 和 H 不能 <0.3。更具体的 H 值规定为:当 H<0.3 时,量表不合格; 当 0.3 ≤ H<0.4 时,量表的准确程度较弱;当 0.4 ≤ H<0.5 时,量表的准确程度中等;当 H ≥ 0.5 时,量表的准确 程度强[27]。 (3)局部独立性检验利用条件关联程序完成,由 3 个条件关联指数 W(1)、W(2)、W(3)检验,被标记的 项目要逐一删除,删除的原则是:具有最多 W 标志的 项目被删除,直到剩下没有标志的项目。如果项目具有 相同数量的标志,则同质性系数 Hi 更小的项目将被删 除[28]。 (4)检验每个项目的单调性。单调性将最小紊乱 系数(#vi/#ac)、显著性(#zsig)和 Crit 的数值作为评 价标准,当以上 3 个指标等于 0 时,说明符合单调性假 设。但在实际应用中,最小紊乱系数 <0.3 可接受[29], 显著性 <1.96 可接受[30]。当 Crit>80 时,违背单调性假 设;当 40 ≤ Crit ≤ 80 时,应按照条目内容和量表使用 目的考虑是否删除;当 Crit<40 时,则可认为该条目基 本满足单调性,个别违反单调性假设的情况可以看作是 被试抽样误差所致[31]。 1.4 统计学方法 采用 SPSS 24.0、AMOS 24.0 和 R 4.2.1 软件进行数 据处理,使用描述性统计分析、验证性因子分析、CTT 精简条目、Mokken 模型精简条目、验证性分析等分析 方法。为了保障简版量表的有效性,以及避免出现样本 量不足造成的研究能力降低的情况,本研究对研究需 要的最低样本量进行了计算[32]:假设使类内相关系数 (intra-class correlation coefficient,ICC)达到 0.90,Ⅰ 型错误概率 α 为 0.05,此时实现 95% 的统计功效需要 223 名被试者。本研究收集了 7 449 份有效数据(包括 条目筛选和验证分析两份数据集在内),说明样本量足 以进行后续数据分析。 研究首先对数据集 1 和数据集 2 的社会人口学信息 进行描述性统计,显示变量各分类的人数及百分比。 在利用数据集 1 检验了 HLS-SF12 的各心理测量学 指标后,分别利用 CTT 和 IRT 的方法简化其条目,得 到了 HLS-SF9 和 HLS-SF4,然后基于数据集 2 的数据 进行验证性分析。在探索性分析的基础上,对得到的简 版量表进行验证性分析,分为地板和天花板效应检验、 信度检验和效度检验简版量表。地板和天花板效应分别 反映了得分最低和最高的参与者的反应,建议最低或最 高水平的百分比为 15% 或更低。如果超过 15% 的受访 者分别获得了可能的最低或最高分数,则认为存在地板 或天花板效应[33]。若存在天花板效应,则该量表在实 际使用中,由于顶端水平上选择数量增多从而导致后续 数据分析中各指标的有效性受到影响。地板效应与之相 反。信度指标若均 >0.7 表明可接受[34]。效度检验分 为结构效度分析和实证效度分析。结构效度检验中,由 于 HLS-SF4 已经打破了 HLS-SF12 的三维度结构,所 以不能采用验证性因子分析,需要探索性因子分析;而 HLS-SF9 仍保持原有的三维度结构,所以直接进行验证 性因子分析即可。然后通过比较 12 条目的原量表和开 发的简版量表与 2 个相关概念的相关性,进行实证效度 检验。根据数据类型,使用 Pearson 相关检验计算相关 性。为检验简版量表与完整版量表所测内容的一致性程 度,本研究利用 RStudio 中的“lpSolve”和“irr”包计 算 ICC,ICC 可以反映测量之间的相关程度和一致性。 ICC 的评价标准为:当 ICC<0.50 时,被解释为一致性 差;当 0.50 ≤ ICC<0.74 时,被解释为一致性中等;当 0.75 ≤ ICC ≤ 0.90 时,被解释为一致性好;ICC>0.90 时, 被解释为一致性优秀[35]。
2 结果 2.1 研究对象的社会人口学信息 在 样 本 数 据 集 1 的 3 680 名 受 访 者 中, 男 1 608 名(43.7%), 汉 族 3 449 名(93.7%), 常 住 城 镇 者 2 700 名(73.4%),农业户口 1 524 名(41.4%)。在 数据集 2 的 3 769 名受访者中,男 1 678 名(44.5%), 汉族 3 544 名(94.0%),常住城镇者 2 749 名(72.9%), 农业户口 1 599 名(42.4%),完整的人口统计细节见表 1。 2.2 完整版量表的心理测量学检验 基于数据集 1 的数据,对 HLS-SF12 的心理测量 学指标进行验证性因子分析,如图 1 所示。结果显示 规范拟合指数(NFI)=0.960,拟合优度指数(GFI)=0.957, 调 整 拟 合 优 度 指 数(AGFI)=0.934, 比 较 拟 合 指 数(CFI)=0.962, 近 似 误 差 均 方 根(RMSEA) =0.068,各拟合指标表明原量表模型拟合良好。计算内 部一致性系数得出 Cronbach's α=0.932,量表信度良好。 2.3 探索性分析 2.3.1 基于经典测量理论的条目精简:首先,采用项目 间残差相关法进行项目分析,MI 值的门槛值使用默认 值。结果显示,各维度中残差 MI 值最大的条目分别为 条目 3、条目 5 和条目 11,说明这几个条目对本维度的 解释力在每个维度的所有条目中是最小的,故考虑剔除。 其次,采用相关系数法进行项目分析。结果表明, 完整版健康素养量表与各条目之间的相关系数均 >0.710 (r=0.716~0.797),说明这些条目与量表的一致性良好,均考虑保留。 再次,采用 CITC 对量表进行分析,发现删除每项 后的 Cronbach's α 系数在 0.924~0.928,删除条目后内 部一致性系数均有所下降,因此量表中没有条目需要 删除。 最 后, 以 健 康 素 养 量 表 HL 指 数 最 高 的 27% (≥ 37.500 分)和最低的 27%(≤ 30.556 分)划分高 分组与低分组,进一步做独立样本 t 检验,结果显示, 量表的高、低分组在各条目上的得分均存在显著性差异 (P<0.001),因此量表中没有对应的条目需要删除。 综上所述,运用 4 种经典测量理论的方法对 HLSSF12 进行精简,结果表明条目 3、条目 5 和条目 11 在 项目间残差相关法中考虑删除,因此将这 3 个条目删除, 形成 1 个 9 条目的三维简版量表。基于经典测量理论简 化后的健康素养量表(HLS-SF9)共包括 9 个条目:条 目 1、条目 2、条目 4、条目 6、条目 7、条目 8、条目 9、 条目 10 和条目 12,具体条目分析结果见表 2。 表 2 基于经典测量理论的 4 种条目分析方法结果汇总 Table 2 Summary of the results of 4 item analysis methods based on the classical test theory 条目 项目间残 差相关法 相关 系数 CITC 极端值法 (P 值) 被入选 次数 删除 条目 HLS1 215.869 0.730 0.928 <0.001 4 HLS2 129.501 0.791 0.925 <0.001 4 HLS3 517.124 0.745 0.927 <0.001 3 √ HLS4 230.189 0.725 0.927 <0.001 4 HLS5 361.478 0.737 0.927 <0.001 3 √ HLS6 210.054 0.760 0.926 <0.001 4 HLS7 18.808 0.785 0.925 <0.001 4 HLS8 123.271 0.785 0.925 <0.001 4 HLS9 8.414 0.770 0.925 <0.001 4 HLS10 5.270 0.797 0.924 <0.001 4 HLS11 41.051 0.762 0.926 <0.001 3 √ HLS12 5.978 0.716 0.928 <0.001 4 注:CITC= 项目 - 总体相关系数。 2.3.2 基于 Mokken 模型的条目精简:首先,对 HLSSF12 进行 Mokken 模型分析。利用 AISP 检验量表单维性, 从 c=0 开始,到 c=0.55 结束,步长设置为 0.05。结果表明, AISP 当 c 设置在 0~0.55 时,均只能得到 1 个维度,且 所有项目在该维度中。 然后,计算量表的各同质性系数。结果表明,本 研 究 中,Hij 均 大 于 0.43,Hi 均 大 于 0.53( 表 3), H=0.609。这说明本研究使用同质性系数不能删除条目。 再进行局部独立性检验,即进行条件关联分析。第 一轮分析中,指标 W(1)表明第 11 项有 6 个标记,第 2 项和第 8 项各有 4 个标记,第 10 项有 1 个标记,故先 将条目 11 删除。在之后的几轮分析中,根据指标 W(1)、 W(2)和 W(3)的结果,依次删除条目 8、条目 2、条目 12、条目 6、条目 9、条目 4、条目 10。经过条件关联分析, 保留 4 个条目,分别是条目 1、条目 3、条目 5、条目 7。 随后对这 4 个条目进行单调性检验,条目 1、7 均 未违反单调性,条目 3 的最小紊乱系数为 0.02,显著性 为 1,Crit 值为 13,且条目 5 的最小紊乱系数为 0.02, 显著性为 1,Crit 值为 19,均在可接受范围内,考虑保留, 详见表 3。 综上所述,基于 Mokken 模型简化后的健康素养量 表(HLS-SF4)共包括 4 个条目:条目 1、条目 3、条目 5、 条目 7。 表 3 基于 Mokken 模型的条目分析结果 Table 3 Results of item analysis based on Mokken model 条目 Hi (SE) #vi/#ac #zsig Crit HLS1 0.571(0.012) 0 0 0 HLS2 0.622(0.011) HLS3 0.630(0.012) 0.02 1 13 HLS4 0.593(0.013) HLS5 0.611(0.012) 0.02 1 19 HLS6 0.605(0.012) HLS7 0.618(0.011) 0 0 0 HLS8 0.635(0.012) HLS9 0.610(0.012) HLS10 0.629(0.011) HLS11 0.633(0.013) HLS12 0.558(0.013) 注:#ac 表示进行是否违反单调性假设的检验次数;#vi 表示违反 了单调性假设的次数;#vi/#ac 表示最小紊乱系数;#zsig 表示违反单 调性的显著系数。 2.4 验证性分析 2.4.1 天花板和地板效应检验:HLS-SF9 和 HLS-SF4 的可靠性可通过最小的地板 / 天花板效应而得到加强。 表 4 显示其在数据集 2 中的天花板和地板效应,均未超 过 15%,说明得分最低或最高的被试可以相互区分,利 于信度的测量。 表 4 两个精简版量表的 HL 指数得分情况 Table 4 HL index scores for the two short versions of the scales 量表 最小值 (分) 最大值 (分) 得分 (分) 地板效应 (%) 天花板效 应(%) HLS-SF9 0 50 35.08±7.96 0.2% 9.2% HLS-SF4 0 50 33.05±9.05 0.5% 10.2% 2.4.2 信度验证:使用数据集 2 检验两个简化后的健康 素养量表的信度,分析显示,HLS-SF9 和 HLS-SF4 的 Cronbach's α 系数为 0.913 和 0.842、折半信度为 0.871 和 0.815,各条目删除后的信度均≤ 0.910 和 0.810,信 度分析指标良好。2.4.3 效度检验 2.4.3.1 结 构 效 度: 在 数 据 集 2 中 对 HLS-SF4 进 行 Bartlett 球 形 检 验 和 KMO 度 量。HLS-SF4 的 Bartlett 球 形检验值为 5 915.883(P<0.01),KMO 度量为 0.807, 可以进行因子分析。随后探索性因子分析提取出 1 个特 征根大于 1 的因子,从 CTT 的角度验证了其单维性, 累积方差贡献率为 67.813%,各条目的因子载荷量均大 于 0.81。 对 HLS-SF9 的 9 个条目进行验证性因子分析(图 2),HLS-SF9 的验证性因子分析模型适配指标的检 验结果显示χ2 /df=10.844、GFI=0.985、AGFI=0.971、 NFI=0.986、CFI=0.987 和 RMSEA=0.051, 除 χ2 /df 外 均达到理想标准,需要说明的是 χ2 /df 消除了自由度的 影响,但没有消除样本容量的影响,由于样本数量为 3 769,属于大样本,而相关研究表明当样本数较大时, 模型整体适配度的卡方值就会随着样本数增大而显著增 大,这时只需要考虑其他重要指标,而这个指标就可以 忽略。因此三维 9 条目的 HLS-SF9 模型拟合结果较好。 图 2 HLS-SF9 验证性因子分析模型 Figure 2 HLS-SF9 confirmatory factor analysis model 2.4.3.2 实证效度:以往研究表明,健康素养与领悟 社会支持、家庭健康均呈显著相关[36-38]。本研究运 用 数 据 集 2 将 PSSS、FHS-SF 和 HLS-SF12、HLSSF9、HLS-SF4 同时进行相关分析,结果显示,HLSSF12 与 PSSS 呈正相关(r=0.361,P<0.001),与 FHSSF 呈 正 相 关(r=0.329,P<0.001),HLS-SF9 和 HLSSF4 与 PSSS 呈 正 相 关(r=0.367,P<0.001;r=0.292, P<0.001),与 FHS-SF 呈正相关(r=0.340,P<0.001; r=0.237,P<0.001), 表 明 HLS-SF9 和 HLS-SF4 的 实 证效度良好。 2.4.4 测 量 内 容 一 致 性: 基 于 数 据 集 2, 本 研 究 分 析 了 两 个 简 化 版 健 康 素 养 的 效 标 效 度。HLS-SF9 对 HLS-SF12 的 效 标 效 度 的 ICC(95%CI) 为 0.989 (0.988~0.999),HLS-SF4 效标效度的 ICC(95%CI) 为 0.892(0.886~0.899),表明效标效度良好及以上, 即两个精简后的量表与完整版量表所测量的内容有高度 一致性。
3 讨论 3.1 量表简化过程和结果的合理性 HLS-SF12 运用主成分分析法进行简化,在亚洲 6 个国家 / 地区的验证结果显示[10],较好地反映了 HL 的理论结构,并在健康素养水平亚组人群间存在有效 差异,校标检验显示 HLS-SF12 对亚洲健康素养量表 HLS-EU-Q47 的解释有效性高于欧洲地区量表 HLSEU-Q16。HLS-SF12 量表已被国外学者应用于普通门诊、 骨科及中医科等科室患者的研究[39],以及在越南农民、 新型冠状病毒感染期间卫生工作者及门诊患者等人群中 得到验证应用[40-42],均表明该量表具有良好的信效度, 并且在跨文化背景、地域差异以及社会群体差异等方面 具有普适性,可作为应用多群体健康素养的有效衡量 工具。 以往简化的研究中常用经典测量理论和 Mokken 模 型这两个理论模型。一方面,CTT 是历史悠久、发展时 间长、应用最广、最为人们熟知的一种心理测量学理 论[43],其将测验观察分数表示为真分数和误差分数之 和,并且在其假设的基础上,经过几十年的实践,从理 论上推导出包括信度、效度、条目难度和区分度等十几 个参数的计算公式,建立了完善测验方法体系,明确了 测验标准化程序,使整个测验过程更加客观、科学。除 此之外,CTT 拥有一套较为易懂的数学模型、参数概念 和估计方法,提倡的标准化技术能有效控制测量过程中 产生的误差,更重要的是,其理论和方法体系相对完整, 前提假设比较弱,很容易为实际工作所满足[44]。例如, 于斌斌等[45]采用基于经典测量理论的极端值法、相关 系数法和 CITC 将批判思维倾向量表简化为 28 个项目, 且信效度检验结果显示简化版量表可用性强。另一方面, IRT 的测验模型也被证实具有更多的优点,其采用非线 性模型,建立了被试对项目的反应与其潜在特质之间的 非线性关系,这一点更符合实践领域中的施测情况[46]。 而 Mokken 模型是非参数项目反应理论模型的一种,具 有非参数的特性,同样服从 IRT 的基本原则,可以弥 补参数项目反应理论模型的不足[47]。对所有项目进行 Mokken 模型分析后可以将不符合理论假设的项目加以 删除或修改,进一步提高量表的质量[48],WANG 等[49]和 WU 等[50]使用 Mokken 模型分别简化了新的一般自 我效能感量表和领悟社会支持量表,信效度良好,可应 用于实践领域。 在简化前,本研究使用验证性因子分析对数据集 1 中原量表的结构效度进行验证,结果表明健康素养量表 (HLS-SF12)的结构效度良好。在基于经典测量理论 的量表简化过程中,本研究还根据 4 种常用于项目分析 的经典测量理论的方法对健康素养量表进行精简,其中 每个维度中有一个条目在项目间残差相关性中考虑删 除,将其删除后形成 1 个 9 条目的简版量表(HLS-SF9)。 在根据非参数项目反应理论进行量表简化的过程 中,本研究对完整版量表进行 Mokken 分析。首先对完 整版量表进行分析,单维性检验表明完整版量表只能得 到 1 个维度,同质性系数良好,但在局部独立性检验中, 依次删除了具有条件关联的 8 个条目,再进行单调性检 验,没有删除多余的项目,最终得到了 1 个 4 条目的简 版量表(HLS-SF4)。 以经典测量理论和 Mokken 模型为基础开展简化工 作,得到了两个精简后的版本 HLS-SF9 和 HLS-SF4, 利用数据集 2 的数据进行天花板和地板效应分析,结果 表明两个效应均低,可以较好区分高、低分被试,有 利于进行进一步的信度分析。信度检验表明,两个简 版量表信度良好。然而,HLS-SF9 的各信度优于 HLSSF4。在结构效度检验中首先进行了 Bartlett 球形检验和 KMO 度量,确定 HLS-SF4 可以进行因子分析,然后采 用探索性因子分析验证 HLS-SF4 的简化结构,经过主 成分分析提取出 1 个特征根大于 1 的公因子,结果符合 Mokken 模型分析中 AISP 所检验的量表单维结构的前提 假设;对 HLS-SF9 则采用验证性因子分析,结果显示 其三维模型的各项适配指标均为优秀,说明 9 条目的简 版量表被划分为三个维度是合理的。值得一提的是,两 个简版量表是采用两种不同的结构效度验证方式检验量 表结构,这有两个原因:一是利用经典测量理论简化条 目时,并未涉及维度的增减,维度确定且与原量表保持 一致;二是利用 Mokken 模型简化条目时,打破了原有 的维度,合并成单一维度,且简化后保留的条目只涉及 前两个维度。实证效度检验的结果显示,HLS-SF9 以及 HLS-SF4 均具有较好的实证效度。测量两个精简后的量 表与完整版量表的 ICC 指数,结果表明所要测量的内容 有高度一致性,但 HLS-SF9 高于 HLS-SF4。综上所述, HLS-SF9 条目保留原量表因子结构,信度、实证效度较 优,和原量表的测量内容一致性更高,而 HLS-SF4 条 目少,各项因子载荷量更高,因此保留两个精简版本均 具有合理性。研究人员可根据各自研究的情况选择更具 有针对性的测评量表,如首要目的是获得更精确的测量 结果,则可以采用 HLS-SF9;若首要目的是缩短整体问 卷作答时间(如在大型横截面调研项目中,可通过牺牲 精度以获得更精简的问卷量),则 HLS-SF4 更为适用。 在传染性或非传染性疾病的预防与控制中,健康素 养是不容忽视的重要因素,比如在新型冠状病毒感染的 信息疫情中,健康素养成为公众辨识“谣言”的关键 工具[51]。本研究使用全国范围的大样本研究数据,尽 可能降低地域差异带来的偏倚,以提高研究的可推广 性[52],并将数据随机生成两个样本群,相互验证研究 结果。精简后的健康素养量表条目相较于国内的常用的 评估问卷,条目数量少、作答时间短、作答难度较低, 更适宜测评全年龄段人群抑或在综合性问卷中使用。 3.2 局限及未来研究 本研究分别采用两种理论为基础,皆严格遵守了量 表简化的理论原则,但仍存在一定局限性。例如本研究 选择全国大样本横截面研究为数据来源,未来需要在纵 向研究中,做简化版量表的有效性与稳定性验证工作; 在多领域实际运用中,也需要更多的适应性验证与调整。 综上所述,本研究运用经典测量理论以及 Mokken 模型筛选 HLS-SF12 条目,经过简化的 9 条目与 4 条 目的健康素养量表在我国公众群体中具有良好的信效 度,可以作为测评我国全人群健康素养的可靠且精简的 工具。 作者贡献:孙小楠、陈珂进行文章的构思与设计, 撰写论文;孙小楠、陈珂、武运筹、王飞、孙昕霙进行 研究的实施与可行性分析;孙小楠、汤靖琪进行数据收 集、整理;孙小楠、陈珂、武运筹进行统计学处理,结 果的分析与解释;孙小楠、陈珂、汤靖琪进行论文的修 订;贺苗、吴一波对文章整体负责,监督管理。
本文无利益冲突。--转载文献
免责声明:仅供科研学习和分享,不做商业用途,如有侵权,请联系我们删除,谢谢