当前位置:首页 > 医药医学 > 文章正文

言语测听工具的效度、信度与敏感度


作者单位:解放军总医院耳鼻咽喉头颈外科(北京 100853)

【关键词】  测听

  随着我国听力学理论体系的逐步完善以及临床实践的不断深化,越来越多的听力学家认识到:我国的言语测听体系[1]尚不完善,亟需针对临床耳科诊断和听力康复效果评估的不同需求,发展并规范一系列的汉语言语测听材料和方法[2]。
  
  我国自上世纪50年代开始,许多耳科学家[3-7]、语音学家[8, 9]、心理学家[10]先后研发出七、八种中文言语测听词表,但以声学媒质传世的很少,大多只留下了文字稿。对言语测听不甚了解的人也许会产生误解,既然已有如此多的词表文字稿,为什么说我国的言语测听体系还不完善呢?
  
  其实kruel等[11]早就指出“测听材料不应仅是文字稿而应该是录音材料”。编撰词表的文字稿,仅仅是研发言语测听材料过程中的第一步,还需要基于心理语言学测量结果进行声学处理以及后续的临床验证工作[12, 13]。即便是经过了等价性验证的同一套文字稿,在不同的录音条件下由不同的播音人诵读,语音的声学特征和可懂度也会有很大的不同。但一些中文测听词表的研发报告忽视了播音人的语音差异[10],只发表了基于实验录音得出的“等价性”的文字稿而未将实验阶段的录音稿随之配套发行。这在一定时期内产生了误导,不少医疗、科研单位出于各自需要分别将文字稿灌制成了唱片或磁带,均未对录音材料的应用范畴、误差程度和临床效能做后续的临床验证工作未形成标准化的言语测听材料。因而所得临床、科研结论难免“自说自话”,严重制约了言语测听材料的普及。进入21世纪,一些测听材料采用数字化录音技术,并进行了词表等价性的临床验证[14],但由于对原始录音未进行必要的声学处理,加之实验设计上的瑕疵,所得到的等价性表的数量还是有限[15]。
  
  本文介绍言语测听材料三项主要的评价指标 —— 效度(可行性)、信度(可靠性)[16]和敏感度(效能)[17],并将影响这些指标的两大类因素融入叙述当中。第一类是在确定文字稿时所涉及的语言学、心理学、统计学因素,主要与测试的效度有关,一旦确定,我们在临床实践中就无法改变其特征;第二类涉及录音材料的声学、听力学因素,主要与测试的信度、敏感度有关。针对具体的录音材料,结合言语识别曲线的心理声学测试结果,我们可对原始语音信号进行强度、频率和时间等方面的调整,使测试材料的信度和敏感度指标更优。临床使用时还可以根据需要,对这些因素(声级、信噪比、测试项数目等……)进行控制。
  
  本文对信度、敏感度的描述只局限于言语识别率范畴,与笔者以往著述[13]中的定义有所不同,望予注意。

  1 可行性指标 —— 效度(validity)
  
  我们在选择或设计一个言语测试材料时,必须回答一个问题:该词(句)表能否按照预期量度出受试者在特定场合下的言语听觉水平,这涉及到测试材料的可行性指标 —— 效度,它考察的是言语测试能否成功地鉴别出听觉言语功能的具体缺陷或者反映出所想评价的残障程度。
  
  言语识别能力是一个软性指标,只有理论上的“真实”识别阈或识别率。因此对言语测听工具的效度评价,多采用表面效度的方式进行。表面效度评价的是,测量方法或观测结果所说明的问题符合专家和公众共识的程度[16]。
  
  在临床实践中,言语测听的目的是多种多样的。比如在助听器的选配过程中,听力师希望能用言语识别测试来验证助听听阈的可靠性,微调助听参数后判定使用者的言语识别能力是否得以提高,或者预测患者在日常生活中的实际表现。
  
  显然,单独一个测试是不可能同时满足这么多应用需求的。因此,言语测听材料在设计之初,一定要根据目的(简单说可分为两类:进行鉴别诊断和评测患者的言语识别能力)、 受试者认知水平(成人还是儿童)与交流能力(有无其它残障、唇读能力)、 应用场合(安静还是嘈杂)等因素来设计。

  1.1 测试项的选择
  
  选定什么样的语言样本作为测试项,对于测听材料的效度至关重要。或是遵循音位平衡规则,或是采用上下文语义关联的语句或段落,或是生成冗余信息很少的音素表或单音节表……不一而足。汉语的语言学、语音学和音系学规则是需要重点考虑的内容。......

很抱歉,暂无全文。欢迎作者提供全文。

推荐阅读
支持杂志产业发展,请购买、订阅纸质杂志,欢迎杂志社提供过刊、样刊及电子版。
关于我们 | 免责声明 | 联系方式 | RSS 2.0订阅
全刊赏析网 2019 繁體中文 简体中文