Siri有口音辨識障礙

專家看新聞

Siri有口音辨識障礙
Siri有口音辨識障礙

2020-11-01 羅培茲-洛雷達(Claudia Lopez-Lloreda)

語音辨識軟體經常聽不懂少數族群的腔調。

「克洛-蒂亞」,我說了一次、兩次。到了第三次,我放棄了,改用美語腔說出我的名字:「克羅-迪-雅」。終於,Siri辨識成功了。如果你的母語不是英語,或是姓名並非常見的美語名字,調整說話方式才能跟語音辨識技術互動必定是很熟悉的經驗。出於這個原因,我不再使用蘋果公司以語音為基礎的虛擬助理Siri。


這項技術近十年來的發展(不只Siri,還包括Alexa和Cortana等)揭示了其中一個問題:種族偏誤。《美國國家科學院學報》(PNAS)最近刊登的一篇論文顯示,語音辨識軟體對黑人所講的話會產生偏誤。研究團隊發現,平均而言,蘋果和微軟等主要科技公司推出的五款語音辨識軟體都發生明顯的種族差異;它們轉錄黑人講話的錯誤率大約是白人的兩倍。


這有效查核了一些語音,發現它們不屬於用來訓練這些軟體的「標準」語言。美國陶森大學技術通訊與資訊設計的助理教授勞倫斯(Halcyon Lawrence)並未參與這項研究,她評論:「除非我調整口音,否則我無法跟這些裝置交談,這大有問題。」勞倫斯有千里達與托巴哥口音,我的則是波多黎各口音,人們的身分認同有一部份來自講特定語言、擁有口音,或使用一套言語形式。如今卻為了讓機器辨識語音,必須改變身分認同中不可或缺的一環,這在本質上相當殘酷。


PNAS論文的第一作者科內克(Allison Koenecke)是史丹佛大學計算與數學工程研究所博士生,她表示機器若無法辨識口音,也會影響其他族群,例如有視覺或行為障礙的人,可能會仰賴語音辨識或語音轉錄文字的工具。對於依賴這些技術的失能人士,語音遭誤解可能有嚴重後果。許多因素可能造成這些語言差異,科內克指出最有可能的因素是:用於訓練的語料庫,顯然大多來自母語是美語的白人。這些語料庫在用字遣詞或說話方式上都相當狹隘,導致訓練出來的語音辨識軟體無法辨識口音,以及其他有獨特語言特徵的說話方式。人類有口音和語言偏見,例如研究顯示口音會影響陪審員判定是否有罪,或者病人覺得醫師是否稱職。


認知到這些偏誤是避免在技術上造成這些偏誤的重要方法。但要發展更有包容度的技術需要時間、心力和資金,而投資決策通常是市場導向......