每10份音频就有8份被“胡编”？OpenAI语音转委用具被曝存紧要残障

发布日期：2024-10-31 09:12 点击次数：100

　　生成式东说念主工智能限度的领军者OpenAI，曾吹嘘其东说念主工智能转委用具Whisper具有接近 “东说念主类水平的褂讪性和准确性”。

　　有关词，跟着该转委用具在五行八作被越来越多地进步使用，其问题似乎也正启动突显——把柄业内媒体对十多位软件工程师、缔造东说念主员和学术盘问东说念主员的采访，如今Whisper所存在的一个紧要残障已愈发谢绝漠视：它很容易会捏造大段笔墨，甚而是整段句子。

　　这些业内巨匠暗意，一些捏造出的笔墨——在行业内被称为“幻觉”，可能包括种族言论、暴力措辞，乃至有余杜撰出的医疗提议。

　　巨匠们越来越驰念这种“胡编乱造”可能形成严重效劳，因为Whisper面前正被全球多个行业用于翻译和转录采访本体、生成文本以及为视频制作字幕。天然OpenAI曾劝诫不应在“高风险限度”使用该用具，但当今一些好意思国医疗中心王人正启动使用基于Whisper的用具，来记载患者与医师间的对话。

　　据平庸使用Whisper的盘问东说念主员和工程师暗意，他们在职责中平庸会碰到该用具出现“幻觉”。举例，密歇根大学的别称盘问东说念主员在盘问环球会议的转录准确率时发现，他所审核的每十份音频转录中，便有八份存在“幻觉”。

　　一位机器学习工程师则称，在他分析的100多个小时的Whisper转录中，他起首发现能够有一半存在“幻觉”。第三位缔造东说念主员指出，在他用Whisper创建的26000份记载中，险些每一份王人发现了胡编乱造的餍足。

　　即使是在那些录制邃密的爽朗音频样本里，问题也一经存在。在最近的一项盘问中，计较机科学家们在审查的朝上13000个表示音频片断中发现存187个存在“幻觉”问题。

　　盘问东说念主员暗意，这种趋势将导致在数百万段灌音中出现盈篇满籍的造作转录。

　　效劳严重

　　曾在拜登政府换取白宫科技战略办公室职责的Alondra Nelson暗意，这种造作可能会形成“相配严重的效劳”，尤其是在病院里。

　　当今，包括明尼苏达州的曼卡托诊所和洛杉矶儿童病院在内的朝上30000名临床医师和40个卫生系统，已启动使用法国AI调养公司Nabla基于Whisper打造的用具。

　　Nabla公司的首席技巧官Martin Raison暗意，该用具把柄医学语言进行了微调，以转录和回来医师与病东说念主间的互动。该用具转录的就诊记载当今已多达约700万次。该公司官员还指出，他们知说念Whisper会产生幻觉，期货软件并正在发奋处置这个问题。

　　当今担任普林斯顿高级盘问院诠释的Nelson暗意，“莫得东说念主但愿出现误诊。(该限度)应该有更高的范例。”

　　当今，Whisper还被用于为聋东说念主和听力遮盖者制作字幕——这是一个绝顶容易因出现造作转录而堕入逆境的东说念主群，因为聋东说念主和听力遮盖者有余无法识别“秘密在通盘文本中”的捏造本体。

　　这种幻觉在Whisper中的遍及存在，已促使繁密巨匠、见地者和OpenAI前职工号令好意思国政府接洽制定东说念主工智能律例。他们指出，OpenAI至少需要处置这一残障。本年2月因驰念公司的发展标的而从OpenAI去职的工程师William Saunders就暗意，要是OpenAI怡悦优先处置这个问题，这个问题似乎是不错处置的。而要是你长久把它放在那儿，而东说念主们对它的功能过于自信，并把它集成到通盘这些其他系统中，那就有坚苦了。

　　天然大大批缔造东说念主员王人以为转委用具弗成幸免会拼错单词或出现其他造作，但不少工程师和盘问东说念主员暗意，他们从未见过其他东说念主工智能转委用具像Whisper相似容易产生幻觉。

　　当今，该用具已被集成到OpenAI旗舰聊天机器东说念主ChatGPT的某些版块中，同期亦然甲骨文和微软云计较平台的内置产物，为全球数千家公司提供行状。它还可用于将文本转录和翻译成多种语言。

　　仅在上个月，开源东说念主工智能平台HuggingFace上的一个Whisper最新版块就被下载了420多万次。该平台的机器学习工程师Sanchit Gandhi暗意，Whisper是最流行的开源语音识别模子，从呼唤中心到语音助手，王人内置了Whisper。

　　康奈尔大学诠释Allison Koenecke和弗吉尼亚大学诠释Mona Sloane，当今已盘问了他们从卡内基梅隆大学的盘问府上库TalkBank中得到的数千个爽朗音频片断。他们发现，近40%的幻听是无益的或令东说念主担忧的，因为谈话者的同意可能被曲解或诬蔑。

　　盘问东说念主员并不折服Whisper和肖似用具产生幻觉的原因，但软件缔造东说念主员暗意，这些胡编乱造时常发生在出现停顿、布景声息或音乐播放时。OpenAI此前在网上涌现的信息中曾提议，不要在方案情境中使用Whisper，因为准确性上的残障会导致礼貌上的显着残障。

　　而针对最新爆料，有OpenAI发言东说念主回复称，OpenAI会在接下来的模子更新中加入相应的响应机制。

让建站和SEO变得简单

每10份音频就有8份被“胡编”？OpenAI语音转委用具被曝存紧要残障

热点资讯

相关资讯