OpenAI做得不够清楚ChatGPT的局限性

因为当谈到让人们准备好使用像ChatGPT这样强大、被炒作和被误解的技术时,很明显OpenAI做得还不够。本周末,当有消息称美国律师StevenA.Schwartz在对哥伦比亚航空公司Avianca提起的诉讼中求助于聊天机器人以寻找支持案例时,ChatGPT被误解的性质在本周末被无数次澄清。当然,问题是ChatGPT建议的情况都不存在。

Schwartz声称他“没有意识到[ChatGPT的]内容可能是假的”,尽管他与机器人的谈话记录显示他非常怀疑以检查他的研究。不幸的是,他通过询问ChatGPT来做到这一点,系统再次误导了他,向他保证其虚构的案例历史是合法的:

一张截图显示律师询问所引用的案例之一是否真实,聊天机器人回答说是真实的。律师然后问“你的消息来源是什么”

“不要相信他的谎言。”图片:SDNY

在这种情况下,Schwartz应该受到很多指责,但这种情况发生的频率——当ChatGPT用户将系统视为可靠的信息来源时——表明还需要进行更广泛的清算。

在过去的几个月里,有很多人被ChatGPT的谎言所愚弄的报道。大多数案例都是微不足道的,几乎没有或没有负面影响。通常,该系统编造了一个新闻故事或一篇学术论文或一本书,然后有人试图找到这个来源并且要么浪费他们的时间要么看起来像个傻瓜(或两者兼而有之)。但很容易看出ChatGPT的错误信息如何导致更严重的后果。

例如,5月,德克萨斯A&M的一位教授使用聊天机器人检查学生的论文是否是在AI的帮助下撰写的。ChatGPT非常乐于助人,他说,是的,所有学生的论文都是人工智能生成的,尽管它没有可靠的评估能力。教授威胁要让这门课不及格并扣留他们的文凭,直到他的错误被指出为止。然后,在4月,一位法学教授讲述了该系统如何生成虚假新闻故事来指控他性行为不端。他只是在一位正在做研究的同事提醒他这个事实时才发现。“这真是令人不寒而栗,”这位教授告诉《华盛顿邮报》。“这种指控非常有害。”

我不认为像这样的案例会使ChatGPT和其他聊天机器人的潜力失效。在正确的场景和正确的保护措施下,这些工具显然非常有用。我还认为这种潜力包括检索信息等任务。正在进行各种有趣的研究,这些研究表明这些系统如何能够并且将在未来更加基于事实。关键是,现在,这还不够。

这在一定程度上是媒体的错。许多关于ChatGPT和类似机器人的报告将这些系统描述为具有情感和欲望的类人智能。通常,记者没有强调这些系统的不可靠性——以明确他们提供的信息的偶然性。

但是,正如我希望这篇文章的开头所阐明的那样,OpenAI当然也可以帮助解决问题。尽管聊天机器人被描述为一种新型技术,但很明显人们将它们用作搜索引擎。(而且很多都是明确作为搜索引擎推出的,所以他们当然会感到困惑。)这并不奇怪:一代互联网用户已经接受过将问题输入框中并获得答案的训练。但是,尽管像Google和DuckDuckGo这样的消息来源提供了引起审查的链接,但聊天机器人将他们的信息混淆在重新生成的文本中,并以无所不知的数字助理的爽快语气说话。一两句话作为免责声明不足以推翻这种启动。

有趣的是,我发现Bing的聊天机器人(由与ChatGPT相同的技术提供支持)在这些事实调查任务上做得稍好;大多数情况下,它倾向于搜索网络以响应事实查询并为用户提供链接作为来源。ChatGPT可以搜索网络,但前提是您付费购买Plus版本并使用测试版插件。它的独立性使其更容易产生误导。

干预措施不需要很复杂,但必须到位。例如,为什么ChatGPT无法识别何时被要求生成事实引用并警告用户“检查我的来源”?为什么它不能回答有人问“这段文字是人工智能生成的吗?”明确地说“对不起,我没有能力做出那个判断”?(我们联系了OpenAI征求意见,如果我们收到回复,我们会更新这个故事。)

OpenAI在这方面确实有所改进。根据我的经验,自从ChatGPT推出以来,它已经变得更加坦率地了解它的局限性,通常以AI陈词滥调作为答案的开头:“作为一种AI语言模型......”但它也并不一致。今天早上,当我问机器人“你能检测到人工智能生成的文本吗?”它警告说它“并非万无一失”,但当我向它提供一大块这个故事并问同样的问题时,它只是简单地回答:“是的,这段文字是人工智能生成的。”接下来,我要求它给我一份关于测量主题的书籍推荐清单(我知道的很少关于)。“当然!”它在提供10条建议之前说。这是一个很好的列表,击中了许多经典,但两个标题完全是虚构的,如果我不知道要检查,我就不会注意到。自己尝试类似的测试,您会很快发现错误。

对于这种性能,“可能偶尔会生成不正确的信息”之类的免责声明似乎并不准确。

免责声明:本文章由会员“王夕远”发布如果文章侵权,请联系我们处理,本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系

王夕远
免责声明:本文章由会员“王夕远”发布,如果文章侵权,请联系我们处理,本站仅提供信息存储空间服务;如因作品内容、版权和其他问题请于本站联系