机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 93|回复: 0

AI 编了六个假判例 骗进了联邦法庭

[复制链接]

2万

主题

3万

帖子

21万

积分

超级版主

Rank: 8Rank: 8

积分
219303
发表于 6 天前 | 显示全部楼层 |阅读模式
马塔诉阿维安卡公司案(Mata v. Avianca,Inc.)可能是首例在司法文书中涉及律师使用AI撰写法律文书的不当行为的案件,律师史蒂文·施瓦茨(Steven Schwartz)于1992年起获准在纽约州执业,其主要执业领域是人身伤害和工人赔偿法,执业范围仅限于州法院,未取得联邦法院的执业资格。原告罗伯特·马塔(Roberto Mata)于2019年8月27日搭乘哥伦比亚航空公司(Avianca Airlines)670号航班从萨尔瓦多飞往纽约。在飞行途中被金属餐车撞伤,膝盖严重受损,被告阿维安卡公司(Avianca,Inc.)是该航班的实际承运人,和哥伦比亚航公司同属一家控股母公司。
原告马塔聘请史蒂文·施瓦茨律师于2020年7月20日在纽约州最高法院向被告提起初次诉讼。被告母公司阿维安卡控股公司面临严重财务困境,已作为债务人在2020年5月10日根据美国破产法第11章向纽约南区地方法院申请破产,包括被告阿维安卡公司在内的23家附属债务人同时申请破产,原告对被告的人身伤害损害赔偿诉讼因自动停止(Automatic Stay)规则而暂停。
被告退出破产程序后,同原告于2022年1月31日共同签署协议终止原告提起的初次诉讼。2022年2月2日,原告在同一地方法院向被告提起第二次诉讼,向被告主张基于1999年蒙特利尔公约的人身损害赔偿。由于被告成功主张联邦法院对案件的管辖权,该起诉讼在2月23日由纽约州最高法院移送至纽约南区联邦地区法院,由法官凯文·卡斯特尔(Judge Kevin Castel)负责审理。由于史蒂文·施瓦茨律师未取得纽约南区职业资格,原告代理律师变更为其同事彼得·洛杜卡(Peter LoDuca)。
本案的核心争议点在于诉讼时效规则的适用及计算,蒙特利尔公约第35条对诉讼时限(Limitation of Actions)的规定是航空器到达目的地点之日、应当到达目的地点之日或者运输终止之日起2年期间,该条向来是蒙特利尔公约颇具争议的条款之一,有关诉讼时限的法律性质、2年期间是否可变以及诉讼时限对第三方诉讼的影响等等均存在解释分歧。与此相对,法院地纽约州民事执行法与规则(New York Civil Practice Law and Rules)第214(5)条则规定人身伤害赔偿诉讼的诉讼时效(Statute of Limitations)为事故发生之日起3年。
被告在2023年1月13日提出的驳回动议中主张:第一,该起索赔诉讼仅受蒙特利尔公约管辖。第二,蒙特利尔公约第35条规定的2年诉讼时限并非诉讼时效,而是权利人可以根据蒙特利尔公约启动诉讼的先决条件(Condition Precedent)。因此,鉴于本案原告自其抵达之日起2年又5个月后提起本次诉讼,该诉讼不能被受理。第三,航空公司陷入破产程序的事实并不会暂停(Toll)蒙特利尔公约第35条2年期间的计算。

彼得·洛杜卡律师作为律师出庭,并负责文书的签署和提交,而史蒂文·施瓦茨律师由于提出最初诉状,将继续承担案件的实质性法律工作。
Steven Schwartz律师是一位拥有30年执业经验的纽约律师,熟稔于处理纽约州法下的争议,但对本案涉及的联邦法律、蒙特利尔公约和破产暂停规则均不太熟悉,也无法通过律所电脑访问联邦判例数据库。因此他将目光转向了新兴发布的ChatGPT,认为这是“一个超级搜索引擎”。
ChatGPT 给了他六个判例,名字、案号、引文、判决理由,一应俱全:Varghese 诉中国南方航空、Martinez 诉达美航空、Shaboon 诉埃及航空……每一个都长得像真的,措辞、格式、引用层级,跟真正的判例书没有任何区别。Schwartz 把它们写进材料,最终由律师团队提交给了法庭。
然后对方律师去查这些判例,查不到;法官去查,也查不到。因为它们是 ChatGPT 编的。
最让人后背发凉的是中间那一步。Schwartz 其实起过疑,他回头问 ChatGPT:“Varghese 这个案子是真的吗?”ChatGPT 答得斩钉截铁,说是真的,还顺手补了几个看起来很权威的数据库出处。他信了。
主审法官 P. Kevin Castel 没被这套说辞糊弄过去。2023 年 6 月,他对 Schwartz、负责把文件递上去的律师 Peter LoDuca,以及他们的律所,合计开出 5000 美元罚款,还要求他们给每一个“判决”里被 AI 凭空安上名字的真实法官写信说明情况。至于 Roberto Mata 那个膝盖伤的官司,已另一起事运输:诉讼超过了《蒙特利尔公约》的两年时效被驳回。假判例让律师挨了罚,案子本身不是我栽在它手上。
一个执业三十年的律师,怎么会栽在这种事上?律师本来就该自己核验判例,这一步他确实没做到,法院罚的正是这个。但更值得警惕的是另一半:AI 编出来的东西,足够像真的,像到能让一个干了三十年的人放下戒心。

要看懂这件事,得先知道 ChatGPT 被问“给我找几个判例”时,到底在干什么。
它不是去一个判例库里检索,再把查到的东西抄给你。它做的是另一件事:顺着你的问题,一个词一个词地,生成一段“最像答案的文字”。判例长什么样,它在训练里见过海量,太清楚一个判例该有的样子了——一个原告告一个被告,一个像模像样的法院,一段口吻笃定的判决摘要,一串格式正确的引用号。它把这些“像判例的零件”拼出来,拼得严丝合缝。
麻烦在于,在没有联网、没有数据库、没有外部核验的时候,它做的不是去证明“真”,是生成一段最“像”的文字。一段编造的判例和一段真实的判例,在它眼里都只是“像判例的文字”;它内部没有一个开关会亮起来,告诉你“这一段是我编的”。
它编得越具体、越笃定,恰恰因为细节也是生成出来的:案号是编的,引文是编的,连那句“我帮你核实过了,是真的”也是编的。它不会因为虚构而露出半点犹疑,对它来说那都不算“撒谎”。

如果说 Schwartz 那次是生成式 AI 凭空编造,那还有另一种风险:机构把一个自动化客服摆上官网,它对普通人说的话,跟公司自己的正式政策对不上。出事之后,公司还想甩锅。
2022 年 11 月,加拿大人 Jake Moffatt 的祖母过世。他要赶飞机回去奔丧,上 Air Canada 官网,问网站上的客服AI:丧亲票价怎么申请。AI告诉他,即便已经飞了,也可以在出票日起 90 天内提交申请、退差价。
他照做了。事后申请退款,被拒。Air Canada 翻出自己官网的政策原文:丧亲票价不能在行程结束后补申请。AI给他的说法,和公司白纸黑字的规定正好相反。
Moffatt 把 Air Canada 告到了 BC 省的民事仲裁庭。Air Canada 的辩词堪称离谱,仲裁员把它的意思概括得很尖锐:等于把那个AI当成一个要为自己行为负责的独立法律实体,AI说错了不算公司的。
2024 年 2 月,仲裁庭驳回了这个说法,判 Air Canada 赔偿:总共 812 加元,其中 650 多是票价差额,外加利息和仲裁费。理由很朴素:AI是你摆在你官网上的,用户没理由不信它,它说错了,你负责。(点评:豆包AI要是在加拿大推广,都不知道死多少回了)

两个故事拼在一起,是自动化信息系统的两类风险:一种是生成式 AI 编出不存在的权威材料,另一种是机构官网的客服AI给出和正式政策相反的承诺。底层机制不一定相同,但落到面前那个人身上,伤害一样:他都信了一个“看起来该信”的答复。

你可能觉得,Schwartz 是个例,是某个不太懂技术的老律师一时糊涂。
有个叫 Damien Charlotin 的法律研究者建了个数据库,专收法院或仲裁庭已经处理过的“AI 编造引用”案例,最早一批能追到 2023 年。
2025 年下半年,媒体报道的数量就越过了 500 起;
截至 2026 年 6 月,库里收录了 1500 多起,其中一千多起来自美国。
频率从年初的一周两三起,涨到后来的一天好几起,光 2026 年 3 月 31 日一天,美国就有 17 起裁决提到 AI 幻觉。
这还只是闹上法庭、被写进裁决的那一部分,不是全部。
栽进去的,不是没文化的人,是律师,是专业人士,有的还来自顶级律所。
2025 年 10 月,加州一位律师因为在上诉状里用了 AI 的引用,被罚了一万美元。
为什么偏偏是专业人士也反复中招?正因为他们专业。AI 既骗得了外行,也骗得了内行,只是骗内行更隐蔽:它模仿的不是常识,是专业文本的外观。一个律师一眼扫过去,格式对、措辞对、逻辑自洽,职业直觉会先一步替它背书。

那怎么防范呢,强如998的话,不用即可。但我们多数人没那么强,就得掌握几条原则。
第一,越具体越要警惕。人会下意识觉得“细节越多越可信”,AI 偏偏反过来:它编造的时候,案号、引文、链接给得最全,因为这些细节本身也是顺手生成的。那份扑面而来的权威感,不是真有底气,是装出来的。看到一段信息特别齐整、特别笃定,别急着松气,那往往正是要核的地方。
第二,凡是它给的“事实”,回一手来源核对。判例、数据、引文、链接,只要是能查证的,就去查证:点开那个链接,搜一下那个案号,不存在就是不存在。注意,“我问它是不是真的,它说是”不叫核对,它只会接着编。Schwartz 我就栽在这一步,他把“再问一遍 AI”当成了“核实”。
第三,分清它是在“查”还是在“写”。手上没有联网、没有数据库的时候,AI 给你的不是检索结果,是一段“像答案的话”。它有没有真的去查,有没有联网、调用工具、给出能点开的真实出处,决定了你能信它几分。同一个模型,接了可靠检索的,和光凭记忆张口就来的,可信度差着一个量级。

Schwartz 后来反复说,他“不知道 ChatGPT 会编造案例”。这句话其实点中了要害:他以为自己在用一个会查资料的工具,实际上他用的是一个会写作文的工具,一个写得太好、好到连法官名字都编得一本正经的工具。
AI 没想骗谁。它不恨 Schwartz,也不恨那位奔丧的乘客,它只是做了它一直在做的事,把一段“听起来对”的话,流畅地生成出来。
只是“听起来对”和“是对的”,是两回事。没有来源、没有检索、没有核验链的时候,AI 最擅长的,仍然是前一个。



豆包AI在满足情绪价值上那真是诚意满满

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2026-6-17 21:56 , Processed in 0.052710 second(s), 20 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表