法国禁止对裁判文书进行大数据分析，为什么？

Posted 2021-04-26 我在抱住

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了法国禁止对裁判文书进行大数据分析，为什么？相关的知识，希望对你有一定的参考价值。

摘要：2019年3月法国立法机关颁布的2019-222号法律第33条禁止基于法官身份的数据分析、比较、评估与预测，由此将判决书大数据应用限制在相对有限的领域。上述禁令的出台，是立法机关对司法大数据应用与法官隐私、司法独立、司法权威、司法公正之间法理冲突的回应。其深层次原因是改革者平衡司法公开与个人信息、司法权威与言论自由、司法独立与技术主义、法官个人与法院整体等价值之后选择的折衷方案。围绕禁令的讨论对规范我国司法大数据应用具有重要的启示意义。在我国司法大数据应用中有必要引入个人信息保护理念，破除片面技术主义误区。在此基础上，推动司法大数据应用的常规备案与伦理审查、明确司法大数据应用的非约束性适用原则、建立司法大数据应用的负面清单制度。

关键词：司法大数据；法官画像；司法公开；预测性司法；法国司法改革

2019年6月4日，知名杂志“Artificial Lawyer”刊登了一篇题为《法国禁止分析法官违反者将被判处五年监禁》的文章，引发全球科技界与法律界的高度关注。 “法国禁止人工智能指引”“法国禁止判决结果预测”“法国禁止对法官进行大数据分析”“法国禁止法律数据分析”“法国禁止对公共数据合法使用”等多种解读充斥坊间，法律科技界寒冬将至的论调甚嚣尘上。摆在法律科技界和大数据研究人员面前的问题是：随着各国法院判决的数字化与公开化，司法大数据应用已经日益成为全球化的趋势，法国在此种背景下为何要逆势而上？这一选择会否产生多米诺骨牌效应而引发全球效仿？对于方兴未艾的中国司法大数据应用而言，又有何种启示？本文将以法国司法大数据禁令为切入点，从法理冲突与价值平衡的视角，分析其立法的成因及其制度背景，并结合我国司法大数据应用的现状提出应对之策。

一

文本解读：法国司法大数据禁令概述

2019年3月23日，法国立法机关基于2018-2022年的司法改革框架颁布了2019-222号法律（de programmation 2018-2022 et de réforme pour la justice，以下简称《司法改革法》），其中就包括备受争议和误读的第33条。《司法改革法》主体部分可以被看作对法国国内已有的多部法律具体条款修订内容的详细说明，形式上类似法律修正案；附件报告部分则是司法改革的具体规划，形式上与我国司法改革纲要相仿，因此并非我们惯常所理解的标准意义上的法律。本文关注的第33条其实就是对《商法典》（code de commerce）、《行政司法法典》（code de justice administrative）、《司法组织法典》（code de l'organisation judiciaire）等法律特定条款修改的说明。其中，司法大数据禁令主要体现在《司法改革法》第33条对《行政司法法典》第L.10条和《司法组织法典》第L.111-13条的修订中。由于两者修订的内容只有部分表述的细微差异，因此笔者仅展示有关前者的修订原文：

修改《行政司法法典》第L.10条，将第2款和第3款替换为如下3款：

在不违反有关查阅和公布司法判决的特别规定的情况下，法院作出的判决应以电子的形式免费提供给公众。

作为对前一款的限制，判决中提及的自然人姓名，无论是当事方还是第三方，在向公众公开之前需要进行隐名处理。如果披露相关资料会损害相关人士或其身边人士的安全或隐私，任何可识别当事人、第三人、法官、书记官的身份信息亦需保密。

法官和书记官处成员的身份资料不得用于评价、分析、比较或预测其实际或假定的专业做法。违反禁令者，应判处刑法228-18、226-24及226-31所规定的处罚，但不影响1978年1月6日第78-17号法律关于数据处理、归档的措施与制裁。

从立法文本来看，《司法改革法》第33条对《行政司法法典》第L.10条和《司法组织法典》第L.111-13条修订的核心内容包括三点：第一点关注司法公开，根据该款规定，法国所有法院的判决原则上都要电子化并向社会公众免费提供。这是对2016年法国司法公开改革的进一步深化。在相当长的时间内，法国司法判例的公布主要由最高法院（la cour cassation）和国务委员会（le conseil d'Etat）进行遴选，公开比例有限，并且呈现出零碎和不完整的状态。尽管2002年第2002-1064号法令颁布后，部分法院的判决书就开始在公共网站（legifrance.gouv.fr）上发布，然而，直到2016年，公开的比例也不到法国总判决数的1%。2016年《数字共和国法》（Loi République numérique，也称“勒梅尔法”）力图改变判决书公开不足的现状。该法第20条和21条分别对《行政司法法典》和《司法组织法典》进行修订，要求在尊重有关人员隐私和评估再识别风险的基础上向公众免费提供所有法院的判决。这无疑“剥夺”了法国最高法院和国务委员会选择性公开判决的权力，是法国司法改革进程中具有里程碑意义的事件。不过，“勒梅尔法”虽然规定需要“免费提供”，但却没有明确提供的方式，在法律适用过程中发生了一定争议。因此，2019年的《司法改革法》就进一步明确判决书以“电子形式”免费提供。第二点是对第一点的补充，即在文书充分公开的基础上对特定自然人姓名和身份信息进行必要保密。相较于“勒梅尔法”，新法明确将判决书中法官与书记官的身份信息纳入了保护范围。第三点就是国内外法律科技界热议的司法大数据“禁令条款”（以下简称“禁令条款”）。结合法国《刑法》第226-18、226-24和226-31条所列的惩罚措施可以发现，“禁令条款”的处罚颇为严厉，违反者最高可以被判处5年有期徒刑以及30万欧元的罚金。仅从字面含义看，“禁令条款”没有限定分析方法和适用对象，因此，理论上可以涵盖所有从事法律文本大数据挖掘，甚至是小数据分析的个人、研究机构和技术公司，然而，按照立法逻辑和立法原意，“禁令条款”主要针对的是大数据应用。在《司法改革法》颁布之前，法国的司法裁判文书并未完全电子化公开，法律科技企业无法获得足够的数据对所有法国法官/书记官进行精准的大数据分析，而在《司法改革法》出台之后，科技企业理论上可以获得接近法国全国法院判决全样本的数据集，由此就获得了大数据应用的数据基础。因此，“禁令条款”实际是立法机关对法国司法裁判文书全面网上公开之后所可能引发的司法大数据应用（评价、分析、比较、预测等）的直接限制。这也解释了为何对于“禁令条款”的关注主要来自各国的法律科技界。在此之前，欧盟国家司法机关在官方层面对智能技术虽然谈不上大力支持，但也不禁止科技公司、研究机构、律师事务所展开这方面的尝试与应用。“禁令条款”打破了上述平衡与默契，令整个法国乃至全球法律科技行业“哀鸿遍野”。

然而，若我们对“禁令条款”进行解释论意义上的分析就会发现，媒体的诸多报道并不准确，甚至存在一定误读。申言之，“禁令条款”有非常明确的指向性，即不得基于“法官和书记官处成员的身份（d'identité）”进行“评价、分析、比较或预测”。可见，如果相关的应用并非基于法官/书记官的身份展开，则是完全合法的，比如分析特定法院案件的处理效率、预测特定法院对具体案件的支持度等。从这个意义上讲，法国的立法并没有禁止判决预测，也没有禁止裁判文书的大数据分析，而是禁止基于身份的定向挖掘。用严格的技术术语来表述，“禁令条款”禁止的是基于法官/书记官“画像”的判决书大数据应用。从草案讨论过程来看，立法者重点关注的是基于判决书大数据所可能产生的围绕法官身份“复用”（réutilisation）与“画像”（profilage）的分析、预测、评价。按照司法大数据现有的应用场景来看，主要是禁止以下四种应用：（1）一致性分析：将特定法官办案数据与其他法官办理类似案件的大数据进行对比，分析特定法官特定案件与整个司法系统的一致性状况。（2）连续性分析：通过将特定法官特定在办案件与其历史相似案件的对比，分析法官判决标准是否具有连续性。（3）适法性分析：通过对特定法官办理案件的挖掘，分析其是否符合现行法律的相关规定。（4）预测性分析：通过对特定法官办理案件的挖掘，预测其在办案件可能的结果，也就是俗称的大数据判决预测。因此，“禁令条款”并未一刀切地禁止所有司法大数据应用，针对整个司法系统乃至特定法院的大数据应用仍然具有合法性。

当然，“禁令条款”的出台过程并非一帆风顺，甚至一度引发宪法争议。反对者认为基于法官身份的司法数据分析有助于获得对司法实际运作更全面的认识。“禁令条款”侵犯了公民获得公平审判、获取法律的宪法权利。然而，在2019-778号决定中，法国宪法委员会（The Conseil Constitutionnel）裁定“禁令条款”并没有在当事人之间造成任何不合理的区别，也没有损害各方的平衡与获得平等程序的权利。以“禁令条款”违反1789年法国《人权和公民权宣言》第6条和第16条为理由的申诉必须予以驳回。

二

法理冲突：法国司法大数据禁令的成因

尽管从技术逻辑上看，法国《司法改革法》并未完全禁止对司法裁判文书的大数据挖掘，但其对“法官画像”的禁令同样耐人寻味。毕竟，随着各国司法文书电子化与公开化的推进，基于文书大数据挖掘的法官判决结果预测已经成为法律大数据最为主流的应用之一，中国、美国、英国、法国等国科技界与学术界均有此类大数据预测平台，以法官判决预测为主题的学术论文也屡见不鲜。有人对法国国内164家法律科技公司统计后发现，有11%推出了基于法院判决的大数据与人工智能产品。正因如此，“禁令”一经发布立刻引发了欧美科技界的关注，各类成因分析的文章充斥媒体的科技板块。令人遗憾的是，现有的相当部分分析采取了“隔岸观火”的视角，并颇有阴谋论的意味。比如，有文章指出，法国禁止“法官画像”是因为大数据对法官判决可以作出准确的预测。由此，社会公众就会因为依赖大数据应用而降低对律师行业的需求。还有分析认为，禁止“法官画像”主要是因为法官害怕大数据挖掘可以呈现他/她的判决历史轨迹，尤其会呈现判决与法律不相一致、与历史判决不连贯之处。对于法国的法官而言，AI的结果预测技术就好比吹哨人。因此，“禁令”实际上是法官群体对吹哨人的集体抵制。不得不说，上述分析有一定的偏颇与误读之处，并未完全反映“禁令条款”背后的立法考量。实际上，在“禁令条款”出台之前，法国国内对此问题进行了深入的讨论。最终方案正是立法机关对司法数据分析与法官隐私、司法独立、司法权威、司法公正之间法理冲突的回应。

（一）与法官隐私的冲突

“禁令条款”的出台有相当部分是基于法官隐私保护的考量。实际上，《司法改革法》法律文本的篇章布局也凸显了这一立法原意。从体例安排来看，第33条是在“协调法院判决公开性与隐私权”的章节之下。该章节下的所有内容理应从属于协调判决公开与隐私保护的叙事逻辑。回归文章第一部分的法律文本，《司法改革法》第33条对《行政司法法典》和《司法组织法典》修订的核心内容第一点实际上是司法公开的规定，要求法国所有法院判决书原则上应该免费在线公开。第二点则是对第一点的限定，在《司法改革法》对《行政司法法典》的立法文本修订上更是直接使用“作为对前一款的限制”的表述，要求在司法公开的过程中必须保障当事人、第三人的隐私（匿名化处理）。如果判决书的公开可能影响到当事人、第三人、法官与书记官的隐私，则上述主体的身份信息也需要从公开的裁判文书中隐去。实际上，在2016年“勒梅尔法”出台后，对该法第21条和第22条“在尊重有关人员隐私的同时，免费向公众提供法院作出的决定”的适用存在诸多争议。其中最为核心的争议就在于法条中“有关人员”是否包括法官。法国司法部组织的专家组在多次调研听证会之后得出了与会人员立场和观点差异巨大，完全无法达成共识的结论。然而，《司法改革法》的修订实际上认可了法官隐私权的存在。也就是说，按照《司法改革法》的规定，当事人姓名属于当然隐去的隐私。同时，基于隐私考量，法国立法也允许判决书在网上公开时不出现法官姓名。《司法改革法》第三点的修订则进一步强化了第二点中提及的法官隐私保护。如果说，法官的姓名属于个人隐私的话，那么特定法官的所有历史判决的分析就属于“职业隐私”。“禁令条款”禁止了法官画像，也就是禁止公开特定法官“职业隐私”。换言之，对于部分特定案件，法官的姓名可以基于隐私的考量而在公开的判决书中隐去。对于没有隐去法官姓名的判决书，公众获取的信息仅限于法官与特定判决表面关联（法官署名）。至于法官对特定诉请的支持率、证据偏好、审判效率等职业信息则完全禁止进行数据分析，因此也就处于对公众保密的状态。

（二）与司法权威的冲突

前文已经提及，在法国对法官判决预测并非是一个新鲜的事物。在该技术应用的过程中，曾引发了法律界与科技界的论战。其中，一篇有关法国法官审理庇护案件的大数据挖掘报告是重要导火索。2016年，一位律师和机器学习专家Michaël Benesty通过大数据挖掘分析法国的庇护案件（asylum decision）。数据显示，法官在审理此类案件时存在显著的司法偏见。一些法官倾向于拒绝所有的庇护申请，而其他法官则只有相当低的拒绝比例。Benesty还创建了一个非营利性的网站“超级法庭”（SupraLegrem）来跟踪法官庇护案件的审理进展。公众可以通过软件来追踪上述案件中的司法偏见。法国司法系统对此反应迅速，有法官陆续发表了针对Benesty的批评文章。部分媒体也站在法官一边，将Benesty及其创建的网站视为一项激进的商业技术。无独有偶，还有研究显示，只要获知法官的姓名和难民的国籍，就可以准确预测80%申请庇护案件的结果。研究人员进一步指出，这些法官的判决之所以如此好预测，是因为他们的判决模式更依赖“瞬间判断”（snap judgment），而不是基于法律和事实的不带偏见的深思熟虑。当研究人员给相关法官指出他们判决中的“偏见”时，法官随后的判决会有显著的改善。还有研究显示，除庇护案件之外，法官在其他案件（如环境类案件）也存在显著的偏见。随着法官判决大数据挖掘的普及，对司法系统的批判嵌入了“高科技”的元素。在智能技术日益具备正当性的时代，司法体系需要不断面对技术话语的挑战与批评。然而，由于挖掘算法的专业性和不可解释性，司法系统往往无法进行有针对性的回应。这种现象加深了官方对于大数据挖掘可能影响司法权威的担忧。除此之外，有论者还认为，法官姓名的公开还可能被赋予性别、出身或宗教的关联。如果在大数据挖掘中将判决结果与上述敏感信息关联，可能产生实际错误但却极具传播力的批评。由此，在判决书中公开法官的姓名不但不会实现期待中的司法权威的提升，反而极可能削弱公众对司法系统的信任。

（三）与司法独立的冲突

“禁令条款”的另一个有力支撑在于基于法官身份的判决预测很可能会对法官判决造成不当干预，进而影响司法独立，阻碍司法创新。按照法律大数据的应用逻辑，理论上通过对海量判决书的深度学习，可以形成对具备特定情节案件的判决预测模型。该模型不但可以对未决案件进行智能辅助，同样还可以对已决案件进行偏离度的测算。这就是本文第一部分提及的“一致性分析”和“连续性分析”。在“禁令条款”出台之前，法国司法系统于2017年在雷恩和杜埃两家上诉法院进行了司法人工智能判决结果预测软件Predictice的试点。经过试点后，法国司法系统得出的结论是软件并无显著价值，它无法判断案件中的细微差别，也无法充分考量一些案外因素。随后，法国政府于2017年成立公开数据委员会（Commission on Open Data）研究司法改革，并有了“禁令条款”的出台。从对各类报告的归纳来看，“禁令”的出台主要是基于几个方面的考量：第一，现有大数据挖掘技术精准性不足。“预测性分析”（predictive analytic）的基本目标是最优化，也就是在一系列备选方案中寻求最优解。其挖掘的结果只是一种概率的选择。基于法官大数据画像的判决结果预测和偏离度评估并非完全准确；第二，基于大数据挖掘所产生的最优判决（最优解）的压力，客观上可能潜在地形成一种要求法官向历史平均判决结果靠拢的压力。这不仅对法官判决形成不当干预，影响司法独立，还会抑制法律制度适应性和动态性所必须的较低层次的差异或异质性。过度地向平均数靠拢将会从根本上限制司法场景中基于价值变化或理念调整而进行的“创造性演变”。第三，大数据还会给多数派判决以过高的权重，当法官受到大数据判决方案的影响，多数派判决就会被进一步强化，最终导致整个司法实践固化。第四，法官大数据画像的应用可能引发管辖权兜售（forum selling）的行为。在司法实践中，出于不同的动机，包括名誉或地方利益，一些法官希望审理更多的案件。当原告有广泛的法院选择时，这些法官有动机使法律更有利于原告，从而吸引更多的原告起诉。司法大数据分析的应用使得法官可能为了塑造良好的记录而有意识地向公众偏好倾斜，以便在管辖权竞合的诉讼案件中争取更多的案源，从而给法官判决形成了不当的诱导。因此，法国立法者在解释“禁令条款”时就强调，基于法官“画像”的数据分析，将会给法官履职带来压力并影响司法的正常运作。

（四）与司法公正的冲突

“禁令条款”还有避免诉讼投机行为，保障司法公正的考量。法国宪法委员会第2019-778号决定中明确提及法官大数据画像的应用可能会加剧策略性的管辖权选择行为（des stratégies de choix de juridiction），也就是“择地诉讼”和“挑选法官”的诉讼投机行为。“择地诉讼”（forum shopping），又称“选择法院”“挑选法院”“选购法院”，是指当事人为了获得有利于自己的判决结果而有意识地选择在特定法院进行诉讼的行为。《元照法律词典》对于“择地诉讼”的解释是“一方当事人选择某一特定法院进行诉讼，以获得最有利的判决”。在美国，“择地诉讼”主要出现在联邦与州管辖竞合以及国家纠纷的案件中，它被认为是“一种事实活动和合理的诉讼策略”。当然，这种认知更大程度上是建立在传统诉讼模式的基础之上。在管辖权相对弹性的诉讼制度中，律师可以根据对不同法官的了解而灵活选择管辖法院，以此获得有利的判决。然而，随着大数据技术的普及和法官大数据画像的广泛应用，“择地诉讼”的成本和难度将大幅度下降。传统诉讼中少数人可以享受的“特权”可能走向普及。由此，小范围的“诉讼策略”也就可能潜在地转变为普遍性的“诉讼投机”，进而影响司法公正。实际上，在2016年“勒梅尔法”颁布之后，法国国内关于判决的大数据分析就迅速发展。不少法国科技公司利用大数据与人工智能技术对法官进行“画像”、统计、排名，以此为基础预测诉讼的成功概率、可能获得的侵权赔偿金额，甚至是帮助当事人选择在赡养纠纷中更“慷慨”的法官。

三

价值平衡：法国司法大数据禁令的评析

无论是对法官隐私与安全的保护，还是避免法官遭遇不当干预，防止诉讼投机，其立法原因都和法国特定的制度背景紧密相关。脱离特定的制度背景，对于法国司法大数据分析禁令多少可能感到费解，比如中国读者就很难认同判决书在网上公开时需要保护法官的隐私。因此，要进一步加深对法国“禁令条款”的理解，还要从法国乃至欧盟特有的制度背景切入。实际上，“禁令条款”的出台是立法者调和司法公开与个人数据、司法权威与言论自由、司法独立与技术主义、法官个体与法院整体等多元价值冲突所作出的妥协与折衷。

（一）司法公开与个人数据的价值平衡

众所周知，《通用数据保护条例》（General Data Protection Regulation，以下简称GDPR）在2018年5月正式生效。作为欧盟区通行的数据保护规范，GDPR强化了数据主体对个人数据的控制导向，赋予数据主体以数据隐私权。因此，在法国制定《司法改革法》时，由于涉及到当事人乃至法官、书记官的个人数据，如何符合GDPR的数据保护规范就成为需要重点讨论的内容。正因如此，在理解“禁令条款”时必须结合GDPR，否则难以理解为何在司法公开过程中还需要探讨法官的个人数据保护。当然，由于本文关注的是“禁令条款”的深层原因，其核心是“法官画像”问题，因此笔者将聚焦两方面：其一，法官出现在判决书上的姓名是否属于“个人数据”（personal data）？其二，相关主体，如科技公司、研究机构是否有权基于法官姓名而进行大数据挖掘？

根据GDPR第4（1）条的规定，“个人数据”是一个已识别或可识别自然人的所有相关信息。其中，自然人姓名属于最为重要的“个人数据”。那么，法官履行公职的行为——依法在判决书署名——是否会使姓名由“个人数据”转换为“职务数据”？对此，GDPR并没有明确提及。但是，从欧盟法院的相关判决我们可以推知，履行公共职责并不构成个人信息的排除。在2019年的布伊维兹案（Buivids）中，布伊维兹录制了一名警察在警察局履行职责时的录像，并将录像上传至视频网站。在判决中，法院认定，视频录像所记录的图像使警务人员易于辨认，因此毫无疑问是“个人数据”。布伊维兹的拍摄和上传行为也属于“个人数据”的“处理”。可见，只要能够直接或间接识别个人的数据便是GDPR中的“个人数据”，不受使用方式、数据来源影响。也就是说，法官在判决书上所署的姓名仍然属于个人数据，依法受到GDPR的保护。

在明确判决书上法官姓名属于个人数据后，我们需要讨论对科技公司、研究机构“法官画像”的禁止是否有GDPR的正当性基础。在GDPR的概念框架中，“数据处理”是指对个人数据或个人数据集合所做的任何一项或一组操作，包括但不限于收集、记录、储存、修改、结构化、排列或组合[第4（2）条]。对于“画像”行为属于处理“个人数据”并不存在争议。争议点就在于科技公司、研究机构是否有权利进行上述处理。一般而言，“数据处理”必须有合法性的基础，比如基于数据主体的明确同意与授权[第6（1）（a）条]。不过，也有例外，即基于“法律职责”[第6（1）（c）条]或“公共利益”[第6（1）（e）条]。可以肯定，科技公司、研究机构的“法官画像”行为不属于“职权行为”。同时，在法国立法者看来，基于法官身份的司法大数据分析不仅可能不是有助于“公共利益”，反而有可能给司法独立、司法权威与司法公正带来负面影响。基于上述认识，在GDPR的框架下，科技公司、研究机构的“法官画像”的数据处理行为就必须要获得数据主体，也就是法官的明确授权。从《司法改革法》出台前法国法官群体对大数据挖掘的抵触情绪来看，这种授权很难以实现。因此，“禁令条款”实质上与GDPR的基本制度框架一脉相承。

（二）司法权威与言论自由的价值平衡

关于法国“禁令条款”的解读还需要放置在法国甚至欧盟的言论自由体系下来关注。《欧盟人权公约》第10条第1款明确规定了“言论自由”（free of expression）的权利——人人都有表达自由的权利。这项权利应包括发表意见、接受和传播信息和思想的自由。不过，在第10条第2款还规定了基于维护司法权威可以对言论自由进行“合法限制”。在欧盟的法律环境中，对法官进行大数据画像、行为分析、判决预测进而对法官、法院、司法体制进行批评也是言论自由的范畴。因此，需要进一步讨论“禁令条款”是否违反了《欧盟人权公约》的规定。这就需要判定，“禁令条款”对言论自由（基于法官大数据画像的评估、分析、批判）所施加的限制是否具有“合法目的”（legitimate aim）。欧洲人权法院（The European Court of Human Rights）在Prager and Oberschlick v. Austria一案中强调基于保护司法声誉和维护司法权威的目的而限制批评法官的言论具有合法性——司法系统必须受到特别保护，使其免受毫无根据的破坏性攻击。一个普遍被视为破坏司法权威的例子发生在2016年英国法官的第一个有关脱欧的判决——要求政府必须经过议会批准才能脱欧。判决出台后，英国高等法院（High Court of England and Wales）三位法官的照片出现在2016年11月4日《每日邮报》（Daily Mail）的头版，并配以“人民的敌人”的标题。正如本文第二部分提到的那样，“禁令条款”出台的背景之一就包括基于大数据挖掘而对法官判决随意性、不连贯性、不一致性的批判，认为法国的法官判决常常是“瞬间判断”、存在自己都没有意识到的“偏见”等。上述批判以智能技术为“外衣”，获得了极大的关注和影响力。有些批判甚至已经可以在一定程度上被视为“人身攻击”。因此，法国“禁令条款”实际上是针对言论自由与司法权威之间张力的立法选择，旨在避免不实人身攻击，维护司法权威。当然，仅仅具备“合法目的”还不足以构成正当的言论自由限制。根据欧盟的相关司法实践，基于合法理由对言论自由的限制还必须具有手段上的“恰当性”（比例原则）。为此，法国立法机关作了折衷选择，将司法大数据的禁令限制在针对法官个人画像的范围之内。

（三）司法独立与技术主义的价值平衡

在全球范围内，大数据与人工智能技术已经开始广泛影响政治、经济与文化生活。然而，不同国家对于智能技术的态度截然不同。美国采用了相对宽松的管理制度，对于大数据与人工智能技术在司法领域的应用也并不反对。Lex Machina、Premonition、Ravel Law等知名的司法大数据挖掘平台都是基于海量裁判文书对法官进行画像，进而实现风险评估与结果预测。与美国形成鲜明对比，欧洲层面对于司法公开，尤其是判决书网上公开之后可能给司法系统带来的影响充满担忧，对于科技企业以市场为导向大规模使用上述数据更是心怀警惕。这就使得在欧盟范围内司法大数据与人工智能应用呈现出以下几点显著特征：第一，民间应用蓬勃发展。欧美国家司法领域大数据与人工智能的开发主要集中在私有主体（private sector），如科技公司、律师事务所。经过多年发展，已经在法律问答机器人、法律文书审查与生成、案件研究、判决预测等方面形成了一系列的应用。第二，官方应用相对有限。与民间蓬勃发展形成鲜明对比的是，欧美国家官方层面，以公共政策进行推广的司法智能化应用较为有限。近年来，欧美不少国家都推出了司法现代化的改革。上述改革也不乏强调科学技术的应用，但相关措施仍然主要停留在传统信息化的维度，强调文书电子化、在线纠纷解决等。改革过程中对于大数据与人工智能技术的关注并不充分。欧洲司法效率委员会（European Commission for the Efficiency of Justice）在《关于在司法系统及其环境中使用人工智能的欧洲伦理宪章》中指出欧洲各国法律大数据与人工智能应用未受足够重视，并且主要来自私营部门，而未被纳入公共政策。可以说，法国“禁令条款”的出台与欧盟地区各国对大数据技术司法应用的警惕一脉相承，所不同的只是法国政府更进一步，由“谨慎”到部分“禁止”。

当然，对于智能技术在司法领域的警惕可能只是表象，其潜藏的是司法自治与技术主义之间的话语冲突。在传统社会，法官是司法系统的核心，法官判决的质量取决于系统内部的同行评价。换言之，司法系统的独立性赋予司法系统以案件质量评价的自主性（autonomy）。司法系统掌握着评价的最终话语权。然而，随着智能技术的发展，技术开始作为法官案件质量评价的重要标准，并且由于“智能”的外衣在社会公众认知层面已经形成共识，技术话语对于案件质量的评价往往比法官乃至法院系统的自我评价更具有正当性和说服力。由此，案件评价的话语权就潜在地可能由系统内转向系统外。更进一步，随着技术对司法渗透范围的扩大，司法全过程都可能被纳入技术治理的视角之下，无远弗届、无处遁形。于是，司法独立与技术主义之间的张力在这个过程中就逐步加剧。因此，法国“禁令条款”正是价值平衡之后的折衷处理。一方面，禁止对法官个人进行大数据挖掘，保留司法的独立性；另一方面，允许非个人化的大数据挖掘，保障技术的发展与应用。

（四）法官个人与法院整体的价值平衡

众所周知，英美法系的法官以个人名义作出判决，法官个人构成了司法判决的核心。而在法国，法理上认为法官并非以个人名义作出判决，而是以“法国人民”（au nom du peuple français）的名义。法国国务委员会副主席在表达对法官“画像”的反对立场时就表示，“在法国的概念中，法院的判决超越了法官个人”。一般而言，法国法院判决由三名法官组成的合议庭在评议之后作出，而评议过程是保密的。没有人知悉合议庭中特定法官对判决的意见。尤其是对判决持否定意见的法官也因为合议庭所呈现的“整体”面目而失去可辨识性。在这种背景下，法官个人是隐藏在法院组织之内的。换言之，在法国的司法系统中，法院（整体）和法官（个人）之间是有着显著差异的。如果不了解这一基本理念的话，中国的读者就很难理解法国《行政司法法典》第L.10条第一款为何要明确规定判决书必须公开，并且标明作出判决的法官姓名。在中国读者看来，规定法官要在判决中署名稍显多此一举。然而，在法国的司法实践中法官署名则属法律强制。也正因如此，在《司法改革法》修订的过程中，就有声音认为既然判决是由合议庭以法院的名义作出，那么在判决向社会全面公开的过程中就应该隐去法官的姓名。尽管立法者最终没有采纳这种稍显激进的建议，但也作出了一定的妥协，也就是在公开法官姓名的同时禁止针对法官个人的大数据挖掘。

四

中国选择：法国司法大数据禁令的启示

当前，大数据与人工智能技术被普遍视为审判体系与审判能力现代化的重要动力。得益于顶层的大力推动，中国司法大数据与人工智能技术的应用不再是某一片断、局部场景的小范围运用，而是呈现出范围全面性、功能根本性、地位关键性与态度开放性等时代特征。在《最高人民法院关于加快建设智慧法院的意见》中就明确提到“挖掘利用海量司法案件资源，提供面向各类诉讼需求的相似案例推送、诉讼风险分析、诉讼结果预判”。实践中，“同案不同判预警”“判决结果预测”“诉讼风险评估”等基于司法大数据的智能应用已经完成开发，进入试点阶段。可见，相较于欧盟主要国家司法机关对于智能技术的应用而言，我国司法大数据的应用具有全场景、全业务、全流程的特征。因此，我们在推动司法大数据应用时“既要关注大数据技术给审判体系与审判能力现代化所带来的突破，更要关注大数据技术给传统司法理论带来的调整，明确大数据在司法场景内应用的限度”。法国“禁令条款”出台的理由以及围绕它展开的讨论为我们理解司法大数据应用可能与司法独立、司法权威、司法公正之间形成的法理冲突提供了重要启示。同样，“禁令条款”出台过程中，立法者对各种价值进行权衡后的折衷选择同样具有重要的参考价值。

当然，考虑到中国与法国在法律文化、制度体系和司法实践上的诸多差异性，对域外立法与实践也不能照抄照搬，而需要结合本土语境展开有选择的借鉴。众所周知，欧盟的GDPR高度倾向于个人保护，因此，其制度设计以扩大个人数据权能为典型特征。由此，就给数据控制者和数据处理者设定了较高的合规义务。科技公司、科研机构在基于公开判决书进行大数据分析时，仍然需要承担较高的个人数据保护义务。我国的个人信息保护则奉行利益均衡原则，在立法时强调保障与发展并重，在实践中关注信息主体与信息业者的平等保护。理念差异的一个直接后果就是我国现有规范体系对于依法公开后的个人信息的使用设定了较为弹性的空间。对此，尽管《网络安全法》等现行法律没有具体规定，但在我国的相关国家标准中却有明确体现。国家标准《信息安全技术个人信息安全规范》（GB/T 35273-2017）第5﹒4条规定，个人信息控制者“从合法公开披露的信息中收集个人信息”时不需要个人信息主体的授权。也就是说，无论是科技公司还是科研机构，从最高人民法院公开的裁判文书网上收集判决书，并获取信息无须经过个人信息主体授权。进而言之，由于个人信息保护制度通常是围绕信息收集的目的展开的，信息控制者的处理行为受目的限制。然而，依法从公开渠道获得信息的处理目的完全由数据控制者决定。由此，信息控制者后续的数据处理行为只是抽象地受“合法、正当、必要”原则的限制，只要不明确违反法律规定、损害公共利益、破坏公序良俗等，则无论是个人画像还是其他应用一般都不会遭遇明显的合规问题。可见，无论是理论认识还是法律规范，我国都不具备完全禁止司法大数据应用的可行性。与此同时，司法大数据的合理使用，确实也能够为司法系统带来显著的正面效应。对于法官而言，司法大数据可以为法官提供类案推荐、偏离预警等司法辅助工作。对于当事人而言，则可以获得诉讼风险评估、判决结果预测等智能化服务。对于整个司法系统而言，则有利于推动司法可预测性的实现，降低司法的不确定性。也正因如此，我国现阶段也不具备完全禁止司法大数据应用的必要性。

尽管如此，司法大数据应用并非完全不受限制。尤其应考虑到司法大数据滥用可能对司法独立、司法权威和司法公正造成的潜在危害。由于整体上缺乏对司法大数据应用，尤其是与法官画像有关的大数据分析的风险评估，实践中，很多试点虽然是基于提高效率、保障司法公正等目的，但其执行的结果却可能会消解司法的固有属性、削弱法官的主体地位。比如有地方试点就采用大数据的理念，对法官历史办案数据进行分析，进而得出每位法官办案的效率、准确率、特定案由的支持率、擅长案由的范围等分析结果。在分析结果的基础之上，对法官进行绩效考评，甚至作为员额进出的参考依据。该试点由于将司法大数据分析与法官晋升相关联，使其对法官正常履行职权产生了实质影响。类似的地方试点并非孤例。因此，基于保障司法独立、维护司法权威和实现司法公正的需要，规范我国方兴未艾的司法大数据应用就显得刻不容缓。

第一，在司法大数据应用中引入个人信息保护理念。众所周知，司法机关在职权履行过程中会涉及到大量个人信息，其中不仅有姓名、年龄、性别等一般意义的个人信息，还可能会涉及遗传或生物特征、健康数据等个人敏感信息。因此，个人信息保护理念是法院系统在大数据时代所必须遵循的理念。欧盟层面就高度重视将个人信息保护理念引入司法系统。“欧盟司法计划（2014-2020年）”专门资助成立了司法系统数据保护组织INFORM，推动在欧盟层面司法系统中的个人数据保护改革。不同于法国以私有主体推动为特征的司法大数据应用，我国司法大数据应用呈现出鲜明的公共政策属性。法院系统本身就是司法大数据应用的最大推动者和应用者。因此，在应用开发时需要遵循个人信息保护的基本框架，在具备合法性的基础上重点考虑个人身份使用的必要性以及数据挖掘目的、手段和结果应用的正当性。一方面，在司法大数据应用中，如无必要不进行基于个人身份的数据挖掘。强调“对案不对人”，淡化高度指向个人的定向开发。另一方面，如有个人信息在司法大数据应用中不可或缺，那么在处理时应当通过合理的技术或组织手段，保障个人信息的合理安全，包括防止未授权或非法的处理、预防意外损失或销毁等。

第二，破除司法大数据应用的片面技术主义误区。尽管司法大数据技术确实有相较于传统信息技术的优势，然而，我们必须认识到其尚处于初级阶段，技术仍有待完善。首先，司法大数据应用面临着图谱构建、情节抽取、模型构建等一系列技术难题，相关应用不仅深受案由的限制，也面临不同程度的对准确率的质疑。其次，现有司法大数据的方法论强调情节与结果之间的函数关系挖掘，它实际上将法官案件审判工作简化为相关性的挖掘，忽视了司法判决过程中对政策背景、社会关系的考量，导致分析结果的机械主义与片面主义。再次，司法大数据高度依赖用以分析的判决数量。如果司法大数据挖掘仅针对法官个人办理的案件，考虑到我国的法官群体的数量和人均办案量，很难形成足够精准的数据挖掘模型，准确度则更加难以保障。因此，下一步需要赋予司法大数据应用主体以适当的释明义务，明确采用的路径、数据样本的数量、评估的准确性等关键信息，由此破除片面技术主义的迷思，形成对司法大数据应用的合理期待。

第三，推动司法大数据应用常规备案与伦理审查。在大数据日益发展的背景下，各国司法机关纷纷成立委员会对相关算法与应用进行规范。比如，2019年初“英格兰与威尔士法律协会”成立了“公共政策、技术和法律委员会”（Public Policy Technology and Law Commission）。该委员会的核心任务是负责审查英格兰和威尔士司法系统中算法的使用情况，以确定采用何种控制措施能够有效保护人权和维护对司法系统的信任。下一步我国最高人民法院可以尝试牵头成立由法学、伦理学、计算机科学等领域专家联合组成的“人民法院数据委员会”，其核心工作有两个方面：其一，对全国范围内法院系统推动的司法大数据应用进行常规备案；其二，从司法独立、司法公正、司法权威角度出发，对全国范围内法院系统推动的司法大数据应用进行司法伦理审查。尽管工作组中有技术专家，但审查主要是从司法伦理角度出发，充分评估其应用可能给司法造成的影响。

第四，明确司法大数据应用的非约束性适用原则。法国法官大数据画像禁令的原因在于避免法官受到不当的压力，维护司法独立。这一论点对中国同样具有启示意义。实践中，已经有部分试点可能潜在地影响了法官行使审判权。比如部分地区利用司法大数据评估法官办案的准确度，当法官在办案件与历史类案高度偏离时则无法作出判决，或是必须进行说明。此种司法大数据应用已经超出了单纯辅助性的功能，而具备了相当程度的强制性。因此，要避免司法大数据应用给法官带来的不当影响，就必须明确司法大数据应用的非约束性适用原则。对于涉及法官核心职权的实体问题，司法大数据应用仅具有辅助性质，法官有选择参考与否的自由。

第五，建立司法大数据应用的负面清单制度。负面清单制度的实质是为司法大数据应用划定禁区。换言之，在负面清单之外的应用，各地法院、科技公司、研究机构均可以自由地展开相关研发。正如前文所论及的那样，部分大数据的滥用，可能给司法独立、司法权威和司法公正带来负面影响。比如明显以诉讼投机为核心诉求的司法大数据应用，或者容易诱发民族歧视、地域歧视、性别歧视、宗教歧视的司法大数据分析。对此，“人民法院数据委员会”可以结合司法大数据应用的常规备案与伦理审查，适时出台并定期更新“司法大数据应用负面清单”，以此为全国范围内的司法大数据应用提供指引。

五

结语

法国《司法改革法》第33条对《行政司法法典》和《司法组织法典》的修订最初是基于法官隐私、司法独立、司法权威与司法公正的考量。尽管官方对立法的出台作了正当化的论述，但在法国国内仍然存在不小的争议。举例而言，为了维护司法权威，一定程度上限制或禁止法官大数据画像尚可以理解，但以刑事手段进行制裁则多少超出必要的限度。众所周知，适当的批评是司法机关作为公共机构所必须面对的挑战。在裁判大数据公布之前，学术界、实务界利用公开信息监督法院运作和法官行为业已成为常态。无论对于大陆法系还是英美法系，法官是否严格地遵守法律展开判决、法官个人判决是否遵循统一的尺度以及是否呈现出不当的偏见都是至关重要的问题。进入大数据时代，机器学习技术的发展使得大样本分析成为可能。由此，对于司法公正至关重要的问题可以获得大样本数据的支撑。合理利用对法官个人身份的大数据挖掘不仅不会损害司法权威，恰恰对于维持司法权威至关重要。当然，任何法律的修订与出台都是权利（权力）博弈的结果，因此必然无法得到各方的一致认可。但可以肯定的是，“禁令条款”的蝴蝶效应已然出现。在《司法改革法》出台后，法国律师通过“全国律师协会理事会”（Council of National Bar Associations）推动法律修订，要求赋予律师与法官相同的不受大数据挖掘的权利。结合GDPR对于“个人信息”的保护框架，律师群体的上述主张绝非毫无依据可言。总之，“禁令条款”这只蝴蝶的振翅已经导致了立法者可能不曾设想的结果。它对于法国司法大数据行业的发展究竟会形成怎样的影响，还需要我们耐心地观察。

本文转自比较法研究，作者王

编辑：抱住君丨版式：WING

特别申明：以上文章内容仅代表作者本人观点，不代表抱住观点或立场。如有关作品内容、版权或其它问题请于作品发布后30日内与抱住联系。

点击阅读原文，查看精彩好文！

以上是关于法国禁止对裁判文书进行大数据分析，为什么？的主要内容，如果未能解决你的问题，请参考以下文章