咨询律师 找律师 案件委托   热门省份: 北京 浙江 上海 山东 广东 天津 重庆 江苏 湖南 湖北 四川 河南 河北 110法律咨询网 法律咨询 律师在线 法律百科
我的位置:110网首页 >> 资料库 >> 论文 >> 司法制度 >> 查看资料

从理念到技术:在司法领域中运用实验方法的局限性

发布日期:2012-04-12    文章来源:互联网
【出处】《清华法学》2011年第6期
【摘要】司法领域的特殊性和复杂性决定了司法领域运用实验方法不仅具有社会学领域实验所普遍具有的不足,还面临司法领域所特有的障碍。我国司法领域的实验存在实验设计和启动不够科学、实验主体立场不够客观、实验过程缺乏科学控制、对实验结论的论证不够充分的局限性。应当从避免实验过程中的功利主义倾向、遵循实验的基本要求、公开详细的实验方案、实验过程和实验结论,接受社会和同行检验、建立司法实验统一规划审批和监督机构等方面进行弥补。
【关键词】司法领域实验;局限性;受控比较;试错
【写作年份】2011年


【正文】

  实验,是指在人为控制或模拟的特定条件下对研究对象进行观察比较,从而发现事物间的因果联系,或验证某种理论假设是否正确可行而进行的一系列操作或活动,最初应用于自然科学研究。随着自然科学的不断进步、实验手段的日益提高,实验方法的种类也越来越多。上世纪60、 70年代开始实验逐步被应用于社会科学研究中,在社会学、心理学等领域较为常见,在法学领域则起步较晚。近年来,随着西方新法律现实主义的盛行和社会学研究方法的引入,实证研究逐渐成为我国法学界的潮流。实验作为实证研究方法中的一种受到司法领域的广泛关注,不但实务部门兴趣盎然,众多学者也成为实验的积极倡导者,二者还常常优势互补,共同进行实验研究,这为我国本土法律学术资源的累积和传统研究范式的转型开辟了一片“新大陆”。然而,法学界和实务界对于实验的基本原理和局限因素的研究尚不深入,这在一定程度上影响了司法领域实验的效果和公信力。笔者不揣浅陋,拟从实证研究的角度对司法领域实验的方法论基础和局限因素略抒己见,并通过批判性地分析我国目前司法领域实验现状提出弥补建议,以期对司法领域实验的规范化有所裨益。

  一、实验运用于司法领域的样态及其界定

  与自然科学领域和其他社会科学领域相比,由于实证研究方法引入较晚,法律领域实验在方法论和研究对象上都体现出先天不足。在司法领域,常常可见以法官、陪审团、诉讼参与人为对象的心理学实验{1}或社会学实验{2},虽然实验结论对司法领域具有启发性,但因为研究者一般都是心理学、社会学等非法学领域专家,也并非以法学理论建构为最终归宿,所以无法视为为司法领域实验。如果以研究者所属领域和实验的结论都归属于司法领域作为司法领域实验的标准,根据笔者有限的观察,司法领域实验大致有两种样态:一类是以验证理论假说为目的的研究类实验,是基于对经验事实的归纳分析,提出某种因果关系假说,在一定范围内设计实验,对假说进行正确性验证,结论一般对司法实践具有指导性和参考性。此类实验以解释为最终目的,研究性更强,也更贴近实证研究的本质。例如,对交通违法判刑严重是否会导致赦免比率上升{3},在过渡时期给予少量资金资助能否推迟或阻止从监狱释放的囚犯再次犯罪{4},等等。这类实验在我国的法律研究领域还比较少见,国外则更多一些。另一类则是以制度改良为目的的探索类实验。这类实验对解释司法现象和发现因果关系没有兴趣,而是主要借助实践活动探索新制度的效果。最典型的是我国目前普遍存在的“小额诉讼”、“量刑程序改革”、“刑事和解”等制度改革试点。其所秉持的理念是“公众对法律的信任不应只是源于异想天开的争论和政治运动的诱人力量,用实验方法证明法律的效力可以为这种信任提供更坚实的基础。在实验观察表明法律的某个方面无效或者有反作用,并对此加以改变的同时,法律自身也会随之得到改进。”{5}这类实验多以新制度试点的面目出现,常常缺失研究类实验的某些典型特征,有时可能仅仅意味着制度的“革新”或“变化”而已,有时则接近于社会学领域中的公共政策评估方法{6}。

  如果从狭义理解,以试点为主要形式的探索创新类实验与实证研究中的典型实验有明显的区别,不能笼统地称为“实验”。因为,前者是一种以改良司法制度为目的的实践活动,可能使用包括实验在内的各种实证研究方法。实验则是实证研究方法中的一种,遵循着特有的逻辑思路和操作原理。而从广义理解,实验都是实践活动,试点本身就是实验,具备实验的特征。尽管对于一部分法社会学者来说,理想的研究设计是真正的实验,但是实际上在大多数场合他们只能进行准实验(quasi-experimentation),更严格地说是含有实验性因素的比较研究,“试点”就是这种研究的典型代表。美国联邦最高法院沃伦首席法官任命的联邦司法中心法律实验顾问委员会的关于法律实验的报告指出,“实验”的语义应该从广义上理解,包括对于新的概念或者项目的验证在内。{7}本文对实验的内涵采广义理解,将司法领域的制度创新试点和研究类实验都归为实验的范畴。此两类实验虽然目的不同,在具体实施上有明显差异,但仍然具有实验的共性特征,遵循实验的某些基本规律,同时也具有实验所特有的局限性,因此都是本文的研究对象。

  二、实验运用于司法领域的方法论基础

  实验起源于自然科学研究领域,因此天然带有自然科学方法论的烙印,而当其被引入包括法学在内的社会科学各个领域之后,又兼容了社会科学研究的思维特点。

  (一)为什么要做实验

  从事学术研究的人在进行研究时非常重视事例的选择和分析,事例的获取最初是通过观察,但仅仅通过观察不一定能得到所需事例,简单列举现成事例又不能确保结论的可靠。因此研究者渐渐不再满足于通过被动地观察外界所提供的事例来探究因果联系,而想到通过实验来变换条件人为地制造一些事例,并对事例作进一步的研究,从中发现规律。如何变换条件人为制造事例呢?实验应运而生,其遵循的原理是控制和比较。如果想研究某个因素与某个结果之间的因果关系,可以通过控制其他因素不变,只改变这个因素大小的方式,来确定这个因素对结果影响。“控制”就是对实验环境,外部刺激的强度、类型,实验对象的人数、规模、结构进行人为的设计和掌控,以符合实验目的。“比较”就是将实验对象的不同状态进行对比,从中发现区别和联系。19世纪英国哲学家J. S.密尔(近代又译为穆勒)提出“密尔五法”(穆勒五法){8}作为归纳法的重要内容,也为实验活动中的“比较”提供了基本的逻辑准则。基于控制和比较的原理,有社会学家将实验定义为“修正一个情境下的某种事物,然后将其结果与未做任何修正的情境下所得的结果做比较”。{9}

  司法领域实验中的假说验证类实验和制度改良类实验都遵循受控比较的原理,但在实现形式上有所不同。假说验证类实验严格遵循实验的基本要求和条件,而制度改良类实验则更复杂一些。由于具有较强的探索创新性质,在实验过程中往往缺少严格的条件控制,而常常通过与新制度实施之前状态的比较或实验过程中的反复自我调试来实现。从本质上说,其是通过在实践中不断试错、对比和调试来追求制度运行的最佳效果。这种逻辑可以用波普尔的“试错理论”来概括。波氏反对自培根开始的古典归纳主义和逻辑实证主义,提倡“试错法(trial and error) ” ,认为科学的发展是由不断提出试探性的猜想,并通过反驳和证伪不断排除猜想中的错误而实现的。“试错法”不是单纯的否定,而是要通过证伪去达到暂时的“确认”。{10}由于制度创新类实验不是追求理论解释的客观性,而是新制度效果的验证,因此不重谨慎严密的条件控制,而重积极探索式的“试错”,因此与典型的研究类实验具有一定的差异,缺乏某些实验的基本特征。但总体而言,受控比较仍然是两类实验得以实行的理论基础。

  (二)实验怎么做

  实验的具体操作离不开三对基本要素:①自变量与因变量。所谓“变量”,是指变化着的事物,能对其他某物的具体状态施加影响,或者是被后者影响,蕴含着对程度或者差异度的看法。{11}自变量是实验中的刺激因素,因变量是由自变量所引起的状态。实验的目的就是考察自变量对因变量的影响。实验与纯理论研究的一个重要不同就是“转概念为变量”,这样做是为了用一种可观察的形式把概念表达出来,使之包含对程度或差异的某种看法。{12}②前测与后测。在实施实验刺激以前对实验对象(实验组和控制组)进行的测量称为前测,而在实施实验刺激后对他们的测量称作后测。③实验组与控制组。为了更加精确地观察实验对象的变化,实验还常常将受试者分为实验组与控制组,这两个组是随机选派的。实验组是指在实验中被施以刺激的受试者;控制组是指在实验中没有被施以刺激的受试者,但是在其他方面则和实验组一样。{13}从理论上说,由于实验组与控制组的无关变量的影响是相等的,故实验组与控制组两者之差异可认定为是来自实验变量的效果,这样对比而得出的实验结果是可信的。

  简单地说,一个典型的实验过程是:设计一个实验组,先测量在没有受到A(自变量)的影响之前B(因变量)的情况(前测),然后施加实验刺激A并保持其他条件完全相同,再对受A影响后的B进行测量(后测)。为了结果精确起见,将实验组的前后测情况与没有接受刺激的控制组进行比较。最后通过比较前后两次测量的结果是否存在差异来判定A和B之间是否存在因果关系。如果前后两次情况发生变化,则能够初步认为A是导致B变化的原因,即A→B。这是典型模式,实际上三对实验基本要素在实验设计中根据实验目的和设计繁简的不同可能体现为不同的组合形式。{14}

  (三)实验效果如何评价

  实验的效果以实验效度来评价,实验效度指实验方法能达到实验目的的程度,包括内部效度和外部效度。实验具有内在效度是指从实验结论能够准确反映实验本身的可能性。内部效度决定了两个变量的因果关系是否能够被合适地表现出来,这主要体现在:原因(自变量)在时间上的发生顺序先于结果(因变量);原因(自变量)与结果(因变量)存在关联性;在实验观察中没有似是而非的其他解释(其他可变因素)。{15}在任何时候,只要实验以外的因素影响了因变量,就会造成内在无效度。美国学者坎贝尔和斯坦利曾列出社会学实验设计的内在无效度的12种来源,包括历史事件、成熟、测验、测量工具、统计回归、选择偏好、实验死亡率、因果时序、实验处理中的传播与模仿、补偿、补偿性竞争、自暴自弃。{16}具有外在效度指的是实验结果概化到“现实”世界的可能性,也就是普适性程度。较高的外部效度就是指可以类推到实验的目标群体,可以类推到与实验类似的其他群体,实验环境、选择、测量工具、构想效度等因素都会影响实验的外部效度。{17}

  上述理论都是针对典型的实验而言的。由于社会科学研究常常无法像自然科学研究那样在设备良好的实验室中严格控制各种条件来进行实验,所以存在众多没有严格执行实验方法准则的“准实验”,所谓准实验就是没有严格地进行指派和严格控制实验刺激的实验。它通常不是在纯粹的实验室环境中,而是在研究现场进行,常常依据现场的条件和可能性来设计实验,并对纯粹的实验设计加以简化。尽管它并不总是能检验或建立因果关系,但至少能检验相关关系并能发现新的事实。准实验的特点是:①它的实验假设并不一定是因果关系的假设,也可能是相关关系的假设。②它很少采用严格的随机抽样。③它通常缺乏前测和控制组。{18}严格地说,司法领域实验几乎都不能称作典型实验,而属于“准实验”。尽管准实验与典型实验具有差异,但在基本原理上并没有严格的区别,只是由于场所和研究条件的局限不得不将纯实验设计加以简化。总体而言,无论是准实验还是典型实验都符合以下要求:其一,实验方案逻辑自洽。实验方案必须逻辑严密,能够保证实现实验目的;其二,实验过程严格规范。排除了主观因素和外部因素的干扰;其三,实验结果来源于实验过程中所产生的数据、结论。

  三、实验方法运用于司法领域的局限性

  实验方法运用于司法领域的功能显而易见。其一,易于发现制度与制度之间的因果关系。由于实验通过控制和比较说明了实验对象除了受到实验刺激外,并未受到其他刺激的影响,因此可以将实验对象的改变归因于实验刺激,有助于深化司法领域的基本原理研究。其二,成本较少。一项实验受研究目标和特性的限制,规模往往较小,费用不会太多。由于范围较小,一旦失败也不会造成太大的影响,却可以通过局部试验给大规模的制度变迁提供经验支持。其三,说服力强。由于实验结论来源于具体实践,又有明显的逻辑性和控制性,比学理阐述更具说服力。同时,实验又具有与生俱来的局限性。由于社会现象的特殊性、复杂性,实验的过程和结果有可能受到各种不可控因素的干扰而失去精确性和参考性。司法领域实验以司法现象、司法制度和司法参与者为主要实验客体,既包括人与人之间双向交流的互动关系,又包括新旧制度的运行状态,司法领域的特殊性和复杂性决定了司法领域实验不仅带有社会学领域实验所普遍具有的不足,还面临司法领域所特有的障碍。

  (一)主观偏差

  1.实验主体心态偏差:预期效应

  严格地说,实验主体与实验结果之间应当是利益无涉的,对结果也就不应存有特别的期待。因为无论方案或假说被证立或证伪,其结论都是有价值的。被证立当然能够反映研究者的前瞻性,而被证伪也可以以有说服力的证据和结论告诉后来者“此路不通”或者情况复杂。但多数研究者基于积极的学术追求难以做到对实验结果完全中立,多少会对实验结果有所偏爱。实验人员先入为主的预期心理会导致他们只看到他们想看到的现象而对真实现象视而不见,从而使实验结果发生偏差,这种现象被称为“期望效应”。{19}自然科学实验和社会实验都存在实验人员预期心理的影响,但相比之下,自然科学实验中的“期望效应”更容易控制和排除。这是因为:其一,自然科学实验的对象一般是自然物,可进行重复检验,而且检验标准相对客观,有时甚至是唯一的;其二,自然科学研究遵循着严密的演绎—归纳逻辑和假设检验程序。相比而言,社会科学实验缺乏公认的研究模式和评价标准,很难重复检验,研究者的主观因素对研究结果的影响更为明显。

  2.实验对象心态偏差:霍桑效应

  20世纪30年代,美国芝加哥西部电器公司的霍桑工厂为了提高生产效率,与哈佛大学教授梅奥(G. E. Mayo)合作,共同进行了一项旨在研究工人的生产效率是否与工作环境相关的社会实验,名为霍桑实验。实验发现了许多有意义的结论,其中一个令人意外的结论是:导致实验组生产效率提高的真正原因并不是工作环境的变化,而是实验活动本身,是研究人员的出现使得实验组的工人感到自己是特殊的,他们开始相互了解、相互信任、相互协作,不敢怠慢自己的工作。正是这些心理因素,而不是研究人员所控制的环境条件,引起了生产效率的提高。这个实验说明,当社会实验的对象处于实验环境或得知自己在被观察和研究时,其行为和态度会发生较大的变化,从而影响实验结果的客观性。{20}这个结论又被称为“霍桑效应”。为了克服“霍桑效应”或“预期效应”的影响,社会学领域的很多实验被设计为“单盲实验”或“双盲实验”,即不让实验对象觉察到自己正在参与一项实验,或者同时让实验人员不了解实验的真实目的或不知道哪些是实验的真正对象,但这些做法却因无法在某些具体实验中实现,或可能引发伦理道德问题而被禁止,因此难以从根本上克服霍桑效应和预期效应的发生。

  (二)外部效度不足:探照灯效应

  如何沟通事实(实然)与价值(应然)之间的鸿沟,这在哲学上是个老问题。实验所得到的数据和结论都是描述性的、实然的,而法律上想要的结论却往往是规范性、应然的,两者之间很难做推论,这就直接影响到了实验的外部效度。即使具体实验通过比较方式论证了应然性,也很难将说服力扩大到更大的领域。美国从事实证研究的学者总结实验的缺点时指出,“所有实验都有一个根本不足,即该实验是在特定的地点和特定的时刻,由实验设计规定的具体条件下完成的。实验就像探照灯,亮度很高却只能照亮很小的一块地方”。{21}也就是说,局部的实验即使被成功证立,能否被大范围推广也不无疑问。这也是社会学实验所面临的一个普遍难题。“对于任何一个实验结果来说,最为关键的问题是当超出产生该结果的实验条件之外它仍会存在的普遍性问题。美国心理学家詹金斯的记忆实验四面体模型提供了四个评价心理学实验外部效度的维度:①用其他的被试人群也能得到同样的结果吗?②用其他的实验材料也能得到同样的结果吗?③用其他不同类型的测验会出现同样的结果吗?④用不同的实验处理和不同的自变量操作方式也能出现同样的结果吗?概括地讲,也就是一个特定的结果能否从诸如被试人群、材料、情景以及因变量的测量等几个方面推广出去。”{22}就法学领域而言,许多制度改良性实验都存在外推上的局限性,一时一地实验的成功并不足以得出普适性的结论,尤其是地域、文化、政策背景、所处时间点等外部因素难以复制和考量,有时甚至具有很大的偶然性,究竟能外推到多大范围,具有怎样的生效条件都是实验需要论证的难点问题。

  (三)场域局限

  1.司法领域的秩序性和与实验的探索性有着天然的冲突。在现代法治社会,由立法确立的法律规则愈来愈占据主导地位。法律规则对于社会的作用决定了秩序是司法领域的基础。社会要实现有序状态,法律就必须体现出普适性、稳定性和持久性,任何打破法律秩序性的活动都有可能受到现有法律规则和法治理念自发或自觉的抵制。而实验普遍具有探索性和创新性,法律领域中的实验是以司法现象、司法制度和司法参与者为主要实验客体,有的实验目的就是为了改变现实,探索新的制度措施;有的实验即使不会动摇法律秩序,在条件的控制上也往往要人为改变既有程序或制度,有可能突破或改变现有法律秩序,从而面临司法体制内外基于维护“法治秩序”的责难或抵制,因此以改良立法为目的的实验在司法领域的开展具有天然的局限。

  2.司法领域的因果关系常常不具有可验证性,环境条件也缺乏可控性。穆勒(密尔)曾有实验方法不适用于社会学研究的论断,因为社会学上的因果关系过于复杂。{23}司法领域属于典型的社会科学领域,某种司法现象或司法制度的产生不但关乎秩序、伦理、人性,还涉及意识形态、价值选择,受到政治、经济、文化等复杂因素的综合影响,具有复杂的因果关系网络,常常具有不可验证性和不可评估性,一些制度的效果也难以用实验方式获得真实的验证。比如,具体办案人员的职业利益、偏好、非理性情绪等因素会影响实验过程。有参与了某取保候审实验研究的学者发现,取保候审中办案人员的羁押偏好对实验存在明显的负面影响{24},而这些因素在实验中很难控制。有的实验效果则不完全取决于实验本身,而是政治选择的结果。有国外研究者指出,“在政策研究的许多情况下,决策者为了实行的目的,最终不得不在受控的各方面中作出断然的选择。这种选择更多的是出于对经济的、个人的、社会的、行政的或是政治的等方面的考虑,而不是出于科学的评价。当实地实验结果的实施中包含有这种裁决时,实地实验的严格性就完全消失了”{25}。司法领域的制度改良类实验结果往往如此,因而降低了客观性和公信力。

  3.司法领域的平等原则、权利保护原则以及一些道德准则缩小了实验的活动空间,提高了实验的操作难度。自然科学实验的对象是无生命的自然物或动物,可以在全封闭的人工环境和严格的受控条件下产生结论,因而较少涉及道德、伦理、法律等问题。而法律实验的对象是人、法律现象和法律制度,无法在封闭的实验室中拟制出社会结构、社会制度和社会文化的自然环境,一般都是在真实的环境下进行,在前测后测或者划分控制组和对比组,并施以不同的刺激以观察变化时,极可能打破原有制度秩序对某些实验对象造成待遇不公或侵权现象,或与某些公认的社会道德准则相违背。{26}社会学领域已经意识到了伦理问题对研究的影响,并形成了具有普遍共识的自愿参与、对参与者无害、匿名与保密等伦理准则,司法领域实验也必须参照。这些伦理原则和明确的法律规则相结合,使得司法领域实验在方案设计、对象选择、过程控制等方面普遍缺乏自主空间,比其他社会学领域的实验操作难度更大一些。

  四、我国司法领域运用实验方法的现实问题

  如果说主观偏差、客观条件不可控和信度不足等局限性是司法领域实验在本质的上困境,那么,实验在中国司法领域中的应用过程中又由于“中国特色”的融入而生发出一些特有的问题或放大了实验的某些弱点。

  (一)我国司法领域运用实验方法的现状

  1.以试点为主要形式。我国目前的司法领域实验多以制度改良为最终目的,以试点为主要形式,主要做法是在现有法律制度缺陷的基础上提出一种改良方案,通过在试点小范围实践,证明方案的正确性和可行性,从而促使其最终上升为正式立法。这种做法在我国并非新鲜事物。1979年以后,众多法律进行了修改,许多基层实务部门就曾围绕新法的实施设立试点,其目的是让干警迅速适应新法的要求。{27} 20世纪80年代以后,随着立法缺陷的逐渐显现,一些基层实务部门为了制度完善也曾以试点的名义推出一些改革实验。{28}实证研究方法兴起之后,域外经验和模式被迅速介绍到我国,其中,以美国维拉司法研究所为代表的以促成司法制度改革为目的,设计试点进行评估、推广的实验式实证研究模式与我国原有的“试点”模式天然契合,又在方法上弥补了我国旧有模式的不足,因此实务部门和学者兴趣正浓,实践中也遍地开花{29} 。

  2.实验具体目的多元化。我国司法领域的多数试点以制度改良为最终目的,但在具体目的上又有所差异,根据目的的不同大体又有如下种类:第一类,示范培训类。此类实验侧重于尝试将某一新制度或新措施做成示范样本,因此对参与人员会进行具体业务培训,以期推广到全国,最终上升为立法,因此更为注重做法上的规范性。此类实验的价值论证往往已经在实验前解决(研究者相信其正确才会希望做成示范样本),实验目的主要是为了给司法实践中的同行提供标准的操作样本,因此不强调真实的司法环境,也缺乏详细的对比验证。第二类,探索试验类。此类项目是基于对具体制度缺陷的矫正而进行的探索试验,主要目的是自我尝试,边试验边总结,多为司法实务部门根据自身的问题和现有资源自发进行。第三类,效果验证类。试图通过具体实验活动验证或评估某项新制度的真实效果,一般为学者所主导。虽然这三类目的之间差异明显,但从诸多公开的实验报告可以看出,许多试点往往希望兼顾三者。

  3.实验主体一般有司法实务部门、学者、司法实务部门和学者联合三种模式。基层司法实务部门由于处于司法实践前沿,对司法实践中的问题比较敏感,创新意识和诉求比较强烈,所以以改良立法为目的的实验最初都由司法实务部门主导,他们往往既是实验的主导者,又以自己的工作人员和工作流程作为实验对象。近年来随着实证研究的兴起,学者对司法实践经验事实兴趣不断浓厚,也积极介入实验研究,增加了实验研究的理论含量和技术含量。从对实验的主导作用来看,包括学者主导和实务部门与学者联合主导两种模式。目前,学者主导的实验中除有极少数属于学者自行研究、以验证理论假说为主的实验外,多数都是由学者提出改良立法的方案,再借助于司法实务部门的协助。有时一些实验也会以司法实务部门和学者联合主导的形式出现,由学者和实务部门联合设计实验方案,并共同进行实验活动。

  (二)我国司法领域运用实验方法存在的问题

  1.理论指导缺失。马林诺夫斯基曾说,做研究不能主题先行,但问题永远是为有理论准备的人而准备的。我国司法领域实验的问题恰恰在于主题先行,理论滞后。虽然实证研究在法学界渐成显学,但如何将植根于其他学科的各种研究方法应用于法学领域在理论上几是空白。实务界仍习惯于按照原有的“摸着石头过河”的思维进行探索试验,缺乏对实验的科学原理的吸收和把握。学界开始尝试进行实证研究意义上的实验,但由于理论储备不足,又缺乏知识背景综合互补的研究团队,实验效果并不理想。这主要体现在:

  (1)实验方案缺乏设计规范。从我国目前公开的司法领域实验研究报告来看,我国的许多试点虽然客观存在具体目的上的差异,但自我定位和具体目的却并不清晰,普遍缺少与实验目的形成紧密逻辑关联的实验方案,也少有独立的前期调查,因此实施过程往往存在模糊性和随意性。如果实验是由学者主持,首要考虑的是与司法机关领导的熟络程度,能否得到支持配合,原先是否有实验基础,如何节省经费等现实因素,而对地域代表性、试点数量、如何实现实验目的、如何增强结论的说服力缺少周密考虑;对于如何进行控制和比较缺乏前期设计。司法机关内部的试点实验则首要考虑现实需要、自身优势和领导支持程度,采取边做边调整的态度,对于实验方案的逻辑性和科学性也缺乏关注。

  (2)实验过程缺乏科学控制。实验过程中的科学控制是实验区别于其他实证方法的典型特点,也是实验科学性的最突出体现。而从目前我国司法领域的众多试点、实验的公开成果来看,只有极少数详细描述实验的具体实施过程,对实验过程的控制是否符合科学性要求也十分可疑。例如,在某实验希望证明某项新制度有效可行,在实验实施之前对所有参与人员进行培训,实验过程中所有参与人员都严格按照培训的程序进行了操作,之后对这些人员进行了调查,结果显示新制度效果非常理想。这仿佛是一场心照不宣的戏剧或者一次固定了pose的“摆拍”,显然,全体参与者都努力地按照实验者的要求去做,因此理想结果的出现并非新制度使然,而是“霍桑效应”的结果。一旦脱离实验环境大范围推广,既有条件发生改变,种种实验中未出现的问题就会纷至沓来{30}。事实上,制度改良式实验几乎都属于现场实验,如果实验目的不单纯是示范培训,还要论证制度的有效性,那么就要求在实验过程中必须保持实验对象的原有特性,不改变实验对象的现场背景,甚至不让实验对象知道自己参与了实验(即所谓单盲实验),只有这样才能观察新制度实施之前和之后的真实差异,得出客观的效果评价,但这在目前的司法实验过程中很难见到。

  (3)实验结果缺乏逻辑论证。在目前一些实验报告中,看似眼花缭乱的实验数据、图表与实验结论之间往往并无内在的或直接的逻辑关联,或者不足以推导出实验结论,或者实验结论并不具有唯一性,有的结论甚至完全脱离了实验过程本身,几乎与实验活动无关。有的实验对影响实验效果的各种内在因素缺乏客观的考虑和交代,内部效度十分可疑;就外部效度而言,不少结论根本不涉及适用范围和限度。事实上,在中国这样一个幅员辽阔、政治经济发展不平衡的国度,某些个案的成功能否说明其具备全国普适性是需要严格论证的,即使单个实验本身难以克服实验法普遍存在的“探照灯效应”,但至少应当在本实验范围内有所考虑和交代,而这恰恰被许多实验结论所忽略。它究竟是一项应当被适用于全国范围内所有司法区的改革,还是一项仅仅在大城市或小城市才有效果的改革?它是针对问题的过渡性措施还是永久性方案?这些本身就需要通过实验予以验证的适用范围和效力问题在多数实验结论中都语焉不详或者根本没有考虑,致使实验结论的说服力大打折扣。

  2.中立立场缺失。在目前众多的制度改良式实验中,新做法的价值论证往往已经在实验前解决,实验目的主要是为了验证其是否可行,在实践中能否与真实司法环境中的各种因素相契合。实验主体对实验结果往往已有了倾向性意见,认为新制度能够产生更好的效果,实验主体的“预期效应”在此类实验中体现得十分明显。我国相当一部分试点由实务部门出于追求政绩的目的发起和主导,他们往往既是实验者又是实验对象,既设计又评估,如同既当裁判又当运动员一样,对结果的倾向性明显,而依赖实务部门协助的学者也往往会受到实务部门立场的影响,失去对实验结果的客观追求{31}。司法机关在中国司法实验中扮演重要角色,这是我国现有体制下的一种特殊现象,其对司法改革的经验积累具有十分积极的意义,但同时也产生了一个突出的问题,那就是,难以避免司法机关与实验结果产生利益关联,从而使实验结果带有某些人为的倾向性。因此,报纸所见常常是“某某试点或实验效果明显”的报道,期刊所见也往往是没有客观评估标准参照的“王婆卖瓜”式实验报告,用大量篇幅来阐述实验的正面效果和可行价值,而对逻辑论证和结论的适用条件、范围和局限性着墨甚少。极少有承认实验不符合预期或假说不成立,并坦然以失败的实验为样本从中提炼道理总结经验的案例。有的实验前期宣传大张旗鼓,后期实验效果不够理想,就迅速销声匿迹,具体原因和数据却语焉不详或不肯公开。与之相比更令人担忧的是那些不但预设了立场,而且对实验过程、条件、数据、结果都进行了人为控制的“伪实验”,这种实验毫无内在效度,徒具“实验”外壳,却能以预设结果博得皆大欢喜,损害了实证研究所应当秉承的客观、严谨、科学的研究风气。

  3.统筹监管缺失。如前文所述,司法领域的秩序性限定了实验的施展空间,这是法治社会维持既有稳定性的一种必然。而目前制度改良式试点在司法领域遍地开花,审判机关、检察机关、行政机关都以“司法改革”之名各显神通,缺乏框架设计和统一规划,许多实务部门为求政绩跟风进行试点实验,同一名目下的实验目的不同,做法各异,这使得实验过程和结论普遍带有过于浓重的人为因素和偶然因素,无法重复检验,也难以进行经验汇总,耗费了大量社会资源。针对司法实验对现行法律体制和宪政秩序所造成的冲击,有学者不无忧虑地指出:“司法改革试验突破现行有效的法律,甚至与之发生直接冲突,使法治前或者法治初创时期的不规范现象或者脱序现象有时得到制止,有时得不到制止,虽然还算不上庖代立法,但却实实在在违反了法律,造成了正当程序危机”。{32}自司法改革试点日渐增多以来这样的声音一直环绕在侧,体现了司法改革进程中探索创新与自我约束理念之间的矛盾和博弈,这同时也是我国司法领域实验所面临的一个独特的难题。

  五、司法领域实验局限性的有限弥补

  我国司法领域实验的诸多局限有些是实验进入司法领域的先天不足所致,有些则是目前的实验主体和司法场域生态环境使然,只有后者才有弥补不足的可能,而且这种弥补注定是有限的。

  (一)研究和遵循实验的基本原理

  无论实验目的如何,只有遵循了实验的基本原理才有可能得到客观的实验结论,法学领域实验也概莫能外。所以,无论是实务部门还是学界的研究团队都应当吃透实验的基本原理再予以践行。首先,应当制定目的清晰、逻辑自恰的实验方案。实验之前设计一个较为成熟的逻辑框架和实验步骤是实验方法同观察、访谈、抽样调查等实证研究方法的重要区别。从某种意义上说,实验具体方案在逻辑上是否自恰、设计是否严密科学,是实验能否成功的关键。司法领域的实验方案一般应当包括实验预期目的、实验对象、实验时间、实验选址、实验原理、实验具体操作步骤等内容。其次,有意识地弥补实验过程中有可能影响内部效度和外部效度的主客观因素,比如有些实验涉及伦理道德问题,应当对方案进行合理调整,以不侵犯个人基本权利和不违反社会公序良俗为底线;有些实验很有可能受到参与人员的主观因素影响,就应当设计成“单盲实验”或“双盲实验”,尽量将影响降至最低限度。第三,对实验结果进行充分地逻辑论证。实验的价值并不在于宣告某结论成立,而在于通过实践活动发现规律或论证结论,将纸面上的方案或假说转化为动态过程,在有限的实验过程中发现各种变量之间的动态关系和相互影响的规律,发现结论在不同条件下的适用边界在哪里,预设结论能否被证立有时反而是次要的。因此,实验结论不仅要逻辑自恰,而且应包括其具体适用范围和局限性,充分考虑实验的内部效度和外部效度。

  (二)反思和避免实验研究中的功利主义倾向

  从我国的司法实验现状来看,制度改良式实验占据了实验种类中的绝大多数,以验证理论假说为目的的研究类实验鲜有所见,这在现阶段立法尚欠完善的我国可以理解。但前者好者云集,后者少人问津,多少反映出我国研究者在研究兴趣和研究策略上存在的功利化趋向。纯理论研究没有短期对策研究那样容易受到国内外关注,不容易收到立竿见影的效果,但却是法律体系薄弱、原创理论匮乏的中国法学研究得以自立门户所必须补上的功课。学界终于找到了立足于本国司法的经验事实进行实证研究这条捷径,却将主要精力和研究资源放在一时的制度改良上,这是值得法律学者反思的。

  就制度改良式实验而言,尽管其对于司法改革的路径转换具有十分重要的现实意义,但如果不有意识地避免司法实验过程中的功利主义倾向,这种路径转换的真正效果也将极为有限。司法实验中的功利主义倾向主要源于司法实务部门的政绩冲动。有学者研究我国司法改革发现,由于我国司法实务部门的行政化体制,司法机关的工作与行政机关的行政工作一样,同样强调“政绩”,而且司法改革也是业绩的表现形式之一,而且往往被视为最重要的业绩,更为具体的表现是司法改革的形式主义和盲动主义。{33}如今在实务部门遍地开花的许多技术含量不高的改革试点就明显带有上述特征,而并非从司法实践需要出发,真正希望通过理性的实证研究获得结论。参与到实验中的学者的学术诉求和理性精神显然无力与实务部门的政绩诉求相抗衡,往往沦为陪衬和修饰。

  学界普遍对美国维拉司法研究所以试点推进司法改革的模式颇为推崇,然而却忽视了维拉模式与我国试点模式的明显区别。维拉研究所作为一个私立的非营利性组织,在研究立场和资金来源方面完全独立,他们通过细致的前期调查发现司法实践中的问题和需要,然后据此设计试点进行评估,说服决策者接受并推广试点方案,{34}相当于是专门为司法实务部门设计、制作并向其推销某种“制度产品”,在试点过程中虽然有司法实务部门的协助配合,但与司法实务部门之间是相互独立的,决策者是否接受他们的制度“产品”基本上取决于项目的实用价值和社会效果(符合社区选民意愿),即他们具体的设计方案、评估论证模式是否合理有效。整个过程是开放性的、去功利化的,甚至是市场化的、可竞争的。这与我国的司法改革在司法体系内部自上而下或者自下而上的改革模式{35}和司法过度依附于政治意识形态的现行体制有较大的差异。在吸取其有益经验的同时,我国只有树立客观的司法政绩观,建立科学的司法业绩考评制度和司法官员升迁制度,引入社会力量和民间力量参与和评价司法改革试点,才能将试点的真正目的还原为针对现实需要的有益尝试,才能强化司法实验主体的客观立场,使实验结论获得更多认可。

  (三)公开详细的实验方案、实验过程和实验结论,接受社会和同行检验

  实验从方案、过程到结果是一个具有统一性的逻辑整体,实验方案科学合理,实验结论直接来源于实验过程,实验结论本身具有实际效果并有可重复性,这三者就是检验某一实验的具体标准。某实验结论获得公信力的前提是实验方案、实验过程和实验结论都有详细、公开的资料可供查阅,并能够回应社会和同行的逻辑质疑和被重复检验。回应逻辑性质疑越合理,并且其他地域、其他实验主体用相同的方法得出相同结论的成功率越高,实验结论和实验方法的合理性和普适性就越高。所以,应当建立公开的司法实验信息平台,让实验结论接受社会和同行的研究质疑。

  (四)建立司法实验统一规划审批、评估和监督机构

  针对我国司法实验普遍存在的启动乱、无规划、冲击现有法治秩序的现状,首先应当建立司法实验的统一规划审批机构,对司法领域实验进行统筹规划,在总结现有经验的基础上提出批准司法领域试点的具体标准,并要求进行成本-收益分析,从而把司法实验限制在特定范围内,避免无序跟风,尽量将其对法治的负面影响降到最低限度,时机成熟时将审批程序上升为立法。其次,应当建立具有公信力的实验效果评估机构,由具有社会学、统计学、心理学、法学等学科知识背景的专家组成,对司法领域实验的效果进行科学评估,避免自我实验自我评估现象。再次,应当建立司法实验过程的监督机构,实验过程中出现有违伦理道德、侵犯人权、损害社会利益现象,经过调查属实可以随时纠正或叫停实验。

  结语

  笔者对学界有关司法改革从自上而下的变法逻辑转换为自下而上的试点改革的热切呼唤并无异议{36},也十分肯定法律实证主义所倡导的科学理性精神对法学研究的积极影响,但对被寄予了厚望的司法实验活动目前的实际效果抱有些许怀疑。波斯纳曾经有“法律研究中缺乏可信的受控实验”{37}的论断,就是因为属于社会科学的法学领域不同于自然科学和其他社会学科,不但讲求严格的秩序性,实验者缺乏自主空间,环境、条件也难以控制,结论还多模棱两可,不好重复。因此,司法领域引入实验方法有着严格的前提条件,而且即便引入,由于上文所探讨的种种主客观因素的限制,效果也会受到影响,无法成为法学研究方法中的主流。就引入的前提条件而言,笔者以为有三点尤为重要:其一,实验目的的明确化;其二,实验立场的客观化;其三,实验方法的专业化。前两者取决于实验的动力来源,后者取决于实验主体的专业素质和知识来源。如果实验主体缺乏严谨的实验态度、严格的实验程序、科学的实验方法和技术含量极高的分析框架,再与单纯追求“政绩”的功利化诉求相结合,就会丧失“由经验推导出理性”的宗旨,异化为打着“实验”招牌获取正当性认可的投机行为。由于具有较高的技术含量,实验法在实证研究方法中的难度位阶是比较高的,相比而言,那种不带有任何预设结论,仅仅通过调查、访谈、问卷等实证方法获取经验事实和问题,再以此为基础提炼观点、分析论证的研究路径或许才是实证研究的“基本功”,更适合法学实证研究刚刚起步的我国,它能使研究者沉下心从实践中发现真问题,提炼新概念,解释新现象,而不仅仅满足于对策方案被立法采纳。也只有在有能力圆熟运用观察、访谈、问卷、文献分析等基本方法的基础上,实验法才会被更好地驾驭,实验结论才会更具有公信力。




【作者简介】
葛琳,单位为最高人民检察院。


【参考文献】
{1}例如,在美国,由于陪审团作出判决的方式和社会心理学家的团体决策过程研究和社会互动研究有直接关联,因此社会心理学家对陪审团特别感兴趣,通过许多实验得出了一些对认识陪审团有帮助的结论,比如为什么12人陪审团要优于6人陪审团,哪些因素会对陪审员的决定造成影响等,这些结论对法律制度很有借鉴意义,但它从方法到理论归属都是心理学的而不是法学的。参见Elliot Aronson等著:《社会心理学》(第五版),侯玉波等译,中国轻工业出版社2005年版,第495页。
{2}例如,著名的“斯坦福监狱实验”以监狱环境为背景,与法律领域有关,结论对监狱制度也有一定的启发意义,但性质却是社会学的,也不属于法学实验。该实验是美国学者菲利普·津巴多于1971年在斯坦福大学进行的。实验把征募来的通过了专门测试的受试者—24名身心健康、情绪稳定的大学生分成两组,一组扮作狱警,一组扮作犯人。实验中途就被迫宣告终止,原因是该实验对扮演囚犯的实验者造成了伤害。扮成狱警的一方因为有了特权,出现了很大的暴力性和攻击性,而扮演罪犯的一方性格变的顺从和屈服,这就是津巴多所谓的“路西法效应”。简单说,就是在某种特殊的环境下,好人也会变成坏人。后来津巴多在《路西法效应:好人是怎样变成恶魔的》(The Lucifer Effect)一书中详尽地记述了这次实验的经过。
{3}参见[美]里德·黑斯蒂主编:《陪审员的内心世界—陪审员裁决过程的心理分析》,刘威、李恒译,北京大学出版社2006年版,第155页。
{4}参见[美]汉斯·采泽尔、戴维·凯:《用数字证明—法律和诉讼中的实证方法》,黄向阳译,中国人民大学出版社2008年版,第10页。
{5}[英]C. L豪沃思、M·J.冈恩:“实验立法”,洪戈力译,《外国法译评》1986年第6期。
{6}作为公共政策评估方法的实验意味着在小规模基础上进行试点工作。如果这个项目是全新的,社会实验者必须要设计一个可以进行评估的模型,该项目是否起作用关键在于是否有效地达到了预先设定的目标。参见肖鹏、王志刚、聂秀东:“社会实验:一种新的公共政策评估方法”,《统计与决策》2009年第20期。
{7}参见季卫东:《法治秩序的建构》,中国政法大学出版社1999年版,第152页。
{8}求同法、求异法、求同求异并用法、剩余法和共变法五种方法。
{9}参见[美]劳伦斯·纽曼:《社会研究方法:定性和定量的取向》(第五版),郝大海译,中国人民大学出版社2007年版,第238页。
{10}[英]卡尔·波普尔:《猜想与反驳》,傅季重等译,上海译文出版社2001年版,第318页。
{11}参见[美]肯尼斯·赫文、托德·多纳:《社会科学研究的思维要素》,李涤非、潘磊译,重庆大学出版社2008年版,第10 ~ 13页。
{12}同上,第13页。
{13}参见[美]艾尔·巴比:《社会研究方法》(第11版),邱泽奇译,华夏出版社2009年版,第224225页。
{14}实验根据设计的繁简又可以具体划分为:单组前后测设计(无控制组);单组无前测设计(无前测、无控制组);仅有后测的两组设计(无前测);两组前后测设计。参见袁方:《社会研究方法教程》,北京大学出版社1997年版,第370~371页。
{15} See Brewer, M. (2000).Research Design and Issues of Validity. In Reis, H. and Judd, C.(eds.)Handbookof Research Methods in Social and Personality Psychology, Cambridge: Cambridge University Press.
{16}参见前注{13},[美]艾尔·巴比书,第230~233页。
{17} Elizabethann O’ Sullivan: Cary R. Rassel. Research Methods for Public Administratiors. Addison Wesley Longman. 1999:63. 3rd. ISBN 0801318505.
{18}参见前注{14},袁方书,第380页。
{19}又称“皮革马力翁效应”。
{20}参见[美]伊恩·罗伯逊:《社会学》,黄育馥译,商务印书馆1994年版,第44页。
{21}前注{4},[美]汉斯·采泽尔、戴维·凯书,第9页。
{22}郭秀艳:《实验心理学》,人民教育出版社2004年版,第84页。
{23}参见[法]E.迪尔凯姆:《社会学方法的准则》,狄玉明译,商务印书馆1995年版,第139~140页。
{24}参见雷小政:《法律生长与实证研究》,北京大学出版社2009年版,第193页。
{25}[美]林楠:《社会研究方法》,农村读物出版社1987年版,第406页。
{26}参见郭云忠:“法律实证研究中的伦理问题—以刑事法为视角”,《法学研究》2010年第6期。
{27}例如天津市河西区人民法院:“民事案件公开审判试点工作介绍”,《人民司法》1978年第3期;浙江省绍兴县人民法院:“实施‘两法’试点的一些经验”,《人民司法》1980年第1期。
{28}如上海市长宁区人民法院在1984年进行的建立专门审理未成年人案件的合议庭试点;1990年最高人民法院与最高人民检察院在部分地区开展的民事、经济、行政诉讼法律监督试点;2000年8月辽宁省抚顺市顺城区人民检察院推行的“零口供”实验等。
{29}此类实验在刑事司法领域更为集中。学者主持的改良立法式实验例如:我国学者樊崇义自2002起在北京市海淀区、河南省焦作市、甘肃省白银市开展的“侦查讯问全程律师在场、录音、录像制度”实验;我国学者卞建林2006年在山东东营市三个基层检察院开展的“证据开示”实验;我国学者宋英辉自2006年起在河北、江苏两省的三个城市开展的“刑事和解”实验;我国学者陈瑞华2009年在北京、山东、江苏、上海四个地区基层法院开展的量刑程序改革实验等。实务部门主导的改良立法式实验例如:北京市朝阳区人民检察院2002年试行的“轻伤害案件处理程序”;2008年中国检察官协会推动的在全国8个基层检察院试行的“认罪轻案办理程序”;2011年最高人民法院在全国90个基层法院试点的小额标的案件速裁等。实务部门和学者联合主导的改良立法式实验例如:吉林省辽源市检察院、辽源市公安局、中国人民大学、英国英中协会于2008年合作推行的“羁押巡视员”试点等。
{30}参见陈瑞华:“刑事诉讼法学哲理化笔谈”,《国家检察官学院学报》2010年第5期。
{31}影响学者对实验结果倾向性的因素还有项目资助方的立场、学术评价体制的影响等,在此不再做深入讨论。
{32}张建伟:“法学方法、改革试验与正当程序意识”,《法治论坛》2010年第19辑。
{33}参见张卫平:“司法改革与‘政绩”’,载北大法律信息网//law. chinalawinfo. com/newlaw2002/slc/slc. asp? gid=335574655&db=art&keyword=%CB% BE% B7% A8% B8% C4% B8% EF。
{34}参见[美]吉姆·帕森斯、梅根·戈尔登等著:《试点与改革:完善司法制度的实证研究方法》,郭志媛译,北京大学出版社2006年版,第1~9页。
{35}学者的介入并没有改变这种由司法体系垄断改革的模式,我国的民间机构、学术团体除了与司法机关合作之外并没有其他独立影响司法改革的途径。
{36}参见陈瑞华:“制度变革中的立法推动主义”,《政法论坛》2010年第1期。林喜芬:“论刑事司法改革的逻辑转换:从变法逻辑到试点改革”,《内蒙古社会科学》2008年第4期。
{37}[美]理查德·A.波斯纳:《法理学问题》,苏力译,中国政法大学出版社1994年版,第89页。
没找到您需要的? 您可以 发布法律咨询 ,我们的律师随时在线为您服务
  • 问题越详细,回答越精确,祝您的问题早日得到解决!
发布咨询
发布您的法律问题
推荐律师
吴健弘律师
浙江杭州
周磊律师
江苏无锡
陈皓元律师
福建厦门
李波律师
广西柳州
马云秀律师
广东深圳
王远洋律师
湖北襄阳
陆腾达律师
重庆江北
王高强律师
安徽合肥
高宏图律师
河北保定
热点专题更多
免费法律咨询 | 广告服务 | 律师加盟 | 联系方式 | 人才招聘 | 友情链接网站地图
载入时间:0.02954秒 copyright©2006 110.com inc. all rights reserved.
版权所有:110.com