計畫說明
Introduction

資料種類及資料庫

依照概念的界定,我們可以將法實證資料區別為法實證材料、法實證資訊、目錄化之法實證資料或法實證資料庫等。其中最重要的類型,當然是經由調查研究產出的各種法實證資訊,以及可提供搜尋運算的法實證資料庫。分述如下:

(1)實證材料(empirical materials)
所有可提供實證研究資訊的原始(物質)材料,除常見的契約書、官書、書狀、契據、印章、各種文件等,其他亦可包括透過現代科技產生的照片、錄音帶、錄影帶、各種電磁紀錄,或者紙張出現之前的石版、竹簡等。

(2)實證資訊(empirical information)
透過對實證材料的分析、統計、解讀、詮釋或其他方式的意義建構,所得出的資訊。資訊是意義結構,研究者所需要「得到」的,終究是資訊,而不是材料。但是如果沒有材料,當然也無從解讀出有意義的資訊。而材料之所以是某一「種」性質的材料,例如契約書,當然也是透過對該文件上文字之意義解讀後,所回溯做成的認定。因此作為資訊之物質載體的材料,可以說是資訊的載體,沒有這些載體(尤其是原始材料),就無從得到資訊,但載體畢竟不是資訊本身。

(3)實證資料(empirical data)
實證資料是一個不太清晰的概念,可以指前述的實證材料,亦可以指實證資訊,或者經常是籠統地泛指實證材料以及所透露的實證資訊。
一種比較精確的界定方式,是將實證資料理解為實證資訊的一種,其特點在於以特定的結構,尤其是格式化或分類化,將某一群資訊或資訊材料加以蒐集(collecting),歸整(classifying)或處理(processing)。任何的資訊管理(information management),除非純靠記憶,否則一定是以某種資料的方式加以蒐集整理。傳統的方是就是檔案化,亦即建立各種書面的檔案(files)以及檔案庫(achives)。現代電腦科技化後的方式,就是電子檔案化以及建立數位化的資料庫(digital database)。
由此可見,(實證)資料的概念,可以包括傳統以紙本為主(但並不為限)的檔案以及檔案庫,以及電子化後的電子∕數位檔案與數位化的資料庫。所以重點並不在蒐集材料的物質形式,而在於蒐集與歸整,尤其是透過建立目錄或目錄化(catalogue) 的方式。經過目錄化後的實證資料,已經相當接近於或等於一個實證資料庫了,其中間還存在的細微但重要的區分。

(4)實證資料庫(empirical database)
廣義的(實證)資料庫,是指所有經過目錄化,可供查詢的一群或一組(實證)資料。傳統只有紙本圖書書目(書卡)的圖書館,是此種資料庫的典型例子。但是在今天這種數位化的時代,我們可以將資料庫限於,以特定結構加以蒐集歸整,並得以透過數位邏輯運算或搜尋(search)產生其他相關資訊,尤其是統計資訊(statistics),的數位資料群(狹義的資料庫;數位化的資料庫)。如果這個資料庫所蒐集或可提供的資訊是前述的實證資訊,那此一資料庫即為實證資料庫。未經數位化的資料庫,當然也可以以人工的方式,來產生統計等各種資訊,因此當然也是一種database,但是畢竟效率與精準度都與數位化資料庫差距甚遠。

再者,如果依照資訊所涉及的制度定位來分類,實證資料尚可分為司法資料,立法資料,行政資料,法學教育或學術研究資料等種類。但對於學術研究而言,制度定位的區分固然有其意義,但並非最重要的區分。比較重要的是基礎資訊(basic information)與延伸資訊(derived information)的區分。基礎資訊是指所有可供進一步歸整搜尋,產生延伸資訊的資訊。例如將所有的判決書數位化為一個資料庫,此時這批判決書就是基礎資訊,但是經由進一步的搜尋歸整,可以產生各種可能的延伸資訊,例如各種統計資訊,或者是將某位法官曾參與判決的所有判決書彙整成一個檔案。而所有的延伸資訊,都有可能可以再作為基礎資訊,提供進一步的搜尋或分析歸整。亦可結合其他的資訊,例如經濟資訊、社會資訊等,產生其他更複雜多樣的實證資訊。例如失業率高的年度,竊盜案或破產案件數是否都會提高(統計相關性)。