对于调查记者来说,数据是揭黑报道中不可或缺的重要工具。他们平时都从什么地方获取数据呢?Journalism.co.uk网站总结了一份实用的数据库指南,可以为记者及其它用户查找数据提供极大便利。
出品| 外言社
翻译| kewell 编辑| 王茸 李沁
一般来说,调查记者获取数据的方式有主要有两种,一是从政府部门网站查看公开的数据,这些数据往往与本地发展规划以及政府开支有关;二是从一些新闻媒体或非盈利机构寻找有用的资料和数据。本文中所提到的数据库大部分是免费的,不过有些也需要成为会员才能查看。
OCCRP
作为跨境调查组织的OCCRP(有组织犯罪和腐败报道项目)成立于2006年,主要由东欧和欧亚地区的22家媒体联合组成。用户可以从OCCRP的官网中搜索他们之前立项调查过的文件内容、官方消息源和过期网页链接。他们声称,可以为调查记者提供超过9337万条线索,包括人物、公司各色财产信息等。
https://www.occrp.org/en
The Marshall Project
The Marshall Project(马歇尔计划)是美国一家非营利性互联网媒体机构,专注于报道美国司法公正方面的新闻。与传统数据库不同,他们的“Next to die”项目直接追踪美国国内的死刑计划并为用户提供相关信息。具体包括每个案件的背景,所在各个州的死刑执行历史等等。
https://www.themarshallproject.org/
The Guardian
The Guardian(卫报)的“The Counted”项目是专门用来记录美国警察杀掉多少人的,其数据涵盖了从2015至2016年的所有相关信息。用户可以通过死者的姓名、所在州、种族、年纪、是否携带武器等条件进行筛选。
https://www.theguardian.com/us-news/series/counted-us-police-killings
ProPublica
美国非营利性媒体机构ProPublica则是通过自家的Data Store来获得调查报道数据的,其中包括特朗普政府的财务状况、脸书上广告分类的信息等等。不过Data Store只有部分数据是免费的,有些需要收费。
https://www.propublica.org/datastore/
NICAR
美国的国家计算机辅助报告研究所(NICAR)的数据图书馆所涵盖主题很广,包括美国船只事故数据、联邦竞选捐赠详情等等。用户可以免费下载数据样本,但要付费才能看到所有内容。非美国记者注册一年会员的费用是70美元,注册后能得到内情报告和报道指南。
https://ire.org/nicar/database-library/
Companies House
Companies House是英国政府提供的公开数据库,可以帮助记者搜索到某一特定企业,查看该企业的所有者情况、注册信息等等。
https://beta.companieshouse.gov.uk/
Open Corporates
Open Corporates被誉为全世界最大的企业数据开放机构,拥有超过1.34亿家企业和超过1.76亿个人的资料信息。他们的主要目标是让企业和个人信息可以更广泛地用于公共利益。
https://opencorporates.com/
OpenSpending
在OpenSpending上,用户可以搜索76个国家的2365多个数据包,以及超过6134万份的财政记录
https://openspending.org/
Global Open Data Index(GODI)
GODI(全球开放数据指数)由开放知识基金会网络支持,每年会公开发布一次全球政府数据,为用户提供包括政府预算、全国性统计、草拟法案等主题在内的数据集这些数据最早可以追溯到2013年。
https://index.okfn.org/
European Data Portal
在European Data Portal(欧洲数据入口)中,用户可以根据关键词或相关分类进行搜索,类别包括能源、交通、教育等等。每个类别都有一系列数据集,可以根据不同国家进行深入分析。
https://www.europeandataportal.eu/
Open Data Inception Project
在Open Data Inception网站的在线词典可以利用可交互地图,找到世界上超过2600多个数据门户。此外,用户还可以按话题、按国家、甚至直接搜索某个地点来寻找有没有可供使用的数据集。
https://opendatainception.io/
LittleSis
这个免费数据库可以用户提供线索,发现商务企业跟政府要员之间的联系。很多记者都利用这里的数据来调查贪腐案件,搞清楚逻辑后再做出视觉化呈现。
https://littlesis.org/
World Bank
World Bank(世界银行)拥有自己的数据目录,用户可以按照主题、字母顺序或更新时间进行搜索。值得一提的是,World Bank还拥有中文版。
https://data.worldbank.org/data-catalog/
International Aid Transparency Initiative(IATI)
国际援助透明度倡议(IATI)的数据库会公布使用其标准的机构的所有原始数据。他们的数据库目前是初始版本,需要通过一个应用程序界面或线上表单来查询数据。
https://www.iatiregistry.org/
NRGI