互联网电影数据库
互联网电影数据库(英语:Internet Movie Database,简称IMDb)是一个关于电影演员、电影、电视节目、电视艺人、电子游戏和电影制作小组的在线数据库。IMDb开办于1990年10月17日,从1998年开始成为亚马逊公司旗下的网站,在2020年10月17日时,IMDb庆祝了他们30周年的纪念。
网站类型 | 在线电影、电视和电子游戏数据库 |
---|---|
持有者 | 亚马逊公司 |
创始人 | 柯尔·尼德罕[1] |
网址 | www |
商业性质 | 是 |
注册 | 选择性 |
截至2021年9月,IMDb收录了共8,313,921部作品以及151,033,000个人物的资料[2]。
概要
IMDb上有丰富的电影作品信息,包括影片演员、导演,剧情,影评这类的基本信息,也有更深层的内容,比如影片相关的琐事花絮,片中出现的漏洞,影片音轨,屏幕的高宽比,影片的不同版本等等。演员,导演,作者和其他工作人员都在数据库中有自己的条目,其中列出他们参加过的影片,通常还有他们的传记。用户还可以在akas.imdb.com 找到那些在不同语言不同国家发行时使用了不同片名的电影[3]。
IMDb不只是电影和电子游戏等的数据库,还提供每日更新的电影电视新闻,以及为不同电影活动比如奥斯卡奖推出特别报道。IMDb的论坛也十分活跃,除每个数据库条目都有留言板之外,还有关于多种多样的主题的各种综合讨论版。IMDb扩展出来的姐妹站IMDbPro为专业人士提供额外的信息,如电影业界人士的联系方式,电影活动日期表等等。IMDbPro不是专门为普通大众设计服务的,内容也不是免费的。
任何人只要有电子信箱并使用接受Cookie的Web浏览器就可以在IMDb上建立帐户,提交信息和对参加各种主题的投票。针对自动化查询的需求,数据库的大部分都能以压缩的文本文件格式下载,并用提供的工具解压(通常在命令行进行)。[4]
历史
- 1989年时,Col Needham和其他人在Usenet新闻组rec.arts.movies电影和交换信息。他们编写了一个常见问题解答(FAQ)列表,包含演员,导演和已经去世的电影制作者的传记。在1990年末,他们的FAQ已经收录了将近10,000部电影和电视剧。
- 在1990年10月17日,Needham发布了一套UNIX的Shell脚本,该脚本可以搜索这4个FAQ,IMDb也由此诞生,不过那时的名字是rec.arts.movies电影数据库。
- 到了1993年,数据库已经扩展到包括琐事花絮,传记,影片情节等内容,还带有一个集中的电子邮件界面,用于搜索该数据库。当年晚些时候,IMDb被移到了万维网上(当时还处在婴儿期的网络)。数据库被放置在威尔士卡地夫大学的计算机科学系的服务器上。最初的网页界面作者是Rob Hartill。
- 在1994年,扩展了的电子邮件界面开始接受自动数据提交,人们不必再给指定的维护人员发信而间接提供新内容了。这些年里,数据库在连接着世界各地镜像的网络上靠捐赠的带宽运行。
- 在1995年,这一项目发展得很大,对Col Needham和其他的志愿者来说,依靠捐款和他们的空闲时间来维护它的运行已经明显不太可能。
- 1996年,成立商业公司的决定被作出,IMDb在英国注册成为互联网电影数据库公司。维护数据库的人们成为其股东,依靠广告,许可证和合作获得利润。
- 这种状态持续到1998年。数据库每时每刻都在成长,再一次到达了关键的时刻;利润被用在设备上,股东们很难接受辛苦劳动却只能得到很少收入的事实。一些大公司出价试图收购数据库,然而IMDb的股东们不肯轻易将其出售给无法保证继续免费提供其信息的其他企业。
- 就在这时,亚马逊的杰夫·贝索斯出现了。达成的交易是,IMDb得到了为股东们提供应有收入的资金,而Amazon.com可以在出售其DVD和录像带时使用IMDb的信息资源。
- IMDb的功能继续不断扩展,2002年新增了针对娱乐界专业人士的IMDbPro,提供多样的服务,包括电影制作和票房详细资料,以及电影公司目录。订阅的价格是每月$12.95,或每年$99.95(2005年4月5日价格)。
250部最佳影片
“佳片250”旨在列出数据库内评级最高的250部电影,评级以数据库注册用户评分为基础,再套用下列所述公式[5]。入选规范必须是曾公开上映的非纪录片,片长至少45分钟,评分达两万五千人次以上[6],并且只有定期投票习惯的用户才会采用计票,至于有效票数量多少、如何才是符合“有定期投票习惯”则还不为人知。IMDb宣称为了保持“佳片250”名单的公信力,他们“故意不公开有效计票的标准”[7]。除此之外,“佳片250”还套用精算学的“可信度公式”,对评分作加权评级[8],独立资料的数量越大(在此就是指合格用户的评分),统计处理后的可信度越高,IMDb原以下列公式计算加权评级(IMDb不公开现时公式):
以上:
- =加权评级
- =电影从0到10的平均分数(Rating)
- =评分人次(Votes)
- =进入名单的最少评分人次(目前为25000票)
- =全名单平均分数(目前维持在7.1)
公式所得的 即为“贝式后验平均值”(详见贝氏定理)。
该榜因其综合广泛性以及不时的令人吃惊的结果而受到嘱目。上榜的电影中既有老电影(如《吸血僵尸》,1922年),也有新电影(如《黑暗骑士》,2008年);既有流行影片(如得到超过420,000次投票的《指环王:护戒使者》),也有少有人问津的影片(如只有12,700张投票的《日出》)。榜上有各种不同类型的电影(如黑色影片《双重保险》、科幻片《银翼杀手》、音乐片《雨中曲》、西部片《黄昏三镖客》、动画片《机器人总动员》等等);以及票房一般、很少获奖但却在影迷群体中有广泛的追随者的电影(比如《肖申克的救赎》、《死亡幻觉》等等)。截至2024年9月7日《肖申克的救赎》、《教父》、《黑暗骑士》为排名前三的电影。
这些条件是否能提供一个公正没有偏见的排行榜是有争议的。比如,新近上映的影片总是容易从一见钟情的影迷那里得到较高的评分,而这与成功影片应该经得起反复观赏的观念是不相符的。因此,有时新上映的影片冲进250最佳影片榜,甚至前100名,但随着更多观众的评分和重复观看后的评分而退出榜外的情景就十分常见了。另外一种对该榜的主要批评则是它反映的只是影片的受欢迎程度,并不体现对影片历史和艺术的客观知识。但实际上,在评论家年度评选和历史影片评选中,名列前茅的影片在最佳250部影片中通常排名很高。
目前在最佳250部电影名单中,主演最多影片的演员以詹姆斯·斯图尔特的10部作品最多,罗伯特·德尼罗及哈里森·福特各以9部作品居次。
在IMDb上还有最差的100部影片榜用基本相同的方法投票产生。经常位列榜首的影片是《马诺斯:命运之手》和《外太空九号计划》。[9]
前20名名单
名次 | 年份 | 电影名称 | 导演 |
1 | 1994 | 《肖申克的救赎》 The Shawshank Redemption |
Frank Darabont 弗兰克·达拉邦特 |
---|---|---|---|
2 | 1972 | 《教父》 The Godfather |
Francis Ford Coppola 弗朗西斯·科波拉 |
3 | 2008 | 《黑暗骑士》 The Dark Knight |
Christopher Nolan 克里斯托弗·诺兰 |
4 | 1974 | 《教父2》 The Godfather: Part II |
Francis Ford Coppola 弗朗西斯·科波拉 |
5 | 1957 | 《十二怒汉》 12 Angry Men |
Sidney Lumet 薛尼·卢梅 |
6 | 1993 | 《辛德勒的名单》 Schindler's List |
Steven Spielberg 史蒂文·斯皮尔伯格 |
7 | 2003 | 《指环王:王者归来》 The Lord of the Rings: The Return of the King |
Peter Jackson 彼得·杰克逊 |
8 | 1994 | 《低俗小说》 Pulp Fiction |
Quentin Tarantino 昆汀·塔伦蒂诺 |
9 | 2001 | 《指环王:护戒使者》 The Lord of the Rings: The Fellowship of the Ring |
Peter Jackson 彼得·杰克逊 |
10 | 1966 | 《黄金三镖客》 Il buono, il brutto, il cattivo |
Sergio Leone 赛尔乔·莱昂内 |
11 | 1994 | 《阿甘正传》 Forrest Gump |
Robert Zemeckis 罗伯特·泽米吉斯 |
12 | 1999 | 《搏击俱乐部》 Fight Club |
David Fincher 大卫·芬奇 |
13 | 2010 | 《盗梦空间》 Inception |
Christopher Nolan 克里斯托弗·诺兰 |
14 | 2002 | 《指环王:双塔奇兵》 The Lord of the Rings: The Two Towers |
Peter Jackson 彼得·杰克逊 |
15 | 1980 | 《星球大战V:帝国反击战》 Star Wars Episode V: The Empire Strikes Back |
Irvin Kershner 尔文·克许纳 |
16 | 1999 | 《黑客帝国》 The Matrix |
The Wachowskis 沃卓斯基兄弟 |
17 | 1990 | 《好家伙》 Goodfellas |
Martin Scorsese 马丁·斯科塞斯 |
18 | 1975 | 《飞越疯人院》 One Flew Over the Cuckoo's Nest |
Miloš Forman 米洛斯·福曼 |
19 | 1995 | 《七宗罪》 Seven |
David Fincher 大卫·芬奇 |
20 | 1954 | 《七武士》 七人の侍 |
Akira Kurosawa 黑泽明 |
留言板
IMDb另一受欢迎的特色是其对应每个数据库条目,并且有47个主要板块的留言板系统。注册用户可以在这些留言板上分享和讨论关于电影,演员,导演的消息。至今已有超过六百万注册用户使用过留言板。[10]
著作权问题
所有为数据库提供内容的自愿者都对其作品拥有著作权,但同时准许对其的复制,修改,并将其内容许可给IMDb。相应的,IMDb不允许其他人在未经许可情况下使用其电影概述或生平简介。使用软件方法屏蔽该网站显示的广告也被明令禁止。影片名录中一小部分可以被引用,而且只能用于非商业性的网站。
可信度
由于数据库的人物传记、琐事等部分是采取用户自由贡献,但又并未要求用户对其贡献内容附上参考来源,因此缺少有效而立即的机制,以阻止蓄意破坏者添加未经查证、或对该人物诋毁性的资料。部分人物消息准确度因此有争议。
中国大陆访问状况
- 2010年1月7日,IMDb.com被中国大陆防火长城封锁,与其他被封的海外网站一样,官方没有提供任何解释。[11]2010年2月3日,在中国大陆被解封,可以正常访问。[12]
- 2010年10月,IMDb.com再次被封锁。坊间盛传的一个原因是,当时IMDb首页上出现了一部和西藏有关的记录片《云后的太阳》(《When the dragon swallowed the sun》)的预告视频[来源请求]。此后在中国大陆访问该网站一直处于不稳定状态。
- 2013年3月初,IMDb.com被解除封锁,各项功能均可在中国大陆正常使用,页面显示完整。[13][14]
- 2016年3月,测试发现部分影片页面无法访问,如凛冬烈火页面无法打开,访问此链接后一段时间内无法打开IMDb网站,而后网站恢复访问。因此IMDb不属于在中国大陆完全自由访问的网站[15]。但2020年8月的测试显示全部影片页面均可以访问。
- 2021年7月,测试发现使用中国移动网络无法访问IMDb网站。
API
IMDb的数据在官网上可以免费下载,可惜的是免费提供下载的数据是文本格式,不能检索。为了使IMDb的数据能够被更多人使用,许多开发人员用各自的方法实现了不同的API,目前主要有以下几种:
IMDB API ORG
此接口由中国人开发[16],是一个轻量级的Web服务(RESTful接口),它提供一种IMDB数据的有效访问方式。就像前面说的一样,虽然IMDB的数据可以在官网上免费下载,但是却没有提供一个很好的API来检索这些信息。此Web服务旨在一定范围内解决这一问题。[17]
此接口相较于其它接口具备以下特点:
- 支持中文译名检索
- 支持中文数据返回
- 支持JavaScript调用接口(可以使用AJAX技术直接获取结果,非JSONP方式)
- 返回的数据字段更丰富
- 支持多条结果返回
- 请求限制宽松
此接口是唯一支持中文检索的IMDb API。
OMDB API
此接口的作者为Brian Fritz[18],是之前The IMDB API接口的作者,因为受到IMDb官方的要求而更换了域名,是较早一批提供IMDb数据检索的服务(RESTful接口)。
在英文世界,该服务有较高的知名度。
该接口支持JAVASCRIPT调用。
此接口是由The Movie Database数据库开放的API,严格来说它并不是检索的IMDb数据,它是一个独立的数据库,只是返回数据中提供了IMDb的一些相关数据,如:IMDb ID,IMDb Rating等。[19]
该接口提供的方法更多,但是需要授权使用,限制较多。
参考文献
- ^ 黄敏. 英影迷建成最大电影数据库. 经济参考报. 2011-01-07 [2022-01-20]. (原始内容存档于2022-01-20) (中文).
- ^ Database Statistics. IMDb. [2017-03-10]. (原始内容存档于2015-11-07).
- ^ IMDb - Movies, TV and Celebrities. IMDb. [2017-03-10]. (原始内容存档于2015-06-27).
- ^ Alternative Interfaces. IMDb. [2017-03-10]. (原始内容存档于2020-11-29).
- ^ Top 250 movies as voted by our users. IMDb. [2007-03-01]. (原始内容存档于2009-02-18).
- ^ Types of titles excluded from the Top 250. IMDb. [2007-04-25]. (原始内容存档于2017-03-25).
- ^ The user votes average on film or show X is 9.4, so it should appear in your top 250 Movies or TV list, yet it doesn't. Why?. IMDb. [2017-03-10]. (原始内容存档于2017-03-25).
- ^ Ragnar Norberg, Department of Statistics. Credibility Theory (PDF). London School of Economics. [2007-03-01]. (原始内容 (PDF)存档于2007-07-03).
- ^ Users, IMDb. IMDb Bottom 100. IMDb. [2017-03-10]. (原始内容存档于2007-12-09).
- ^ IMDb Message Boards. IMDb. [2017-03-10]. (原始内容存档于2017-02-28).
- ^ China blocks access to movie site. 好莱坞报道. 2010-01-08 [2010-01-22]. (原始内容存档于2010-01-29).
- ^ IMDB unblocked after 29 days site. 环球时报. 2010-02-08. (原始内容存档于2013-04-24).
- ^ 全球最大电影数据库3年后解封. 云南信息报. 2013-03-07. (原始内容存档于2013-04-28).
- ^ 中国解禁互联网电影数据库IMDb. RFA. 2013-03-08. (原始内容存档于2019-05-03).
- ^ 10 Crazy Ways China Censors The Internet. 2016-02-13. (原始内容存档于2016-03-14).
- ^ IMDB API 发布. 蒙趣空间. 2013-04-28 [2017-03-10]. (原始内容存档于2013-04-28).
- ^ IMDB API, IMDB Web Service. archive.is. 2013-05-03 [2017-03-10]. (原始内容存档于2013-05-03).
- ^ OMDb API - The Open Movie Database. omdbapi.com. [2017-03-10]. (原始内容存档于2020-11-20) (英语).
- ^ TMDb API Documentation — Movie & Cast Information. archive.is. 2013-05-03 [2017-03-10]. (原始内容存档于2013-05-03).
外部链接
- IMDb.com(页面存档备份,存于互联网档案馆)(英文)
- IMDb历史自述(页面存档备份,存于互联网档案馆)(英文)
- IMDb综合留言板(页面存档备份,存于互联网档案馆)(英文)
- IMDbPro[失效链接](英文)
- 互联网电影数据库的Facebook专页(英文)
- 互联网电影数据库的X(前Twitter)账户(英文)
- 互联网电影数据库的Instagram账户 (英文)