EPUB

國際數位出版論壇制定的電子書檔案格式標準

EPUB(Electronic Publication,电子出版)是一种电子图书标准,由国际数位出版论坛英语International Digital Publishing Forum(IDPF)提出;档案的副档名为.epub。这个格式已取代了先前的Open eBook开放电子书标准[2]

Electronic Publication (EPUB)
扩展名
.epub
互联网媒体类型
application/epub+zip
首次发布2007年9月
最新版本
3.3
2023年5月25日,​17个月前​(2023-05-25[1]
使用容器OEBPS Container Format(OCF,ZIP
扩展自Open eBookXHTMLCSSDTBook
标准ISO/IEC TS 30135
免费格式?
网站Publishing@W3C

EPUB使用XHTML为构建基础,UTF-8UTF-16编码,分成页面排版固定的“版式”与文字内容可随装置、使用者调整的“自动重新排版”,并可随需求加入数位版权管理(DRM)。目前已发展至3.3版本并广为采用。

概览

EPUB是一个自由的开放标准,属于一种可以“自动重新排版”的内容;也就是文字内容可以根据阅读设备的特性,以最适于阅读的方式显示。EPub档案内部使用了XHTMLDTBook(一种由DAISY Consortium提出的XML标准)来展现文字、并以zip压缩格式来包裹档案内容。EPUB格式中包含了数位版权管理(DRM)相关功能可供选用。[3]

EPUB于2007年9月成为国际数位出版论坛(IDPF)[4]的正式标准,以取代旧的开放Open eBook电子书标准。EPub包括三项主要规格:

  • 开放出版结构(Open Publication Structure,OPS)2.0,以定义内容的版面;
  • 开放包裹格式(Open Packaging Format,OPF)2.0,定义以XML为基础的.epub档案结构;
  • OEBPS容纳格式(OEBPS Container Format,OCF)1.0,将所有相关文件收集至ZIP压缩档案之中。

自 2017 年 1 月 30 日起,IDPF 已与W3C合并。

文件格式

3.3版(当前版本)

3.2版

3.1版

EPUB 3.0推荐规范发布于2011年10月11日。2014年6月26日,EPUB 3.0.1发布,作为3.0的小维护更新。2017年1月5日发布EPUB 3.1,对文字的格式规范进行了重组和清理。EPUB 3.0取代了之前的EPUB 2.0.1版。可以从IDPF网站页面存档备份,存于互联网档案馆)找到2.0.1到3.0版本的更新内容。

EPUB 3.0由四个规范组成:[5]

  • EPUB出版物3.0,其定义了出版物级别的语义以及EPUB出版物的首要一致性要求。
  • EPUB内容文档3.0,其定义了用于EPUB出版社中的XHTML、SVG和CSS的配置文件。
  • EPUB开放容器格式(OCF)3.0,其定义了将一组相关的资源封装到一个作为EPUB容器的单一文件(ZIP)的文件格式和处理模型。
  • EPUB媒体覆盖3.0,其定义了同步文本和音频的格式和处理模型。

EPUB 3.0格式旨在解决下列问题:

  • 虽然EPUB能够很好的处理以文本为主的书籍,但其可能不适合那些诸如漫画书的需要精确布局的出版物。[6]虽然这被认为是在解决一个已经解决了的问题,而不是解决悬而未决的问题。[7]
  • 阻碍大多数科技出版物使用EPUB的主要问题是其不支持MathML等式格式。现在,其被作为位图SVG图片被嵌入,不能被屏幕阅读器处理,也不能与计算机代数系统交互。EPUB 3.0规范加入了对MathML的支持。
  • 对EPUB规范的其他批评是该规范缺少对链入EPUB书籍、在EPUB书籍之间跳转、在EPUB书籍之内跳转的定义和缺少对注释的定义。对这些链接跳转的阻碍是因为EPUB容器使用的是ZIP文件。此外,目前还不清楚使用EPUB的内部结构标记和直接链接ZIP的文件结构哪个更好。[8]不能以标准方式注释EPUB书籍可能会导致难以共享和转移注释,进而限制了使用EPUB的情景,特别是在教学环境中,其不能提供和网络相媲美的交互性。[9]

2.0.1版

EPUB 2.0发布于2007年10月,2010年9月发布的维护更新版本(2.0.1)对该规范进行了澄清和校正。[10]EPUB 2.0.1版有三个规范组成:

  • 开放出版结构(OPS)2.0.1,包含其内容的格式。[11]
  • 开放包装格式(OPF)2.0.1,使用XML描述.epub文件的结构。[12]
  • 开放容器格式(OCF)2.0.1,以ZIP文档存档所有文件。[13]

EPUB内部使用XHTMLDTBook数位无障碍资讯系统联盟提供的一种XML标准)表示文本并组织内容文档,使用CSS的子集提供的布局和格式化。XML用于创建文档清单、目录和EPUB元数据。最后,文件被捆绑在一个zip文件之中作为一个包装格式。

开放出版结构2.0.1

EPUB文件使用XHTML 1.1(或DTBook)构建2.0.1版本书籍的内容。这与之前的版本不同(OEBPS 1.2及更早),其使用的是XHTML的子集。然而,在某些元素上存在限制。EPUB中XHTML文档的互联网媒体类型是application/xhtml+xml。[11]对于所需XHTML模块的列表和限制的描述,可以查看规范的2.2节页面存档备份,存于互联网档案馆)。

样式和布局使用CSS 2.0的子集,参考开放出版结构样式表。此规范的语法要求阅读系统仅支持一部分CSS属性,并附加了一些自定义属性。自定义属性包括oeb-page-head、oeb-page-foot和oeb-column-number。可以使用@font-face属性实现嵌入字体,同时在开放包装格式的清单中包含字体文件。EPUB中CSS文档的互联网媒体类型是text/css。[11]对于支持属性的列表和详细的信息,可以查看规范的3.0节页面存档备份,存于互联网档案馆)。

EPUB还要求使用互联网媒体类型image/png、image/jpeg、image/gif和image/svg+xml支持PNGJPEGGIFSVG图像。规范同样允许其他媒体类型,但创作者必须使用支持的类型提供替代内容。[11]对于所有需要的互联网媒体类型的列表,可以查看规范的Section 1.3.7节页面存档备份,存于互联网档案馆)。

必须使用Unicode,内容必须使用UTF-8UTF-16编码。[11]这是为了支持国际化和多语种数据。然而,阅读系统不必提供用于显示所有Unicode字符所需的字体,可以使用至少一个占位符显示那些不能完全显示的字符。[11]

EPUB的XHTML文件的结构如下:

<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="zh-TW">
  <head>
    <meta http-equiv="Content-Type" content="application/xhtml+xml; charset=utf-8" />
    <title>Pride and Prejudice</title>
    <link rel="stylesheet" href="css/main.css" type="text/css" />
  </head>
  <body>
    ...
  </body>
</html>

开放包装格式2.0.1

开放容器格式2.0.1

数字版权管理

EPUB文件可以随意的作为附加层包含数字版权管理,但这不是规范所要求的。[14]另外,规范没有指定任何特定的数字版权管理系统,所以出版商可以自由地选择适合的数字版权管理计划。然而,未来版本的EPUB(即OCF)可能会指定数字版权管理的格式。[13]

EPUB规范没有强制或推荐使用特定的数字版权管理计划。这可能会影响设备对不同数字版权管理系统所支持的水平以及购买电子书的便捷性。因此,这些数字版权管理的不兼容可能会按照数字版权管理系统分裂EPUB格式,这将破坏单一标准格式的优势,使得消费者迷惑。[15][16][17][18][19][20]

目前,拥有数字版权管理的EPUB文件必须在其ZIP容器的根级META-INF目录中包含一个名为rights.xml的文件。[13]

验证

一个名为epubcheck开源工具用于对结构化标记(OPS、OPF、OCF)及XHTML和图片文件进行验证并检查错误。该工具可以从命令行运行,也可以在网络应用程序及应用程序中作为使用。此工具原作中的大部分工作是在Adobe Systems中完成的。[21]

软体

Epub阅读软体

Windows

  • Microsoft Edge:微软为Edge加入支持打开EPUB的功能,但后来又取消此功能。[22]
  • SumatraPDF:Windows平台上一款免费阅读器,支持打开PDF, ePub, MOBI, XPS, DjVu, CHM, CBZ和CBR格式。

Linux

macOS、iOS

  • iBooks:Apple的电子书阅读工具,支援书面材质、翻页特效、标注、Spotlight、字典功能,能够透过自家iBooks Store下载电子书。

跨平台

Epub制作软体

  • Sigil:跨平台的开源epub电子书编辑器,支持Windows、Linux和Mac系统。
  • Google文件:Google提供的网页式办公套件在线服务,在档案->下载->EPUB Publication(.epub)之选项。
  • LibreOffice:开放的办公室套装软体,在6.0版中增加“汇出为EPUB”之选项。支援Windows 、 Mac 及 Linux。
  • calibre:自由、开源、跨平台的电子书软体套装,可以用来组织、存放以及管理电子书。可能在数字版权管理的限制下转换电子书的格式。可以阅读、制作epub以及把epub转换为html、odt、docx。

参考文献

  1. ^ Specifications. IDPF. [2017-03-22]. (原始内容存档于2013-05-06). 
  2. ^ EPUB 101 (PDF). [2011-02-21]. (原始内容 (PDF)存档于2010-12-12). 
  3. ^ 3.0 3.1 IDPF EPub常見問答. [2009-06-11]. (原始内容存档于2009-09-03). 
  4. ^ 國際數位出版論壇(IDPF)首頁. [2009-06-11]. (原始内容存档于2010-07-04). 
  5. ^ EPUB 3工作组. EPUB 3预览草案. IDPF. 2011年10月11日 [2011年10月11日]. (原始内容存档于2012年4月15日). 
  6. ^ Rothman, David. ePub变态测试:处理‘三影堂’图画小时. TeleRead: Bring the E-Books Home. 2008年7月27日 [2013年3月6日]. (原始内容存档于2009年6月26日). 
  7. ^ Fixed Width Layout - A Waste of Time. | A Certain Irreverence. [2013-03-06]. (原始内容存档于2012-12-02). 
  8. ^ Links, pointers, bookmarks, highlights: How should .epub do it?. FrontMatters. BookGlutton. March 29, 2008 [2013-03-06]. (原始内容存档于2013-08-16). 
  9. ^ Rothman, David. 'Social annotation and the marketplace of ideas': Time for an IDPF annotation standard for books and other e-pubs!. TeleRead: Bring the E-Books Home. November 5, 2007 [2013年3月6日]. (原始内容存档于2013年1月13日). 
  10. ^ 1.1 EPUB Revision History. IDPF. IDPF. 11 October 2011 [2013-03-06]. (原始内容存档于2013-03-06). 
  11. ^ 11.0 11.1 11.2 11.3 11.4 11.5 IDPF. Open Publication Structure (OPS) 2.0.1 - Recommended Specification. IDPF. September 4, 2010 [February 21, 2011]. (原始内容存档于2013-03-08). 
  12. ^ IDPF. Open Packaging Format (OPF) 2.0.1 - Recommended Specification. IDPF. September 4, 2010 [February 21, 2011]. (原始内容存档于2013-03-25). 
  13. ^ 13.0 13.1 13.2 IDPF. Open Container Format (OCF) 2.0.1 - Recommended Specification. IDPF. September 4, 2010 [February 21, 2011]. (原始内容存档于2013-03-09). 
  14. ^ IDPF. IDPF's Digital Book Standards FAQs. IDPF. November 20, 2006 [2013年3月18日]. (原始内容存档于2009年9月3日). 
  15. ^ Gelles, David. Walls close in on e-book garden. Financial Times. January 29, 2010 [2013-03-18]. (原始内容存档于2013-11-13). 
  16. ^ Rothman, David. Adobe-DRMed ePub isn’t ‘open’: Why the New York Times urgently needs to clarify its Sony eBook Store article. TeleRead: Bring the E-Books Home. August 13, 2009 [2013年3月18日]. (原始内容存档于2009年10月14日). 
  17. ^ Biba, Paul. Does the Nook use its own incompatible DRM scheme?. TeleRead: Bring the E-Books Home. December 21, 2009 [2013年3月18日]. (原始内容存档于2009年12月28日). 
  18. ^ Biba, Paul. iPad adds to the DRM mess? Apple ebook DRM exclusive to Apple hardware. TeleRead: Bring the E-Books Home. January 28, 2010 [2013年3月18日]. (原始内容存档于2010年2月2日). 
  19. ^ Kendrick, James. Who Really Needs an iPad?. jkOnTheRun. January 28, 2010 [2013-03-18]. (原始内容存档于2010-08-05). 
  20. ^ Dave Dickson. EPUB, iPad and Content Interoperability. Digital Editions. January 27, 2010 [2013-03-18]. (原始内容存档于2013-02-20). 
  21. ^ epubcheck: Validation tool for Epub. Google Code. [January 29, 2010]. (原始内容存档于2013-05-09). 
  22. ^ Microsoft Edge 將不再支援使用 .epub 副檔名的電子書。. [2020-07-09]. (原始内容存档于2019-09-01). 

外部链接