EPUB

國際數位出版論壇制定的電子書檔案格式標準
(重定向自開放出版結構

EPUB(Electronic Publication,電子出版)是一種電子圖書標準,由國際數位出版論壇英语International Digital Publishing Forum(IDPF)提出;檔案的副檔名為.epub。這個格式已取代了先前的Open eBook開放電子書標準[2]

Electronic Publication (EPUB)
扩展名
.epub
互联网媒体类型
application/epub+zip
首次发布2007年9月
最新版本
3.3
2023年5月25日,​17個月前​(2023-05-25[1]
使用容器OEBPS Container Format(OCF,ZIP
扩展自Open eBookXHTMLCSSDTBook
标准ISO/IEC TS 30135
免费格式?
网站Publishing@W3C

EPUB使用XHTML為構建基礎,UTF-8UTF-16編碼,分成頁面排版固定的「版式」與文字內容可隨裝置、使用者調整的「自動重新排版」,並可隨需求加入數位版權管理(DRM)。目前已發展至3.3版本並廣為採用。

概覽

EPUB是一個自由的開放標準,屬於一種可以「自動重新排版」的內容;也就是文字內容可以根據閱讀設備的特性,以最適於閱讀的方式顯示。EPub檔案內部使用了XHTMLDTBook(一種由DAISY Consortium提出的XML標準)來展現文字、並以zip壓縮格式來包裹檔案內容。EPUB格式中包含了數位版權管理(DRM)相關功能可供選用。[3]

EPUB於2007年9月成為國際數位出版論壇(IDPF)[4]的正式標準,以取代舊的開放Open eBook電子書標準。EPub包括三項主要規格:

  • 開放出版結構(Open Publication Structure,OPS)2.0,以定義內容的版面;
  • 開放包裹格式(Open Packaging Format,OPF)2.0,定義以XML為基礎的.epub檔案結構;
  • OEBPS容納格式(OEBPS Container Format,OCF)1.0,將所有相關文件收集至ZIP壓縮檔案之中。

自 2017 年 1 月 30 日起,IDPF 已与W3C合并。

文件格式

3.3版(當前版本)

3.2版

3.1版

EPUB 3.0推荐规范发布于2011年10月11日。2014年6月26日,EPUB 3.0.1发布,作为3.0的小维护更新。2017年1月5日發布EPUB 3.1,對文字的格式規範進行了重組和清理。EPUB 3.0取代了之前的EPUB 2.0.1版。可以从IDPF网站页面存档备份,存于互联网档案馆)找到2.0.1到3.0版本的更新内容。

EPUB 3.0由四个规范组成:[5]

  • EPUB出版物3.0,其定义了出版物级别的语义以及EPUB出版物的首要一致性要求。
  • EPUB内容文档3.0,其定义了用于EPUB出版社中的XHTML、SVG和CSS的配置文件。
  • EPUB开放容器格式(OCF)3.0,其定义了将一组相关的资源封装到一个作为EPUB容器的单一文件(ZIP)的文件格式和处理模型。
  • EPUB媒体覆盖3.0,其定义了同步文本和音频的格式和处理模型。

EPUB 3.0格式旨在解决下列问题:

  • 虽然EPUB能够很好的处理以文本为主的书籍,但其可能不适合那些诸如漫画书的需要精确布局的出版物。[6]虽然这被认为是在解决一个已经解决了的问题,而不是解决悬而未决的问题。[7]
  • 阻碍大多数科技出版物使用EPUB的主要问题是其不支持MathML等式格式。现在,其被作为位图SVG图片被嵌入,不能被屏幕阅读器处理,也不能与计算机代数系统交互。EPUB 3.0规范加入了对MathML的支持。
  • 对EPUB规范的其他批评是该规范缺少对链入EPUB书籍、在EPUB书籍之间跳转、在EPUB书籍之内跳转的定义和缺少对注释的定义。对这些链接跳转的阻碍是因为EPUB容器使用的是ZIP文件。此外,目前还不清楚使用EPUB的内部结构标记和直接链接ZIP的文件结构哪个更好。[8]不能以标准方式注释EPUB书籍可能会导致难以共享和转移注释,进而限制了使用EPUB的情景,特别是在教学环境中,其不能提供和网络相媲美的交互性。[9]

2.0.1版

EPUB 2.0发布于2007年10月,2010年9月发布的维护更新版本(2.0.1)对该规范进行了澄清和校正。[10]EPUB 2.0.1版有三个规范组成:

  • 开放出版结构(OPS)2.0.1,包含其内容的格式。[11]
  • 开放包装格式(OPF)2.0.1,使用XML描述.epub文件的结构。[12]
  • 开放容器格式(OCF)2.0.1,以ZIP文档存档所有文件。[13]

EPUB内部使用XHTMLDTBook数位无障碍资讯系统联盟提供的一种XML标准)表示文本并组织内容文档,使用CSS的子集提供的布局和格式化。XML用于创建文档清单、目录和EPUB元数据。最后,文件被捆绑在一个zip文件之中作为一个包装格式。

开放出版结构2.0.1

EPUB文件使用XHTML 1.1(或DTBook)构建2.0.1版本书籍的内容。这与之前的版本不同(OEBPS 1.2及更早),其使用的是XHTML的子集。然而,在某些元素上存在限制。EPUB中XHTML文档的互联网媒体类型是application/xhtml+xml。[11]对于所需XHTML模块的列表和限制的描述,可以查看规范的2.2节页面存档备份,存于互联网档案馆)。

样式和布局使用CSS 2.0的子集,参考开放出版结构样式表。此规范的语法要求阅读系统仅支持一部分CSS属性,并附加了一些自定义属性。自定义属性包括oeb-page-head、oeb-page-foot和oeb-column-number。可以使用@font-face属性实现嵌入字体,同时在开放包装格式的清单中包含字体文件。EPUB中CSS文档的互联网媒体类型是text/css。[11]对于支持属性的列表和详细的信息,可以查看规范的3.0节页面存档备份,存于互联网档案馆)。

EPUB还要求使用互联网媒体类型image/png、image/jpeg、image/gif和image/svg+xml支持PNGJPEGGIFSVG图像。规范同样允许其他媒体类型,但创作者必须使用支持的类型提供替代内容。[11]对于所有需要的互联网媒体类型的列表,可以查看规范的Section 1.3.7节页面存档备份,存于互联网档案馆)。

必须使用Unicode,内容必须使用UTF-8UTF-16编码。[11]这是为了支持国际化和多语种数据。然而,阅读系统不必提供用于显示所有Unicode字符所需的字体,可以使用至少一个占位符显示那些不能完全显示的字符。[11]

EPUB的XHTML文件的结构如下:

<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="zh-TW">
  <head>
    <meta http-equiv="Content-Type" content="application/xhtml+xml; charset=utf-8" />
    <title>Pride and Prejudice</title>
    <link rel="stylesheet" href="css/main.css" type="text/css" />
  </head>
  <body>
    ...
  </body>
</html>

开放包装格式2.0.1

开放容器格式2.0.1

数字版权管理

EPUB文件可以随意的作为附加层包含数字版权管理,但这不是规范所要求的。[14]另外,规范没有指定任何特定的数字版权管理系统,所以出版商可以自由地选择适合的数字版权管理计划。然而,未来版本的EPUB(即OCF)可能会指定数字版权管理的格式。[13]

EPUB规范没有强制或推荐使用特定的数字版权管理计划。这可能会影响设备对不同数字版权管理系统所支持的水平以及购买电子书的便捷性。因此,这些数字版权管理的不兼容可能会按照数字版权管理系统分裂EPUB格式,这将破坏单一标准格式的优势,使得消费者迷惑。[15][16][17][18][19][20]

目前,拥有数字版权管理的EPUB文件必须在其ZIP容器的根级META-INF目录中包含一个名为rights.xml的文件。[13]

验证

一个名为epubcheck开源工具用于对结构化标记(OPS、OPF、OCF)及XHTML和图片文件进行验证并检查错误。该工具可以从命令行运行,也可以在网络应用程序及应用程序中作为使用。此工具原作中的大部分工作是在Adobe Systems中完成的。[21]

軟體

Epub閱讀軟體

Windows

  • Microsoft Edge:微軟為Edge加入支持打開EPUB的功能,但后来又取消此功能。[22]
  • SumatraPDF:Windows平台上一款免費閱讀器,支持打開PDF, ePub, MOBI, XPS, DjVu, CHM, CBZ和CBR格式。

Linux

macOS、iOS

  • iBooks:Apple的電子書閱讀工具,支援書面材質、翻頁特效、標註、Spotlight、字典功能,能夠透過自家iBooks Store下載電子書。

跨平台

Epub製作軟體

  • Sigil:跨平台的开源epub电子书编辑器,支持Windows、Linux和Mac系统。
  • Google文件:Google提供的網頁式辦公套件在線服務,在檔案->下載->EPUB Publication(.epub)之選項。
  • LibreOffice:開放的辦公室套裝軟體,在6.0版中增加「匯出為EPUB」之選項。支援Windows 、 Mac 及 Linux。
  • calibre:自由、開源、跨平台的電子書軟體套裝,可以用來組織、存放以及管理電子書。可能在数字版权管理的限制下轉換電子書的格式。可以阅读、制作epub以及把epub转换为html、odt、docx。

参考文献

  1. ^ Specifications. IDPF. [2017-03-22]. (原始内容存档于2013-05-06). 
  2. ^ EPUB 101 (PDF). [2011-02-21]. (原始内容 (PDF)存档于2010-12-12). 
  3. ^ 3.0 3.1 IDPF EPub常見問答. [2009-06-11]. (原始内容存档于2009-09-03). 
  4. ^ 國際數位出版論壇(IDPF)首頁. [2009-06-11]. (原始内容存档于2010-07-04). 
  5. ^ EPUB 3工作组. EPUB 3预览草案. IDPF. 2011年10月11日 [2011年10月11日]. (原始内容存档于2012年4月15日). 
  6. ^ Rothman, David. ePub变态测试:处理‘三影堂’图画小时. TeleRead: Bring the E-Books Home. 2008年7月27日 [2013年3月6日]. (原始内容存档于2009年6月26日). 
  7. ^ Fixed Width Layout - A Waste of Time. | A Certain Irreverence. [2013-03-06]. (原始内容存档于2012-12-02). 
  8. ^ Links, pointers, bookmarks, highlights: How should .epub do it?. FrontMatters. BookGlutton. March 29, 2008 [2013-03-06]. (原始内容存档于2013-08-16). 
  9. ^ Rothman, David. 'Social annotation and the marketplace of ideas': Time for an IDPF annotation standard for books and other e-pubs!. TeleRead: Bring the E-Books Home. November 5, 2007 [2013年3月6日]. (原始内容存档于2013年1月13日). 
  10. ^ 1.1 EPUB Revision History. IDPF. IDPF. 11 October 2011 [2013-03-06]. (原始内容存档于2013-03-06). 
  11. ^ 11.0 11.1 11.2 11.3 11.4 11.5 IDPF. Open Publication Structure (OPS) 2.0.1 - Recommended Specification. IDPF. September 4, 2010 [February 21, 2011]. (原始内容存档于2013-03-08). 
  12. ^ IDPF. Open Packaging Format (OPF) 2.0.1 - Recommended Specification. IDPF. September 4, 2010 [February 21, 2011]. (原始内容存档于2013-03-25). 
  13. ^ 13.0 13.1 13.2 IDPF. Open Container Format (OCF) 2.0.1 - Recommended Specification. IDPF. September 4, 2010 [February 21, 2011]. (原始内容存档于2013-03-09). 
  14. ^ IDPF. IDPF's Digital Book Standards FAQs. IDPF. November 20, 2006 [2013年3月18日]. (原始内容存档于2009年9月3日). 
  15. ^ Gelles, David. Walls close in on e-book garden. Financial Times. January 29, 2010 [2013-03-18]. (原始内容存档于2013-11-13). 
  16. ^ Rothman, David. Adobe-DRMed ePub isn’t ‘open’: Why the New York Times urgently needs to clarify its Sony eBook Store article. TeleRead: Bring the E-Books Home. August 13, 2009 [2013年3月18日]. (原始内容存档于2009年10月14日). 
  17. ^ Biba, Paul. Does the Nook use its own incompatible DRM scheme?. TeleRead: Bring the E-Books Home. December 21, 2009 [2013年3月18日]. (原始内容存档于2009年12月28日). 
  18. ^ Biba, Paul. iPad adds to the DRM mess? Apple ebook DRM exclusive to Apple hardware. TeleRead: Bring the E-Books Home. January 28, 2010 [2013年3月18日]. (原始内容存档于2010年2月2日). 
  19. ^ Kendrick, James. Who Really Needs an iPad?. jkOnTheRun. January 28, 2010 [2013-03-18]. (原始内容存档于2010-08-05). 
  20. ^ Dave Dickson. EPUB, iPad and Content Interoperability. Digital Editions. January 27, 2010 [2013-03-18]. (原始内容存档于2013-02-20). 
  21. ^ epubcheck: Validation tool for Epub. Google Code. [January 29, 2010]. (原始内容存档于2013-05-09). 
  22. ^ Microsoft Edge 將不再支援使用 .epub 副檔名的電子書。. [2020-07-09]. (原始内容存档于2019-09-01). 

外部連結