将结构添加到 PDF

在选择“导出 Adobe PDF”对话框“常规”区域中的“创建带标签的 PDF”选项导出为 Adobe PDF 时,会使用一组可描述内容的结构标签自动为导出的页面添加标签,以标识诸如大标题、文章和图形等页面项目。要在导出之前添加其他标签或微调现有的标签,可以使用 InDesign 中的“标签”面板。“结构”窗格(“视图”>“结构”>“显示结构”)反映了这些更改。

在导出之前将标签添加到 InDesign 文档,可以提高 Adobe PDF 文档的可访问性和重复使用功能。如果 PDF 文档不包含标签,则用户在读取或重排此文档时,Adobe Reader 或 Acrobat 会尝试自动为此文档添加标签,但效果可能不好。如果在导出的 PDF 文件中没有获得所需效果,可以使用 Acrobat 6.0 Professional 及更高版本中的工具,编辑带标签的 PDF 文档的结构。要获得最新的工具,请使用 Acrobat 9 Professional。

在将标签应用到 PDF 导出文档时,这些标签不会控制导出为 PDF 的内容,这与使用 XML 导出类似。相反,标签会向 Acrobat 提供有关文档结构化内容的更多信息。

使用标签的优点

在导出为 PDF 之前将标签应用到文档,可以执行下列操作:

  • 将 InDesign 段落样式名称映射到 Acrobat 标记的 Adobe PDF 段落样式,可以创建可重排的 PDF 文件以便在手持设备和其他媒体上查看。

  • 标记并隐藏打印人工效果、文本和图像,以便它们不会在 Acrobat 中重排时显示。例如,如果为页面项目添加“人工效果”标签,则在手持设备上、小型显示器或大显示器上重排带标签的 Adobe PDF 文档的内容时,将不会显示此页面项目。

  • 向图形添加替换文本,以便可以使用屏幕阅读软件为视力不佳者朗读文本。

  • 使用可读字母替换图形字母,例如,花饰首字下沉。

  • 为一组文章提供标题,或者将文章和图形编组到文章中。

  • 排序文章和图形以确定读取顺序。

  • 识别表、设置了格式的列表和目录。识别属于不同文章的内容块。

  • 包含文本格式信息,例如字符的 Unicode 值、单词间距以及软连字符和硬连字符的识别。

标签如何影响重复使用和可访问性

Adobe PDF 文档的内容可重复用于其他用途。例如,您可以创建一个包含文本、表和图像的 Adobe PDF 报告文件,然后使用各种格式发布此文件:在显示器上全尺寸打印或读取、在手持设备上查看、通过屏幕阅读器朗读,以及作为 HTML 页面通过 Web 浏览器直接访问。能否方便、可靠地重复使用内容取决于文档的基本逻辑结构。

要确保可靠地重复使用和访问 Adobe PDF 文档,必须向其中添加标签。添加标签会将基本组织结构(即逻辑结构树)添加到文档。逻辑结构树是指文档内容的组织,例如标题页面、章、节和小节。它可以指出精确的读取顺序并改进导航功能(特别适合于较长、较复杂的文档),而不会更改 PDF 文档的外观。

对于无法查看或解码文档可视外观的用户,可通过使用逻辑结构树的辅助技术可靠地访问文档内容。多数辅助技术依靠此结构并以替换格式(如声音)传送内容和图像的含义。在未添加标签的文档中,不存在此类结构,Acrobat 必须根据首选项中的读取顺序选择推断结构。这种方法并不可靠,并且经常导致以错误的顺序读取页面项目或根本无法读取。

在 Acrobat 6.0 和更高版本中,标签显示在“标签”选项卡上,这些标签根据所标记元素的关系定义嵌套在此处。不能在 Acrobat Standard 中编辑标签。如果工作中需要直接处理标签,应升级到 Acrobat 9 Professional。有关更多信息,请参阅 Acrobat 帮助。

Acrobat 9 中“标签”选项卡上的逻辑结构树

注:  可以将 Adobe PDF 文件中所用的标签与 HTML 和 XML 文件中的标签进行比较。要进一步学习基本标签概念,请参阅可以在书店、图书馆以及 Internet 上获得的任何参考资料和书籍。

了解并优化重排

可以重排 PDF 文档以便在手持设备、小型显示器或大显示器上读取此文档,而无需在读取每行时水平滚动。

重排 Adobe PDF 文档时,某些内容可以载入重排的文档,某些内容则不可以。多数情况下,只能将可读的文本重排到重排的文档。可读文本包括文章、段落、表、图像和设置了格式的列表。不可以重排的文本包括表单、注释、数字签名字段和页面人工效果,例如页码、表头和表尾。同时包含可读文本和表单或数字签名字段的页面不会被重排。垂直文本水平重排。

作为作者,您可以通过为 PDF 文档添加标签来优化这些文档,以进行重排。添加标签可确保文本块重排并且其内容遵循适当的顺序,这样读者便可以浏览跨不同页面和不同栏的文章,而其他文章也不会中断此流程。读取顺序由结构树定义,您可以在“结构”窗格中对其进行更改。

标题和栏(顶部)按照逻辑读取顺序(底部)重排。

为页面项目添加标签

可以自动或手动为文本框架和图形添加标签。为页面项目添加标签后,可以使用“结构”窗格,通过将元素拖到层次结构中的新位置更改页面的顺序。如果在“结构”窗格中更改元素的顺序,这些更改将传递到 Adobe PDF 文件。在 Acrobat 中将 PDF 文件存储为 HTML 或 XML 文件时,元素的顺序会非常有用。将 InDesign 文档以 Dreamweaver (XHTML) 或 Digital Editions (EPUB) 格式导出时,此顺序也非常有用。

为页面项目自动添加标签

选择“添加未标记的项目”命令时,InDesign 会将标签添加到“标签”面板,并将“文章”和“图形”标签应用到某些未添加标签的页面项目。“文章”标签适用于所有未添加标签的文本框架,“图形”标签适用于所有未添加标签的图形。然后,可以将其他标签手动应用到文本的各个部分。但是,自动为页面项目添加标签不会保证这些项目在导出的 PDF 文件中相应地结构化。

  1. 选择“窗口”>“实用程序”>“标签”以显示“标签”面板。

  2. 选择“视图”>“结构”>“显示结构”以在“文档”窗口左侧显示“结构”窗格。

  3. 从“结构”窗格菜单中选择“添加未标记的项目”。

    “结构”窗格和“标签”面板中的标签


为页面项目手动添加标签

  1. 选择“窗口”>“实用程序”>“标签”以显示“标签”面板。

  2. 选择“视图”>“结构”>“显示结构”以在“文档”窗口左侧显示“结构”窗格。

  3. 从“结构”窗格菜单中选择“添加未标记的项目”。

  4. 选择文档中的页面项目。

  5. 在“标签”面板中选择一个标签。请注意针对某些导入标签的下列建议使用方法:

    伪像

    当在“重排”视图(仅显示带标签的项目)中查看导出的 PDF 文件时,可通过“人工效果”标签隐藏页面项目(例如,页码或不重要的对象);请参阅 Adobe Acrobat 文档。这对于在手持设备上或其他 PDF 阅读器中查看 PDF 文件尤其有用。


    单元格

    将此标签用于表单元格。


    图形

    将此标签用于置入的图形。选择“添加未标记的项目”时,“图形”标签将应用到文档中所有未添加标签的置入图形。


    段落标签(P、H、H1-H6)

    在“重排”视图中查看导出的 PDF 文本时,这些标签不会影响导出的 PDF 文本。但是,在某些情况下将 PDF 文件导出为 HTML 格式时,这些标签可能非常有用。


    文章

    将此标签用于文章。当选择“添加未标记的项目”时,“文章”标签将应用到所有未添加标签的文本框架。例如,假设有一个设置了三种段落样式格式的 InDesign 文档:标题 1、标题 2 和正文。首先,分别将这些段落样式映射到 H1、H2 和 P 标签。下一步,导出为 PDF。最后,在 Acrobat 中将 PDF 文档导出为 HTML 或 XML 时,标签为 H1、H2 和 P 的段落会相应地显示在 Web 浏览器中(例如,在 H1 中使用大号的粗体字母)。有关将 PDF 文档导出为 HTML 或 XML 的信息,请参阅 Adobe Acrobat 文档。

标记图形以用于屏幕阅读器软件

如果希望屏幕阅读器能够说明文档中解释重要概念的图形元素,则必须提供此说明。屏幕阅读器不会识别或读取图形和多媒体,除非将替换文本添加到标签属性中。

通过 Alt 文本属性可以在查看插图的位置创建可读取的替换文本。ActualText 与 Alt 文本相似,因为它显示在图像的位置。通过 ActualText 属性可以替换单词中的图像部分,例如,当别致的图像用于显示首字下沉效果时。在本例中,ActualText 属性允许将首字下沉字母作为单词的一部分进行读取。

导出为 Adobe PDF 时,Alt 文本和 ActualText 属性值存储在 PDF 文件中,并可以在 Acrobat 6.0 和更高版本中查看。然后,在 Acrobat 中将 PDF 文件存储为 HTML 或 XML 文件时,便可以使用此替换文本信息。有关更多信息,请参阅 Adobe Acrobat 文档。

  1. 如果需要,请选择“视图”>“结构”>“显示结构”以显示“结构”窗格,然后选择“窗口”>“实用程序”>“标签”以显示“标签”面板。

  2. 从“结构”窗格菜单中选择“添加未标记的项目”。

  3. 要确保图像被标记为“图形”,请选择此图像,然后在“标签”面板中选择“图形”。

  4. 选择“结构”窗格中的“图形”元素,然后从“结构”窗格菜单中选择“新建属性”。

  5. 对于“名称”,请键入 Alt 或 ActualText(此功能区分大小写)。

  6. 对于“值”,请键入将替代图像显示的文本。

将页面项目编组为文章元素

使用“结构”窗格,将页面项目逻辑编组为“文章”元素。例如,如果一组文章跨多个页面,则可以创建将这些文章包含在一个组中的伞形元素。这些伞形元素称为结构化元素。也可以命名编组的文章。

注:  但无法为编组的页面项目添加标签。

  • 要将页面项目编组,请从“结构”窗格菜单中选择“新建元素”,在“标签”面板中选择“文章”元素,然后在“结构”窗格中将页面元素拖到它的下面。

  • 要命名编组的项目,请在“结构”窗格中右键单击“文章”元素,并选择“新建属性”。对于“名称”,请键入 Title。对于“值”,请键入要使用的文章的名称。

,