Добавление структуры в документы PDF

Если при экспорте в Adobe PDF в области «Основные» диалогового окна «Экспорт Adobe PDF» выбран параметр «Создать PDF-файл с тегами», то экспортируемые страницы автоматически размечаются тегами из набора тегов структуры, описывающими содержимое и определяющими такие элементы страницы, как заголовки, материалы и рисунки. Перед экспортом можно добавить дополнительные теги или выполнить тонкую настройку уже имеющихся тегов с помощью палитры «Теги» в приложении InDesign. Внесенные изменения отразятся в палитре «Структура» («Просмотр» > «Структура» > «Показать структуру»).

Добавление тегов в документ InDesign перед экспортом обеспечивает расширенный доступ и повышает степень многократного использования документов Adobe PDF. Если документ PDF не содержит тегов, то Acrobat может автоматически попытаться выполнить его разметку во время чтения или перекомпоновки пользователем, однако результат может быть неудовлетворительным. Если экспортированный PDF-файл не отвечает поставленным требованиям, то структуру документа PDF с тегами можно отредактировать позднее с помощью инструментов Acrobat 6.0 Professional и более поздних версий. Новейшие средства доступны в Acrobat 9 Professional.

Если при экспорте PDF к документу применяются теги, следует учитывать, что от них не зависит, какое содержимое экспортируется в PDF, как в случае с экспортом в XML. Вместо этого в тегах представлена подробная информация для программы Acrobat о структурном содержимом документа.

Преимущества использования тегов

Применение тегов к документу перед экспортом в PDF обеспечивает следующие возможности.

  • Чтобы создать доступный для перекомпоновки PDF-файл, предназначенный для просмотра на карманных устройствах и на других носителях, необходимо сопоставить имена стилей абзацев InDesign с именами стилей абзацев размеченного документа Adobe Acrobat PDF.

  • Можно отмечать и скрывать артефакты печати, текст и изображения, чтобы они не отображались при перекомпоновке в Acrobat. Например, если какой-либо элемент страницы будет помечен как «Артефакт», то этот элемент страницы не будет отображаться при перекомпоновке содержимого размеченного документа Adobe PDF на карманном устройстве, на небольшом экране или на мониторе с большим увеличением.

  • Добавление дополнительного текста к рисункам, который можно озвучивать для слабовидящих пользователей с помощью программ чтения с экрана.

  • Замена графических букв, например декоративных буквиц, легкочитаемыми буквами.

  • Заголовки для нескольких статей или группировка материалов и рисунков в статьи.

  • Материалы и рисунки можно располагать в порядке чтения.

  • Распознавание таблиц, форматированных списков и оглавлений. Распознавание принадлежности фрагментов содержимого к различным материалам.

  • Добавление информации о форматировании текста, например: значения символов Юникода, интервалы между словами и распознавание мягких и фиксированных переносов.

Влияние тегов на многократное использование и расширенный доступ

Содержимое документа Adobe PDF можно повторно использовать для других целей. Например, предусмотрена возможность создания PDF-файла отчета с текстом, таблицами и изображениями для последующего распространения в различных форматах: для печати или чтения на полноразмерном мониторе, для просмотра на карманном устройстве, для озвучивания программой чтения с экрана и для прямого доступа через веб-браузер, как к HTML-странице. Базовая логическая структура документа определяет простоту и надежность повторного использования содержимого в будущем.

Чтобы гарантировать для документа Adobe PDF возможность повторного использования содержимого и надежность доступа, необходимо добавить в документ теги. При расстановке тегов в документ добавляется базовая организационная структура, или дерево логической структуры. Дерево логической структуры обращается к таким организационным элементам содержимого, как титульные листы, главы, разделы и подразделы. Оно определяет четкий порядок чтения и упрощает навигацию без изменения внешнего вида документа PDF, особенно в длинных и сложных документах.

Надежный доступ к содержимому документа с помощью дерева логической структуры обеспечивают вспомогательные программы, позволяющие читать содержимое документа людям с ослабленным зрением. На основе именно этой структуры большинство таких вспомогательных программ преобразуют смысл содержимого и изображений в альтернативный формат (например, в звуковой). В неразмеченном документе подобная структура отсутствует, поэтому программа Acrobat вводит структуру на основе последовательности чтения, выбранной в установках. Этот метод является ненадежным и часто приводит к тому, что элементы страницы прочитываются в неправильном порядке или вообще не читаются.

Теги отображаются на вкладке «Теги» в Acrobat 6.0 и более поздних версиях, где они вложены в соответствии с определениями отношений для размеченных элементов. В версии Acrobat Standard редактирование тегов не предусмотрено. Если для выполнения конкретной задачи требуется работать непосредственно с тегами, необходимо обновить приложение до версии Acrobat 9 Professional. Дополнительные сведения см. в справке Acrobat.

Дерево логической структуры на вкладке «Теги» в Acrobat 9
Дерево логической структуры на вкладке «Теги» в Acrobat 9

Примечание.

Можно провести аналогию между тегами, применяемыми в файлах Adobe PDF, и тегами в файлах XML и HTML. Дополнительная информация об основных принципах применения тегов приведена в любом из многочисленных справочников и учебников, которые имеются в книжных магазинах, библиотеках и в Интернете.

Понимание принципов перекомпоновки и оптимизация процессов перекомпоновки

Документ PDF может быть перекомпонован для чтения на карманных устройствах, небольших дисплеях или стандартных мониторах с большим увеличением без прокрутки по горизонтали при чтении каждой строки.

При перекомпоновке документа Adobe PDF какая-то часть содержимого переносится в документ, а какая-то — нет. Чаще всего в перекомпонованный документ переносится только читаемый текст. К читаемому тексту относятся статьи, абзацы, таблицы, изображения и отформатированные списки. К тексту, не подлежащему перекомпоновке, относятся формы, комментарии, поля цифровой подписи и такие артефакты страниц, как номера, верхние и нижние колонтитулы. Страницы, содержащие как читаемый текст, так и поля форм или цифровые подписи, недоступны для перекомпоновки. Вертикальный текст перекомпонуется в горизонтальный.

Автор документа PDF может оптимизировать его для перекомпоновки путем расстановки тегов. Расстановка тегов обеспечивает правильную перекомпоновку блоков текста и гарантирует, что содержимое будет следовать при чтении в правильном порядке. Таким образом, пользователь сможет читать текст материала, который расположен на разных страницах и столбцах и не прерывается текстом из других мест. Порядок чтения определяется деревом структуры, которое можно изменить в палитре «Структура».

Заголовки и столбцы перекомпонуются в логическом порядке чтения
Заголовки и столбцы (сверху) перекомпонуются в логическом порядке чтения (снизу).

Разметка элементов страницы

Разметка тегами текстовых фреймов и графики может выполняться автоматически или вручную. После разметки элементов страницы можно изменить порядок чтения страницы в палитре «Структура» путем перетаскивания элементов в новое расположение в пределах иерархии. После изменения порядка расположения элементов в палитре «Структура» эти изменения передаются в файл Adobe PDF. Информация о порядке следования элементов используется при сохранении PDF-файла в программе Acrobat в формате HTML или XML. Использование этой функции также удобно при экспорте документа InDesign в формат Dreamweaver (XHTML) или Digital Editions (EPUB).

Автоматическая разметка элементов страницы

После вызова команды «Добавить элементы без тегов» программа InDesign добавляет теги в палитру «Теги» и применяет теги «Материал» и «Рисунок» к определенным неразмеченным элементам страницы. Тег «Story» применяется к любым неразмеченным текстовым фреймам, а тег «Figure» — к любой неразмеченной графике. Затем можно вручную применить другие теги к фрагментам текста. Но автоматическая разметка элементов страницы не гарантирует, что эти элементы будут соответствующим образом структурированы в экспортируемом PDF-файле.

  1. Чтобы отобразить палитру «Теги», выберите меню «Окно» > «Утилиты» > «Теги».
  2. Чтобы открыть палитру «Структура» в левой части окна документа, выберите меню «Просмотр» > «Структура» > «Показать структуру».
  3. Выберите «Добавить элементы без тегов» в меню палитры «Структура».
    Теги в палитре «Структура» и в палитре «Теги»
    Теги в палитре «Структура» и в палитре «Теги»

Разметка элементов страницы вручную

  1. Чтобы отобразить палитру «Теги», выберите меню «Окно» > «Утилиты» > «Теги».
  2. Чтобы открыть палитру «Структура» в левой части окна документа, выберите меню «Просмотр» > «Структура» > «Показать структуру».
  3. Выберите «Добавить элементы без тегов» в меню палитры «Структура».
  4. Выберите элемент страницы в документе.
  5. Выберите тег в палитре «Теги». Для некоторых импортированных тегов нужно следовать приведенным ниже рекомендациям.

    Artifact

    Тег «Artifact» (артефакт) позволяет скрывать такие элементы страницы, как номера страниц или второстепенные объекты при просмотре экспортируемого PDF-файла в представлении «Перекомпоновка», в котором отображаются только размеченные элементы. См. документацию по Adobe Acrobat. Это особенно удобно, если PDF-файлы планируется просматривать на карманном устройстве или на других устройствах чтения PDF.

    Cell

    Этот тег применяется для ячеек таблицы.

    Figure

    Этот тег предназначен для графики, помещенной в документ. Тег «Figure» (рисунок) применяется ко всей неразмеченной графике, помещенной в документ, если выбрана команда «Добавить элементы без тегов».

    Теги «Paragraph» (P, H, H1-H6)

    Эти теги не влияют на экспортируемый текст PDF при просмотре в представлении «Перекомпоновка». Однако они могут быть полезными в некоторых ситуациях при экспорте PDF-файла в формат HTML.

    Структурный тег «Story» (PDF)

    Этот тег используется для материалов. Тег «Story» применяется ко всем неразмеченным текстовым фреймам после выбора команды «Добавить элементы без тегов». Например, предположим, что документ InDesign отформатирован с тремя стилями абзацев: Head1, Head2 и Body. Вначале эти стили абзацев следует сопоставить с тегами H1, H2 и P соответственно. Затем выполняется экспорт в PDF. В конечном итоге во время экспорта документа PDF в формат HTML или XML в программе Acrobat абзацы, размеченные как H1, H2 и P, будут отображены в веб-браузере правильно (например, текст в теге H1 будет отображен крупным полужирным шрифтом). Информацию об экспорте документов PDF в формат HTML или XML см. в документации по Adobe Acrobat.

Добавление надписей к графике для программ чтения с экрана

Если нужно, чтобы программы чтения с экрана описывали элементы графики, иллюстрирующие важную информацию в документе, необходимо ввести соответствующие описания. Программы чтения с экрана не могут распознавать или считывать рисунки или мультимедиа, если в свойства тегов не добавлен дополнительный текст.

Атрибут «Alt-текст» позволяет создавать сопроводительный текст, который будет заменять просмотр соответствующей иллюстрации. Атрибут «ActualText» аналогичен атрибуту «Alt-текст» в том, что его содержимое выводится вместо изображения. Атрибут «ActualText» позволяет заменять изображение, которое является частью слова, например когда в качестве буквицы используется причудливая картинка. В этом примере атрибут «ActualText» позволяет читать буквицу как часть слова.

При экспорте в файл Adobe PDF значения атрибутов «Alt-текст» и «ActualText» сохраняются в файле PDF, и их можно просматривать в Acrobat 6.0 и более поздних версиях. В дальнейшем эта сопроводительная текстовая информация может использоваться при сохранении файла PDF в программе Acrobat в формате XML или HTML. Дополнительную информацию см. в документации по Adobe Acrobat.

  1. При необходимости выберите «Просмотр» > «Показать структуру», чтобы открыть палитру «Структура», и «Окно» > «Утилиты» >«Теги» для вывода на экран палитры «Теги».
  2. Выберите «Добавить элементы без тегов» в меню палитры «Структура».
  3. Чтобы разметить изображение тегом «Рисунок», выделите изображение, затем выберите «Рисунок» в палитре «Теги».
  4. Выберите элемент «Рисунок» в палитре «Структура», затем выберите «Новый атрибут» в меню палитры «Структура».
  5. В поле «Имя» введите Alt или ActualText (учитывается регистр символов).
  6. В качестве атрибута «Значение» введите текст, который выводится вместо изображения.

Группировка объектов страницы в элемент «Статья»

Логически сгруппировать элементы страницы в элемент «Статья» можно с помощью палитры «Структура». Например, если ряд материалов занимает несколько страниц, можно создать «покрывающий» элемент, который будет содержать эти материалы в виде единой группы. Такие элементы называются структурными. Кроме того, можно присваивать сгруппированным статьям имена.

Примечание.

Нельзя размечать элементы сгруппированной страницы.

  • Чтобы сгруппировать элементы страницы, выберите команду «Новый элемент» в меню палитры «Структура», выберите элемент «Статья» в палитре «Теги», затем перетащите в него элементы страницы в палитру «Структура».
  • Чтобы присвоить имя сгруппированным элементам, щелкните правой кнопкой мыши элемент «Статья» в палитре «Структура» и выберите «Новый атрибут». В поле «Имя» введите Title. В качестве атрибута «Значение» введите нужное имя статьи.

Эта работа лицензируется в соответствии с лицензией Creative Commons Attribution-Noncommercial-Share Alike 3.0 Unported  На посты, размещаемые в Twitter™ и Facebook, условия Creative Commons не распространяются.

Правовые уведомления   |   Политика конфиденциальности в сети Интернет