PDF и PDF/A: что выбрать для хранения документов?
В статье исследуем, как различные форматы PDF влияют на размер и редактируемость электронных документов.
Формат, в котором сохранен PDF-документ, влияет на его размер и возможность редактирования. Кроме классического PDF, существуют также еще форматы PDF/А, PDF/X, PDF/E.
Формат PDF/A
PDF/A — это разновидность классической версии PDF, предназначенная для архивирования и долгосрочного хранения юридических, финансовых и кадровых документов. PDF/X специально разработан для дизайнеров и обеспечивает точное воспроизведение цветов и других графических элементов. В формате PDF/E сохраняют чертежи. Он поддерживает мультимедиа и 3D-модели, которые могут быть важны для работы с инженерной документацией.
PDF/A считается вторым по популярности форматом после стандартного PDF, в то время как PDF/X и PDF/E используются в офисной жизни реже. Многие известные редакторы, такие как Adobe Acrobat, Content Reader PDF и пр., позволяют сохранять документ в формате PDF/A.
Существуют следующие виды PDF/A:
-
PDF/A-1(a, b)
-
PDF/A-2(a, b, u)
-
PDF/A-3(a, b, u)
Где проходят границы применения подвидов PDF/A
Каждая версия PDF/A предназначена для определенных целей и имеет свои ограничения.
PDF/A-(1a, 2а, 3а)
-
PDF/A-1a считается оптимальным для архивации документов, где критически важна структура, возможность поиска, а также доступность, например, для различных программ чтения с экрана. Его можно использовать для архивации учебных материалов, научных работ, судебных решений и т.п.
-
PDF/A-2a дополнительно ко всем возможностям PDF/A-1a поддерживает JPEG2000, прозрачность, слои, вложения в формате PDF/A и цифровые подписи. Документы можно архивировать с меньшими потерями качества.
-
PDF/A-3a расширяет возможности PDF/A-2a, позволяя интегрировать в документ дополнительные вложения любого формата, что может пригодиться при архивировании комплексных документов, когда важно хранить связанные файлы (таблицы, метаданные). Это может подойти для хранения финансовых отчетов с вложенными таблицами, медицинских данных и пр.
PDF/A-(1b, 2b, 3b)
-
Эти форматы поддерживают только визуальную целостность документа. Их можно использовать, когда важна точность воспроизведения текста и базовых графических элементов, но нет необходимости поддерживать функции поиска информации внутри документа.
-
PDF/A-2b за счет наличия слоев и поддержки JPEG2000 позволяет получить еще более высокое качество при оцифровке графических документов. Например, архитектурных чертежей, географических карт, картинок, графиков и пр. Причем размер файла, сохраненного в формате PDF/A-2b, будет меньше, чем в PDF/A-1b.
-
PDF/A-3b позволяет хранить внутри документа файлы любого типа в качестве вложений. К примеру, он подойдет, когда требуется архивировать юридические доказательства вместе с аудио- или видеозаписями судебных заседаний. Можно также использовать PDF/A-3b для архивации медицинских записей с возможностью добавления к документам дополнительных данных, например, результатов анализов.
PDF/A-(2u, 3u)
-
Включают возможность работы с юникодом, что важно для архивации документов, составленных на нескольких языках. Оба формата подходят для документов, где требуется одновременно и визуальная целостность, и поддержка мультиязычности.
-
PDF/A-3u сочетает поддержку юникода с возможностью прикрепления файлов, расширяя тем самым функциональность PDF/A-2u. Это подходит для оцифровки международных контрактов, соглашений или публикаций, когда требуется обеспечить возможность интеграции в документ каких-либо дополнительных файлов.
Когда PDF лучше, чем PDF/А
1. Мало места для хранения объемных файлов
Формат PDF/A, в отличие от PDF, подразумевает, что вся информация, которая необходима для отображения документа в неизменном виде (текст, растровые изображения, векторная графика, шрифты, информация о цвете), должна быть внедрена в файл. Это приводит к тому, что сохраненный документ обычно имеет больший размер по сравнению с его PDF-эквивалентом. Тут важно отметить, что чаще всего это касается документов, сохраненных в формате PDF/A-1 (a, b).
2. Нужна поддержка интерактивных элементов
Не поддерживаются в формате PDF/A также интерактивные элементы и гиперссылки. Это ограничение делает использование PDF/A менее эффективным в ситуациях, когда необходимо заархивировать документы, где нужно обеспечить динамическое взаимодействие с пользователем. Например, формы или бланки для заполнения.
3. Критически важна безопасность данных
Обычный PDF лучше защищает данные, так как поддерживает шифрование. Это позволяет устанавливать пароли и ограничения на доступ к документу. PDF/A не имеет такой функции, что делает его менее безопасным для передачи данных через интернет. А при отправке PDF-документов по электронной почте или через интернет шифрование обеспечивает защиту данных от перехвата и чтения третьими лицами. В PDF/A такая возможность отсутствует.
Какие форматы поддерживают редакторы
Важно, чтобы пользователь мог самостоятельно выбирать формат PDF/A при сохранении документа. Если такой функции у редактора нет, то это может привести к проблемам с совместимостью и доступностью архивируемого документа в будущем. Например, некоторые версии PDF/A не поддерживают определенные виды вложений, что сделать файл недоступным для чтения.
Стандартно редакторы предлагают пользователям всего два формата для сохранения архивных документов: PDF или в PDF/A заданного разработчиком подтипа. Обычно это PDF/A-1a или PDF/A-1b. Причем интерфейс некоторых продуктов настроен таким образом, что пользователю приходится проходить целый квест, чтобы выяснить, в каком же все-таки формате программа сохранила документ.
Ручной выбор подходящего типа PDF/A доступен в некоторых многофункциональных редакторах, таких как ContentReader PDF и Adobe Acrobat.