Пдф формат это какой: Что такое PDF? Формат PDF

Содержание

Формат PDF: кто и как с ним работает

Как часто вы работаете с документами в формате PDF? Что обычно с ними делаете – просто просматриваете, копируете информацию или вам периодически требуется исправить цифру-другую? Примерно такие вопросы – а также ещё несколько десятков похожих – мы задали этим летом более 500 сотрудникам, работающим в средних и крупных российских компаниях. И узнали много интересного о формате PDF и его роли в современном офисе.

Пара слов о формате

Формат PDF (portable document format, или формат переносимых документов) – это открытый стандарт для обмена электронными документами. Документы, формы, изображения и веб-страницы, преобразованные в PDF, корректно отображаются на любых устройствах, в том числе на смартфонах и планшетах. То есть вы можете быть уверены, что ваш отчёт в формате PDF смогут открыть все коллеги вне зависимости от того, пользуются ли они ПК, Маком или смартфоном с Андроидом.

Подмножество формата PDF – PDF/A – отлично подходит для долгосрочного архивного хранения.

Из таких документов исключены некоторые особенности, которые не подходят для хранения, поэтому документ в этом формате и через несколько лет откроется в том же виде, в каком был архивирован.

Всё это делает формат PDF одним из самых удобных в работе.

Популярность PDF преувеличена… или нет?

Нет:)

Выяснилось, что PDF даже популярнее, чем мы ожидали: каждый второй респондент ответил, что регулярно сталкивается с необходимостью что-то сделать с PDF-документом. И чаще всего это не просто просмотр. Вот 5 наиболее популярных сценариев, которые выделили сотрудники:

  1. Поиск информации в тексте.
  2. Копирование данных.
  3. Работа со страницами в документе: например, нужно изменить их порядок, добавить новые или удалить существующие.
  4. Внесение небольших правок в текст PDF, к примеру, исправление ошибок и опечаток.
  5. Объединение файлов различных форматов  в PDF-документ.

С каждой из этих задач сталкиваются больше половины опрошенных. Некоторые задачи решаются с помощью простейших приложений для просмотра PDF, которые можно свободно скачать в интернете – они помогут вам открыть документ, найти в нём какую-то информацию и скопировать её (правда, не во всех случаях). С остальным сложнее.

Когда бесплатные программы не спасут

Предположим, вы обнаружили, что в важном PDF-отчёте опечатка. Что делать, как исправить? Достаточно просто: современные программы для работы с PDF умеют решать такие проблемы, и внесение правок в текст уже не является волшебством.

То же можно сказать и про объединение разных файлов в PDF – например, если у вас есть два вордовских документа и одна таблица в экселе, и вы очень хотите сформировать из этого отчёт. А если отчёт составил до вас кто-то не очень сведущий в этих делах, и страницы перепутаны местами, поправить это также несложно. Нужна просто специальная программа – и да, скорее всего она окажется платной.

Существует и ещё одна проблема, которую не в силах решить PDF-ридеры: PDF, полученные при сканировании. Предположим, вы попросили у коллеги отчёт в PDF, а он, не найдя его в своём компьютере, не растерялся и отсканировал бумажный экземпляр. Вы получаете документ, открываете его с помощью бесплатного ридера – и не можете скопировать нужный фрагмент. И вы не одиноки – с такой или похожей проблемой сталкивается 81% офисных сотрудников.

Почему эта проблема вообще возникает? Грубо говоря, при сканировании в файл добавляется только изображение документа – как если бы вы его сфотографировали. Для копирования, поиска и прочих операций нужен текстовый слой – а его ни в сканах, ни в фото нет. Что делать? Опять-таки поставить специализированную программу: она не просто откроет документ, но и распознает текст. Так что запомните – если сканируете бумажные документы, вам необходимо что-то сложнее бесплатной программки из интернета.

Кстати, что там с бумагой?

Судьба бумажных документов нам небезразлична: во-первых, мы за экологичность и спасение деревьев, во-вторых, наши программы и решения помогают компаниям переходить на электронный документооборот. Поэтому вопрос «Как за 2 года изменилось количество бумажных документов, с которыми вы работаете?»  очень нас интересовал.

Выяснилось, что, несмотря на появление все большего числа электронных документов, поток бумаги в офисе также увеличился. Это отметили 68% сотрудников – число немаленькое и явно свидетельствующее о том, что работы у нас еще много.

Время делать выводы

Выводы просты: офисные сотрудники всё чаще сталкиваются с PDF, причём для работы с ними зачастую требуется специальное программное обеспечение. Это ПО должно уметь работать со всеми типами PDF, в том числе и с отсканированными документами (не забываем о росте бумаги), а также быть простым и удобным.

Честно признаемся, что нас такие выводы радуют – ведь в начале этого года мы выпустили как раз такую программу, ABBYY PDF Transformer+. Она заслуживает отдельного подробного рассказа, так что следите за публикациями в блоге и подписывайтесь, чтобы ничего не пропустить.

PDF-формат файлов: удобный и незаменимый — Многостраничные издания.

Поздравительные журналы

В современном издательско-полиграфическом деле PDF-формат файлов является часто используемым, универсальным и, пожалуй, незаменимым. PDF в «легкой» версии удобно высылать на просмотр и утверждение готовых сверстанных материалов, а PDF для печати, записанный по специальным требованиям, отправляется в типографию. Помимо прочего, PDF-документ удобен для маркетинговой и рекламной работы, повсеместного распространения, пересылки, демонстрации, хранения какой‑либо информации.

Что же такое PDF-формат?

Portable Document Format (PDF) переводится с английского как «межплатформенный формат электронных документов». Данный формат файлов был разработан известной компанией Adobe Systems. В нем используется язык PostScript. Большая часть используемого в настоящее время профессионального печатного оборудования поддерживает формат PDF, поэтому произведение печати различных документов в этот формат возможно без использования специального программного обеспечения.
PDF содержит одну или множество страниц с графикой, текстами. Он поддерживает цветовые режимы, такие как CMYK, Grayscale, RGB, Lab, Duotone, Bitmap, а также различные типы сжатия растровой информации. Также этот формат позволяет внедрять в себя шрифты, изображения (векторные и растровые), формы для заполнения и мультимедиа-вставки (интерактивные элементы).

Множество разной документации, а также электронные книги во всемирой сети распространяются зачастую именно в формате PDF, так как при открытии PDF-документа он смотрится ровно так же, как выглядел в момент его создания. Этот формат файлов в настоящее время применяется в компьютерном дизайне и верстке различной полиграфической продукции, что позволяет получить при печати на бумаге именно то, что задумывалось.

Как создавать PDF-файлы

Чаще всего PDF-файлы создаются с помощью так называемого виртуального принтера. Документ готовится в какой‑либо из программ (например, в InDesign, MS Word, Illustrator), а затем экспортируется (т.  е. конвертируется) в формат PDF. Таким образом, файл PDF по своей сути является конечным форматом (не исходником).

Как открывать PDF-файлы

PDF-файлы можно смотреть на любом компьютере, в котором установлена какая‑либо из программ, позволяющая открывать этот тип файлов. Наиболее известной и популярной программой для просмотра PDF-файлов сейчас является Adobe Reader. Несложно догадаться, что эту программу в свое время создала компания Adobe, придумавшая также и формат PDF. Adobe Reader также встроен в Acrobat Professional, что расширяет возможности работы с этим форматом файлов. Бесплатно скачать просмотрщик PDF можно на официальном сайте Adobe. Другие программы для открытия PDF-файлов: Foxit Reader, PDF-XChange Viewer, PDF Creator. «Глюки» и ошибки, видные при открытии PDF-файла, чаще всего связаны с неправильной конвертацией в этот формат или с некорректным содержимым в исходнике изначально (например, «битый» шрифт).

Достоинства формата PDF

  • Совместимость. Кроссплатформенность позволяет открыть файл в этом формате на любом компьютере, будь то PC или Mac, а также на мобильных телефонах и планшетах. А программы-просмотрщики PDF сейчас предустановлены практически в каждой ОС.
  • Компактность.
    В большинстве случаях PDF-файлы имеют небольшой размер, так что без проблем отправляются по электронной почте и быстро открываются.
  • Безопасность. Имеется возможность защиты документа от открывания, распечатки, а также копирования содержимого файла.
  • Удобство в работе с полиграфией. PDF-файл отображает содержимое всегда и везде одинаково: именно так, как это было изначально создано, с теми же шрифтами и таким же расположением элементов. А для работы с типографией данный формат файлов просто незаменим.

Редактирование PDF-файлов

Как уже было написано выше, PDF-формат по сути своей является конечным, и его редактирование без специальных программам или плагинов невозможно, поскольку не предусмотрено. Конечно, наилучшим выходом является найти и отредактировать исходник файла, который был когда‑то изначально создан, а потом сконвертирован в PDF. Это самый правильный вариант. Но, к сожалению, частенько исходники оказываются либо утраченными, либо поврежденными, а исправить что‑либо в готовом PDF очень надо. В таком случае стоит воспользоваться специальными программами, позволяющими вносить изменения в PDF-документ. Если же исправления предстоят большие, либо речь идет о полной переверстке, то целесообразнее сверстать документ заново по имеющемуся образцу и сделав сразу все необходимые правки и корректно подготовив файл к печати в типографии.

Кстати, большинство записанных PDF-файлов не подходят по качеству для того, чтобы их сразу же напечатать в типографии. В таком случае их необходимо дорабатывать (а то и переверстывать), но помнить, что восстановить качество, допустим, используемых в PDF-файле растровых изображений невозможно.

Сохранение или конвертация файлов в формат PDF или XPS в классической версии Project

Чтобы экспортировать или сохранить файл Office в формате PDF, откройте его и в меню

Файл выберите пункт Экспорт или Сохранить как. Чтобы просмотреть пошаговые инструкции, выберите приложение Office в раскрывающемся списке.

  1. Откройте таблицу или отчет, которые требуется опубликовать в формате PDF.

  2. На вкладке Внешние данные в группе Экспорт нажмите кнопку PDF или XPS.

  3. В поле Имя файла введите или выберите имя документа.

  4. В списке Тип файла выберите PDF.

    • Если требуется высокое качество печати документа, установите переключатель в положение Стандартная (публикация в Интернете и печать).

    • Если качество печати не так важно, как размер файла, установите переключатель в положение Минимальный размер (публикация в Интернете).

  5. Нажмите кнопку Параметры, чтобы выбрать страницы для печати, указать, должна ли печататься разметка, а также выбрать параметры вывода. Нажмите кнопку ОК.

  6. Нажмите кнопку Опубликовать.

Эти сведения также относятся к Microsoft Excel Starter 2010.

Примечание: Вы не можете сохранять листы Power View как PDF-файлы.

  1. Откройте вкладку Файл.

  2. Выберите команду Сохранить как.
    Чтобы диалоговое окно «Сохранить как» Excel 2013 или Excel 2016, необходимо выбрать расположение и папку.

  3. В поле Имя файла введите имя файла, если оно еще не присвоено.

  4. В списке Тип файла выберите PDF.

    • Если файл требуется открыть в выбранном формате после его сохранения, установите флажок Открыть файл после публикации.

    • Если необходимо высокое качество печати документа, установите переключатель в положение Стандартная (публикация в Интернете и печать).

    • Если качество печати не так важно, как размер файла, установите переключатель в положение Минимальный размер (публикация в Интернете).

  5. Нажмите кнопку Параметры, чтобы выбрать страницы для печати, указать, должна ли печататься разметка, а также выбрать параметры вывода. Подробную информацию о диалоговом окне «Параметры» в Excel см. в статье Дополнительные сведения о вариантах создания PDF. По завершении нажмите кнопку ОК.

  6. Нажмите кнопку Сохранить.

OneNote 2013 и OneNote 2016

  1. Откройте вкладку Файл.

  2. Нажмите кнопку Экспорт.

  3. В разделе Экспорт текущего элемента выберите часть записной книжки, которую необходимо сохранить в формате PDF.

  4. В разделе Выбор формата выберите пункт PDF (*.pdf) и нажмите кнопку Экспорт.

  5. В диалоговом окне Сохранить как в поле Имя файла введите название записной книжки.

  6. Нажмите кнопку Сохранить.

OneNote 2010

  1. Откройте вкладку Файл.

  2. Выберите команду Сохранить как и выберите параметр, соответствующий части записной книжки, которую необходимо сохранить в формате PDF.

  3. В разделе Сохранить раздел как выберите пункт PDF и нажмите кнопку Сохранить как.

  4. В поле Имя файла введите имя для записной книжки.

  5. Нажмите кнопку Сохранить.

  1. Откройте вкладку Файл.

  2. Выберите команду Сохранить как.
    Чтобы диалоговое окно «Сохранить как» в PowerPoint 2013 и PowerPoint 2016, необходимо выбрать расположение и папку.

  3. В поле Имя файла введите имя файла, если оно еще не присвоено.

  4. В списке Тип файла выберите PDF.

    • Если файл требуется открыть в выбранном формате после его сохранения, установите флажок Открыть файл после публикации.

    • Если необходимо высокое качество печати документа, установите переключатель в положение Стандартная (публикация в Интернете и печать).

    • Если качество печати не так важно, как размер файла, установите переключатель в положение Минимальный размер (публикация в Интернете).

  5. Нажмите кнопку Параметры, чтобы выбрать страницы для печати, указать, должна ли печататься разметка, а также выбрать параметры вывода. По завершении нажмите кнопку ОК.

  6. Нажмите кнопку Сохранить.

  1. На вкладке Файл выберите команду Сохранить как.
    Чтобы диалоговое окно «Сохранить как» Project 2013 или Project 2016, необходимо выбрать расположение и папку.

  2. В поле Имя файла введите имя файла, если оно еще не присвоено.

  3. В списке Тип файла выберите PDF-файлы (*.pdf) или XPS-файлы (*.xps) и нажмите кнопку Сохранить.

  4. В диалоговом окне Параметры экспорта документа укажите в пункте Диапазон публикации, следует ли Включить непечатаемые данные или использовать Совместимость с ISO 19500-1 (только для PDF).

Советы по форматированию

Приложение Project не поддерживает все возможные функции форматирования документов PDF или XPS, но с помощью некоторых параметров печати вы можете изменять вид конечного документа.

На вкладке Файл выберите пункт Печать, а затем измените любой из следующих параметров:

В диалоговом окне Параметры страницы вы можете изменить параметры на таких вкладках:

  • «Поля»,

  • «Легенда»,

  • «Вид».

  1. Откройте вкладку Файл.

  2. Выберите команду Сохранить как.
    Чтобы диалоговое окно «Сохранить как» в Publisher 2013 или Publisher 2016, необходимо выбрать расположение и папку.

  3. В поле Имя файла введите имя файла, если оно еще не присвоено.

  4. В списке Тип файла выберите PDF.

  5. Если необходимо изменить способ оптимизации документа, выберите команду Изменить. (Щелкните Параметры в Publisher 2013 или Publisher 2016).

    • Внесите все необходимые изменения в разрешение изображения и непечатаемые сведения.

    • Чтобы изменить параметры печати документа, выберите Параметры печати.

    • По завершении нажмите кнопку ОК.

  6. Если после сохранения файл требуется открыть в выбранном формате, установите флажок Открыть файл после публикации.

  7. Нажмите кнопку Сохранить.

  1. Откройте вкладку Файл.

  2. Выберите команду Сохранить как.
    Чтобы диалоговое окно «Сохранить как» в Visio 2013 или Visio 2016, необходимо выбрать расположение и папку.

  3. В поле Имя файла введите имя файла, если оно еще не присвоено.

  4. В списке Тип файла выберите PDF.

    • Если файл требуется открыть в выбранном формате после его сохранения, установите флажок Автоматический просмотр файла после сохранения.

    • Если необходимо высокое качество печати документа, установите переключатель в положение Стандартная (публикация в Интернете и печать).

    • Если качество печати не так важно, как размер файла, установите переключатель в положение Минимальный размер (публикация в Интернете).

  5. Нажмите кнопку Параметры, чтобы выбрать страницы для печати, указать, должна ли печататься разметка, а также выбрать параметры вывода. Нажмите кнопку ОК.

  6. Нажмите кнопку Сохранить.

Word 2013 и более новые

  1. Выберите Файл > Экспорт > Создать PDF/XPS.

  2. Если свойства документа Word содержат информацию, которую вы не хотите включать в PDF-файл, в окне Опубликовать как PDF или XPS нажмите кнопку Параметры. Затем выберите пункт Документ и снимите флажок Свойства документа. Задайте другие нужные параметры и нажмите кнопку ОК.

    Дополнительные сведения о свойствах документа см. в разделе Просмотр или изменение свойств файла Office 2016.

  3. В окне Опубликовать как PDF или XPS выберите место, где нужно сохранить файл. При необходимости измените имя файла.

  4. Нажмите кнопку Опубликовать.

Дополнительные сведения о вариантах создания PDF

  • Чтобы преобразовать в формат PDF только некоторые страницы, укажите их в полях Страницы.

  • Чтобы включить исправления в PDF, в разделе Опубликовать установите переключатель в положение Документ с исправлениями. В противном случае убедитесь установите переключатель в положение Документ.

  • Чтобы создать набор закладок в PDF-файле, установите флажок Создать закладки, используя. Затем установите переключатель Заголовки или, если вы добавили закладки в свой документ, Закладки Word.

  • Если вы хотите включить в PDF-файл свойства документа, убедитесь в том, что флажок Свойства документа установлен.

  • Чтобы сделать документ удобней для чтения в программах чтения с экрана, установите флажок Теги структуры документа для улучшения восприятия.

  • Совместимость с ISO 19005-1 (PDF/A). Этот параметр предписывает создать PDF-документ, используя стандарт архивации 1.7 PDF. Стандарт PDF/A позволяет гарантировать, что при открытии на другом компьютере документ будет выглядеть точно так же.

  • Преобразовать текст в точечный рисунок, если невозможно внедрить шрифты. Если невозможно внедрить шрифты в документ, при создании PDF-файла используется точечный рисунок текста, чтобы PDF-документ выглядел так же, как оригинальный. Если этот параметр не выбран и в файле используется невстраиваемый шрифт, программа чтения PDF-файлов может применить другой шрифт.

  • Зашифровать документ с помощью пароля. Выберите этот параметр, чтобы ограничить доступ к PDF-файлу людям, у которых нет пароля. Когда вы нажмете кнопку ОК, Word откроет диалоговое окно Шифрование документа в формате PDF, в котором вы можете ввести пароль и его подтверждение.

Открытие PDF-файла в Word и копирование содержимого из него

Вы можете скопировать из PDF-документа нужное содержимое, открыв его в Word.

Выберите Файл > Открыть и найдите PDF-файл. Word откроет PDF в новом файле. Вы можете скопировать нужное содержимое, включая изображения и схемы.

Word 2010

Эти сведения также относятся к Microsoft Word Starter 2010.

  1. Откройте вкладку Файл.

  2. Выберите команду Сохранить как.
    Чтобы диалоговое окно «Сохранить как» в Word 2013 и Word 2016, необходимо выбрать расположение и папку.

  3. В поле Имя файла введите имя файла, если оно еще не присвоено.

  4. В списке Тип файла выберите PDF.

    • Если файл требуется открыть в выбранном формате после его сохранения, установите флажок Открыть файл после публикации.

    • Если необходимо высокое качество печати документа, установите переключатель в положение Стандартная (публикация в Интернете и печать).

    • Если качество печати не так важно, как размер файла, установите переключатель в положение Минимальный размер (публикация в Интернете).

  5. Нажмите кнопку Параметры, чтобы выбрать страницы для печати, указать, должна ли печататься разметка, а также выбрать параметры вывода. По завершении нажмите кнопку ОК.

  6. Нажмите кнопку Сохранить.

Чтобы сохранить файл в формате PDF в Office для Mac, выполните эти простые действия:

  1. Откройте вкладку Файл.

  2. Нажмите кнопку Сохранить как.

  3. Щелкните Формат файла в нижней части окна.

  4. Выберите PDF в списке доступных форматов.

  5. Присвойте файлу имя, если оно еще не указано, а затем нажмите кнопку Экспорт.

С помощью Word, PowerPoint и OneNote в Интернете можно преобразовать документ в формат PDF.

  1. Выберите «Файл>печатать > «Печать» (в PowerPoint выбран один из трех форматов).

  2. В меню «Принтер» выберите пункт «Сохранитькак PDF», а затем — «Сохранить».

  3. Затем в открываемом меню проводника вы можете назвать PDF-файл, выбрать, где его сохранить, а затем выбрать «Сохранить».

При этом приложение создаст обычный PDF-файл, в котором будут сохранены макет и форматирование исходного документа.

Если вам нужны дополнительные параметры для управления PDF-файлом, например возможность добавлять закладки, преобразуйте документ в формат PDF с помощью настольного приложения. Нажмите кнопку «Открыть в настольном приложении» на панели инструментов PowerPoint и OneNote, чтобы начать работу с классическим приложением, а затем в Word выберите в этом приложении dropdown и нажмите кнопку «Открыть в настольном приложении».

Если у вас нет настольного приложения, вы можете попробовать или купить последнюю версию Office прямо сейчас.

У вас есть предложения для этой возможности?

Голосуйте за понравившиеся идеи или предлагайте свои в копилке идей на сайте word.uservoice.com.

Чтобы экспортировать документ Word или книгу Excel в файл формата PDF на устройстве с iOS, нажмите в левом верхнем углу кнопку Файл и выберите пункт Экспорт, а затем — PDF.

Форматы файлов, прикрепляемых к почтовым сообщениям.

Doc, RTF или … в каком формате должны быть файлы, прикрепляемые к почтовым сообщениям?

Мы рассмотрим, в качестве возможных альтернатив, документы в форматах TXT, RTF, DOC, HTML и PDF. Есть еще один способ: комбинация из нескольких файлов, «сжатых» в общий архив, например, ZIP. «Документами» мы будем называть тексты, в которых используются разные шрифты, в разных стилях (курсив, жирный, подчеркивание…) и разных размеров, с иллюстрациями и другими средствами усиления выразительности. В зависимости от особенностей отправляемого документа и возможностей адресата, оптимальным может оказаться любой из перечисленных способов.

1. Кодировки текста
Для цифрового представления (и передачи) текстовой информации, используются различные кодировки. В большинстве кодировок для представления символов используется байт, восьмиразрядное двоичное число, которое может принимать значения от 0 до 255. В некоторых кодировках для «буквы» используются два или более байт. Сосчитать точное число используемых (и использовавшихся) кодировок невозможно, и определить, какую из них следует использовать для прочтения взятого наугад фрагмента текста, можно только методом проб и ошибок… или владея какой-то дополнительной информацией. Кодировки, особенно национальные, различны между платформами (то же число обозначает разные буквы). Буквы латиницы чаще всего совпадаютв разных кодировках… но тоже не всегда. Текст отображается на экране компьютера (или на листе бумаги) с помощью шрифтов, в которых некоторым из кодов соответствуют строго определенные «картинки»: изображения букв, идеограмм, цифр, знаков препинания и прочих символов. В любой кодировке, кроме них, есть еще невидимые символы: «разделители слов» — пробелы, переходы на новую страницу, табуляции. При отображении текста, неизвестные в данном шрифте коды отображаются специальным образом (прямоугольниками, ромбиками со знаком вопроса и т.п.) в зависимости от типа шрифта и особенностей программы, которая воспроизводит текст. Если кодировки используемого шрифта и отображаемого текста различны, вместо понятного текста пользователь увидит «краказябры» — нечитаемую мешанину из обычных и странных букв.
2. TXT
Простые текстовые файлы содержат текст, только текст и ничего кроме текста. О том, какая кодировка использовалась при создании документа, можно только догадываться. Если пересылаемые по электронной почте данные можно, без потери важной информации, представить в виде текста, этот формат отлично подходит. Но, только если отправитель уверен в том, что операционные системы получателей используют в своей работе те же кодировки, что и он. В Windows, юниксах (например, Ubuntu) и на Mac OS X русскоязычные тексты кодируются по разному. К «чисто текстовым» файлам относятся, например, исходные тексты на различных языках программирования (с самыми разными расширениями, например, «c», «h», «rb», «m», «mm» и т.п.), «сложные» текстовые форматы (например, RTF, HTML или PostScript), разнообразные служебные и специальные файлы (например, XML, INI и многие другие). Считается, что исходные тексты программ можно пересылать именно в их исконном виде… это правильно, но только если (а) компьютер получателя использует ту же кодировку, что и компьютер отправителя или (б) комментарии в исходном тексте на английском языке. Иначе получателю, чтобы прочитать комментарии, придется прибегать к всевозможным трюкам. Кстати, в Mac OS X и в Windows кодировка большинства «маленьких» букв… совпадает (кроме «я», «ь», «ъ» и «ё»). «Большие» все разные. Это может пригодиться. Для пересылки небольших по размеру текстов по электронной почте иногда лучше всего просто впечатать (или скопировать) текст в тело сообщения. Почтовые клиенты умеют позаботиться о кодировках. Почти всегда полученный текст удается прочитать (иногда попробовав для этого несколько кодировок из списка предлагаемых почтовым клиентом).

Достоинства простого текстового формата:
— простота
— экономичность
— это открытый стандарт

Недостатки:
— при обмене данными между компьютерами различных платформ возможны конфликты кодировок
— не поддерживаются стили текста и графика

3. RTF
«Богатый текстовый формат» (Rich Text Format) был разработан корпорацией Microsoft в начале 90-х годов прошлого века, его поддерживают большинство версий Microsoft Word (все версии, выпущенные после 95 года), а также многие другие программы — в том числе и бесплатно поставляемые вместе с различными операционными системами, такие как WordPad в Windows и Text Edit в Mac OS X. Многие текстовые процессоры умеют импортировать и экспортировать файлы в этом формате (то есть, «читать» и «писать»). При экспорте из текстового процессора в RTF часть информации (графика: иллюстрации, схемы, диаграммы, графики и т.п.) теряется. В Mac OS X, RTF — стандарт представления текста (наряду с «простым текстом»). На его основе разработан формат RTFD (Rich Text Format Directory), позволяющий сохранять графику, мультимедиа и много чего еще. Пользователям компьютера Макинтош следует помнить о том, что формат RTFD… неизвестен на других платформах. Но если вы получили что-то очень важное именно в этом формате, вы сможете его «прочитать»: RTFD представляет из себя директорию, в которой обязательно есть файл TXT.rtf (в нем весь текст документа, в стандартном RTF, со всеми стилями и т.п.), и, в виде отдельных файлов — вся графика, мультимедиа и «все, что угодно», включенная автором в RTFD-документ. Файлы RTF являются обычными текстовыми файлами, которые можно прочитать с помощью любой программы, умеющей читать такие файлы. Содержимое RTF состоит из команд и «собственно текста». С помощью команд задаются стили текста, выбор шрифта, размер шрифта, кодировки и т.п. RTF — оптимальный формат для прикрепления к почтовому сообщению, особенно если получатель должен не только прочитать полученный документ, но и внести в него какие-то дополнения. О том, как с его помощью пересылать то, что он не умеет, читайте ниже.

Достоинства RTF:
— сохраняет информацию о выбранных автором шрифтах, кодировках, стилях, цвете текста
— читается на различных компьютерных платформах
— многие программы (в их числе бесплатные) умеют с ним работать
— это открытый стандарт

Недостатки:
— не поддерживает графику
— занимает больше места на диске, чем простые текстовые файлы

4. DOC
DOC — файлы в формате Microsoft Word. Это бинарный (нетекстовый) формат. Позволяет сохранять не только текст, стили и данные о шрифтах и кодировках, но и графику, комментарии к тексту, выделение фрагментов текста маркером, и многое другое. Формат является собственностью корпорации Microsoft, и время от времени претерпевает радикальные изменения. Поседний раз такое радикальное изменение произошло в Word 2007 (правда, на этот раз изменилось и расширение, используемое для файлов в формате DOCX — теперь это не «.doc», а «.docx». Новый формат основан на XML. Вопреки широко распространенному заблуждению, формат DOC поддерживается не только в Windows. Его успешно «читают» и «правят» пользователи, например, Mac OS X, у которых на компьютере установлен MS Office для Мака (Microsoft — крупнейший в мире маковский разработчик), или iWorks, офисный пакет разработки Apple. Тем не менее, в качестве формата для прикрепленных к почтовому сообщению документов не рекомендуется. Велика вероятность того, что на компьютере получателя не окажется программы, умеющей читать этот формат.

Достоинства DOC:
— сохраняет всю информацию о форматах и стилях текста
— с большой вероятностью может быть прочитан на компьютере получателя

Недостатки:
— проприетарный формат
— занимает больше места на диске, чем простые текстовые файлы
— с большой вероятностью может не читаться на компьютере получателя

5. HTML
Основной рабочий формат всемирной паутины. Разработан Тимом Бернерсом-Ли в 1993 году, на компьютере NeXT (в операционной системе NeXTstep, одном из предков Mac OS X). Основное предназначение этого формата — гиперссылки. Конструкции, позволяющие быстро переходить к другим местам в тексте, где бы они не находились (внутри самого документа, в другом документе той же файловой системы, где-то на планете Земля, а скоро к ним добавится и «где-то в Солнечной системе»). По сути это еще один «богатый текстовый формат» (см. RTF), но с рядом важных отличий. Он «богаче» (может ссылаться на графику и мультимедия, каскады форматов (CSS), поддерживает с десяток языков скриптования и программирования (JavaScript, Python, Ruby, AppleScript, Visual Basic и другие). Помимо текстов, на HTML вполне можно программировать несложные «программы» — например, на Всероссийской Коференции Маковских Разработчиков весной 1998 года, аспирантка одного из Московских медицинских институтов продемонстрировала программу диагностирования рака молочной железы, написанную исключительно на HTML (совместимую с любым интернет-браусером в мире), и тем не менее, очень эффективную и полезную. Файлы в формате HTML можно использовать для передачи самого сложного и богатого «контента», но для этого приходится использовать большое число различных вспомогательных файлов. Большинство (все?) современных почтовых клиентов поддерживают, помимо «чисто текстового» формата сообщений, еще и сообщения в HTML. И почти у всех почтовых клиентов в мире с чтением таких почтовых сообщений есть те или иные проблемы. Прикреплять документы в виде HTML к почтовым сообщениям… можно. Но с умом. Следует помнить, что иллюстрации, диаграммы и прочая графическая информация, отображаемая на HTML-страницах в интернет-браусере, существует в виде отдельных файлов, на которые в теле таких документов должна быть «жесткая» ссылка. Подробнее см. в разделе про ZIP. Большинство браусеров умеет работать с кодировками, и позволяет (если в документе не указана правильная кодировка, или она не указана вообще) выбрать кодировку интерпретации данных из списка.

Достоинства HTML:
— сохраняет информацию о выбранных автором шрифтах, кодировках, стилях, цвете текста
— читается на различных компьютерных платформах
— многие программы (в их числе бесплатные) умеют с ним работать
— это открытый стандарт

Недостатки:
— графика хранится отдельно
— часто представляет из себя не отдельный файл, а целую группу файлов
— занимает больше места на диске, чем простые текстовые файлы

6. PDF
PDF — это Portable Document Format. Переносимый формат представления документов. По замыслу разработчиков (Adobe Corporation), такие документы должны одинаково воспроизводиться на самых разных компьютерных платформах, независимо от кодировок, наличия или отсутствия шрифтов, которые использованы при создании документа. Это открытый формат. Adobe публикует детальную спецификацию всех его версий, в виде документа в формате PDF из многих сотен страниц. Программа для чтения этого формата (Acrobat Reader) бесплатно распространяется в вариантах для основных платформ. На некоторых платформах этот формат поддерживается самой операционной системой. Важная особенность формата PDF: это формат для чтения. Своего рода «электронная бумага». Генерация документов в этом формате напоминает печать на принтер. Напечатанное можно слегка подправить (в PDF-документ можно добавить «аннотации»), но для внесения исправлений надо «печатать документ заново». Специальных программ, которые позволяли бы создавать и редактировать PDF подобно тому, как мы редактируем RTF или DOC, нет. Документ создается с помощью самых разных прикладных программ, и затем сохраняется в формате PDF в точно таком же виде, в каком он был бы отпечатан. Некоторые программы позволяют редактировать содержимое PDF (поскольку это «почти графический формат»), но для внесения исправлений лучше… «внести изменения в исходный файл, и отпечатать (отпидиэфить?) его заново». Для выполнения главной своей функции (одинакового отображения документа на разных платформах), всё, что использовано при создании исходного документа PDF-файл должен «нести в себе». Шрифты (кроме 14 шрифтов, именуемых «базовыми», которые обязательно должны быть установлены в любой операционной системе, чтобы она могла корректно работать с PDF), всевозможная графика, текст. Для экономии дискового пространства к элементам применяются различные алгоритмы сжатия. Для защиты содержания файлов от несанкционированного прочтения, оно может быть закодировано, а доступ к файлу запаролен. Начиная с версии 1.2, в PDF поддерживаются «гиперссылки» (см. HTML), а с версии 1.4, формат поддерживает «прозрачность». Если получатель не должен вносить исправления в отправляемый ему документ, PDF — почти идеальный формат для прикрепления к почтовому сообщению. Получатель прочитает его именно таким, каким его создаст отправитель.

Достоинства PDF:
— сохраняет всю информацию о формате документа
— читается на различных компьютерных платформах
— многие программы (в их числе бесплатные) умеют с ним работать
— это открытый стандарт

Недостатки:
— занимает значительно больше места на диске, чем простые текстовые файлы
— сложно редактировать

7. ZIP
Документ, который заслуживает внимания получателей, может быть отправлен в виде целого комплекта файлов. Директории, а в некоторых случаях — и целого дерева из различных директорий. Внутри этих директорий могут находиться файлы самых разных форматов — в том числе и исполняемый код или скрипты, оживляющие пересылаемые данные. Это может быть комплекс из многих HTML-файлов, с иллюстрациями и видеофрагментами. Это может быть целый web-сайт, или его фрагмент. Некоторые почтовые клиенты (старые) не поддерживают прикрепление директорий к сообщениям. Комплекс из многих файлов (или отдельный большой файл) разумнее всего пересылать в «сжатом» виде — например, в виде ZIP-архива. ZIP — открытый стандарт, понятный на самых разных платформах. В некоторых операционных системах поддержка этого формата осуществляется на уровне самой ОС. Достоинства и недостатки пересылки информации в сжатом виде очевидны.

При пересылке групп из нескольких файлов следует помнить о том, что…
— имена файлов на разных платформах кодируются в кодировках этих платформ, и на других могут быть трудно читаемы (или нечитаемы вообще), поэтому не стоит использовать в именах файлов оригинальную национальную графику (например, кириллицу или китайские иероглифы)
— содержание графических файлов, особенно файлов «современных» форматов, хранится в сжатом виде. Эффект от повторного сжатия таких файлов, в лучшем случае, незначителен.

8. Некоторые другие форматы…
тоже заслуживают внимания. Например, PostScript. Еще одна разработка Adobe Corporation. Это одновременно и язык программирования, и векторный графический стандарт, и язык описания документов… и стандартный формат вывода документов на печать (поддерживаемый всеми высококачественными и относительно дорогими принтерами). Прежде чем отправлять информацию в виде ps-файла (засширение PostScript), не мешает узнать, понимает ли компьютер получателя этот формат без лишних хлопот. В наше время это не самый популярный формат. Если заранее известно, что получатель использует такую же программу, что и вы, для прикрепления к почтовым сообщениям вполне подойдут документы таких программ. Например, таблицы или диаграммы Microsoft Excel, графика в формате Adobe Photoshop, или даже профессионально набранный текст в QuarkXPress. А еще, чтобы послать получателю диаграмму, график или фотографию, нет необходимости превращать отправляемое в HTML или PDF: просто превратите данные в файл графического формата (если данные еще не в нем), например, сделав моментальный снимок с экрана компьютера (скриншот), и отрезав от него лишнее…

Свиргстин Олег



 

Наверх

Что такое формат PDF? | Конвертер PDF в Word

Что такое формат PDF?

Если файл имеет расширение .pdf, скорее всего это файл формата Portable Document Format (PDF), разработанный Adobe Systems, Inc. PDF файл позволяет просматривать и печатать документ под различными платформами, включая Windows, UNIX и Mac.

Просмотр PDF файлов

Для просмотра PDF файлов необходимо скачать программу Adobe® Acrobat® Reader, которая является бесплатной и служит для просмотра и печати файлов формата Adobe Portable Document Format (PDF) в наиболее распространенных операционных системах и платформах.

PDF Navigation Features

Certain features built into the PDF specification allow authors to expand the usefulness of a document. For example, you can add bookmarks, thumbnails of each page, internal and external links, form fields, article threads, buttons for navigation, notes to annotate information, and views to magnify or reduce a page to fit within the user’s computer screen. PDF allows users to magnify up to 800% on screen with no loss of clarity.

PDF Size and Performance

For the Web, smaller files are better since download time depends on file size. PDF files can be optimized to reduce file sizes and can create files up to 80% smaller than their HTML counterparts.

PDF files can be «linearized» to allow the user to start viewing the document before it is fully downloaded, similar to the process used to deliver streaming video over the internet.

PDF can be interwoven seamlessly into most Web sites. This combination of HTML and PDF formats enables authors to serve content in its most appropriate format based on the demands of content versus technology. Also, on most popular Web servers there is no compression, translation, or filtering penalty for serving PDF files.

PDF Security

PDF has a well-established security feature set. Authors of PDF files can prevent users from editing, printing, and/or copying content (text and graphics). Software developers can create their own software to read, create, or modify PDF files without special permission or licensing. The only condition that Adobe insists on is that the document author’s PDF security settings be respected.

что это и чем открыть? Какой программой открыть файл pdf?

Иногда у пользователя есть интересный документ, информация в котором очень нужна, но прочитать ее не удается. Ведь документ имеет формат pdf, наличие которого, вызывает панический страх. Не пугайтесь, все просто. Чтобы на экране, вместо кракозябр, появилась читаемое изображение, нужно просто уметь правильно открывать файлы этого типа.

Что такое PDF формат?

PDF (Portable Document Format) – это особый формат электронных документов, созданный компанией Adobe System. Если дословно расшифровать и перевести аббревиатуру, то мы получим – Формат Переносимого Документа. На самом деле такие файлы – это не что иное, как снимки документов. Поэтому возможности редактирования для них не предусмотрены. Тем не менее, использование pdf-файлов довольно распространено. Многие электронные журналы, книги и учебники имеют именно этот формат. Такие файлы могут содержать и текст, и изображения.

Чем открыть PDF файлы?

Открыть документы с форматом pdf в обычных текстовых редакторах невозможно. Придется устанавливать на компьютер дополнительные программы. К слову, подобного софта в сети предоставлено большое количество. Самые популярные программы для открытия pdf-файлов: Adobe (Acrobat) Reader, PDF-Viewer, STDUViewer, STDU Viewer, Foxit Reader. Все они бесплатны для пользователей, а пользоваться ими совершенно несложно. Давайте познакомимся с этими программами поближе.

Adobe (Acrobat) Reader

Начну, пожалуй, с самой известной программы — Adobe (Acrobat) Reader. Благодаря софту, пользователь получает полный спектр всех необходимых функций для просмотра pdf-файлов.

Если программа уже установлена на компьютере, то при попытке открыть документ с форматом pdf, она запускается автоматически. Т.е. файл сразу открывается в редакторе Adobe (Acrobat) Reader.

Можно сразу запустить программу и открыть документ уже с помощью ее меню.

Итак, запускаем Adobe (Acrobat) Reader. Нажимаем на пункт меню «Файл», в открывшемся меню выбираем «Открыть»:

Появится окно, в котором представлен перечень файлов, хранящихся на компьютере. Ищем наш pdf-документ, который нужно открыть, и жмем «Открыть»

После этого мы видим на экране наш файл:

PDF-Viewer

PDF-XChange Viewer – бесплатный софт, который предоставляет возможность не только просматривать pdf-документы, но и совершать манипуляции с его содержимым. С его помощью мы можем преобразить наш файл в другой формат – JPEG, BMP, PNG или TIFF.

Итак, запускаем программу. Клацаем мышкой по пустому полю. Или нажимаем в строке меню кнопку «Открыть»:

В появившемся окошке находим нужный нам файл с форматом pdf, выделяем его и жмем кнопку «Открыть». Обратите внимание на приятную возможность этой программы. Возле окошка с файлами высветилась информация о выбранном документе. Полезный бонус от софта.

После нажатия кнопки «Открыть» мы получаем наш документ в читаемом виде:

STDU Viewer

Программа STDU Viewer отличается высокой скоростью обработки документов и маленьким объемом требуемого места на диске – чуть больше 2 Мб. Поэтому она является фаворитом у многих пользователей. Пользоваться софтом очень легко.

Запускаем программу. В меню выбираем «Файл/Открыть» или просто кликаем мышкой по свободному полю:

Ищем в открывшемся окошке название документа, который нужно просмотреть и жмем «Открыть»:

Вот он и наш файл:

Foxit Reader.

Foxit Reader – тоже довольно популярная программа для работы с pdf-документами. Минус – она англоязычная. Хотя разобраться с ней совсем несложно, к тому же можно дополнительно скачать к ней русификатор, который переведет каждый пункт меню. Этот софт отлично работает даже на самых маломощных компьютерах.

Итак, запускаем программу. Появляется окно, в котором софт предлагает выбрать наиболее удобный вариант меню. Я выбрал первый. Жмем «ОК»:

Программка открылась. Выбираем пункт «File/Open»:

Ищем в появившемся окне pdf-документ, который нужно просмотреть и клацаем по кнопке «Открыть»:

Все, можно просматривать наш файл:

Как вы смогли убедиться, все упомянутые программы открывают файлы в pdf-формате по одному алгоритму. Все действия занимают буквально несколько секунд. Какой софт выбрать – решать вам. Каждая из этих программ достойна внимания.

Удачи вам. Пусть всегда, все нужные вам файлы, открываются только в читаемом виде.

PDF/X: подарок, которого ждали

Всё чаще в публикациях, посвящённых допечатной подготовке, стала появляться доселе незнакомая аббревиатура PDF/X. И хотя в ней угадывается родство с PDF, это не снимает закономерный вопрос: зачем издательской индустрии понадобился ещё один формат?

Чтобы разобраться, давайте вспомним историю. Как известно, изначальное предназначение Portable Document Format (PDF) — быть межплатформенным средством для обмена документацией. Именно эту цель преследовал исполнительный директор Adobe Systems Джон Ворнок, когда в 1991 г. осознал необходимость разработки универсального формата для документов (тем, кто хочет ознакомиться с аргументами мэтра, рекомендую познавательную статью по адресу http://www.planetpdf.com/ mainpage.asp?webpageid=1851). У компании уже была интересная разработка — язык описания страниц PostScript, под управлением которого вполне успешно работали лазерные принтеры и ФНА, эксплуатировавшиеся на всех существовавших платформах. Этот язык и был взят за основу нового формата.

Следовательно, PDF был нацелен, в первую очередь, на корпоративный рынок, больше всего страдавший от проблем с открытием документов, созданных в различных программах. Разработка была быстро взята на вооружение, и время, которое армия клерков ранее тратила на эту примитивную операцию, стало расходоваться более эффективно.

Итак, PDF был совершенно не предназначен для использования в полиграфии. Позже Adobe адаптировала его под нужды печатающей братии, и ныне формат всё чаще выступает как альтернатива традиционным способам. Оценивая сегодняшнее положение PDF, можно констатировать, что он состоялся именно как межплатформенное средство обмена цифровой информацией. «Сваяв» своё творение в любом пакете, каждый через PDF может сохранить его для всемирной истории, сделав доступным для просмотра, архивации, поиска из любой среды, в т. ч. и поисковыми машинами Интернета. Замечательно!

Несколько иная картина вырисовывается, если отдать это творение для печати. Как правило, люди малознакомые с полиграфией не могут создать PDF так, чтобы в итоге получилось именно то, что они хотели. Налицо конфликтная ситуация.

PDF стал неотъемлемой частью процесса допечатной подготовки благодаря предсказуемости результатов. Корректно созданные файлы невелики по размеру и быстро выводятся на печать. Однако PDF может содержать чуждые для препресса элементы (аннотации, комментарии, изображения в модели RGB), бывает, отсутствуют шрифты. Приведённый пример показывает: то, что файл имеет расширение PDF, ещё ни о чём не говорит, — кто знает, как его делали? Разумеется, в таком случае ничего хорошего на печати ожидать не приходится.

Во избежание подобных недоразумений и была введена отдельная спецификация формата — PDF/Х, описывающая требования исключительно для допечатной подготовки. Предполагается, что его использование позволит ввести в обиход издательского сообщества понятие blind exchange («слепой обмен», или «без входного контроля»).

Разновидности PDF/X

PDF/Х разработан Комитетом по стандартизации графических технологий (CGATS) при Американском институте национальных стандартов (ANSI) и основывается на спецификации Adobe формата PDF. Фактически, это не один стандарт, а целых три: PDF/Х-1, PDF/Х-2, PDF/Х-3. Первоначальная редакция PDF/Х-1 (PDF/Х-1:1999, основана на спецификации PDF 1.2) исключала использование цветов RGB, аннотаций, полей электронных форм и комментариев. Это упростило процедуру приёма PDF и сократило время запуска их в работу, гарантировав надлежащее качество.

Паспорт документа: к печати годен!

Редакция PDF/Х-1:2001 появилась после выхода Acrobat 4 и стала поддерживать возможности новой спецификации PDF 1.3. Самая поздняя из семейства PDF/Х-1 — редакция PDF/Х-1а, в ней запрещено использование OPI (Open Prepress Interface) и шифрование (encryption). Таким образом, PDF/Х-1 является базовым форматом, принятым издательской индустрией в качестве стандарта.

Настройки параметров PDF/X-1а в Enfocus PitStop

Но жизнь вносит свои коррективы… Дело в том, что поддержка исключительно CMYK и Duotone накладывает определённые ограничения на применение PDF/Х-1а. Многие, особенно крупные издательства, предпочитают изображения в модели sRGB. Тогда, в отличие от CMYK (строго привязанного к определённому типу бумаги, растискиванию растровой точки и прочим меняющимся параметрам), при помощи ICC-профилей можно учитывать особенности допечатных и печатных процессов, следовательно, при любых условиях получать оттиски наилучшего качества.

Эти поправки и составили основу стандарта PDF/Х-2, который отличается от предшественника гораздо меньшей «дисциплинированностью». Он поддерживает цветовую модель LAB, управление цветом с помощью профилей ICC, разрешает применение OPI и даже допускает отсутствие внедрённых шрифтов. Базируясь на спецификации PDF 1.4, позволяет использовать полупрозрачные объекты.

В общем, получился довольно гибкий формат, ориентированный исключительно на профессионалов. Однако «техника в руках дикаря — груда металла». Представив, сколько проблем возникнет, когда он попадёт к не самым компетентным людям, учёные мужи разработали промежуточный вариант между PDF/Х-2 и PDF/Х-1а (ближе к последнему). Кроме возможностей, поддерживаемых PDF/Х-1 (и, конечно же, прозрачности), по стандарту PDF/Х-3 позволено использовать палитру LAB с цветокорректирующими профилями. Поскольку утверждён совсем недавно, он только начинает распространяться.

Создание PDF/X

Самый удобный способ создать PDF/X-совместимый документ — использовать Acrobat 6.0 Professional. Acrobat Distiller может создавать файлы по стандартам PDF/X1-a и PDF/X-3 (необходимый тип выбирается из предустановок программы Adobe PDF Settings). В процессе создания файлов Distiller проверяет полученный PostScript на соответствие принятым нормам. При полном их соблюдении в документ дописывается соответствующая информация. Если PDF, удовлетворяющий выбранному стандарту, из PostScript создать невозможно, Distiller прекращает работу и в отчёте (log file) перечисляет все обнаруженные проблемы.

Кроме Adobe, продукты, создающие PDF/X-совместимые документы, выпустили все известные игроки рынка: Agfa (Apogee Series 3), Apago, Callas, CGS, Creo, Dalim, Fujidilm, Global Graphics и Heidelberg.

Удостовериться, что перед вами действительно PDF, получивший «добро» на печать, можно в Acrobat. Например, при использовании его пятой версии и Enfocus PitStop достаточно зайти в меню Certified PDF/Show Status. У Acrobat 6.0 Professional соответствующая информация находится в Document/Preflight/Validate.

Несмотря на то, что формирование PDF согласно новым спецификациям гарантирует корректное цветоделение, от некачественного результата PDF/X не убережёт (низкое разрешение, ошибки с overprint и т. п.). Поэтому анализ файлов средствами предварительной проверки — такая же неотъемлемая процедура, как и для любых других, подготовленных к выводу.

В Acrobat 6.0 Professional проверка выполняется из меню Document/Preflight. Сначала выбирается определённый профиль, а после завершения инспекции появляется окно с её результатами. Объект, вызвавший проблему (пометки красными символами), можно просмотреть, дважды щёлкнув на её описании. При этом Acrobat перейдёт на необходимую страницу и вокруг некорректного элемента появится красная прерывистая рамка. Если проблем не обнаружено, тут же из исходного файла можно сделать PDF/X-совместимый (Save as PDF/X). Затем желательно готовый файл снабдить сертификатом подлинности (Validate) — это избавит персонал сервисного бюро от траты времени на его очередную инспекцию. В файл дописывается информация о результатах проверки, выбранном профиле и дате проверки.

Выводы

PDF/X, являясь подмножеством PDF, обезопасит всех участников технологической цепочки допечатной подготовки от гипотетической головной боли. Он должен придти на смену существующему способу генерации PDF, когда сервисные бюро сохраняют требуемые настройки Distiller (Job options) в виде файла (*.joboptions) и затем распространяют их всем клиентам, ориентирующимся на использование этого формата. О широких перспективах PDF/X свидетельствует тот факт, что в недавно вышедшем Adobe InDesign CS уже присутствуют опции для создания публикаций по обеим спецификациям (PDF/Х-1а и PDF/Х-3).

8 типов стандартов PDF — каждый служит уникальной цели

PDF, переносимый формат документов, является отраслевым стандартом для обмена и печати документов. Каждый документ, преобразованный в PDF или сохраненный в формате PDF, может быть сохранен как определенный стандарт; в зависимости от того, какой стандарт вы сохраняете файл, будет зависеть цель, для которой он был создан. Если вы сохраните неправильный стандарт, у вас могут возникнуть проблемы при попытке распечатать, поделиться или архивировать файлы сейчас или в будущем.

Понимание стандартов PDF

Всего существует восемь стандартов PDF; шесть стандартов ISO и два от других организаций.

Шесть типов стандартов PDF из ISO

ISO — это Международная организация по стандартизации, которая выдает сертификаты для продуктов, соответствующих их стандартам во многих отраслях промышленности, включая документы в формате PDF. Они устанавливают стандарты, основанные на строгом процессе сертификации, чтобы гарантировать качество, надежность и универсальность. Каждый стандарт PDF от ISO имеет гарантированное качество, основанное на определенных обстоятельствах. Итак, какой стандарт вы будете использовать, будет определяться набором обстоятельств вашего документа — как ваш PDF-файл будет храниться, просматриваться, совместно использоваться, печататься и т. Д.

  1. PDF — этого общего стандарта PDF достаточно для использования в офисе, совместного использования и просмотра в Интернете, а также для документов стандартного качества.
  2. PDF / A — этот стандарт был разработан для долгосрочного хранения файлов, обычно используется архивариусами, менеджерами по документации и менеджерами по соблюдению нормативных требований. Он имеет ограниченный набор функций, включая JavaScript, аудио и видео контент и шифрование, потому что они могут запретить пользователям открывать и просматривать точно в будущем.
  3. PDF / E — этот стандарт чаще всего используют архитекторы, инженеры, специалисты по строительству и производственные группы.Согласно Planet PDF, «этот стандарт был предназначен для решения ключевых проблем в областях широкоформатных чертежей, мультимедиа, полей форм и управления правами — и это лишь некоторые из них, — которые могут помешать инженерному сообществу использовать PDF в своих рабочих процессах».
  4. PDF / X — этот стандарт лучше всего подходит профессионалам печати, графическим дизайнерам и творческим профессионалам. При использовании этого стандарта можно ожидать высококачественных документов профессионального уровня. Этот стандарт PDF обеспечивает готовность документов к печати за счет правильного встраивания шрифтов, изображений, цветовых профилей и прочего.
  5. PDF / UA — Этот стандарт повышает удобство чтения для людей с ограниченными возможностями, ИТ-менеджеров в государственных или коммерческих предприятиях и менеджеров по соблюдению нормативных требований. UA означает универсальный доступ; этот стандарт будет работать со вспомогательными технологиями, которые помогают пользователям в чтении и навигации.
  6. PDF / VT — профессионалы печати также будут использовать этот стандарт для документов. Этот стандарт основан на компонентах стандарта PDF / X, что позволяет поддерживать некоторые функции, такие как цветовые профили, слои и прозрачность.Самым большим дополнением является возможность настраивать данные в этих файлах, такие как банковские выписки, бизнес-счета или персонализированные маркетинговые материалы.

Два типа стандартов PDF от других организаций

Дополнительные организации приняли стандарты для своих конкретных требований к документам.

  1. PAdES — Стандартизация безопасных безбумажных транзакций в соответствии с европейским законодательством. Этот стандарт был установлен для цифровых подписей PDF в ЕС.
  2. PDF Healthcare — согласно Acrobat, этот стандарт «предоставляет передовой опыт и рекомендации по внедрению для облегчения сбора, обмена, сохранения и защиты медицинской информации. Следование этим рекомендациям обеспечивает более безопасный электронный контейнер, который может хранить и передавать медицинскую информацию, включая личные документы, XML-данные, изображения и данные DICOM, клинические заметки, лабораторные отчеты, электронные формы, сканированные изображения, фотографии, цифровые рентгеновские снимки и ЭКГ ».

Знание ваших параметров PDF оптимизирует качество вашего документа, если у вас есть определенные цели просмотра, совместного использования, печати или архивирования документа.Если вам нужна дополнительная информация о печати высококачественных PDF-файлов (PDF / X), загляните в нашу статью о предварительных настройках PDF в ближайшее время.

Источники:

http://acroeng.adobe.com/wp/?page_id=303
https://www.eldos.com/security/articles/6963.php
http://www.planetpdf.com/enterprise/article. asp? ContentID = PDF_Standards
http://www.pdflib.com/knowledge-base/pdfvt/
http://www.businessknowledgesource.com/manufacturing/what_are_iso_standards_027120.html

PDF (Portable Document Format) Семейство

Общие

Максимальный размер PDF-файлов : Эта тема обсуждалась на ряде онлайн-форумов.На одном из форумов Adobe в ответ на вопрос 2012 года «Есть ли ограничение на размер PDF?» Описан очень высокий теоретический предел количества страниц: «Явного ограничения количества страниц нет, но есть ограничение на косвенные объекты в 8 388 607 из 32 -битное приложение для рендеринга PDF — Acrobat и Adobe Reader представляют собой 32-битный код, и поскольку каждая страница использует как минимум один косвенный объект, каждый PDF-файл, созданный или открытый Acrobat, должен содержать меньше страниц, чем это. создать собственное приложение PDF x64, вы могли бы добавить больше страниц, но полученные файлы вообще не открывались бы в 32-разрядных приложениях.В этой записи форума говорится: «С архитектурной точки зрения в стандарте PDF есть только одно ограничение: общий размер файла должен быть ниже ~ 10 ГБ, поскольку таблицы перекрестных ссылок, определяющие структуру PDF, используют 10 бит».

Предыдущий абзац дает подробное представление о возможном размере PDF-файла. Многие комментаторы утверждают, что предел практичности ниже, чем указано выше. Важно то, можете ли вы открыть данный PDF-файл в любом подходящем приложении, включая Acrobat и Adobe Reader, упомянутые выше.Интернет-форумы также включают отчеты, подобные этим примерам: «Похоже, что у iPad есть ограничение в 30 МБ для отображения файлов PDF» и «пользователи GoodReader сообщили о безупречной производительности с файлами размером более 1 гигабайт». Практические ограничения, накладываемые приложениями, могут также включать ограничения, устанавливаемые индексаторами, если PDF-файл содержит доступный для поиска текст.

Самоидентификация хронологических версий PDF : Идентификация хронологических версий PDF может быть дана в двух местах в файле PDF.Все файлы PDF должны иметь версию, указанную в заголовке с помощью 5 символов % PDF– , за которыми следует номер версии в форме 1.N, где N — это цифра от 0 до 7 или номер версии 2.0. Например, PDF 1.7 будет идентифицирован как % PDF – 1.7 . Однако, начиная с PDF 1.4, соответствующий писатель PDF может использовать запись Версия в Каталоге документа, чтобы переопределить версию, указанную в заголовке. Расположение Каталога в файле указано в корневой записи концевого / нижнего колонтитула файла.Эта функция переопределения была введена для облегчения постепенного обновления PDF-файла путем простого добавления в конец файла. В результате необходимо найти Каталог в файле, чтобы получить правильный номер версии. Если PDF не является «линеаризованным», и в этом случае Каталог находится впереди, для этого потребуется прочитать трейлер, а затем использовать ссылку там, чтобы найти Каталог, который обычно будет сжат. Это имеет практическое значение, поскольку инструменты идентификации формата, включая DROID, обычно ищут определенные символы в начале файла (т.е.е., в заголовке), чтобы позволить идентификацию с минимальными усилиями. DROID может искать символы в конце файла, но не может следить за косвенной ссылкой или распаковывать содержимое файла. Если номер версии в заголовке и в Каталоге не совпадает, существует вероятность ошибок идентификации формата.

Сжатие «объектов потока» в файлах PDF. : Объекты потока в файле PDF часто сжимаются. Для файлов PDF поддерживается ряд схем сжатия, обозначенных значениями фильтра, определенными в спецификации.Имена фильтров соответствуют декодированию / распаковке, которые необходимо применить для восстановления исходных данных. Фильтры можно объединять в конвейеры. Перечисленные ниже фильтры разрешены в общих файлах PDF. Однако некоторые фильтры не разрешены в «подмножествах стандартов для PDF», таких как PDF / A, PDF / X и PDF / E.

  • ASCIIHexDecode: данные, закодированные в шестнадцатеричном представлении ASCII. Этот фильтр был разработан для Postscript в то время, когда было полезно преобразовать двоичные данные в представление, которое можно было безопасно использовать в почтовых сообщениях.Двоичные данные можно преобразовать в ASCII, представив каждый байт двоичных данных в виде двух шестнадцатеричных цифр ASCII (0–9 и либо A – For a – f). Символы новой строки добавляются в закодированный вывод не реже одного раза через каждые 80 символов, тем самым ограничивая длину строк. Полученные данные были вдвое больше, чем исходная двоичная форма. См. Справочник по языку PostScript, 3-е издание.
  • ASCII85Decode: данные, закодированные в представлении ASCII base-85. Этот фильтр также использовался в PostScript и был предпочтительнее ASCIIHexDecode, поскольку он давал файлы меньшего размера.Обычно для каждых 4 байтов двоичных данных эта схема сжатия производит 5 печатаемых символов ASCII. ASCII85 — это схема кодирования, используемая программами uuencode и uudecode, доступными в системах UNIX. См. Справочник по языку PostScript, 3-е издание.
  • LZWDecode: данные, закодированные с использованием сжатия LZW (Lempel-Ziv-Welch). LZW — это метод адаптивного сжатия переменной длины без потерь, который можно применять к любой форме данных. LZW поддерживается в формате изображения TIFF 6.0. До 2004 года он был защищен патентом.
  • FlateDecode: данные, закодированные с использованием ZLIB / DEFLATE метод сжатия, определенный в IETF RFC 1950 и IETF RFC 1951. Подобно LZW, он имел то преимущество, что не имел патентов. Разрешено для PDF 1.2 и выше. Наиболее часто используемый метод сжатия текстового содержимого PDF-файлов.
  • RunLengthDecode: данные, закодированные с использованием байтовой длины серии алгоритм кодирования. См. Запись в Википедии о кодировании длин серий.
  • CCITTFaxDecode: данные, закодированные с использованием стандарта факсимильной связи CCITT (теперь ITU-T) Group 3 или Group 4.Используется для данных монохромного изображения при 1 бит на пиксель. См. Сжатие факсов группы 4 ITU-T.
  • JBIG2Decode: данные, закодированные с использованием стандарта JBIG2, как определено в ISO / IEC 14492: 2001 и его поправках 1 и 2, за исключением поправка 3. Используется для данных монохромного (1 бит на пиксель) изображения. Разрешено для PDF 1.4 и выше. См. Запись в Википедии о JBIG2.
  • DCTDecode: данные, закодированные с использованием DCT (дискретный косинус transform) на основе стандарта JPEG. Базовое кодирование JPEG разрешено для всех хронологических версий PDF.Для PDF 1.3 и более поздних версий разрешено кодирование Progressive JPEG. См. JPEG_DCT_BL и JPEG_DCT_PRG.
  • JPXDecode: данные, закодированные с использованием сжатия JPEG 2000 метод и структура данных JPX, как определено в ISO / IEC 15444-2. Разрешено для PDF 1.5 и выше. Данные, используемые в изображениях PDF XObjects, должны быть ограничены базовым набором функций JPX. Нумерованное цветовое пространство 19 (CIEJab) не поддерживается. Однако нумерованное цветовое пространство 12 (CMYK), которое является частью JPX, но не базовый формат JPX, разрешен в PDF.

Фильтр Crypt (представленный в PDF 1.5) может использоваться для определения алгоритма шифрования, который был применен к потоку данных. Многие алгоритмы шифрования, поддерживаемые в более ранних хронологических версиях PDF, теперь устарели.

PDF с тегами : Концепция PDF с тегами была введена в PDF 1.4. В дополнение к дереву содержимого, которое является частью любого PDF-файла, PDF-файл с тегами также имеет дерево структуры. Теги обеспечивают логическую структуру, которая управляет представлением содержимого документа с помощью вспомогательных технологий.Каждый тег идентифицирует связанный элемент содержимого, например абзац

, заголовок третьего уровня

, элемент списка

  • , изображение
    или ячейку данных таблицы
  • . Порядок тегов определяет порядок чтения. Справочник PDF (третье издание), который определяет PDF 1.4, указывает, что Tagged PDF представляет собой стилизованное использование PDF, в котором используется набор стандартных типов структур и атрибутов, которые позволяют извлекать содержимое страницы (текст, графику и изображения) и повторно используется для других целей.PDF-файлы с тегами следуют набору правил для представления текста в содержимом страницы, чтобы символы, слова и порядок текста может быть надежно определен для использования инструментами, выполняющими такие операции, как:

    • Простое извлечение текста и графики для вставки в другие приложения
    • Автоматическая перекомпоновка текста и связанной графики, чтобы соответствовать размеру страницы, отличной от предполагаемой для исходного макета
    • Обработка текста для таких целей, как поиск, индексирование и проверка орфографии
    • Преобразование в другие распространенные форматы файлов (например, HTML, XML и RTF) с сохранением структуры документа и базовой информации о стилях
    • Обеспечение доступа к контенту для слабовидящих

    Многие файлы PDF создаются с помощью «печати в PDF» или других методов, которые не позволяют создавать структуры тегов.Как правило, логическая структура документа представлена ​​в файле PDF только в том случае, если создатель или процесс во время создания предпринимают шаги для включения структурных тегов. См. Что такое PDF с тегами? из 2004 г., в котором Дафф Джонсон сказал: «Теги могут быть созданы автоматически для любого PDF-файла с помощью Acrobat 6.0 Professional, но если документ действительно не очень прост, автоматическая установка тегов вряд ли даст удовлетворительные результаты и, конечно, не поможет быстро. исправить для соответствия Разделу 508.«Некоторые приложения, для которых собственный формат по своей природе структурирован соответствующим образом, имеют специализированный экспорт, который может создавать файлы PDF с тегами, которые представляют эту структуру. Например, согласно описанию экспорта в PDF с расширенными возможностями из Framemaker (программное обеспечение для настольных издательских систем)», — предоставляет Adobe PDF с тегами следующие возможности:

    • Обеспечивает правильный порядок чтения информации на странице.
    • Включает атрибуты абзаца, используемые для правильного преобразования содержимого документа в устройства разного размера, например устройства для чтения электронных книг.
    • Обеспечивает надежный перевод текста в Unicode. Этот подход распознает лигатуры и дефисы, поэтому программа чтения с экрана Windows может правильно читать все символы и слова.
    • Распознает альтернативные текстовые описания для графики в закрепленных фреймах.
    • Позволяет более надежно экспортировать документ в формат RTF и XML из Acrobat 7.0 для повторного использования в других документах.

    Руководство по специальным возможностям с использованием Adobe InDesign побуждает пользователей «применять специальные возможности в вашем документе InDesign, вместо того, чтобы вносить серьезные изменения в программное обеспечение Adobe Acrobat.Теги PDF, альтернативные теги и порядок содержимого, который вы назначаете, остаются в документе, когда вы его редактируете «.

    Руководство по передовой практике PDF с тегами: синтаксис, выпущенное в 2019 году Технической рабочей группой PDF / UA (PDF / UA TWG), содержит подробное руководство, направленное на доступность.

    PDF_1_4, PDF Версия 1.4

    Общие

    Обозначение хронологических версий PDF может быть дано в двух местах в файле PDF.Все файлы PDF должны иметь версию, указанную в заголовке с помощью 5 символов % PDF– , за которыми следует номер версии. Для файлов PDF, соответствующих стандарту ISO 32000-1: 2008 или более ранней версии (т.е. до ISO 32000-2: 2017), номер версии имеет вид 1.N, где N — цифра от 0 до 7. Например, PDF 1.4 идентифицируется как % PDF – 1.4 . Однако, начиная с PDF 1.4, соответствующий писатель PDF может использовать запись Версия в Каталоге документа, чтобы переопределить версию, указанную в заголовке.Расположение Каталога в файле указано в корневой записи концевого / нижнего колонтитула файла. Эта функция переопределения была введена для облегчения постепенного обновления PDF-файла путем простого добавления в конец файла. В результате необходимо найти Каталог в файле, чтобы получить правильный номер версии. Если PDF не является «линеаризованным», и в этом случае Каталог находится впереди, для этого потребуется прочитать трейлер, а затем использовать ссылку там, чтобы найти Каталог, который обычно будет сжат.Это имеет практическое значение, поскольку инструменты идентификации формата, включая DROID, обычно ищут определенные символы в начале файла (т. Е. В заголовке), чтобы обеспечить идентификацию с минимальными усилиями. DROID может искать символы в конце файла, но не может следить за косвенной ссылкой или распаковывать содержимое файла. Если номер версии в заголовке и в Каталоге не совпадает, существует вероятность ошибок идентификации формата.

    Знакомство с форматом файлов PDF

    Как хранятся изображения?

    Когда я изучал формат файла PDF, я обнаружил, что изображения могут быть довольно сложной темой в PDF, поэтому я написал эту статью, чтобы, надеюсь, объяснить их ясно.Пожалуйста, дайте мне знать, если у вас есть предложения по его улучшению или у вас возникнут какие-либо вопросы.

    Файл PDF обычно хранит изображение как отдельный объект (XObject), который содержит необработанные двоичные данные для изображения. Все они перечислены в объекте ресурсов для страницы или файла, и у каждого есть имя (например, Im1). Неправильно думать об изображениях, встроенных в PDF, как об изображениях в форматах Tif, Gif, Bmp, Jpeg или Png. Они не.

    Важно понимать, что это обычно не изображение в смысле изображения Tif, Jpg или Png — это двоичные данные для пикселей, цветовое пространство, используемое для изображения, информация об изображении.Изображение разрывается при создании PDF-файла, и разные инструменты для создания PDF-файлов могут сохранять одно и то же изображение по-разному.

    Вот пример, показанный в программе просмотра объектов PDF в Acrobat 9

    Иногда необработанные данные изображения корректируются до требуемого размера, необходимого для страницы, а иногда нет — в этом случае масштаб увеличивается или уменьшается, когда он нарисован — разные инструменты для создания PDF-файлов создают PDF-файлы по-разному.

    Фактические данные пикселей могут быть сжаты, и один из форматов сжатия (DCTDecode) тот же, что и в JPEG (JPX такой же, как Jpeg2000).Если вы сохраните эти данные, их можно будет открыть как файл JPEG, но может потребоваться их изменение, чтобы включить данные о цветовом пространстве.

    Это изображение затем рисуется в потоке содержимого PDF с помощью команды DO и имени изображения (например, Im1). Изображение можно использовать несколько раз, масштабировать, поворачивать или обрезать — он принимает любые значения, установленные при выполнении команды DO. Некоторые вещи, которые воспринимаются глазом как изображение, также могут состоять из нескольких изображений или даже не состоять из изображений!

    Все это означает, что если вы хотите извлечь изображения из PDF, вам необходимо собрать изображение из всех необработанных данных — оно не сохраняется как полный файл изображения, который вы можете просто извлечь.

    А также есть «сырая» (которая иногда имеет гораздо более высокое качество, а иногда и тот же размер) версия изображения и обрезанная / масштабированная версия изображения — оба могут быть извлечены (и вы также можете масштабировать закрепить на RAW, чтобы получить изображение более высокого качества — см. этот пример извлечения обрезанного изображения PDF).

    Как и все, что касается PDF, существует большая гибкость и множество альтернатив и опций…

    Этот пост является частью нашей серии «Знакомство с форматом файлов PDF».В каждой статье мы стремимся взять конкретную функцию PDF и объяснить ее простым языком. Если вы хотите узнать больше о PDF, мы обладаем 13-летним опытом работы с PDF и советами, поэтому нажмите здесь, чтобы перейти к индексу нашей серии!

    Наше руководство для разработчиков содержит большое количество технических статей, которые помогут вам понять формат файла PDF.

    Использование PDF / A в качестве формата сохранения

    PDF / A (или Portable Document Format Archival) — это формат, разработанный в качестве формата для сохранения цифровых записей, особенно документов.Однако этот формат также можно использовать для отсканированных документов. Это международный стандарт и подмножество формата PDF. Одно из главных достоинств форматов PDF заключается в том, что они являются открытыми стандартами, широко используются во всем мире и предназначены для записи изображений и машиночитаемого текста в один документ.

    PDF / A может использоваться для хранения многих типов записей, но наиболее ценен как формат для хранения долговременных копий цифровых текстовых документов, таких как файлы Microsoft Word. Когда вы конвертируете такой файл в PDF / A, полученный файл сохраняет внешний вид исходного документа.Каждая страница исходного документа отображается как отдельная страница в файле сохранения, в обоих документах используются одни и те же шрифты, и вы можете искать текст в PDF / A так же, как и в оригинале. Если документ цветной, значит, цвет тоже есть. По этим причинам PDF / A является хорошим форматом в тех случаях, когда внешний вид документа имеет значение для его интерпретации и понимания.

    Другие цифровые файлы также могут быть преобразованы в PDF / A, включая обычные PDF-файлы, электронную почту, цифровые изображения и электронные таблицы.Вы даже можете преобразовать последовательность цифровых изображений в один PDF / A. Любой цифровой файл, который можно распечатать, можно преобразовать в PDF / A, хотя для некоторых документов этот формат лучше, чем для других. Формат лучше всего подходит для статических файлов, которые не меняются. Это не подходит для файлов, которые постоянно находятся в движении, например, для баз данных.

    Бумажные документы также можно преобразовать в PDF / A во время сканирования, но в этом случае будет лучше, если вы также воспользуетесь программой оптического распознавания символов (OCR) для преобразования изображений букв в документе в электронный текст.Однако всякий раз, когда вы OCR документ, в преобразованном тексте будут ошибки данных. (Рекомендации по сканированию и распознаванию текстовых документов см. В Руководстве по обработке цифровых изображений Государственного архива за 2013 год.)

    PDF / A имеет много преимуществ как формат файла для хранения записей с длительными или постоянными сроками хранения. Если вы рассматриваете другие форматы цифровых файлов как варианты для длительного или постоянного хранения, сравните их преимущества с преимуществами PDF / A. Приведенные ниже преимущества PDF / A послужат контрольным списком функций, необходимых для любого формата сохранения.Обратите внимание, что вы найдете форматы файлов, которые обладают одним или даже несколькими из этих преимуществ, но именно их совокупность делает PDF / A хорошим форматом для сохранения. Microsoft Word, например, широко распространен и долговечен, но в нем отсутствуют другие важные функции, которые сделали бы его кандидатом на долгосрочное хранение записей.

    Не зависит от платформы

    С момента своего создания формат PDF был доступен на всех вычислительных платформах, и формат PDF / A имеет то же преимущество.Это означает, что PDF / A, созданный в среде Windows, будет прекрасно читаться и использоваться в среде Mac или наоборот.

    Вездесущий

    Нечто повсеместное — это то, что можно найти повсюду, а форматы PDF и PDF / A используются сотнями миллионов людей во всем мире каждый день. Ценность такого универсального использования PDF в том, что это означает, что он вряд ли исчезнет как формат в ближайшее время. Кроме того, поскольку PDF / A — это просто подмножество PDF, любой программный продукт, который может читать PDF, может читать PDF / A.Adobe бесплатно распространяет программное обеспечение Adobe Reader для чтения PDF-файлов, позволяя каждому читать PDF / A без дополнительных затрат на компьютерное оборудование или оборудование. (Его можно загрузить с http://get.adobe.com/reader/.)

    Долговечный

    Формат PDF существует с 1991 года, поэтому вряд ли он скоро исчезнет. Опять же, пока существует PDF, PDF / As будет легко читать и использовать.

    Вспомогательные метаданные

    Чтобы понять цифровой файл, вам часто требуются хорошие метаданные, чтобы дать ему контекст.Эти метаданные могут включать много информации, например имя автора и дату создания файла. Для цифровых файлов метаданные часто хранятся в самом файле, поэтому важно иметь возможность сохранять эти метаданные (и даже добавлять к ним) при преобразовании одного цифрового файла в другой. PDF / A специально разработан для поддержки расширенных метаданных.

    Поддержка идеального преобразования

    Цель любой программы преобразования, даже микрофильмирования и сканирования, — создать новую запись, максимально похожую на оригинал.PDF / A предназначен для многого в этой области: он сохраняет внешний вид и возможность поиска исходного файла и требует, чтобы исходные шрифты, цвета и макет сохранялись в создаваемом вами PDF / A. Формат PDF / A делает это, будучи самодостаточным, то есть сохраняя в самом файле всю информацию, необходимую для отображения документа. (Сюда входят шрифты и определения цвета, которые не всегда сохраняются в других форматах файлов.)

    Открыть

    Открытый формат файла — это формат, в котором спецификации доступны для всех и где каждый может использовать эти спецификации для разработки программного продукта для создания и чтения файлового формата.PDF / A всегда был стандартом хранения с момента его первоначального выпуска в 2005 году, поэтому он явно соответствует этому критерию.

    Поддерживает подлинность

    В цифровом мире, даже в большей степени, чем в аналоговом, важно гарантировать, чтобы записи сохраняли эту аутентичность, чтобы они не изменялись после их создания, чтобы они не содержали информацию, отличную от той, которую они изначально содержали. Ни один формат файла сам по себе не может гарантировать аутентичность, но PDF / A поддерживает аутентичность, поскольку его сложно (хотя и возможно) изменять и обеспечивая безопасность документа (например, цифровые подписи).

    Расширяемый

    Все это расширяемое означает, что читаемость цифрового файла будет расширяться в будущем, что файл не станет нечитаемым при изменении программного обеспечения. Стандарт PDF / A разработан таким образом, чтобы самый ранний PDF / A всегда был доступен для чтения в самой последней программе просмотра PDF. Это обеспечивается тем фактом, что каждая версия PDF / A всегда является подмножеством той, которая идет после нее, а это означает, что стандарт PDF / A-3 всегда поддерживает все характеристики исходного PDF / A-1, а также несколько дополнительных функций.

    Хотя PDF / A имеет много преимуществ, у него есть и недостатки. Все цифровые файлы нельзя преобразовать в PDF / A. Иногда это происходит из-за того, что файлы имеют функции, которые запрещены в PDF / A, поскольку не существует известного способа сохранить эти функции с течением времени. К таким файлам относятся документы с аудио- и видеоданными или Javascript. PDF / A также является сложным форматом текста и изображений, и его сложность может стать проблемой в будущем. Наконец, некоторые цифровые файлы или записи просто не подходят для преобразования в PDF / A.Например, можно сохранить веб-сайт в формате PDF / A, но полученный файл будет громоздким и сложным в использовании. Поскольку PDF / As требует встраивания любых шрифтов, используемых в файле, они также могут быть больше, чем обычные PDF-файлы. Несмотря на эти недостатки, PDF / A является хорошим форматом для сохранения большинства цифровых документов.

    Поскольку PDF / A разработан как формат, который со временем расширяет свои возможности, уже существует ряд различных версий PDF / A (PDF / A-1, -2 и -3).Помимо этого, каждое поколение формата имеет разные уровни соответствия, которые указывают степень, в которой каждое из них соответствует высшим целям PDF / A.

    Все версии PDF / A объединены определенным набором поддерживаемых функций, которые в первую очередь можно свести к одной идее: каждый файл PDF / A должен быть самодостаточным, содержать в себе всю информацию, необходимую для читаться как полный файл. Может показаться, что все цифровые файлы самодостаточны, что в каждом из них есть все необходимое, чтобы сделать его читаемым, поскольку он был предназначен для чтения, но это не так.Например, если вы работаете с файлом Microsoft Word на работе, а затем открываете его дома, он может выглядеть совсем иначе: если у вас дома нет того же шрифта, что и на работе, тогда файл Word выберет ближайший шрифт, который он может найти на вашем компьютере. Файл Word не должен хранить в себе шрифты, которые он использует; вместо этого он сохраняет только информацию об используемом шрифте, а затем ищет этот шрифт в любой вычислительной среде, в которой он находится.

    PDF / A, однако, должен встраивать в себя все свои шрифты, чтобы ему никогда не приходилось искать шрифты, которые ему нужны, чтобы полностью раскрыть себя пользователю.Для экономии места в файле будет храниться только необходимое ему подмножество шрифта, поэтому, если в файле нет заглавной буквы X, информация, показывающая этот символ, не сохраняется в файле. PDF / As также должны иметь неограниченное законное использование любых встроенных шрифтов, потому что в противном случае их нельзя будет точно просматривать в будущем. Некоторые шрифты содержат метаданные, которые не позволяют использовать их в PDF-файлах или ограничивают временные рамки, в течение которых шрифт может использоваться на законных основаниях. Если такие шрифты есть в документе, который вы пытаетесь преобразовать в PDF / A, вы не сможете создать из него PDF / A.

    Помимо встроенных шрифтов, PDF / A также нуждается в цвете, независимом от устройства, что означает, что отображение цвета в файле не может зависеть от вычислительного устройства, которое вы использовали для его просмотра. PDF / A имеет один из двух типов цветовой кодировки, чтобы гарантировать независимость устройства. Эти две проблемы, встроенные шрифты и независимый от устройства цвет, являются частью более широкого правила, согласно которому файл PDF / A не может иметь никаких ссылок на внешний контент.

    Также важны для определения PDF / A требования к метаданным.Поскольку PDF / As являются архивными файлами, они должны включать метаданные, описывающие файл, и файл должен идентифицировать себя как PDF / A определенной версии. Поскольку расширение файла для PDF / A такое же, как и для любого типа PDF (все они .pdf), файл должен хранить внутри себя метаданные, которые точно определяют, какая это версия PDF / A.

    PDF / A-1 (2005)

    Стандарт ISO 19005-1: 2005
    На основе ссылки PDF 1.4 (Acrobat 5)

    Самая ранняя версия PDF / A — это PDF / A-1, первая в серии.PDF / A-1 также исключает функции, которые могут быть исключены из серии PDF / A навсегда или, по крайней мере, на долгое время. Поскольку средства сохранения определенного содержимого неизвестны, ни одна версия PDF / A не поддерживает аудио- или видеоконтент, JavaScript или исполняемые файлы, а также 3D-моделирование, все из которых являются сложными формами данных. Шифрование запрещено во всех версиях PDF / A, поскольку оно может стать постоянным препятствием для доступа к архивной записи.

    PDF / A-1 также поддерживает наименьшее количество функций по сравнению с любой версией PDF / A.Он не поддерживает прозрачность (это функция, которая поддерживает создание затенения текста, поскольку средства поддержки прозрачности в долгосрочной перспективе еще не найдены). Эта версия также не поддерживает сжатие JPEG2000 или встроенные файлы, которые поддерживаются во всех последующих версиях.

    Уровень соответствия PDF / A-1a
    Самый высокий уровень соответствия любого PDF / A — это уровень 1a, где «a» означает «доступный». Этот уровень имеет все общие характеристики PDF / A, но также сохраняет логическую структуру документа.Это означает, что PDF / A-1a хранит информацию для сохранения текстового потока (или текстовых потоков) документа в порядке чтения. Например, если вы создадите PDF / A-1a информационного бюллетеня, файл будет знать, как направить вас с одной статьи на первой странице прямо туда, где она продолжается на пятой. Эта функция особенно важна для людей с ослабленным зрением, чьи программы чтения с экрана поймут метаданные в PDF / A-1a и логически проведут их по файлу. PDF / A-1a также должен указывать внутри себя язык, на котором он написан, и должен включать отображение Unicode.Юникод — это расширение ASCII. Там, где ASCII кодирует весь латинский алфавит, Unicode кодирует все системы письма, которые когда-либо существовали, что обеспечивает более точное представление текста в файле.

    Уровень соответствия PDF / A-1b
    Уровень соответствия PDF / A-1b является ступенью ниже уровня 1a. (Буква «b» на этом уровне означает «базовый».) Этот уровень сохраняет внешний вид визуального формата файлов, как и все PDF / As, но не требует такого количества описательной информации, использования Unicode, сохранение порядка чтения текстового потока.Это делает PDF / A-1b менее доступным форматом (для людей с ослабленным зрением), но по-прежнему создает пригодный для использования файл сохранения. Поскольку все PDF / As в соответствии с уровнем соответствия b легче создавать, они также имеют тенденцию быть более распространенными.

    PDF / A-2 (2011)

    Стандарт ISO 19005-2: 2011
    На основе ссылки PDF 1.7

    PDF / A-2 расширяет формат, поддерживая ряд различных функций: встраивание шрифтов OpenType (вместо шрифтов только PostScript), сжатие изображений JPEG2000, прозрачные объекты и слои (которые можно скрыть для поддержки просмотра многослойного документа).Эта версия также определяет использование цифровых подписей (что обеспечивает лучшую поддержку безопасности), определяет требования к созданию метаданных лицом, создающим PDF / A, и позволяет встраивать документы в PDF / A. В последнем случае только PDF / As может быть встроен в PDF / A, но это позволяет пользователям создавать наборы документов в одном файле (например, серию электронных писем или связанных отчетов).

    Уровень соответствия PDF / A-2a
    Этот уровень такой же, как PDF / A-1a, но с расширениями PDF / A-2.

    Уровень соответствия PDF / A-2b
    Этот уровень такой же, как PDF / A-1b, но с расширениями PDF / A-2.

    Уровень соответствия PDF / A-2u
    Уровень PDF / A-2u идентичен уровню PDF / A-2b, за исключением одного аспекта: он требует использования «Unicode». (U означает Unicode.) Как и версия 2b, версия 2u не представляет логическую структуру документа, но она немного лучше, чем 2b, потому что она лучше представляет текст в нескольких системах письма.

    PDF / A-3 (2012)

    Стандарт ISO 19005-3: 2012
    На основе ссылки PDF 1.7

    В настоящее время PDF / A-3 является последней версией формата, но новые версии PDF / A ожидаются и неизбежны. Эта новейшая версия включает только одно изменение версии PDF / A-2: она позволяет встраивать файлы любого типа в PDF / A. Ценность этого изменения заключается в том, что оно поддерживает практику сохранения исходного исходного файла вместе с созданным из него PDF / A. Это позволяет вам поддерживать обе версии как часть одного файла, что упрощает ваши методы сохранения, если вы следуете рекомендуемой практике цифрового сохранения, когда исходные цифровые файлы всегда хранятся вместе с их копиями для сохранения.

    Уровень соответствия PDF / A-3a
    Этот уровень аналогичен PDF / A-2a, но с расширением PDF / A-3.

    Уровень соответствия PDF / A-3b
    Этот уровень такой же, как PDF / A-2b, но с расширением PDF / A-3.

    Уровень соответствия PDF / A-3u
    Этот уровень аналогичен PDF / A-2u, но с расширением PDF / A-3.

    Выбор версии PDF / A для использования

    При принятии решения о том, какую версию PDF / A использовать, необходимо учитывать ряд факторов, но до некоторой степени подойдет любая версия.Если у вас есть только программное обеспечение, которое будет создавать PDF / A-1b и поддерживает все необходимые вам функции, то это хороший выбор, и он будет постоянным. Помните, что, учитывая расширяемость серии PDF / A, первая версия PDF / A совместима со всеми более поздними версиями, и нет причин конвертировать PDF / A в более новую версию формата PDF / A.

    Есть несколько основных правил, которым вы можете следовать, делая свой выбор. Во-первых, наилучшим уровнем соответствия для использования всегда является уровень a, который всегда создает наиболее доступный файл.За исключением этого, вы должны выбрать уровень u для его кодировки Unicode, но имейте в виду, что базового уровня (b) почти всегда будет достаточно для ваших нужд. Также имеет смысл использовать последнюю версию серии, которую вы можете создать, потому что это позволит вам поддерживать наибольшее количество функций.

    Более важным фактором может быть кодировка цвета. Если вам нужно распечатать высококачественные копии документа, вам следует выбрать кодировку CMYK (что означает голубой, пурпурный, желтый и черный).Но если вы ожидаете, что будете читать файлы только на экране компьютера, то цвет RGB (для красного, зеленого и синего) — ваш лучший выбор.

    Чтобы создать PDF / A, вам нужен продукт, который может создавать PDF / As. Одним из наиболее часто используемых продуктов является Adobe Acrobat Professional версии 8 и новее. Однако имейте в виду, что есть много других программных продуктов, которые вы также можете использовать, и некоторые из них имеют различные функции, которые могут оказаться вам полезными. (Список некоторых из этих продуктов см. В «Приложении A: Инструменты PDF / A.») Кроме того, ряд общих продуктов, таких как пакет Microsoft Office, теперь включает в себя инструменты для создания PDF / As, поэтому вам может вообще не понадобиться покупать какое-либо новое программное обеспечение, в зависимости от ваших потребностей. Однако если вам нужно создать несколько файлов PDF / As одновременно, вам необходимо приобрести продукт, ориентированный на создание PDF / As, поскольку они поддерживают пакетную обработку, которая позволяет конвертировать несколько документов одновременно.

    Практика преобразования

    Процесс преобразования цифрового файла в файл сохранения технически называется нормализацией.В этом процессе целевой формат (в данном случае PDF / A) должен соответствовать требованиям формата сохранения, поэтому не ожидается, что он исчезнет или станет непригодным для использования в ближайшем будущем. .

    Перед преобразованием файлов необходимо убедиться, что на компьютере, который вы используете для нормализации, установлены необходимые шрифты. Без необходимых шрифтов вы не сможете создать PDF / A. Конечно, это не проблема при преобразовании отсканированного изображения в PDF / A.

    Когда создавать PDF / A

    Фактически у вас есть выбор, когда создавать PDF / A, и вы можете выбрать создание PDF / As на разных этапах жизненного цикла записей на основе ваших бизнес-процессов для разных записей.

    В момент создания
    Иногда вы можете создать PDF / A как исходный документ, таким образом полностью обойдя проблему преобразования. Это позволит вам начать жизнь документа в формате, который, как вы знаете, прослужит долго. Если вы сделаете это, вам придется делать это только с документами, которые вам не придется изменять с течением времени.Обычно PDF / As создаются при создании только как вывод из больших баз данных.

    В момент записи
    Запись — это процесс преобразования документа в запись. Например, вы можете создать несколько версий отчета, но только окончательная версия будет записью. Поэтому, когда вы завершите написание и редактирование этого отчета, вы можете сохранить файл как PDF / A, что замораживает файл, что затрудняет его изменение. Другое преимущество этого метода заключается в том, что он позволяет легко отличать промежуточные черновики от окончательной версии, потому что PDF / A всегда будет окончательным.

    В момент архивирования
    Большинство людей все еще конвертируют документы, бумажные и электронные, в PDF / As в момент архивирования, когда они решают сохранить запись как архивную запись, создав ее копию для сохранения .

    Сканирование с бумаги

    При сканировании с бумаги необходимо настроить сканер на создание файла, совместимого с PDF / A. Затем вы сканируете документ, сохраняя все страницы документа в одном PDF / A, и запускаете распознавание текста OCR, если необходимо, чтобы преобразовать текст в документе в интеллектуальный цифровой текст.

    Преобразование существующих отсканированных изображений

    Если у вас есть цифровые изображения текстовых документов для преобразования в PDF / A, вы можете использовать программное обеспечение PDF для распознавания текста OCR и сохранить файл в выбранной вами версии PDF / A. При сканировании записей возможны только уровни соответствия b и u, предпочтительным является уровень u.

    Использование двигателя Distiller

    Один из методов преобразования файла в формат PDF / A доступен только в Adobe Acrobat — это движок Distiller.Distiller работает отдельно от Adobe Acrobat, но также является частью этого программного обеспечения. Обычно он доступен на панели задач вашего компьютера. Чтобы создать PDF / A с помощью Distiller, вы должны выбрать соответствующую настройку PDF, а затем сохранить или экспортировать файл. Движок Distiller иногда может быть немного удобнее, но у него нет других преимуществ, и он не может создать полностью доступный файл (то есть тот, который соответствует уровню соответствия a).

    Преобразование из проприетарных программных продуктов

    Вы также можете создавать PDF / A из многих программных продуктов, которые делают гораздо больше, чем создание PDF-файлов.К ним относятся программы для обработки текстов, электронных таблиц и верстки страниц. Обычно вы можете создать PDF / As, «распечатав» или сохранив файлы в PDF / A, но вы должны обязательно изменить настройки PDF в соответствии с предпочтениями PDF / A. Вы также можете установить для программного обеспечения предпочтительные настройки по умолчанию для удобства использования в дальнейшем.

    Преобразование из обычных PDF-файлов

    Многие люди имеют хранилища обычных PDF-файлов, которые они хотят преобразовать в PDF / As в целях сохранения. Для этого вам, возможно, сначала придется удалить все функции, запрещенные в PDF / A, или вы можете запустить преобразование и посмотреть, возникают ли какие-либо ошибки во время преобразования.Если вы используете Adobe Acrobat, вам придется использовать его функцию предварительной проверки, чтобы преобразовать обычный PDF в PDF / A. Поскольку преобразования PDF в PDF / A заведомо безуспешны, вы можете приобрести продукт, предназначенный для таких преобразований. Продукт 3-Heights PDF в PDF / A анализирует файлы более подробно, чтобы обеспечить более высокий уровень успеха при преобразовании. Тем не менее, ни один продукт не всегда сможет создать PDF / A из обычных PDF-файлов.

    Любая форма репрографии (например, микрофильмирование, визуализация или фотокопирование с сохранением) должна включать этап контроля качества, чтобы гарантировать получение точной копии оригинала.То же самое и с процессом нормализации.

    Есть два основных шага к контролю качества PDF / A. Сначала вы должны визуально проверить документ, чтобы убедиться, что новый файл выглядит так же, как старый. Если преобразование каким-то образом пошло не так, вы должны увидеть это в файле, а затем повторить процессы преобразования после повторной проверки настроек и методологии. Второй шаг в контроле качества — проверка соответствия созданных файлов используемой вами версии стандарта PDF / A.Для этого вам придется использовать любой из ряда инструментов проверки, включая функцию предварительной проверки Adobe Acrobat. Список таких продуктов см. В «Приложении B: Инструменты проверки PDF / A».

    Сохранение записей включает в себя гораздо больше, чем просто создание PDF / As. Это требует длительной работы и постоянной бдительности. Вы должны разработать надежные процедуры конвертации, за которыми следует надлежащая практика контроля качества. Вам нужно будет создать и поддерживать метаданные в файлах, чтобы сделать их доступными и пригодными для использования.Вам нужно будет убедиться, что ваши средства контроля окружающей среды подходят для хранения электронных файлов, а средства контроля управления данными (особенно процедуры резервного копирования) являются разумными и последовательными. И вам нужно будет убедиться еще в одном факте: выбранный вами формат файла для хранения остается допустимым форматом сохранения. Прямо сейчас PDF / A — хороший формат для долгосрочного хранения документов, особенно цифровых текстовых документов, но через десять лет это может измениться.

    Adobe Acrobat
    www.adobe.com

    Apago
    www.apagoinc.com

    Каллас
    www.callassoftware.com

    Compart
    www.compart.net

    PDFlib
    www.pdflib.com

    PDF Tools AG
    www.pdf-tools.com

    Luratech
    www.luratech.com

    Функция предварительной проверки Adobe Acrobat
    adobe.com

    Callas Software’s pdfaPilot
    callassoftware.com

    PDF Tools AG: валидатор PDF 3-Heights
    pdf-tools.com

    Приложение C: Дополнительные ресурсы

    PDF / A Стандарт
    http: // www.aiim.org/shop/product/865

    Extensible Metadata Protocol
    http://aiim.org/documents/standards/xmpspecification.pdf

    Общие ресурсы в формате PDF
    http://www.planetpdf.com

    Вопросы?

    Электронная почта: [email protected].

    Выдано 08.08.2013

    Основы PDF | формат файла и его использование в допечатной подготовке

    Portable Document Format был первоначально создан Adobe как формат файлов для надежного представления и обмена документами.Adobe по-прежнему остается одним из основных разработчиков программного обеспечения, позволяющего создавать, редактировать и визуализировать файлы PDF. Поскольку спецификации формата файла общедоступны и даже стали официальным стандартом ISO, многие другие компании также разрабатывают программное обеспечение, связанное с PDF. В допечатной подготовке PDF обычно используется в качестве формата для обмена данными, будь то полные страницы, которые необходимо распечатать, или рекламные объявления, которые необходимо включить в публикацию. Формат файла также популярен для мягкой проверки и просмотра содержимого, поскольку есть приложения, позволяющие делать примечания на страницах PDF.

    Что можно делать с PDF?

    PDF можно использовать для:

    • Создание электронных документов — PDF максимально приближен к «безбумажному офису».
    • обмен данными — все больше и больше приложений могут читать файлы PDF. Рекламными объявлениями часто обмениваются в виде файлов PDF. PDF / X — это специальная версия PDF, оптимизированная для этого типа приложений.
    • архивирование данных — на рынке есть инструменты, которые позволяют индексировать файлы PDF, чтобы вы могли создавать и выполнять поиск в электронной библиотеке файлов PDF.Существует даже специальная версия PDF, называемая PDF / A, которая оптимизирована для длительного хранения электронных документов.
    • интерактивных документов — PDF можно использовать для электронных форм, в которых заполненные данные могут храниться в базе данных.

    Для получения дополнительной информации посетите следующие страницы:

    Формат файла PDF

    Файлы PDF

    имеют расширение .PDF. Их значок выглядит так:

    Как на Mac, так и на ПК, вы не увидите этот значок, если не установлено приложение, которое может обрабатывать файлы PDF.В настоящее время многие системы поставляются с предустановленным необходимым приложением Adobe Viewer. Система Apple OS X имеет встроенную поддержку PDF.

    Для получения дополнительной информации посетите следующие страницы:

    Особые ароматы PDF

    • PDF / X-1a — популярный стандарт для обмена данными в допечатной подготовке и печати
    • PDF / X-3 — альтернатива PDF / X-1a с управлением цветом
    • PDF / X-4 — Новый стандарт использования PDF для допечатной подготовки и печати
    • PDF / X-5 — Непонятная альтернатива PDF / X-4
    • PDF / VT — Использование PDF для печати переменных данных и транзакций
    • PDF / A — Использование PDF для архивирования электронных документов
    • Certified PDF — подтверждение того, что PDF-файл был предварительно проверен

    PDF Association предлагает бесплатное 17-страничное руководство по формату файлов PDF / X, которое в двух словах называется PDF / X.

    В чем преимущества PDF?

    PDF имеет уникальный ряд преимуществ:

    • Это кроссплатформенный стандарт. Это означает, что кто-то может создать файл PDF на рабочей станции Unix, а вы можете открыть его на Mac или ПК и по-прежнему видеть документ так, как он был предназначен для просмотра.
    • Файлы PDF
    • могут быть независимыми от устройства: их можно распечатать на дешевом струйном принтере, а также на дорогом фотонаборном устройстве. Это не обязательно означает, что вывод будет оптимизирован для каждого устройства.Многое зависит от способа создания документа.
    • PDF-файлы компактны. PDF поддерживает ряд сложных алгоритмов сжатия, а также продуманную файловую структуру, позволяющую свести размер файлов PDF к абсолютному минимуму.
    • Файлы
    • PDF могут содержать мультимедийные элементы, такие как фильмы или звук, а также элементы гипертекста, такие как закладки, ссылки на адреса электронной почты или веб-страницы и эскизы страниц.
    • PDF поддерживает безопасность. Создатель файла PDF может устанавливать различные параметры безопасности.Можно заблокировать PDF-файл, чтобы его можно было открыть только с паролем. Также можно запретить изменение содержимого PDF-файла или отключить возможность печати PDF-файла.

    Недостатки PDF

    Конечно, у использования PDF есть и недостатки.

    • Вопреки своему названию, Portable Document Format не так удобен. Примерно каждые два года Adobe выпускает новую версию PDF, каждый раз добавляя новые функции или расширяя объем существующих.Последние версии Adobe Reader и Acrobat игнорируют функции PDF, которых не было на момент выпуска программного обеспечения. Хотя это элегантный обходной путь, тот факт, что существует так много разных версий PDF, не очень практичен и не удобен для пользователя.
    • Некоторые организации всегда возражали против использования PDF, потому что это был частный формат файла, принадлежащий Adobe. Так было до января 2007 года, когда Adobe выпустила спецификации PDF 1.7 для сертификации ISO. Некоторые разновидности PDF, такие как PDF / X-1 и PDF / A, уже несколько лет назад прошли сертификацию ISO.
    • PDF пытается быть всем для всех, а это означает, что он может быть не таким эффективным для конкретной задачи, как инструмент, оптимизированный для этой задачи. Вы можете использовать PDF в Интернете, но в большинстве случаев документ HTML может быть более эффективным. Вы можете использовать PDF для обмена небольшими графическими элементами, такими как реклама, рисунки или изображения, но большее количество приложений допечатной подготовки может работать с форматом файлов EPS. Вы можете использовать PDF для архивирования данных, но иногда обширные функции макета, такие как кернинг, могут помешать вам найти конкретное слово в PDF-документе.
    • PDF предназначен для визуализации документов. Используя метаданные, можно сохранить логическую структуру документа. К сожалению, не так много приложений, которые создают такие файлы PDF с тегами.
    • Файлы
    • PDF не предназначены для редактирования. В файл PDF можно внести небольшие изменения, но довольно сложно добавить полные блоки текста или изображений в существующий файл PDF. Для этого на рынке есть специализированные инструменты, но даже они не всегда могут обойти это ограничение.

    Различный

    Общие сведения о формате переносимого документа (PDF)

    Структура файла PDF аналогична различным уровням иерархии в типичной компании. Подобно генеральному директору, словарь каталога документов находится на вершине иерархии. Фактически вы можете просмотреть структуру PDF-файла с помощью инструмента PDFDebugger — я включил более подробную информацию на эту веб-страницу http://www.printmyfolders.com/view-structure-of-a-pdf

    Как мы видели ранее, чтение PDF-файла приложение сначала просмотрит трейлер PDF.В трейлере будет корневая запись, в которой указано расположение каталога. Это похоже на человека (приложение для чтения PDF ), подходящего к генеральному директору (каталог документов ) после того, как он нашел ее контактные данные в разделе контактов ( Трейлер ) на веб-сайте компании ( PDF-файл ).

    Каталог документов: Каталог документов — это словарь, который ссылается на другие объекты, определяющие файл PDF. По сути, Каталог документов похож на центр, откуда можно найти любую информацию о файле PDF.Как словарь, он состоит из различных ключей. Мы пока рассмотрим только обязательные ключи.

    Тип — всегда будет Каталог (имя типа)

    Страницы — Косвенная ссылка на объект, который является корнем дерева страниц (рассмотрим это позже)

    A PDF-файл, который я создал с помощью бесплатного программного обеспечения для создания PDF-файлов, имеет этот словарь каталога

      1 0 obj  
      << / Тип / Каталог / Страницы 3 0 R  
      >>  
      endobj  

    Вы заметите, что каждый из этих словарей всегда начинается с записи «/ Тип», которая описывает, какой это тип словаря.В данном случае это словарь «Каталог».

    Приложение, которое читает указанный выше словарь Catolog, будет знать, что ему необходимо прочитать словарь «Страницы» (косвенный объект 3), чтобы получить информацию о страницах в этом файле PDF.

    Дерево страниц: Дерево страниц - это имя структуры, используемой для описания страниц в файле PDF. Он имеет два типа узлов - узлов дерева страниц, и объектов страниц. Каждая страница в файле PDF представлена ​​как объект страницы.Каждый из этих объектов называется «листовым» узлом в дереве страниц.

    Узлы дерева страниц: Обязательные ключи:

    Тип - всегда будет Страницы для узла дерева страниц

    Родительский - узел дерева страниц, который является родительским узлом. Не допускается в корневом узле.

    Kids - массив, относящийся к дочерним элементам этого узла. Дочерние элементы могут быть только узлами дерева страниц или объектами страниц

    Счетчик - количество объектов страницы, которые являются потомками этого узла

    В PDF-файле, который я создал ранее, есть это дерево страниц (помните, что словарь каталога указывал на косвенный объект 3).

      3 0 obj  
      << / Тип / Страницы / Дети [ 
      4 0 R  
     ] / Счетчик 1  
      / Повернуть 0 >>  
      
    endobj

    У этого узла дерева страниц есть только один дочерний элемент, который является объектом 4. Ключ Parent отсутствует, поэтому это корневой узел.

    Поскольку / Count равен 1, мы можем с уверенностью предположить, что в этом дереве страниц находится только 1 страница (которая на основе массива / Kids является косвенным объектом 4.

    Как упоминалось ранее, вы заметите, что в этом словаре тоже есть запись «/ Тип», которая показывает, какой это тип словаря.

    Объекты страницы : это словарь, который раскрывает характеристики самой страницы. Некоторые из ключей:

    Примечание: Большинство ключей для меня новые. Я намеренно упустил ключи, которые в данный момент не имеют для меня смысла. По мере того, как я узнаю больше о спецификации PDF, я, надеюсь, подробно расскажу о них.

    Тип - всегда будет страница

    Родительский - Косвенная ссылка на родительский элемент этой страницы

    LastModified - Дата и время последнего изменения этой страницы

    Ресурсы - Ресурсы, необходимые для эта страница. Обычно это относится к шрифту, используемому на этой странице, и другой информации.

    MediaBox - прямоугольник, определяющий границу, внутри которой должна отображаться страница.

    Содержимое - поток содержимого, описывающий содержимое этой страницы.

    Повернуть - кратно 90. Поворачивает страницу на количество градусов перед отображением.

    Thumb - объект потока, который дает эскизное изображение для этой страницы.

    Dur - количество секунд, в течение которых страница будет отображаться в презентациях перед автоматическим переходом к следующей странице.

    Trans - Словарь, указывающий, какой переход использовать при отображении страницы во время презентации.

    Аннотации - Это массив словарей, содержащий ссылки на все аннотации к этой странице

    AA - Это сокращенная форма для дополнительных действий.Этот словарь определяет действия, которые необходимо предпринять при открытии или закрытии файла.

    Метаданные - поток, содержащий метаданные для этой страницы

    Вот отрывок из образца PDF, который я создал с помощью бесплатного программного обеспечения для создания PDF.

      4 0 obj  
      << / Тип / Страница / MediaBox [0 0 595 842]  
      / Повернуть 0 / Родительский 3 0 R  
      / Ресурсы << / ProcSet [/ PDF / Текст]  
      / ExtGState 10 0 R  
      / Шрифт 11 0 R  
      >>  
      / Содержание 5 0 R  
      >>  
    конец
     905  
      3 0 obj  
      << / Тип / Страницы / Дети [ 
      4 0 R  
     ] / Счетчик 1  
      / Повернуть 0 >>  
      конец 
       
      1 0 obj  
      << / Тип / Каталог / Страницы 3 0 R  
      >>  
      endobj  

    Как видите Объект 1 - это каталог, который направляет приложение для чтения PDF в корень дерева страниц (Obj и т. д. 3).Объект 3, корневой узел имел только одного ребенка (объект 4) и, очевидно, не мог иметь родителя. Объект 4 «отображается» в прямоугольнике (0 0 595 842), не вращается (Повернуть 0) и имеет Объект 3 в качестве своего родителя. Включены его «ресурсы», а также его содержимое (объект 5). Вот объект 5 из моего файла.

    Как мы обсуждали ранее, поток в этом объекте начинается со словаря, который показывает длину потока (который хранится в объекте 6). Мы обсудим больше о потоках контента ниже..uujNWnjY :: si / .L9, ČGPY1k /.% 'f! endstream

      endobj  

    Атрибуты страницы наследуются: Интересный факт. Некоторые атрибуты страницы могут быть унаследованы от ее родителя или любого из ее предков в дереве страниц. Устраняет необходимость повторять одинаковые атрибуты для каждого дочернего элемента, внука и т. Д. Если предок определяет значение для атрибута, это значение может быть заменено или изменено дочерним элементом.

    Словарь имен: Вместо того, чтобы ссылаться на объекты по их ссылкам, на некоторые объекты можно ссылаться по их именам.Связь между именами и ссылками на них хранится в словаре имен PDF-файла. Один из дополнительных ключей в каталоге, Names , используется для указания словаря имен . Пожалуйста, обратитесь к спецификации PDF для получения более подробной информации.

    Потоки содержимого: Это поток (объект в формате PDF, если вы помните), в котором есть инструкции по отображению текста и графики на соответствующей странице. В объекте 5 моего PDF-файла, упомянутого ранее и повторенного ниже, мы можем видеть поток..uujNWnjY :: si / .L9, ČGPY1k /.% 'f! endstream

      endobj  

    Данные в потоке не имеют смысла, потому что данные были закодированы (преобразованы из исходной формы в другую). В следующих разделах мы более подробно рассмотрим структуру этих данных и поймем, как они формируют инструкции для приложения для чтения PDF-файлов для отображения страницы.

    Обратите внимание, что в отличие от других объектов в файле PDF, инструкции в потоке объектов читаются и выполняются последовательно (одна за другой).

    Опубликовано в категории: Разное

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *