Pdf файл что это такое: Обзор формата Adobe PDF

Содержание

PDF — что это такое простыми словами?

Здравствуйте друзья! Сегодня я постараюсь простыми словами рассказать вам что такое PDF, зачем примерно оно нужно. На самом деле все просто и надеюсь поймет каждый.

РЕКЛАМА

PDF — что это такое?

PDF — формат, в котором идут оцифрованные книги, журналы, документы и прочее. Все что вы можете прочитать в жизни в бумажном виде, все это можно оцифровать в формат PDF и потом просмотреть на ПК или смартфоне.

Формат был разработанный компанией Adobe, является наверно самым популярным. Есть много программ-читалок для просмотра PDF-файлов, но самая основная и популярная — Adobe Reader (кстати бесплатная).

Многие современные устройства печати понимают PDF без установки специального софта. Кстати электронные читалки тоже понимают данный формат.

Зачем нужен формат? В принципе и так понятно — бумага не вечная, а вот электронный документ пожалуй вечный, главное чтобы он не был удален. Многие старые книги, журналы (например Cool) — оцифрованы, их можно скачать в интернете, установить читалку и посмотреть.

Часто в формате PDF идут всякие инструкции к технике, ноутбукам там и прочему.

Кстати Adobe Reader в принципе неплохая читалка, но легкой ее назвать нельзя, может тормозить на слабом ПК. Поэтому часто используют Foxit Reader, STDU Viewer, Sumatra PDF.

Также формат позволяет внедрять контент — необходимые шрифты, векторные и растровые изображения, формы, мультимедиа, разные форматы картинок. Также можно поставить цифровую подпись для защиты.

Современные браузеры умеют открывать PDF-документ без использования каких-то программ:

И потом в браузере вместо интернет-странички будет содержимое PDF:

Правда по удобству — все равно лучше специальные программы.

Вот простой пример — какой-то журнал Computer в оцифрованном виде:

Иногда интересно посмотреть старые выпуски журналов.. особенно я люблю читать про старые телефоны, смартфоны, когда они выходили, тогда это была бомба, а сейчас никому не нужны.

Вот например вы скачали PDF-файл, открываете его читалкой. Во многих сразу слева будут миниатюры страниц, чтобы можно было быстро переключаться между ними:

А вверху могут быть вкладки открытых документов. То есть можно сразу читать несколько.

В документе также можно выделить текст и скопировать его:

Содержание файла (точнее навигация) может быть удобным, то есть переключаться между разделами/страницами, как здесь:

Но это зависит от файла, в некоторых такого нет.

Есть много программ для PDF: большинством можно только смотреть, некоторыми редактировать, третьими все вместе делать.

Заключение

Главное выяснили, PDF это формат:

  1. В котором идет оцифрованные книги, журналы, инструкции и прочее.
  2. Самый популярный, хотя есть и другие популярные: FB2, DjVu, EPub.
  3. Родной для многих устройств печати, а также для электронных читалок.

РЕКЛАМА

Удачи!

Сохранение в качестве PDF-файла на мобильном устройстве

Сохранение в формате PDF

  1. Откройте файл, который вы хотите сохранить в формате PDF, а затем нажмите Файл на планшете или коснитесь значка «Файл» на телефоне.

  2. В меню Файл коснитесь пункта Печать.

  3. Если этот пункт еще не выбран, нажмите Печать в PDF (Майкрософт) на планшете или PDF на телефоне.

  4. Нажмите Печать.

  5. На планшете откроется страница Сохранить как. Выберите расположение для PDF-файла, введите новое имя и нажмите Сохранить.

    На телефоне PDF-файл автоматически сохраняется в вашей папке Документы.

Сохранение файла Word в формате PDF с тегами

Вы можете использовать Word на мобильном устройстве для сохранения документов в виде файлов PDF с тегами. Файлы PDF с тегами упрощают для средств чтения с экрана и других специальных возможностей определение логического порядка чтения и навигации для файла, а также возможность перекомпоновки содержимого при использовании мобильных телефонов.

  1. Откройте файл Word, который вы хотите сохранить в формате PDF с тегами, а затем коснитесь значка «файл» на своем телефоне.

  2. В меню файл выберите команду сохранить.

  3. В меню » сохранить » выберите » экспортировать этот файл«.

  4. Выберите расположение для PDF-файла и нажмите .

  5. Введите имя файла PDF и нажмите и выберите PDF- файл из раскрывающегося списка Тип файла .

  6. Нажмите кнопку Сохранить .

    Документ Word будет сохранен в формате PDF в том месте, которое вы выбрали на шаге 4.

Расширение файла PDF. Чем открыть PDF?

Расширение PDF

Чем открыть файл PDF

В Windows: Adobe Reader, Adobe Acrobat X, Foxit Reader, Sumatra PDF, Corel WordPerfect Office X6, Nuance PDF Converter Professional 8, LULU Soda PDF, Solid PDF Tools, Informative Graphics Brava! Reader, Adobe Illustrator, Microsoft Word, jPDF Tweak, FME DESKTOP, Adobe Creative Suite, любой браузер с плагином Adobe Reader
В Mac OS: Apple Preview, Adobe Reader, Adobe Acrobat X, Nuance PDF Converter для Mac 2.0, Adobe Illustrator для Mac, Adobe Creative Suite для Mac, Solid PDF to Word, Skim, Mac OS X, Preview, любой браузер с плагином Adobe Reader
В Linux: KPDF, KDE Okular, Evince, PDFedit, Foxit Reader для Linux, любой браузер с плагином Adobe Reader
Кроссплатформенное ПО: LibreOffice Impress
В Windows Mobile/CE: Adobe Reader
В Symbian:

OfficeSuite
В Google Android: Adobe Reader, Quickoffice Pro, OfficeSuite Viewer, OfficeSuite Professional, ThinkFree Mobile, Documents To Go, Polaris Office, Kingsoft Office, QuickOffice Pro, Picsel Smart Office
В Blackberry: eOffice
В Apple iOS (iPhone, iPad, iPod): GoodReader, Apple iBooks, Adobe Debut, Quickoffice Pro, Pages for iOS, Comic Zeal

Описание расширения PDF

Популярность:

Раздел: Документы

Разработчик:

Расширение PDF в первую очередь связано с форматом документов Adobe Acrobat Portable Document Format (PDF). Другие форматы файлов с расширением .PDF встречаются очень редко, и будет не преувеличением сказать, что 99,99% файлов PDF, найденных в сети Интернет, это документы Adobe Portable.

Portable Document Format (PDF) представляет собой файл формата, разработанный Adobe Systems с использованием ряда возможностей языка PostScript, который является кроссплатформенным, т.е. не зависит от операционной системы компьютера, на котором открывают файл PDF. Каждый файл .PDF инкапсулирует полное описание 2D-документов (и, с появлением Acrobat 3D, встроенных 3D-документов), что включает в себя текст, шрифты, изображения и 2D векторную графику, которые входят в документ. PDF-файлы не содержат информацию, специфичную для прикладного программного обеспечения, аппаратных средств, операционной системы или используется для создания или просмотра документов. Эта функция гарантирует, что файл PDF будет отображаться точно так же, независимо от его происхождения или назначения (но в зависимости от наличия таких же шрифтов). Google, Bing и другие поисковые системы в настоящее время индексируют PDF документы, которые можно просматривать в веб-браузере с помощью бесплатного плагина Adobe Reader.

Любой может создавать приложения, читать и создавать PDF файлы без необходимости платить комиссию Adobe Systems, однако Adobe имеет ряд патентов, связанных с форматом PDF, которые утверждают, что это открытый стандарт, лицензирует их на безвозмездной основе для использования в разработке программного обеспечения, которое соответствует его спецификации PDF.

PDF файлы больше всего целесообразно использовать для кодирования точного вида документа не зависимо от операционной системы. Формат PDF может описывать как очень простые одно-страничные документы, так он может также быть использован для сложных много страничных документов, которые используют различные шрифты, графику, цвета и изображения.

Существуют много программ, которые открывают файл PDF почти для всех операционных системах, такие, как Xpdf, Foxit и Adobe имеет собственную программу Adobe Reader. В основном такие программы бесплатны. Есть множество программ для создания PDF-файлов, в том числе встроенная возможность в Mac OS X печати PDF (в меню Файл вместо нажатия на «Print» выберите «Save as PDF» в выпадающем меню в левом нижнем углу экрана), кроссплатформенная OpenOffice, многочисленные драйвера печати в PDF для Microsoft Windows, и сам Adobe Acrobat. Существует также специализированное программное обеспечение для редактирования PDF-файлов.

Некорректные расширения: pdf[1], pdf-, pdf,

Mime тип: application/pdf, application/x-pdf, application/acrobat, applications/vnd.pdf, text/pdf, text/x-pdf
HEX код: 25 50 44 46 2D 31 2E
ASCII код: %PDF-1.

Другие программы, связанные с расширением PDF

    Файл настоек ArcView от Esri
    Расширение файла pdf используется программой ArcView для хранения настроек. Относится к разделу Конфигурационные файлы.
    Популярность:
    Информационный файл устройства печати Netware от Novell, Inc.
    Файл PDF связан с Novell Netware. Этот файл создается или был скопирован с помощью программы NetWare PRINTDEF. С помощью этой программы, вы можете импортировать .PDF файл из другого источника или создать их на файловом сервере. Команды в этом файле, добавляются в начало и в конец каждого задания на печать, инициализируя принтер из файла настроек. Относится к разделу Системные файлы.
    Популярность:

PDF — формат файла. Чем открыть PDF?

Файл формата PDF открывается специальными программами. Чтобы открыть данный формат, скачайте одну из предложенных программ.

Формат .PDF появился в 1993 году, и его разработкой занималась компания Adobe Systems. Расшифровка аббревиатуры в названии расширения – Portable Document Format

Программа для открытия файлов PDF

Стандартный вариант для тех случаев, когда нужно открыть PDF файл и просмотреть его содержимое. Эта программа создана той же компанией, которая разработала формат .PDF, и, несомненно, является самой популярной «читалкой». Конвертируем Pdf также с помощью этой программы. Бесплатное программное обеспечение (платная подписка на версию Pro даст возможность создавать и редактировать файлы с расширением PDF).

 

Один из лучших вариантов для работы с расширением PDF. Это редактор PDF, для распечатывания, добавления примечания, внесения правок и даже создания абсолютно новых, полностью совместимых с другими «читалками». Работает быстрее и менее требовательна к ресурсам операционной системы, чем Adobe Acrobat DC, несмотря на то, что разработана сторонней компанией («Foxit Software»).

Существует также многофункциональное приложение для открытия и файлов PDF, DJVU, EPUB и прочих, – STDU Viewer. 

В каких ОС открываются файлы PDF

С файлами формата PDF можно работать в любой версии ОС Windows и Linux, открываются они и в Mac OS. Также они доступны в мобильных операционных системах – iOS, Android и Windows Phone, также можно редактировать или открыть PDF онлайн в любой операционной системе.

Что находится в файлах PDF

Возможное содержимое файлов с расширением .PDF – изображения, текст, интерактивные кнопки, гиперссылки, встроенные шрифты, видео.

Конвертация PDF

Сделать Pdf файл можно с помощью стандартных средств программ-просмотрщиков формата или конвертировать Pdf в Word различным программным обеспечением, например Convertin.io. Также, с помощью онлайн конвертеров, например online-convert.

Для чего используются файлы PDF

Чаще всего, файлы с таким расширением представляют собой руководства по продуктам, электронные книги, листовки, приложения для работы, отсканированные документы и брошюры.

Причина популярности данного формата в том, что PDF-файлы не зависят ни от программ, в которых они были созданы, ни от какой-либо конкретной операционной системы или оборудования. Они будут выглядеть одинаково с любых устройств.

Что такое PDF файл? Преимущества и недостатки PDF

Загружая документ из Интернета, вы можете заметить, что он имеет формат .PDF. Возможно, вы также заметили, что его трудно (если вообще возможно) редактировать. Чтобы открыть файл .PDF формата нужно иметь специальную программу, например Adobe Acrobat Reader. Иногда пользователи путаются, какой формат выбрать. Почему люди используют PDF файлы? Разве не проще пользоваться .DOC или .DOCX форматами?

На самом деле, формат .PDF широко распространен для передачи различного рода документов и электронных книг. Почему так произошло? Давайте разберемся, что такое PDF файл, и узнаем его плюсы и минусы.

Преимущества PDF файлов

Давайте вернемся к вопросу “Что лучше, PDF или DOCX?”. DOCX — отличный формат для пользователей, которые используют Microsoft Office на своих устройствах. DOCX это стандартный формат документов Microsoft Word. Но если кто-то открывает ваш файл, на его компьютере должен быть установлен текстовый редактор от MS, или другая программа, которая умеет работать с этим форматом. Хотя и большинство альтернатив MS Office могут конвертировать .DOC в нужный формат, этот процесс иногда изменяет оригинальное форматирование и создает лишние хлопоты.

К счастью, большинство операционных систем полностью поддерживают PDF файлы. Это значит, что вам не нужно создавать документ специально для пользователей Windows, MacOS, Linux, IOS, или Android. Просто выберите PDF и будьте уверены, что он откроется на любом устройства.

Когда стоит использовать .PDF формат?

В ситуациях, когда вы не знаете, на какой операционной системе будет открываться файл, используйте PDF. Скажем, вы решили выложить на сайт книгу, журнал, брошюру, или какой-либо важный документ. На сайт могут заходить люди с компьютеров под управлением Windows, Linux или владельцы смартфонов на IOS или Android. Лучшим вариантом в данном случае будет использование .PDF формата. Каждое устройство сможет его открыть и отобразить содержимое.

Еще лучше, если после загрузки документа, он автоматически открывается через браузер. Популярные браузеры, такие как Google Chrome (это одна из малоизвестных функций Chrome) или Mozilla Firefox имеют встроенные PDF-просмотрщики, потому люди могут просмотреть документ просто и быстро.

Отдавайте преимущество PDF файлам при отправке по Email. Представим, что вы отправляете резюме. Хорошо, если получатель проверяет почту с компьютера, и может открыть .DOCX файл. А если нет? Со смартфона или планшета проще открыть .PDF ежели .DOC.

Недостатки .PDF формата

Получив файл, вы можете захотеть изменить его, но тут кроется одна из основных проблем PDF файлов — их сложно редактировать. Если DOC файл это оригинальный текстовый документ, который можно легко изменять, то PDF больше напоминает изображение. Редактирование возможно, но для этого нужен просмотрщик со встроенной функцией редактирования, или соответствующая программа.

Когда не нужно использовать PDF

Не используйте формат .PDF, когда вы хотите иметь “живой документ”, который может быть отредактирован другими пользователями. Вы можете добавить редактируемые поля в PDF документ, но полное редактирование требует немалых усилий. Если вы работаете с другими пользователями, желательно узнать, какие операционные системы они используют и договориться о типе файлов, который подходит всем.

По крайней мере, каждый может использовать облачную службу документов, например Google Docs. Для режима “только чтение” хорошо подойдет PDF, а для редактирования — его использовать не стоит.

Итог

Теперь вы знаете, что такое PDF файл, в каких случаях его стоит использовать, а которых лучше подойдет .DOC. Прежде чем создавать документ, подумайте о тех, кто будет им пользоваться. Желаю удачи.

Источник: www.maketecheasier.com

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Чем отличается формат PDF от PDF/A. И что выбрать для хранения электронных документов

Ответ для самых торопливых: PDF/A — это версия формата PDF, стандартизированная ISO и предназначенная для использования при архивировании и долгосрочном хранении электронных документов. Если вы хотите возвращаться к скан-копии печатного оригинала или электронному документу спустя много лет, то лучше использовать именно его. А теперь разберём вопрос подробнее.

Электронный документ PDF: особенности и история формата

PDF (Portable document format) — это универсальный формат электронных документов. Он создан по инициативе компании Adobe в 1993 году, и его исходное предназначение — электронное представление печатных материалов.

Задачи формата PDF:

  • хранение данных о цветовой схеме и расположении элементов;
  • обеспечение идентичного представления информации на разных мониторах и принтерах.

За время своего существования PDF значительно прибавил в возможностях. Ещё в первой редакции формата появилась возможность вставлять ссылки в текст, шифровать документ с паролем и тем самым защищать его от модификации. Функциональность дополнялась год за годом:

Версия Возможности
PDF 1-1.1 (1993-1994) Работа с потоками данных, защита паролем и цветопередача, независимая от устройства
PDF 1.2 (1996) Интерактивные элементы и возможность обрабатывать действия мыши
PDF 1.3 (1999) Электронная подпись (ЭП), javaSAFEscript
PDF 1.4 (2001) Прозрачность, текстовый слой поверх картинки, метаданные «ключ-значение»
PDF 1.5 (2003) Мультимедиа, объектные и перекрестные потоки, слои
PDF 1.6 (2005) XML-формы, AES-шифрование
PDF 1.7-2.0 (2005-2020) AES-шифрование 256-битным ключом, архитектура XML-форм XFA 3.0

Начиная с версии PDF 1.4, которая вышла в 2001 году, пользователи могут наносить текстовый слой поверх изображения. Причём он может быть невидимым. То есть пользователь, видя «картинку», тем не менее может копировать с неё текст. Кроме того, в этой же версии появилась возможность вставлять метаданные в виде пар «ключ-значение», каждая из которых может быть связана с какой-то частью документа (например, отдельным изображением) или со всем документом. Это важные нововведения, с точки зрения архивного хранения, и они поддерживаются форматом по сей день.

С 2008 года PDF — открытый стандарт ISO 32000 (последняя редакция международного стандарта качества — 32000-2 — опубликована в декабре 2020 года). Это значит, что сегодня PDF рекомендуется к использованию во всём мире.

Сохранение документа в PDF/A. Когда нужен этот формат?

В начале статьи мы уже дали ответ на этот вопрос: PDF/A — это версия PDF, которая рекомендована всё тем же ISO для долговременного архивирования электронных документов.

Длительный срок хранения становится возможным, потому что в содержимое электронного документа в формате PDF/A внедряется вся информация, необходимая для его отображения. В частности, к ней относятся шрифты — те из них, которые использованы в документе, включены в него. К слову, это влияет на его размер: документ в формате PDF/A часто больше по размеру, чем документ с аналогичным содержимым, сохранённый в PDF.

Считается, что документ, хранимый в формате PDF/A, из-за полного отсутствия связи с такими изменчивыми вещами как гиперссылки и мультимедийный контент можно будет открыть в любой операционной системе через какое угодно время с помощью приложения, поддерживающего соответствующий формат.

Есть ещё один аргумент в его пользу. Поскольку PDF/A обеспечен статусом международного стандарта, его поддержка разработчиками в долгосрочной перспективе оправдана, а использование целесообразно. Чего не скажешь о других доступных форматах хранения электронных документов, которые могут измениться в любой момент времени.

При этом целостность и неизменность неподписанного документа в формате PDF/A не может быть гарантирована и не заявляется как особенность формата. Другими словами, несмотря на то, что данный формат позиционируется как обеспечивающий долгосрочное хранение, изменение содержимого документа возможно и не является отклонением от нормы, если оно не зашифровано.

Однако есть ещё один нюанс: для каждого конкретного документа, формат которого заявлен как PDF/A, невозможно заведомо утверждать, что это действительно так. В каждом случае необходима верификация на соответствие требованиям формата. И если на этапе размещения в архиве или после очередного изменения она не будет проведена, можно считать миссию обеспечения долгосрочного хранения потенциально проваленной (с некоторыми оговорками, но всё же).

Как проверить PDF/A

Действительно ли документ сохранён в нужном формате — очевидные сомнения. Внешне определить, PDF это или PDF/A, очень сложно.

Если файл соответствует формату PDF/A, то информацию об этом можно увидеть в приложении Acrobat Distiller на панели «Навигация» (Просмотр — Показать/Скрыть — Панели навигации — Стандарты). Подробнее — в справке Adobe.com.

Также в этих случаях используются программы-валидаторы. Пример — veraPDF (можно скачать здесь). Программу создавал союз нескольких профессиональных сообществ, в том числе Ассоциация PDF (PDF Association).

Также есть сервисы, которые могут определить формат в режиме онлайн. В их числе avePDF, pdf-online и другие. Во многих таких сервисах можно не только проверить, но и изменить формат — перевести файл из PDF в PDF/A. Доверять онлайн-решениям или нет — вопрос, который остаётся на стороне пользователя. Во всяком случае к официально признанным программам-валидаторам PDF они не относятся.

Чтобы обеспечить целостность и юридическую значимость электронных документов, недостаточно использовать нужный формат. Также необходимо использовать специализированную систему долговременного хранения.

Как хранить отсканированный документ в PDF/A

Исходя из описанных выше различий между форматами PDF и его потомком PDF/A, вполне можно предположить, что первый больше пригоден для оперативного обмена и краткосрочного хранения электронных документов. При этом PDF/A, несмотря на потенциально большой размер единичного документа (в него внедрены все использованные шрифты, а это для краткосрочного использования избыточный и ощутимый балласт), имея статус международного стандарта, гарантирует, что даже через продолжительное время, вне зависимости от окружения и операционной системы, любой пользователь сможет открыть документ в данном формате, располагая приложением-просмотрщиком. Этот факт укладывается в концепцию архива электронных документов и должен учитываться при сохранении каждого документа в нём.

Теперь необходимо определиться с тем, что такое отсканированный образ документов. Чаще всего это растровое изображение. Предполагается, что текста поверх него нет, то есть в документе хранится исключительно отсканированный растр — изображение, текст на котором непонятен компьютеру, а понятен только человеку.

В исключительных случаях поверх растрового изображения может быть расположен текстовый слой, частично или целиком наполненный. Причём делается это либо вручную человеком, либо с помощью системы распознавания текста. Можно предположить, что документ содержит метаданные, так или иначе связанные с видом документа и его содержимым (например, если это счёт-фактура, метаданные могут содержать информацию о поставщике, дате выставления, сумме и т. д.).

Очевидно, что отсканированный образ документа допускает, но не подразумевает долгосрочного хранения. Но всё-таки в большинстве случаев образ должен храниться не меньше бумажного оригинала, а зачастую значительно дольше, поскольку значимость и важность его в контексте организации-владельца всегда есть. Кроме того, образ снят с бумажного документа, а это значит, что его изменение не подразумевается, хотя и возможно.

На основании перечисленных особенностей, которыми обладает отсканированный образ документа, можно смело заявлять, что для хранения одинаково пригодны оба формата. Хотя PDF/A допускает и метаданные, и текстовый слой поверх изображения, и даже подписание документа с целью защитить его от модификации.

PDF-формат файлов: удобный и незаменимый — Многостраничные издания. Поздравительные журналы

В современном издательско-полиграфическом деле PDF-формат файлов является часто используемым, универсальным и, пожалуй, незаменимым. PDF в «легкой» версии удобно высылать на просмотр и утверждение готовых сверстанных материалов, а PDF для печати, записанный по специальным требованиям, отправляется в типографию. Помимо прочего, PDF-документ удобен для маркетинговой и рекламной работы, повсеместного распространения, пересылки, демонстрации, хранения какой‑либо информации.

Что же такое PDF-формат?

Portable Document Format (PDF) переводится с английского как «межплатформенный формат электронных документов». Данный формат файлов был разработан известной компанией Adobe Systems. В нем используется язык PostScript. Большая часть используемого в настоящее время профессионального печатного оборудования поддерживает формат PDF, поэтому произведение печати различных документов в этот формат возможно без использования специального программного обеспечения.
PDF содержит одну или множество страниц с графикой, текстами. Он поддерживает цветовые режимы, такие как CMYK, Grayscale, RGB, Lab, Duotone, Bitmap, а также различные типы сжатия растровой информации. Также этот формат позволяет внедрять в себя шрифты, изображения (векторные и растровые), формы для заполнения и мультимедиа-вставки (интерактивные элементы).

Множество разной документации, а также электронные книги во всемирой сети распространяются зачастую именно в формате PDF, так как при открытии PDF-документа он смотрится ровно так же, как выглядел в момент его создания. Этот формат файлов в настоящее время применяется в компьютерном дизайне и верстке различной полиграфической продукции, что позволяет получить при печати на бумаге именно то, что задумывалось.

Как создавать PDF-файлы

Чаще всего PDF-файлы создаются с помощью так называемого виртуального принтера. Документ готовится в какой‑либо из программ (например, в InDesign, MS Word, Illustrator), а затем экспортируется (т. е. конвертируется) в формат PDF. Таким образом, файл PDF по своей сути является конечным форматом (не исходником).

Как открывать PDF-файлы

PDF-файлы можно смотреть на любом компьютере, в котором установлена какая‑либо из программ, позволяющая открывать этот тип файлов. Наиболее известной и популярной программой для просмотра PDF-файлов сейчас является Adobe Reader. Несложно догадаться, что эту программу в свое время создала компания Adobe, придумавшая также и формат PDF. Adobe Reader также встроен в Acrobat Professional, что расширяет возможности работы с этим форматом файлов. Бесплатно скачать просмотрщик PDF можно на официальном сайте Adobe. Другие программы для открытия PDF-файлов: Foxit Reader, PDF-XChange Viewer, PDF Creator. «Глюки» и ошибки, видные при открытии PDF-файла, чаще всего связаны с неправильной конвертацией в этот формат или с некорректным содержимым в исходнике изначально (например, «битый» шрифт).

Достоинства формата PDF

  • Совместимость. Кроссплатформенность позволяет открыть файл в этом формате на любом компьютере, будь то PC или Mac, а также на мобильных телефонах и планшетах. А программы-просмотрщики PDF сейчас предустановлены практически в каждой ОС.
  • Компактность. В большинстве случаях PDF-файлы имеют небольшой размер, так что без проблем отправляются по электронной почте и быстро открываются.
  • Безопасность. Имеется возможность защиты документа от открывания, распечатки, а также копирования содержимого файла.
  • Удобство в работе с полиграфией. PDF-файл отображает содержимое всегда и везде одинаково: именно так, как это было изначально создано, с теми же шрифтами и таким же расположением элементов. А для работы с типографией данный формат файлов просто незаменим.

Редактирование PDF-файлов

Как уже было написано выше, PDF-формат по сути своей является конечным, и его редактирование без специальных программам или плагинов невозможно, поскольку не предусмотрено. Конечно, наилучшим выходом является найти и отредактировать исходник файла, который был когда‑то изначально создан, а потом сконвертирован в PDF. Это самый правильный вариант. Но, к сожалению, частенько исходники оказываются либо утраченными, либо поврежденными, а исправить что‑либо в готовом PDF очень надо. В таком случае стоит воспользоваться специальными программами, позволяющими вносить изменения в PDF-документ. Если же исправления предстоят большие, либо речь идет о полной переверстке, то целесообразнее сверстать документ заново по имеющемуся образцу и сделав сразу все необходимые правки и корректно подготовив файл к печати в типографии.

Кстати, большинство записанных PDF-файлов не подходят по качеству для того, чтобы их сразу же напечатать в типографии. В таком случае их необходимо дорабатывать (а то и переверстывать), но помнить, что восстановить качество, допустим, используемых в PDF-файле растровых изображений невозможно.

Формат файла PDF — Что такое файл PDF?

Portable Document Format (PDF) — это тип документа, созданный Adobe еще в 1990-х годах. Целью этого формата файла было введение стандарта для представления документов и других справочных материалов в формате, который не зависит от прикладного программного обеспечения, оборудования, а также от операционной системы. Формат файла PDF имеет полную возможность содержать такую ​​информацию, как текст, изображения, гиперссылки, поля формы, мультимедиа, цифровые подписи, вложения, метаданные, геопространственные функции и трехмерные объекты, которые могут стать частью исходного документа.

В большинстве случаев существующие документы конвертируются в PDF, а не создаются с нуля. Но это не означает, что нет программного обеспечения для создания или обработки файлов PDF.

(Хотите поделиться чем-нибудь о формате PDF-файла? Вы можете опубликовать свои выводы в разделе новостей формата PDF-файла.)

Формат PDF-файла — краткая история

Быстрый просмотр временной шкалы формирования PDF-файла в сроки следующие:

1993 — Adobe Systems предоставила спецификации PDF бесплатно

2008 — PDF был выпущен в качестве открытого стандарта 1 июля 2008 г. и был опубликован Международной организацией по стандартизации как ISO 32000-1: 2008 .

2008 — Adobe опубликовала публичную патентную лицензию в формате ISO 32000-1 без лицензионных отчислений на все патенты, принадлежащие Adobe, которые необходимы для создания, использования, продажи и распространения реализаций, совместимых с PDF.

Первая версия PDF, обозначенная как PDF 1.0, позже претерпела изменения до PDF 1.7. PDF 1.7, который стал ISO 32000-1, включает некоторые нестандартные проприетарные технологии, а также Adobe XML Forms Architecture (XFA) и расширение JavaScript для Acrobat.28 июля 2017 года был опубликован PDF 2.0, известный как ISO 32000-2: 2017, который не включает никаких нестандартных технологий.

Спецификации формата файла PDF

Файл PDF — это набор байтов, которые могут быть сгруппированы в токены в соответствии с правилами синтаксиса, определенными спецификациями PDF. Один или несколько маркеров объединяются для формирования синтаксических сущностей более высокого уровня, в основном объектов, которые являются базовыми значениями данных, из которых создается PDF-документ.

Файловая структура файлов PDF

Содержимое файла PDF расположено внутри файла в следующей последовательности.

| Заголовок | Тело | Таблица перекрестных ссылок | Прицеп

Заголовок файла PDF

Независимо от версии PDF файл PDF начинается с заголовка, содержащего уникальный идентификатор для PDF и версию формата, например% PDF-1.x, где x находится в диапазоне от 1 до 7.

Тело файла

Тело файла PDF состоит из последовательности косвенных объектов, представляющих содержимое документа. Объекты, как описано выше, представляют компоненты документа, такие как шрифты, страницы и образцы изображений.Начиная с PDF 1.5, тело также может содержать потоки объектов, каждый из которых содержит последовательность косвенных объектов.

Таблица перекрестных ссылок

Таблица перекрестных ссылок содержит информацию, которая разрешает произвольный доступ к косвенным объектам в файле, так что не нужно читать весь файл, чтобы найти какой-либо конкретный объект. Таблица должна содержать однострочную запись для каждого косвенного объекта, определяющую байтовое смещение этого объекта в теле файла. (Начиная с PDF 1.5, некоторая или вся информация о перекрестных ссылках может альтернативно содержаться в потоках перекрестных ссылок.

Трейлер файла

Трейлер файла PDF позволяет соответствующему читателю быстро найти таблицу перекрестных ссылок и некоторые специальные объекты. Соответствующие читатели должны читать PDF-файл с его конца. Последняя строка файла должна содержать только маркер конца файла %% EOF. Две предыдущие строки должны содержать, по одной на строку и в определенном порядке, ключевое слово startxref и байтовое смещение в декодированном потоке от начала файла до начала ключевого слова xref в последнем разделе перекрестных ссылок.

Объекты PDF

Файл PDF включает несколько различных типов объектов следующих типов:

  • Логические значения, представляющие условное истинное или ложное значение
  • Числа — целые и действительные значения
  • Строки — содержат символы в круглых скобках
  • Имена — начать с вперед / символа, например / ASomewhatLongerName приводит к ASomewhatLongerName
  • Массивы — PDF поддерживает одномерные массивы. Массивы более высоких измерений могут быть построены с использованием массивов в качестве вложенных элементов.
  • Словари — коллекция объектов в виде пар ключ-значение.Он может иметь нулевые записи.
  • Streams — представляет последовательность байтов, которая также может иметь неограниченную длину.
  • Null Object — представляет нулевое значение.

. Могут быть другие объекты, такие как комментарии, которые представлены знаком% и могут содержать 8-битные символы. .

Косвенные объекты

Любой объект в файле PDF может быть помечен как косвенный объект. Косвенным объектам присваивается уникальный идентификатор объекта, по которому другие объекты могут ссылаться на него.Перекрестные ссылки на них поддерживаются в индексной таблице и помечаются ключевым словом xref, которое следует за основным телом и дает байтовое смещение каждого косвенного объекта от начала файла.

Линейные и нелинейные макеты PDF

Макеты PDF подразделяются на близкие и нелинейные в зависимости от целевых приложений и других факторов.

Нелинейный — Нелинейные PDF-файлы занимают меньше места на диске по сравнению с линейными PDF-файлами. PDF-страницы документа находятся в разрозненной форме по PDF-файлу, поэтому нелинейные файлы работают медленнее по сравнению с линейными файлами.

Линейный PDF-файл — предназначен для онлайн-просмотра PDF-файлов. Файлы линейного PDF-файла построены таким образом, что они записываются на диск в линейном режиме. При этом не требуются плагины браузера для загрузки всего документа перед отображением.

Обзор объектов

Как уже упоминалось, тело PDF-файла представляет собой набор объектов, упомянутых выше. PDF в значительной степени основан на PostScript без функций управления языков программирования, таких как команды if и loop. Команды, выдаваемые кодом Postscript для генерации графического содержимого, собираются и токенизируются в дополнение к любым файлам, графике или шрифтам, на которые ссылается документ.Все это содержимое накапливается в одном файле, в результате чего получается скомпонованный вывод PostScript.

Текст

Текст в PDF представлен текстовыми элементами, которые фактически отображаются с глифами из шрифтов. Глиф — это графическая форма, с которой можно выполнять все графические манипуляции, например преобразование координат. Из-за важности текста в большинстве описаний страниц PDF предоставляет возможности более высокого уровня для удобного и эффективного описания, выбора и визуализации глифов.

Графика

Графические операторы, используемые в потоках содержимого PDF, описывают внешний вид страниц, которые должны воспроизводиться на устройстве вывода растров. Оборудование предназначено как для принтеров, так и для дисплеев. Графические операторы образуют шесть основных групп:

  • Операторы графического состояния манипулируют структурой данных, называемой графическим состоянием, глобальной структурой, в которой выполняются другие графические операторы. Состояние графики включает в себя текущую матрицу преобразования (CTM), которая отображает координаты пользовательского пространства, используемые в потоке содержимого PDF, в координаты устройства вывода.Он также включает текущий цвет, текущий контур обрезки и многие другие параметры, которые являются неявными операндами операторов рисования.
  • Операторы построения пути задают пути, которые определяют формы, траектории линий и области различных типов. Они включают в себя операторы для начала нового пути, добавления к нему линейных сегментов и кривых и закрытия его.
  • Операторы рисования контура заполняют контур цветом, рисуют обводку вдоль него или используют в качестве границы отсечения.
  • Другие операторы рисования рисуют определенные графические объекты с самоописанием.К ним относятся образцы изображений, геометрически определенные оттенки и целые потоки контента, которые, в свою очередь, содержат последовательности графических операторов.
  • Текстовые операторы выбирают и отображают глифы символов из шрифтов (описания гарнитур для представления текстовых символов). Поскольку PDF рассматривает глифы как общие графические формы, многие текстовые операторы можно сгруппировать с помощью операторов состояния графики или рисования. Однако структуры данных и механизмы работы с описаниями глифов и шрифтов достаточно специализированы.
  • Операторы помеченного содержимого связывают логическую информацию более высокого уровня с объектами в потоке содержимого. Эта информация не влияет на визуализированный внешний вид контента; это полезно для приложений, использующих PDF для обмена документами.

Ссылки

Формат файла PDF: Базовая структура [обновлено в 2020 г.]

Все мы знаем, что существует ряд атак, при которых злоумышленник включает некоторый шелл-код в документ PDF. Этот шелл-код использует некоторую уязвимость в том, как документ PDF анализируется и представляется пользователю для выполнения вредоносного кода в целевой системе.

На следующем изображении показано количество уязвимостей, обнаруженных в популярной программе чтения PDF-файлов Adobe Acrobat Reader DC, выпущенной в 2015 году и ставшей единственной поддерживаемой версией Acrobat Reader после прекращения поддержки Acrobat XI в октябре 2017 года. Количество уязвимостей растет. с годами. Наиболее важные уязвимости — это уязвимости выполнения кода, которые злоумышленник может использовать для выполнения произвольного кода в целевой системе (если Acrobat Reader еще не исправлен).

Рисунок 1: Уязвимости Adobe Acrobat Reader DC

Это важный показатель того, что мы должны регулярно обновлять нашу программу чтения PDF-файлов, поскольку количество недавно обнаруженных уязвимостей весьма устрашающе.

Структура файла PDF

Каждый раз, когда мы хотим обнаружить новые уязвимости в программном обеспечении, мы должны сначала понять протокол или формат файла, в котором мы пытаемся обнаружить новые уязвимости. В нашем случае мы должны сначала подробно разобраться в формате файла PDF.В этой статье мы рассмотрим формат файла PDF и его внутреннее устройство.

PDF — это переносимый формат документов, который можно использовать для представления документов, содержащих текст, изображения, мультимедийные элементы, ссылки на веб-страницы и многое другое. Он имеет широкий спектр функций. Спецификация формата файла PDF общедоступна здесь и может использоваться всеми, кто интересуется форматом файла PDF. Только для формата PDF-файлов имеется почти 800 страниц документации, так что читать ее — не то, что нужно делать по прихоти.

PDF имеет больше функций, чем просто текст: он может включать изображения и другие мультимедийные элементы, быть защищенным паролем, выполнять JavaScript и так далее. Базовая структура файла PDF представлена ​​на рисунке ниже:

Рисунок 2: Структура PDF

Каждый PDF-документ содержит следующие элементы:

Заголовок

Это первая строка файла PDF, в которой указывается номер версии используемой спецификации PDF, которая используется в документе.Если мы хотим это выяснить, мы можем использовать шестнадцатеричный редактор или просто использовать команду xxd , как показано ниже:

[простой]
# xxd temp.pdf | head -n 1
0000000: 2550 4446 2d31 2e33 0a25 c4e5 f2e5 eba7% PDF-1.3.% ……
[/ plain]

В PDF-документе temp.pdf используется спецификация PDF 1.3. Символ «%» является комментарием в PDF, поэтому в приведенном выше примере первая и вторая строки фактически представляют собой комментарии, что верно для всех PDF-документов. Следующие байты взяты из вывода ниже: 2550 4446 2d31 2e33 0a25 c4e5 и соответствуют тексту ASCII «% PDF-1.3.% ». Ниже приведены некоторые символы ASCII, в которых используются непечатаемые символы (обратите внимание на точки ‘.’), Которые обычно используются, чтобы сообщить некоторым программным продуктам, что файл содержит двоичные данные и не должен рассматриваться как 7-битный ASCII. текст. В настоящее время номера версий имеют вид 1.N, где N находится в диапазоне 0-7.

Кузов

В теле документа PDF есть объекты, которые обычно включают в себя текстовые потоки, изображения, другие мультимедийные элементы и т. Д. Раздел «Тело» используется для хранения всех данных документа, показываемых пользователю.

таблица xref

Это таблица перекрестных ссылок, которая содержит ссылки на все объекты в документе. Назначение таблицы перекрестных ссылок состоит в том, что она обеспечивает произвольный доступ к объектам в файле, поэтому нам не нужно читать весь документ PDF, чтобы найти конкретный объект. Каждый объект представлен одной записью в таблице перекрестных ссылок, которая всегда имеет длину 20 байт. Покажем пример:

[простой]
xref
0 1
0000000023 65535 f
3 1
0000025324 00000 n
21 4
0000025518 00002 n
0000025632 00000 n
0000000024 00001 f
0000000000 00001 f
36 1
]

Мы можем отобразить таблицу перекрестных ссылок документа PDF, просто открыв PDF-файл в текстовом редакторе и прокрутив его до конца документа.В приведенном выше примере мы видим, что у нас есть четыре подраздела (обратите внимание на четыре строки, содержащие только два числа). Первое число в этих строках соответствует номеру объекта, а вторая строка указывает количество объектов в текущем подразделе. Каждый объект представлен одной записью длиной 20 байт (включая CRLF).

Первые 10 байтов — это смещение объекта от начала документа PDF до начала этого объекта. Далее следует разделитель пробелом с другим числом, указывающим номер поколения объекта.После этого идет еще один разделитель пробела, за которым следует буква «f» или «n», чтобы указать, свободен ли объект или используется.

Первый объект имеет идентификатор 0 и всегда содержит одну запись с номером поколения 65535, которая находится во главе списка свободных объектов (обратите внимание на букву «f», которая означает «свободный»). Последний объект в таблице перекрестных ссылок использует номер поколения 0.

Второй подраздел имеет идентификатор объекта 3 и содержит один элемент, объект 3, который начинается со смещения 25324 байта от начала документа.Третий подраздел состоит из четырех объектов, первый из которых имеет идентификатор 21 и начинается со смещения 25518 от начала файла. Остальные объекты имеют следующие номера 22, 23 и 24.

Все объекты отмечены флажком «f» или «n». Флаг «f» означает, что объект может все еще присутствовать в файле, но помечен как свободный, поэтому его не следует использовать. Эти объекты содержат ссылку на следующий свободный объект и номер поколения, который будет использоваться, если объект снова станет действительным. Флаг «n» используется для представления действительных и используемых объектов, которые содержат смещение от начала файла и номер поколения объекта.

Обратите внимание, что нулевой объект указывает на следующий свободный объект в таблице, объект 23. Поскольку объект 23 также свободен, он сам указывает на следующий свободный объект в таблице, объект 24. Но объект 24 является последним свободным объектом в таблице. файл, так что он указывает обратно на нулевой объект. Если представить приведенную выше таблицу перекрестных ссылок с каждым номером объекта, она будет выглядеть следующим образом:

[простой]
xref
0 1
0000000023 65535 f
3 1
0000025324 00000 n
21 1
0000025518 00002 n
22 1
0000025632 00000 n
23 1
0000000024 00001 f
000000 24 00001
000000 1 9015 1
0000026900 00000 n
[/ простой]

Номер поколения объекта увеличивается, когда объект освобождается, поэтому, если объект снова становится действительным (изменяет флаг с «f» на «n»), номер поколения остается действительным без необходимости его увеличения.Номер поколения объекта 23 равен 1, поэтому, если он снова станет действительным, номер поколения по-прежнему будет 1, но если он снова будет удален, номер поколения увеличится до 2.

В документах PDF, которые постепенно обновлялись, обычно присутствует несколько подразделов, в противном случае должен присутствовать только один подраздел, начинающийся с нуля.

Прицеп

Трейлер PDF определяет, как приложение, читающее документ PDF, должно найти таблицу перекрестных ссылок и другие специальные объекты.Все программы чтения PDF-файлов должны начинать чтение PDF-файла с конца файла. Пример трейлера представлен ниже:
трейлер
& amp; lt; & amp; lt;
/ Размер 22
/ Корень 2 0 R
/ Информация 1 0 R
& amp; gt; & amp; gt;
startxref
24212
%% EOF
Последняя строка документа PDF содержит конец строки файла «%% EOF». Перед концом тега файла находится строка со строкой startxref , которая указывает смещение от начала файла до таблицы перекрестных ссылок.В нашем случае таблица перекрестных ссылок начинается со смещения 24212 байт. Перед этим находится строка трейлера , которая определяет начало раздела трейлера. Содержимое разделов трейлера заключено в символы << и >> (это словарь, который принимает пары ключ-значение).

Мы видим, что раздел трейлера определяет несколько клавиш, каждая из которых предназначена для определенного действия. В разделе трейлера можно указать следующие ключи:

  • / Размер [целое число]: указывает количество записей в таблице перекрестных ссылок (включая также объекты в обновленных разделах).Используемый номер не должен быть косвенной ссылкой.
  • / Prev [целое число]: указывает смещение от начала файла до предыдущего раздела перекрестной ссылки, которое используется, если имеется несколько разделов перекрестных ссылок. Номер должен быть перекрестной ссылкой.
  • / Root [словарь]: указывает объект ссылки для объекта каталога документов, который представляет собой специальный объект, содержащий различные указатели на различные типы других специальных объектов (подробнее об этом позже).
  • / Encrypt [dictionary]: определяет словарь шифрования документа.
  • / Info [dictionary]: Определяет объект ссылки для информационного словаря документа.
  • / ID [массив]: Задает массив двухбайтовых незашифрованных строк, которые образуют идентификатор файла.
  • / XrefStm [integer]: указывает смещение от начала файла до потока перекрестных ссылок в декодированном потоке. Это присутствует только в файлах гибридных ссылок, которые указываются, если мы также хотим открывать документы, даже если приложения не поддерживают сжатые потоки ссылок.

Мы должны помнить, что первоначальная структура может быть изменена, если мы обновим документ PDF в более позднее время. Обновление обычно добавляет дополнительные элементы в конец файла.

Дополнительные обновления

PDF-файл был разработан с учетом инкрементальных обновлений, так как мы можем добавлять некоторые объекты в конец PDF-файла, не перезаписывая файл целиком. Благодаря этому изменения в PDF-документе можно быстро сохранить. Новую структуру PDF-документа можно увидеть на картинке ниже:

Рисунок 3: Структура PDF

Мы видим, что документ PDF по-прежнему содержит исходный заголовок, тело, таблицу перекрестных ссылок и трейлер.Кроме того, в PDF-документ были добавлены другие разделы основного текста, перекрестных ссылок и трейлера. Дополнительные разделы перекрестных ссылок будут содержать только записи для объектов, которые были изменены, заменены или удалены. Удаленные объекты останутся в файле, но будут отмечены флажком «f». Каждый трейлер должен заканчиваться тегом «%% EOF» и содержать запись / Prev, которая указывает на предыдущий раздел перекрестных ссылок.

В PDF версиях 1.4 и выше мы можем указать запись версии в словаре каталога документа, чтобы заменить версию по умолчанию из заголовка PDF.

Пример

Давайте представим простой пример PDF-файла и проанализируем его. Давайте загрузим отсюда образец PDF-документа и проанализируем его. При открытии этого PDF-документа он выглядит, как показано ниже:

Рисунок 4: Образец PDF-документа

Перекрестные ссылки и концевые разделы представлены на картинке ниже:

Рисунок 5: Перекрестная ссылка и раздел прицепа

Раздел с перекрестными ссылками был уменьшен для ясности.Раздел перекрестных ссылок содержит один подраздел, который содержит 223 объекта. Раздел трейлера начинается со смещения байта 50291, включает 223 объекта, где корневой элемент указывает на объект 221, а информационный элемент указывает на объект 222.

В следующем разделе мы рассмотрим основные типы данных структуры PDF.

Типы данных PDF

PDF-документ содержит восемь основных типов объектов, описанных ниже. Эти типы: логические, числа, строки, имена, массивы, словари, потоки и нулевой объект.Объекты могут быть помечены, чтобы на них могли ссылаться другие объекты. Помеченный объект также называется косвенным объектом.

Логические

Есть два ключевых слова: истина, и ложь, , которые представляют логические значения.

Номера

В документе PDF есть два типа чисел: целые и действительные. Целое число состоит из одной или нескольких цифр, которым может предшествовать знак плюс или минус. Пример целочисленных объектов можно увидеть ниже:

Действительное значение может быть представлено одной или несколькими цифрами, с дополнительным знаком и ведущей, конечной или встроенной десятичной точкой (точкой).Пример действительных чисел можно увидеть ниже:

  • 123,0 -123,0 +123,0 123. -,123

Имена

Имена в документах PDF представлены последовательностью символов ASCII в диапазоне 0x21 — 0x7E. Исключение составляют символы:%, (,), <,>, [,], {,}, / и #, которым должна предшествовать косая черта. Альтернативное представление символов — их шестнадцатеричный эквивалент, которому предшествует символ «#». Существует ограничение на длину элемента имени, которая может составлять всего 127 байт.

При написании имени необходимо использовать косую черту для обозначения имени; косая черта не является частью имени, а является префиксом, указывающим, что далее следует последовательность символов, представляющих имя. Если мы хотим использовать пробел или любой другой специальный символ как часть имени, он должен быть закодирован в двузначной шестнадцатеричной системе счисления.

Примеры имен можно увидеть в таблице ниже:

Рисунок 6: Имена PDF-файлов (источник)

Струны

Строки в документе PDF представлены как последовательность байтов, заключенных в круглые или угловые скобки, но могут иметь длину не более 65535 байтов.Любой символ может быть представлен в виде ASCII, а также в восьмеричном или шестнадцатеричном представлении. Восьмеричное представление требует, чтобы символ был записан в форме ддд, где ддд — восьмеричное число. Шестнадцатеричное представление требует, чтобы символ был записан в форме

, где dd — шестнадцатеричное число.

Пример представления строки, заключенной в круглые скобки, можно увидеть ниже:

Пример представления строки, заключенной в угловые скобки, можно увидеть ниже (шестнадцатеричное представление ниже такое же, как и выше, и читается как «mystring»):

Мы также можем использовать специальные хорошо известные символы при представлении строки.Это: n для новой строки, r для возврата каретки, t для горизонтального табулятора, b для возврата, f для подачи формы, (для левой скобки) для правой скобки и для обратной косой черты.

Массивы

Массивы в документах PDF представлены как последовательность объектов PDF, которые могут быть разных типов и заключены в квадратные скобки. Вот почему массив в документе PDF может содержать любые типы объектов, такие как числа, строки, словари и даже другие массивы. В массиве также могут быть нулевые элементы.Массив обозначается квадратной скобкой. Пример массива представлен ниже:

  • 123 123.0 true (mystring) / myname]

Словари

Словари в PDF-документе представлены в виде таблицы пар ключ / значение. Ключ должен быть объектом имени, тогда как значением может быть любой объект, включая другой словарь. Максимальное количество статей в словаре — 4096 статей. Словарь может быть представлен статьями, заключенными в двойные угловые скобки << и >>.Пример словаря представлен ниже:
& lt; & lt; / mykey1 123

/ mykey2 0,123

/ mykey3 & lt; & lt; / mykey4 правда

/ mykey5 (mystring)

& gt; & gt;

& gt; & gt;

Потоки

Объект потока представлен последовательностью байтов и может быть неограниченной по длине, поэтому изображения и другие блоки больших данных обычно представляются как потоки.Объект потока представлен объектом словаря, за которым следует поток ключевых слов, за которым следует новая строка и конечный поток.

Пример объекта потока можно увидеть ниже:
& lt; & lt;

/ Тип / Страница

/ Длина 23 0 R

/ Фильтр / LZWDecode

& gt; & gt;

поток

endstream
Все объекты потока должны быть косвенными объектами, а словарь потока должен быть прямым объектом. Словарь потока указывает точное количество байтов потока.После данных должна быть новая строка и ключевое слово endstream.

Общие ключевые слова, используемые во всех словарях потоков, следующие (обратите внимание, что запись Length является обязательной):

  • Длина: сколько байтов файла PDF используется для данных потока. Если поток содержит запись фильтра, длина должна указывать количество байтов закодированных данных.
  • Тип: Тип объекта PDF, описываемого в словаре.
  • Фильтр: имя фильтра, который будет применяться при обработке данных потока.Можно указать несколько фильтров в порядке их применения.
  • DecodeParms: словарь или массив словарей, используемых фильтрами, указанными в Filter. Это значение определяет параметры, которые необходимо передать фильтрам при их применении. В этом нет необходимости, если фильтры используют значения по умолчанию.
  • F: указывает файл, содержащий данные потока.
  • FFilter: имя фильтра, который будет применяться при обработке данных, обнаруженных во внешнем файле потока.
  • FDecodeParms: словарь или массив словарей, используемых фильтрами, заданными FFilter.
  • DL: указывает количество байтов в декодируемом потоке. Это можно использовать, если на диске достаточно места для записи потока в файл.
  • N: количество косвенных объектов, хранящихся в потоке.
  • Первый: смещение в декодированном потоке первого сжатого объекта.
  • Extends: указывает ссылку на другие потоки объектов, которые образуют дерево наследования.

Данные потока в потоке объектов будут содержать N пар целых чисел, где первое целое число представляет номер объекта, а второе целое число представляет смещение в декодированном потоке этого объекта. Объекты в потоках объектов являются последовательными, и их не нужно сохранять в порядке возрастания относительно номера объекта. Первая запись в словаре идентифицирует первый объект в потоке объектов.

Нельзя хранить в потоке объектов следующую информацию:

  • Потоковые объекты
  • Объекты с номером поколения, отличным от нуля
  • Словарь шифрования документа
  • Косвенный объект записи Length в словаре потока объектов
  • Каталог документов, словарь линеаризации, объекты страниц

В PDF 1.5, информация о перекрестных ссылках может храниться в потоке перекрестных ссылок вместо таблицы перекрестных ссылок. Каждый поток перекрестных ссылок содержит информацию, эквивалентную таблице перекрестных ссылок и трейлеру.

Нулевой объект

Нулевой объект представлен ключевым словом «null».

Косвенные объекты

Прежде всего, мы должны знать, что любой объект в документе PDF может быть помечен как косвенный объект. Это дает объекту уникальный идентификатор объекта, который другие объекты могут использовать для ссылки на косвенный объект.Косвенный объект — это пронумерованный объект, представленный ключевыми словами «obj» и «endobj». Endobj должен присутствовать в отдельной строке, но obj должен находиться в конце строки идентификатора объекта, которая является первой строкой косвенного объекта. Строка идентификатора объекта состоит из номера объекта, номера поколения и ключевого слова «obj». Пример косвенного объекта выглядит следующим образом:
2 1 obj

12345

endobj
В приведенном выше примере мы создаем новый косвенный объект, который содержит объект с номером 12345.Объявляя объект косвенным объектом, мы можем использовать его в таблице перекрестных ссылок документа PDF и повторно использовать его на любой странице, в словаре и т. Д. В документе. Поскольку каждый косвенный объект имеет свою собственную запись в таблице перекрестных ссылок, к косвенным объектам можно получить доступ очень быстро.

Идентификатор косвенного объекта состоит из двух частей; первая часть — это номер текущего косвенного объекта. Непрямые объекты не нужно нумеровать последовательно в документе PDF.Вторая часть — это номер поколения, который устанавливается равным нулю для всех объектов во вновь созданном файле. Это число позже увеличивается при обновлении объектов.

Мы можем ссылаться на косвенные объекты с помощью косвенной ссылки, которая состоит из номера объекта, номера поколения и ключевого слова R. Чтобы ссылаться на вышеупомянутый косвенный объект, мы должны написать что-то вроде ниже:

Если мы пытаемся сослаться на неопределенный объект, мы фактически ссылаемся на нулевой объект.

Структура документа

Документ PDF состоит из объектов, содержащихся в основной части файла PDF. Большинство объектов в документе PDF — это словари. Каждая страница документа представлена ​​объектом страницы, который представляет собой словарь, включающий ссылки на содержимое страницы. Объекты страниц связаны между собой и образуют дерево страниц, которое объявляется с косвенной ссылкой в ​​каталоге документов.

Вся структура PDF-документа может быть представлена ​​на картинке ниже [1]:

Рисунок 7: Структура документа PDF (источник)

На рисунке выше мы видим, что каталог документов содержит ссылки на дерево страниц, иерархию контуров, цепочки статей, именованные места назначения и интерактивную форму.Мы не будем вдаваться в подробности того, что делает каждый из этих разделов, но представим только самый важный раздел — дерево страниц.

Каталог документов

На изображении выше мы видим, что Каталог документов является корнем объектов в документе PDF. Мы уже говорили, что это элемент / Root в разделе Trailer PDF, который определяет каталог документов. Каталог документов содержит ссылки на другие объекты, которые определяют содержание документа. Он также содержит информацию о том, как документ будет отображаться на экране.Записи в каталоге документов следующие:

  • / Тип: Тип объекта PDF, описываемого каталогом (в нашем случае это Каталог, поскольку это объект каталога документов).
  • / Версия: Версия спецификации PDF, на основе которой был создан документ.
  • / Extensions: Информация о расширениях для разработчиков в этом документе.
  • / Pages: косвенная ссылка на объект, являющийся корнем дерева страниц документа.
  • / Dests: косвенная ссылка на объект, который является корнем указанного объекта назначения.
  • / Outlines: косвенная ссылка на объект каталога структуры, который является корнем иерархии структуры документа.
  • / Threads: косвенная ссылка на массив словарей потоков, которые представляют цепочки статей документа.
  • / Метаданные: косвенная ссылка на поток метаданных, который содержит метаданные для документа.

Есть много других записей, которые мы можем видеть как часть каталога документов, но не будем описывать их здесь.Подробности читатель может почитать в наших источниках. Пример каталога документов представлен ниже:
1 0 obj

& lt; & lt; / Тип / Каталог

/ Страницы 2 0 R

/ PageMode / UseOutlines

/ Контуры 3 0 R

& gt; & gt;

эндобдж

Дерево страниц

Доступ к страницам документа осуществляется через дерево страниц, которое определяет все страницы в документе PDF. Дерево содержит узлы, которые представляют страницы документа PDF, которые могут быть двух типов: промежуточные и листовые узлы.Промежуточные узлы также называются узлами дерева страниц, а конечные узлы — объектами страницы.

Простейшая древовидная структура страницы может состоять из одного узла дерева страниц, который напрямую ссылается на все объекты страницы (так что все объекты страницы являются листами).

Каждый узел в дереве страниц должен иметь следующие записи:

  • / Тип: Тип объекта PDF, описываемого этим объектом (в нашем случае это страницы, , поскольку мы говорим об узлах дерева страниц).
  • / Родитель: должен присутствовать во всех узлах дерева страниц, кроме корневого, где эта запись не должна присутствовать. Эта запись указывает своего родителя.
  • / Kids: Должен присутствовать во всех узлах дерева страниц, кроме листьев, и указывает все дочерние элементы, непосредственно доступные из текущего узла.
  • / Count: указывает количество конечных узлов, которые являются потомками этого узла в последующем дереве страниц.

Мы должны помнить, что дерево страниц не имеет отношения ни к чему в документе PDF, например к страницам или главам.

Базовый пример дерева страниц можно увидеть ниже:
2 0 obj

& lt; & lt; / Тип / Страницы

/ Дети [4 0 R

10 0 р

24 0 R

]

/ Количество 3

& gt; & gt;

эндобдж

4 0 объект

& lt; & lt; / Тип / Страница

& gt; & gt;

эндобдж

10 0 объект

& lt; & lt; / Тип / Страница

& gt; & gt;

эндобдж

24 0 объект

& lt; & lt; / Тип / Страница

& gt; & gt;

endobj
В дереве страниц выше определяется объект Root с идентификатором 2, который имеет трех дочерних объектов: объекты 4, 10 и 20.Мы также можем видеть, что листья дерева страниц — это словари, определяющие атрибуты отдельной страницы документа. Есть несколько атрибутов, которые мы можем использовать при их определении для каждой страницы документа.

Мы рассмотрели базовую структуру документа PDF и типы данных. Если мы хотим начать поиск уязвимостей в программах для чтения PDF-файлов, нам необходимо изменить PDF-документ таким образом, чтобы программа для чтения PDF-файлов не могла с этим справиться и вылетела из строя. Обычно, если нам удается вызвать сбой программы чтения PDF-файлов, мы обнаруживаем уязвимость системы безопасности, которую можем использовать для выполнения произвольного кода на целевой машине.

Пример

В этой статье мы рассмотрим очень простой пример документа PDF. Сначала нам нужно создать PDF-документ, чтобы затем мы попытались его проанализировать. Чтобы создать документ PDF, давайте сначала создадим очень простой документ .tex, содержащий то, что показано на рисунке ниже:

Рисунок 8: Простой документ

Мы видим, что документ .tex действительно не содержит большого количества файлов. Сначала мы определяем документ как статью, а затем включаем содержимое статьи в начальный и конечный документ.Мы добавляем новый раздел с заголовком (Введение) и статическим текстом «Hello World!».

Мы можем скомпилировать документ .tex в документ PDF с помощью команды pdflatex и указав имя файла .tex в качестве аргумента. Полученный PDF-файл будет выглядеть так, как показано на рисунке ниже:

Рисунок 9: Результат

Мы видим, что документ PDF на самом деле не содержит очень много, только текст, который мы фактически включили, и никаких изображений, JavaScript или других элементов.

Пример 1

Давайте посмотрим на структуру документа PDF, которая представлена ​​в выводе ниже:
% PDF-1.5

% ÐÔÅØ

3 0 объект & lt; & lt;

/ Длина 138

/ Фильтр / FlateDecode

& gt; & gt;

поток

конечный поток

эндобдж

10 0 объект & lt; & lt;

/ Длина2 1526

/ Длина3 7193

/ Длина4 0

/ длина 8194

/ Фильтр / FlateDecode

& gt; & gt;

поток

конечный поток

эндобдж

12 0 объект & lt; & lt;

/ Длина2 1509

/ Длина3 9410

/ Длина4 0

/ длина 10422

/ Фильтр / FlateDecode

& gt; & gt;

поток

конечный поток

эндобдж

15 0 obj & lt; & lt;

/ Производитель (pdfTeX-1.40.12)

/ Создатель (TeX)

/ CreationDate (D: 20121012175007 + 02’00 ’)

/ ModDate (D: 20121012175007 + 02’00 ’)

/ В ловушке / Ложь

/PTEX.Fullbanner (Это pdfTeX, версия 3.1415926-2.3-1.40.12 (TeX Live 2011) kpathsea версия 6.0.1)

& gt; & gt; endobj

6 0 объект & lt; & lt;

/ Тип / ObjStm

/ № 10

/ Первые 65

/ Длина 761

/ Фильтр / FlateDecode

& gt; & gt;

поток

конечный поток

эндобдж

16 0 obj & lt; & lt;

/ Тип / XRef

/ Индекс [0 17]

/ Размер 17

/ Вт [1 2 1]

/ Корень 14 0 R

/ Инфо 15 0 R

/ ID [& lt; 1DC2E3E09458C9B4BEC8B67F56B57B63 & gt; & lt; 1DC2E3E09458C9B4BEC8B67F56B57B63 & gt;]

/ Длина 60

/ Фильтр / FlateDecode

& gt; & gt;

поток

конечный поток

эндобдж

startxref

20215

%% EOF
Для создания такого простого PDF-документа достаточно много элементов, поэтому мы можем представить, как будет выглядеть действительно сложный PDF-документ.Мы также должны помнить, что все потоки закодированных данных были удалены и заменены тремя точками для ясности и краткости.

Давайте представим каждый из разделов PDF. Заголовок можно увидеть на картинке ниже:

Рисунок 10: Заголовок PDF

Тело можно увидеть на картинке ниже:

Рисунок 11: Тело PDF

Раздел xref можно увидеть на картинке ниже:

Рисунок 11: PDF xref

И, наконец, раздел Trailer представлен ниже:

Рисунок 12: Прицеп PDF

Мы представили все разделы PDF-документа, но нам еще предстоит их проанализировать.Заголовок PDF-документа стандартный, и нам не нужно об этом говорить, поэтому оставим текст на потом.

Вот почему мы должны сначала взглянуть на раздел xref. Мы видим, что смещение от начала файла до таблицы внешних ссылок составляет 20215 байт, что в шестнадцатеричной форме равно 0x4ef7. Если мы посмотрим на шестнадцатеричное представление файла, которое мы можем получить с помощью инструмента xxd, мы увидим то, что представлено на рисунке ниже:

Рисунок 13: Шестнадцатеричное представление файла

Выделенные байты лежат точно в начале смещения 20125 байтов от начала файла.Предыдущие байты 0x0a — это новая строка, а текущие байты 0x31 представляют собой число 1, которое в точности является началом таблицы внешних ссылок. Вот почему таблица xref представлена ​​косвенным объектом с идентификатором 16 и номером поколения 0. (Это должно быть так для всех объектов, поскольку мы только что создали документ PDF и ни один из объектов еще не был изменен. Если мы посмотрите на весь PDF-документ, и мы увидим, что это действительно так; все объекты имеют нулевой номер поколения.)

/ Тип косвенного объекта классифицирует его как таблицу внешних ссылок.Массив / Index содержит пару целых чисел для каждого подраздела этого раздела. Первое целое число указывает номер первого объекта в подразделе, а второе целое число указывает количество записей в подразделе. В нашем примере номер объекта равен нулю, и в этом подразделе 17 записей. Это также указывается в директиве / Size. Обратите внимание, что это число на единицу больше наибольшего числа любого номера объекта в подразделе. Атрибут / W определяет массив целых чисел, представляющих размер полей в записи перекрестной ссылки, что означает, что поля являются одним байтом, двумя байтами и одним байтом.

После этого идет элемент / Root, который указывает каталог каталога для документа PDF как объект номер 14. / Info — это каталог информации документа PDF, который содержится в объекте номер 15. Массив / ID требуется, потому что Зашифрованная запись присутствует и содержит две строки, составляющие идентификатор файла. Эти две строки используются в качестве входных данных для алгоритма шифрования.

Параметр / Length указывает длину ключа шифрования в битах; значение должно быть кратным 8 в диапазоне от 40 до 128 (значение по умолчанию — 40).В нашем случае длина ключа шифрования составляет 60 бит. / Filter указывает имя обработчика безопасности для этого документа; это также обработчик безопасности, который использовался для шифрования документа. В нашем случае это FlateDecode, который кодирует данные с помощью метода сжатия zlib / deflate.

Мы видим, что другая часть таблицы внешних ссылок сжата, поэтому мы не можем ее прочитать. Конечно, мы могли бы применить какой-нибудь алгоритм распаковки zlib к сжатым данным, но есть вариант получше.Зачем нам писать программу для этого, если инструмент уже существует? С помощью pdftk мы можем восстановить поврежденную таблицу внешних ссылок PDF-файла с помощью следующей команды:

  • # pdftk in.pdf output out.pdf

После этого файл out.pdf будет содержать следующие разделы внешних ссылок и трейлеров:

Рисунок 14: xref и трейлер

Очевидно, что номера объектов / Root и / Info изменились, а также другие вещи, но мы получили ключевые слова трейлера и xref, которые определяют таблицу xref.Мы видим, что в таблице внешних ссылок 14 объектов.

Мы могли бы продолжить и попытаться расшифровать и другие разделы, но это выходит за рамки данной статьи. Затем мы проверим документ, который не закодирован.

Пример 2

Давайте взглянем на образец документа PDF, доступный здесь. Некоторые объекты потока зашифрованы, но сейчас они не так важны. Поскольку мы уже знаем, как работать с PDF-документами, мы не потеряем слишком много слов в простых вещах.

Давайте откроем этот PDF-файл в текстовом редакторе, таком как gvim, и посмотрим на раздел трейлера.К настоящему моменту мы должны знать, что все документы PDF следует читать от конца до начала. Прицеп представлен на картинке ниже:

Рисунок 15: Прицеп PDF

Давайте также представим Xref с несколькими объектами (остальные отброшены для ясности):

Рисунок 16: PDF xref

Мы видим, что корневой каталог / документа PDF содержится в объекте с ID 221, а в объекте 222 есть дополнительная информация.Объект 221 — самый важный объект во всем документе, поэтому давайте представим его:

Рисунок 17: Объект 221

Мы видим, что объект действительно является Каталогом документов. Объект Page Tree — 212, объект Outlines — 213, объект Names — 220, а объект OpenAction — 58. Мы не говорили ни о каких других типах, кроме объекта Page Tree, поэтому продолжим разговор о Page Tree. Только.

Объект Page Tree с ID 212 представлен на рисунке ниже:

Рисунок 18: Объект дерева страниц

Итак, объект 212 содержит фактические страницы документа PDF.Он содержит 10 страниц, что совершенно верно (мы можем проверить это, если откроем PDF-файл с помощью любого PDF-ридера и проверим количество страниц).

Мы знаем, что атрибут Kids определяет все дочерние элементы, непосредственно доступные из текущего узла. В нашем случае есть два прямых дочерних узла с идентификаторами объектов 66 и 135. Объект 66 представлен ниже:

Рисунок 19: Объект 66

Объект 66 содержит другие дочерние элементы с ID 57, 69, 75, 97, 108 и 120.

Рисунок 20: Объект 135

Объект 135 дополнительно определяет объекты 129, 138, 133 и 158.

Если мы посчитаем все элементы, мы увидим, что есть ровно 10 элементов, что означает 10 страниц из 10 страниц. Это также подразумевает, что все представленные объекты на самом деле являются фактическими страницами документа PDF и не содержат дополнительных дочерних узлов.

Все представленные объекты объявлены одинаково, поэтому мы не будем рассматривать каждый из них по очереди.Вместо этого мы просто взглянем на один объект, а именно на объект 57. Объект 57 содержит, объявлен следующим образом:

Рисунок 21: Объект 57

Мы видим, что тип объекта — / Page, что напрямую подразумевает, что это листовой узел, представляющий одну из страниц документа PDF. Содержимое этой страницы PDF можно найти в объекте 62:

.

Рисунок 22: Объект 62

Мы видим, что фактическое содержимое страницы PDF кодируется с помощью FlateDecode, который представляет собой простой алгоритм кодирования zlib.

Заключение

Мы видели два примера создания PDF-документов. Обладая полученными знаниями, мы можем начать создавать неправильные PDF-документы и передавать их различным программам для чтения PDF-файлов. Если при чтении определенного PDF-документа происходит сбой определенного PDF-ридера, этот документ содержит что-то, что программа PDF-ридера не может обработать. Это подразумевает возможность уязвимости, которую необходимо изучить дополнительно.

В конце концов, если обнаружится уязвимость, мы даже можем написать PDF-документ, содержащий вредоносный код, который запускается, когда жертва открывает PDF-документ с помощью уязвимого PDF-ридера на своей целевой машине.В таких случаях вся машина может быть скомпрометирована, поскольку произвольный вредоносный код может быть запущен, просто открыв вредоносный документ PDF.

Источники

Статистика уязвимостей

, сведения о CVE

Политики поддержки Adobe: поддерживаемые версии продуктов, Adobe

Управление документами — Формат переносимых документов — Часть 1: PDF 1.7, Adobe (Archive.org)

Артикулы:

[1]: формат файла PDF, доступный по адресу: http: //wwwimages.adobe.com / www.adobe.com / content / dam / Adobe / en / devnet / pdf / pdfs / PDF32000_2008.pdf.

Что означает PDF и как им пользоваться?

Вы начинаете блог и хотите создавать документы для своей аудитории? В конце концов, мы знаем, что создание электронной книги — отличный способ увеличить доход от вашего блога.

Или вы хотите узнать больше о PDF и о том, как его лучше всего использовать?

Каждому нужно узнать, что означает PDF, а также разные вещи, которые вы можете с ним делать.Некоторые из наиболее распространенных применений PDF включают офисную документацию и учебу.

В этом руководстве мы ответим на вопрос «что означает PDF» и другие. Продолжайте читать, чтобы узнать, что еще можно делать с файлом PDF и с какими программами. Мы также обсудили использование и создание PDF на мобильных устройствах.

Что означает PDF?

Если вы работаете в офисе, вы можете услышать, как люди говорят о документах в формате PDF. Даже вне работы вы можете услышать, как термин PDF используется в школе или в Интернете.

Что означает PDF?

Когда вы слышите или видите слово PDF, помните, что оно означает «формат переносимого документа». Самое главное, что люди знают об этом, — это то, что это формат или тип файла. Однако это правильно, давайте погрузимся немного глубже.

Что такое файл PDF?

PDF-файл предназначен только для чтения. Благодаря своим функциям, его легко читать и защищать. PDF также сжимает файлы, которые вы сохраняете как PDF, что делает его идеальным для хранения файлов.

Как и файлы Word, файлы, сохраненные в формате PDF, могут содержать различные типы данных. Эти данные включают текст, изображения, аудио и графику. Однако разница в том, что в файлах PDF документ отображается так, как он будет выглядеть на принтере.

Пока Microsoft создавала Word, Adobe создавала PDF. Формат вышел в начале 1990-х и был выпущен как открытый стандарт в 2008 году. Adobe Systems стремилась сделать с PDF две вещи.

Adobe хотела создать документы, доступные на любом оборудовании или в любой операционной системе.Прямо сейчас вы можете открыть PDF-файл с помощью программы для чтения PDF-файлов или даже в браузере. Это также означает, что вы можете получить доступ к PDF-файлу, независимо от того, использовали ли вы Mac или ПК.

Вторая цель заключалась в том, чтобы макет документа выглядел одинаково, где бы вы его ни открывали. В некоторых случаях вы можете обнаружить, что форматирование в вашем документе Word изменилось, когда вы открыли его на другом компьютере. В формате PDF вы будете видеть то, что вы создали, независимо от того, где вы его открыли.

Преимущества использования файлов PDF

По данным Forbes, средний сотрудник ежегодно использует более 10 000 листов бумаги.Это составляет от 80 до 100 долларов на сотрудника в год. Когда началось движение безбумажных офисов, PDF был одним из первых форматов файлов, которые офисы сразу приняли.

Во-первых, файлы PDF совместимы с различными платформами. Не имело значения, используете ли вы Mac или ПК. Даже не имело значения, есть у вас программа для чтения PDF-файлов или нет.

Следует также отметить сжатие файла PDF. Он может сжать ваш типичный документ до 25% от его исходного размера. Это позволило быстрее открывать PDF-файлы и упростить их отправку по сети.

Это связано с тем, что файлы PDF обеспечивают безопасность на уровне документа. По сравнению с другими форматами файлов, вы можете включить защиту паролем пользователя на уровне документа. Это означает, что документы в формате PDF могут просматривать только те, у кого есть разрешение на его просмотр.

Судебный суд — вот где лучше всего использовать PDF. Если вы собираетесь изменить PDF-файл, вы не сможете не оставить электронный след. Это одна из причин, по которой файлы PDF являются немногими электронными документами, которые принимаются в суде.

Это также одна из основных причин, почему компании использовали формат PDF.Когда документ был отредактирован, отследить стало легче.

Просмотр PDF

Независимо от того, используете ли вы компьютер Mac или Windows, просматривать PDF-файлы очень просто. Самый быстрый и простой способ просмотреть PDF-файл — открыть его в браузере. Большинство компьютеров уже оснащены встроенным веб-браузером.

Щелкните документ PDF правой кнопкой мыши и найдите параметр «Открыть с помощью». Выберите Google Chrome, Firefox или предпочитаемый вами браузер. Большинство браузеров позволяют выполнять самые простые действия с PDF-файлом.

Сюда входит просмотр всего объекта, увеличение или уменьшение масштаба и печать документа. Если вы хотите иметь больший контроль над просмотром PDF-файла, откройте его с помощью таких программ, как Acrobat Reader. Adobe Acrobat Reader является бесплатным и официальным инструментом для чтения PDF-файлов в Windows, macOS, iOS и Android.

Загрузите Acrobat Reader на свой телефон и компьютер для удобного просмотра PDF-файлов и улучшенной поддержки функций. Однако если вы редко используете или открываете PDF-файлы, подойдет встроенный браузер.

Что делать, если вам не нравится Acrobat Reader на вашем компьютере, потому что он слишком громоздкий для вашего места?

В этом случае вы попробуйте загрузить сторонние приложения для просмотра файлов PDF. Многие более быстрые и легкие сторонние приложения доступны в магазине и могут быть загружены бесплатно. Остерегайтесь, многие из них могут не поддерживать расширенные функции просмотра PDF, такие как Adobe Acrobat Reader.

Создание и преобразование PDF

Если вы хотите создать PDF-файл, это легко сделать.Вы можете создать его в программах, которые позволяют печатать файл. С учетом сказанного, любая программа, позволяющая печатать, позволит вам сохранить файл в формате PDF.

Например, давайте поговорим о создании файла PDF в Word. Введите документ, затем откройте меню «Файл» и выберите «Сохранить как» или нажмите F12. Когда откроется всплывающее окно «Сохранить как», выберите PDF в параметрах формата файла.

То же самое верно, если вы хотите сохранить отсканированные документы как файлы PDF в Photoshop и подобных программах. После сканирования документа сохраните его как файл PDF, выбрав один из доступных форматов файлов.

Создание PDF-файлов веб-страниц

Вы также можете создать PDF-файл открытой веб-страницы.

Откройте веб-страницу в своем любимом браузере. Если вы используете Mac, обязательно используйте Firefox. В Adobe Acrobat выберите «Преобразовать веб-страницу в PDF» и введите ссылку.

Если вы используете Chrome, нажмите Ctrl + P или выберите Печать в меню настроек. Когда откроется окно печати, выберите «Изменить» в разделе «Место назначения». Вы увидите вариант Сохранить как PDF.

Выберите эту опцию, и окно печати изменится. Здесь вы можете загрузить предварительный просмотр страниц, выбрать страницы для сохранения и изменить макет. Последний и самый важный шаг здесь — выбрать Сохранить.

Если вы используете другие браузеры, выполните аналогичный процесс. Введите параметры печати, и там вы найдете параметры, в которых вы можете сохранить веб-страницу в виде файла PDF.

Создание PDF-файлов из Интернета на мобильном устройстве

Если вы используете мобильные браузеры, вам нужно будет выполнить другой процесс, чтобы сохранить веб-страницу в формате PDF.В iOS откройте веб-страницу и нажмите кнопку «Поделиться». Если вы не знаете об этом, это кнопка на панели инструментов со стрелкой, направленной вверх, окруженной квадратной фигурой.

Откроется меню опций загрузки. Найдите параметр «Сохранить PDF в iBooks» и выберите его. Подождите, пока PDF-файл сохранится и запустится в iBooks.

Если у вас телефон Android, вы выполните аналогичный процесс. Однако вам также необходимо скопировать и вставить URL-адрес. Если вы торопитесь, лучше скачайте приложения, позволяющие конвертировать веб-страницы в файлы PDF.

Редактирование и преобразование PDF

В большинстве случаев трудно выполнить тяжелое редактирование файла PDF. Вам придется сначала преобразовать PDF-файл в другой формат файла, если вы хотите изменить в нем много информации. Однако, если вы хотите сделать легкое редактирование или заполнить формы, вы можете сделать это с легкостью.

Если у вас уже установлен Adobe Acrobat Reader, вы можете легко вносить незначительные правки в файлы PDF. В нем есть все инструменты и функции, необходимые для легкого исправления PDF-файлов на ходу.Это также самый доступный инструмент для работы с PDF-файлами с полным набором функций.

Вы также можете редактировать PDF-файлы с помощью Microsoft Word. Обратите внимание, что некоторые элементы и информация могут потеряться при переводе. Сюда входят интервалы между ячейками, эффекты шрифтов, функции заполнения форм и многое другое.

Лучше использовать Word с файлами PDF, которые также были файлами документов Word до того, как они были преобразованы или сохранены в формате PDF. Откройте файл PDF в Word. Если в Word отображается поле с предупреждением о отображении содержимого в том формате, в котором оно может отображаться, нажмите кнопку «ОК».Отредактируйте документ по своему усмотрению, а затем сохраните его как файл PDF.

Как использовать PDF-файл, если в нем есть области для заполнения формы? Вы можете заполнить заполняемый PDF-файл в браузере Google Chrome, а затем распечатать его. Обратите внимание, что вы не можете сохранить уже заполненный PDF-файл с возможностью заполнения формы.

Чем больше вы знаете

Наконец, мы снова спрашиваем, что означает PDF? Теперь вы знаете ответ и многое другое. Теперь вы также знаете, как редактировать и создавать файлы PDF, а также знать некоторые из его основных преимуществ.

Помните, что хотя PDF существует уже некоторое время, неплохо быть в курсе новостей PDF. Вы никогда не знаете, когда вредоносное ПО атакует вас через мобильные приложения PDF.

Вот и все, что нужно для нашего руководства по созданию, редактированию и использованию PDF-файлов. Мы надеемся, что вы многому научились и получили удовольствие от чтения этой публикации. Если вы хотите прочитать больше подобного образовательного контента, ознакомьтесь с другими нашими руководствами прямо сейчас.

Как создать документ PDF

Формат переносимого документа, или PDF, был разработан Adobe Systems и стал отраслевым стандартом для обмена документами.Документ PDF — это точная копия исходного документа, будь то текстовый файл или текстовый файл, графический рисунок, фотография, карта или даже видео. Кроме того, его можно защитить паролем, чтобы ограничить доступ к таким функциям, как редактирование и печать [источник: Adobe].

Для создания и просмотра PDF-файлов необходимо установить соответствующее программное обеспечение. Самая известная программа для создания PDF-файлов — Adobe Acrobat. Хотя вам необходимо приобрести это программное обеспечение, Adobe предлагает бесплатную программу просмотра PDF-файлов под названием Adobe Reader, которую вы можете загрузить с их веб-сайта.

Кроме того, можно бесплатно загрузить несколько хороших сторонних приложений PDF. Некоторые из них могут преобразовывать PDF-файлы обратно в исходные документы. Некоторые продукты, например Microsoft Office 2007, имеют встроенные конвертеры PDF. Вот как преобразовать документ MS Word в PDF в MS Word 2007:

  1. Нажмите кнопку Office .
  2. Наведите указатель мыши на стрелку рядом с кнопкой Сохранить как и выберите PDF или XPS .
  3. Введите имя PDF-файла в поле Имя файла или выберите его из списка файлов.
  4. Выберите PDF в раскрывающемся списке Сохранить как тип .
  5. Выберите Открыть файл после публикации , чтобы открыть новый PDF-файл после его создания и сохранения. Этот параметр доступен только в том случае, если на вашем компьютере установлена ​​программа для чтения PDF-файлов.
  6. Выберите Стандартный (публикация в Интернете и печать) или Минимальный размер (публикация в Интернете) до Оптимизировать для , в зависимости от того, хотите ли вы лучшего качества печати или меньшего размера файла соответственно.
  7. Щелкните Параметры и установите соответствующие параметры печати.
  8. Нажмите ОК .
  9. Нажмите Опубликовать , чтобы начать процесс создания PDF. Если вам нужно внести какие-либо исправления или изменения в PDF-файл, внесите их в исходный документ Word, а затем создайте новый PDF-документ [источник: Microsoft Office].

Что такое PDF-файл, как он создается и для чего работает?

В начале 90-х соучредитель Adobe Systems Джон Варнок создал Camelot, который стал PDF или Portable Document Format.PDF был создан Adobe System специально для цифровой печати в начальный период.

PDF или Portable Document Format на самом деле является файловым форматом, который предлагает пользователям привлекательные функции. И благодаря этому PDF широко используется во всем мире. Его можно использовать многими способами, такими как задания на печать, презентация документов, написание книг, создание мультимедийных файлов и т. Д. Его можно легко создать с помощью Adobe Reader, который бесплатно предоставляется Adobe Systems. Хотя в настоящее время есть много других программ, которые могут создавать или читать PDF-файлы, но всегда следует предпочесть Adobe Reader, что лучше всего в этом случае.

PDF предоставляет пользователям ряд функций, которых они не получают в других файлах. Он обладает хорошей гибкостью и мобильностью, что помогает пользователям обмениваться файлами PDF или передавать их через Интернет. Пользователи могут защитить PDF-файлы, применив ограничения или пароли к своим PDF-файлам. Это позволяет пользователям добавлять интерактивные функции в свои документы, включая мультимедийные файлы. Если у PDF-файла есть несколько функций, большая проблема возникает с PDF-файлом. Иногда файлы PDF, содержащие все важные и ценные документы, внезапно повреждаются или повреждаются.

Каким образом файл PDF может быть поврежден или поврежден?

PDF-файл можно легко испортить в любой момент, так как это всегда происходит без приглашения, но очень болезненно. Есть несколько факторов, которые могут привести к повреждению файлов PDF. Некоторые из основных причин, которые играют важную роль в PDF коррупция:

  • Из-за прерывания или нарушения загрузки или совместного использования.
  • из-за вируса или троянской инфекции.
  • Из-за неправильного отключения системы.
  • Из-за поломки или ошибки жесткого диска.
  • Из-за проблемы программного или аппаратного сбоя.
  • Из-за нежелательного прерывания или помех при создании или использовании файлов PDF.

Выше приведены некоторые распространенные причины, которые могут плохо повлиять на файлы PDF.

Каковы симптомы поврежденного файла PDF?

Всякий раз, когда файл PDF поврежден или поврежден, он становится недоступным, что является основным признаком любого поврежденного файла.Поврежденный файл невозможно открыть, и случайно, если он откроется, данные станут буквально нечитаемыми, а файл будет бесполезным. В любом случае данные не могут быть извлечены из поврежденного резервного файла. И вместо открытия, если файлы PDF выдают сообщения об ошибках, это означает, что файлы повреждены и их необходимо восстановить.

Итак, это некоторые симптомы, которые указывают на то, что файлы резервных копий недействительны или повреждены.

Что делать, чтобы восстановить поврежденный файл PDF?

В случае повреждения файла PDF лучшим решением является восстановление этого файла с помощью программного обеспечения.SysInfoTools PDF Recovery позволяет пользователям исправлять ошибки в файлах PDF и помогает им восстанавливать данные из этих файлов. Он дополнен несколькими расширенными функциями, которые предлагают пользователям дополнительную помощь. С помощью этого инструмента пользователи могут восстановить максимально возможные данные и содержимое файлов, таких как изображения, текст, таблицы, графика и т. Д., Из поврежденного файла PDF, не теряя много времени, поскольку он выполняет быстрое действие по восстановлению.

Чего следует избегать, чтобы предотвратить повреждение PDF-файлов?

Есть несколько советов, которым должен следовать каждый, чтобы предотвратить повреждение PDF-файлов:

  • Пользователи должны проверять свое интернет-соединение во время загрузки или совместного использования файла PDF.
  • Пользователи должны проверять свои компьютерные системы регулярно, то есть не реже 1 или 2 раза в неделю. Программная и аппаратная части должны содержаться в хорошем состоянии.
  • Пользователи должны регулярно проверять или обновлять свою антивирусную программу. Иногда антивирусная программа не работает, и в результате компьютерная система заражается вирусной инфекцией.
  • Пользователи должны завершить работу своей системы должным образом, потому что, если процесс завершения работы выполняется неправильно или принудительно пользователями, он может повлиять на все базы данных компьютера.
  • Пользователи должны использовать устройство ИБП (неэкранированный источник питания). Это помогает пользователям правильно выключить компьютерную систему во время внезапного отказа источника питания.
  • Пользователи должны быть осторожны при создании PDF-файла для своей системы, потому что проблемы с повреждением PDF-файла чаще возникают во время создания.

Итак, это несколько важных советов, которые помогут пользователям избежать нежелательной ситуации с повреждением файла PDF.

Советы по использованию файлов Adobe PDF

Многие из наших онлайн-форм, отчетов, нормативных актов и публикаций доступны только в формате Portable Document Format (PDF).Файлы PDF можно просматривать с помощью бесплатного программного обеспечения Adobe Reader.

Скачать бесплатно Adobe Reader

Проблемы с нашими файлами PDF?

Существует несколько причин, по которым вы не сможете открывать или распечатывать онлайн-файлы PDF CDSS, особенно если это большой PDF-файл и / или если вы используете более медленный коммутируемый доступ в Интернет или старую версию Программное обеспечение Adobe Acrobat Reader.

Шаги, которые помогут вам просмотреть или распечатать онлайн-файлы PDF:

A. Есть ли на вашем компьютере рабочая копия Adobe Reader последней версии?
Вы можете проверить это, щелкнув указанную выше ссылку, чтобы перейти на сайт загрузки Adobe Reader.Вы также можете попробовать открыть другие PDF-файлы (онлайн или хранящиеся на вашем компьютере), чтобы убедиться, что ваше программное обеспечение Reader работает правильно.

B. Если по-прежнему не удается открыть или распечатать файл PDF, обычно можно решить проблему, загрузив файл на свой компьютер перед его открытием. Вот как это сделать:

  1. Щелкните правой кнопкой мыши ссылку на файл PDF. НЕ открывайте его в это время.
  2. В раскрывающемся меню выберите «Сохранить объект как …». (Примечание: если вы используете Mac вместо ПК, выберите «загрузить на диск»). Появится окно «Сохранить как».Примечание. Окно «Сохранить как» может появиться через некоторое время, если вы загружаете большой файл PDF или используете коммутируемый доступ в Интернет.
  3. В поле «Сохранить в» вверху выберите место для сохранения файла на вашем компьютере, которое вам будет легко запомнить. Ваш рабочий стол или Мои документы — два наиболее распространенных места. Щелкните «Сохранить».
  4. PDF-файл будет загружен на ваш компьютер. После завершения процесса загрузки перейдите в папку, в которой вы сохранили файл, и дважды щелкните по нему, чтобы открыть.Вы сможете без проблем открывать и распечатывать файл из этого места.

Формат файла Microsoft Excel

Формат Microsoft Excel (.xls) — это формат файла, который используется для загрузки данных для расчетов данных. Перед загрузкой данных на вашем компьютере должен быть установлен Microsoft Excel или бесплатная программа просмотра Microsoft Excel Viewer. Средство просмотра Microsoft Excel Viewer предлагает ограниченные возможности для управления данными и может быть загружено с веб-сайта Microsoft.

Как создать файл PDF на Mac и Windows

Теперь, когда так много людей работают удаленно, стало более принято, чем когда-либо, отправлять официальные документы в цифровом виде — и большинство из них отправляются в формате PDF.

Если вы не знакомы с предысторией этого формата, PDF означает переносимый формат документа и был создан Adobe в начале 1990-х годов, чтобы позволить людям и организациям создавать точные цифровые версии бумажных документов. Идея заключалась в том, что документ был точной неизменной копией оригинала (хотя некоторые PDF-файлы теперь можно редактировать, вы можете создать PDF-файл, который не может).

С тех пор PDF-файлы стали стандартом для отправки официальных документов. Если вам нужно отправить что-то с каким-либо видом законности, вас, вероятно, попросят отправить это в формате PDF.

Вы можете создать PDF-файл из бумажной копии документа, отсканировав его и сохранив как PDF-файл. Но что, если вы просматриваете онлайн-документ и вам нужно сохранить его в формате PDF?

Это действительно просто, как для пользователей Mac, так и для ПК с Windows. И в том, и в другом случае это делается одинаково: вы «распечатываете» документ в файл PDF. Эти инструкции предназначены для печати веб-документа с помощью браузера Chrome, но это работает для любого приложения, в котором есть функция печати.

  • Нажмите на три точки в правом верхнем углу.
  • Нажмите «Печать …»
Чтобы создать PDF-файл, сначала перейдите к функции печати.
  • Появится окно печати с окном предварительного просмотра слева и рядом функций справа. Рядом с меткой «Место назначения» щелкните раскрывающееся меню и выберите «Сохранить как PDF».
Сделайте пункт назначения «Сохранить как PDF».
  • Если у вас есть документ из нескольких страниц и вы хотите создать PDF-файл только с использованием определенной страницы или диапазона страниц, щелкните раскрывающееся меню рядом с меткой «Страницы», выберите «Пользовательский» и введите страницы, которые вы хотите сохранить.(Это работает точно так же, как если бы вы отправляли страницы на принтер.)
Рекомендуется выбрать, какие страницы вы хотите сохранить в PDF.
Опубликовано в категории: Разное

Добавить комментарий

Ваш адрес email не будет опубликован.