PDF to format plików służący do prezentowania, drukowania treści oraz obrazków w postaci cyfrowej. Został on stworzony przez firmę Adobe, która 29 stycznia 2007 postanowiła w całości otworzyć format i przekazać jego pełną specyfikację organizacji AIIM. 2 lipca 2008 Międzynarodowa Organizacja Normalizacyjna ogłosiła uznanie PDF 1.7 za obowiązujący standard ISO 32000-1:2008. Język opisu pliku PDF jest okrojoną wersją języka programowania PostScript, wzbogaconą dodatkowo o elementy hipertekstowe.

PDF Split and Merge

PDF SAM to wolne narzędzie do manipulowania dokumentami w formacie PDF. Program został napisany w języku Java, dzięki czemu może być uruchomiony na dowolnym systemie operacyjnym ze środowiskiem uruchomieniowym Java. Posiada łatwy i przejrzysty interfejs graficzny, który w miarę możliwości dostosowuje się do tematu systemowego. Aplikacja nie posiada niestety pełnego spolszczenia, co jednak nie przeszkadza w korzystaniu z niej. Do pobrania są dostępne źródła i podstawowa wersja. Za niewielką opłatą, która jest przeznaczana na dalszy rozwój, możemy uzyskać rozszerzoną wersję:

  • Szyfrowanie dokumentów PDF (RC40 bits, RC128 bits, AES128 bits) i ustawianie praw dostępu do nich
  • Dodawanie dokumentu PDF, jako strony głównej lub dodatku, albo obu na raz
  • Mieszanie różnych stron, pobranych z dwóch dokumentów PDF, w prostej lub odwrotnej kolejności w jednym dokumencie
  • Rozpakowywanie załączonych plików z dokumentu PDF
  • Deszyfrowanie plików PDF
  • Zapisanie domyślnej akcji przeglądarki, jak powinna otwierać dokument
  • Ustawianie meta danych dokumentu: autor, tytuł, temat i słowa kluczowe

Główne okno prezentuje praktycznie wszystkie najpotrzebniejsze nam opcje. Z jego poziomu możemy zobaczyć aktualnie posiadaną wersję aplikacji, a także wybrać interesujące nas menu. Z lewej strony możemy zauważyć drzewko wyboru poleceń. Menu Wtyczki to funkcje, jakie możemy wykonać na naszym dokumencie PDF. Opcje natomiast pozwalają nam na ustawienie polskiego interfejsu, wygląd, sprawdzanie aktualizacji, wybranie katalogu roboczego oraz wczytywanie domyślnego katalogu roboczebo.

PDF Split and Merge - strona główna PDF Split and Merge - Ustawienia

Dziel
Pozwala na dzielenie dokumentu w zadany przez nas sposób, wybrany z opcji. Możemy wybrać docelowe miejsce zapisu, wersję PDF, a także sposób nazywania plików wyjściowych.

PDF Split and Merge - Dziel

Mieszanie stron
Funkcja pozwala na mieszanie dowolnych stron z dwóch różnych dokumentów.

PDF Split and Merge - Mieszanie stron

Rotate
Tutaj możemy obrócić nasze strony w dokumencie o kąt 90 – 270 stopni.

PDF Split and Merge - Rotate

Visual Document Composer
Narzędzie pozwala nam graficznie dostosować ułożenie poszczególnych stron. W pierwszym wierszu pokazany mamy obecny stan. Do drugiego wiersza przeciągamy strony i układamy według własnego uznania, te które chcemy. Możemy także obracać je o dowolny kąt oraz zamieniać miejscami kilka stron na raz.

PDF Split and Merge - Visual Document Composer

Visual Reorder
Mniej funkcjonalna wersja poprzedniego narzędzia, która pozwala jedynie na zmianę pozycji stron.

PDF Split and Merge - Visual Reorder

Łącz/Dziel
Tutaj otrzymaliśmy możliwość połączenia wielu dokumentów PDF w jedną całość.

PDF Split and Merge - Łącz - Dziel

pdftk

Pdftk jest prostym narzędziem do manipulowania dokumentami PDF. Nie wymaga zainstalowanego pakietu Adobe Reader, czy innego czytnika. Działa pod wieloma systemami operacyjnymi.

Poniżej możliwości programu:

  • Łączenie dokumentów PDF
  • Dzielenie stron na nowe pliki
  • Obracanie stron lub dokumentów
  • Deszyfracja dokumentu przy otwarciu, jeżeli konieczne (wymagane jest hasło)
  • Szyfrowanie dokumentu podczas tworzenia
  • Wypełnianie formularzy PDF z danymi FDF lub XFDF lub spłaszczanie formularzy
  • Dodawanie znaku wodnego lub stempla w tle
  • Raporty metryczne, jak meta dane, zakładki i etykiety stron
  • Aktualizowanie meta danych
  • Załączanie plików do stron albo dokumentu
  • Wypakowywanie załączników PDF
  • Dzielenie dokumentu PDF na poszczególne strony
  • Dekompresja i ponowna kompresja strumieniowanych stron
  • Naprawa uszkodzonego pliku PDF (jeżeli jest to możliwe)

Poniżej przykłady z użyciem kilku poleceń:
Łączenie dwóch lub więcej plików PDF w jeden dokument:

pdftk 1.pdf 2.pdf 3.pdf cat output 123.pdf

używając zmiennych:

pdftk A=1.pdf B=2.pdf cat A B output AB.pdf

wybierając wszystkie pliki:

pdftk *.pdf cat output razem.pdf

Rozdzielanie konkretnych stron na pojedyncze dokumenty:

pdftk A=jeden.pdf B=dwa.pdf cat A1-7 B1-5 A8 output razem.pdf

Obrót pierwszej strony o 90 stopni zgodnie z ruchem wskazówek zegara:

pdftk dok.pdf cat 1E 2-end output wynik.pdf

Obrót całego dokumentu o 180 stopni:

pdftk dok.pdf cat 1-endS output wynik.pdf

Szyfrowanie dokumentu PDF 128 bitowym kluczem, wraz z prawami dostępu danego użytkownika:

pdftk dok.pdf output dok.128.pdf owner_pw haslo

Tak samo, jak wyżej, z tym, że tutaj jest wymagane hasło do otwarcia pliku:

pdftk dok.pdf output dok.128.pdf owner_pw haslo user_pw haslo1

Tak samo, z dodaną możliwością wydruku (zaraz po otwarciu)

pdftk dok.pdf output dok.128.pdf owner_pw haslo user_pw haslo1 allow printing

Deszyfracja PDF:

pdftk zabezpieczony.pdf input_pw haslo output niezabezpieczony.pdf

Łączenie dwóch dokumentów, w tym jednego zaszyfrowanego (plik wyjściowy nie jest szyfrowany):

pdftk A=zabezpieczony.pdf dok.pdf input_pw A=haslo cat output razem.pdf

Dekompresja strumieniowanych stron do edycji kodu, w edytorze tekstowym:

pdftk dok.pdf output dok.clear.pdf uncompress

Naprawa uszkodzonej tabeli XREF i długości strumieni (jeżeli możliwe)

pdftk uszkodzony.pdf output naprawiony.pdf

Dzielenie pojedynczego dokumentu PDF na strony i dodanie tego do raportu doc_data.txt

pdftk dok.pdf burst

Raportowanie metryczne, takie jak meta dane, zakładki i etykiety stron:

pdftk dok.pdf dump_data output raport.txt

pdftohtml

Polecenie to potrafi konwertować dokumenty PDF do plików HTML, XML i PNG. Należy tutaj zaznaczyć, iż wynikowych plików może być naprawdę sporo i należy to robić w osobnym katalogu.

Konwersja dokumentu PDF do HTML:

pdftohtml dok.pdf

Konwersja konkretnych stron w dokumencie:

pdftohtml -f numer-pierwszej-strony -l numer-ostatniej-strony dok.pdf

Konwersja zaszyfrowanego dokumentu. Można także obie opcje -opw i -upw dać razem, pamiętając ze hasła są inne.

pdftohtml -opw test dok.pdf
pdftohtml -upw test dok.pdf

pdftotext

Polecenie to potrafi konwertować dokumenty PDF do plików tekstowych.

Konwersja dokumentu PDF do tekstowego:

pdftotext dok.pdf

Konwersja konkretnych stron w dokumencie:

pdftotext -f numer-pierwszej-strony -l numer-ostatniej-strony dok.pdf

Konwersja zaszyfrowanego dokumentu. Można także obie opcje -opw i -upw dać razem, pamiętając że hasła są inne.

pdftotext -opw test dok.pdf
pdftotext -upw test dok.pdf