PDF to format plików służący do prezentowania, drukowania treści oraz obrazków w postaci cyfrowej. Został on stworzony przez firmę Adobe, która 29 stycznia 2007 postanowiła w całości otworzyć format i przekazać jego pełną specyfikację organizacji AIIM. 2 lipca 2008 Międzynarodowa Organizacja Normalizacyjna ogłosiła uznanie PDF 1.7 za obowiązujący standard ISO 32000-1:2008. Język opisu pliku PDF jest okrojoną wersją języka programowania PostScript, wzbogaconą dodatkowo o elementy hipertekstowe.
PDF Split and Merge
PDF SAM to wolne narzędzie do manipulowania dokumentami w formacie PDF. Program został napisany w języku Java, dzięki czemu może być uruchomiony na dowolnym systemie operacyjnym ze środowiskiem uruchomieniowym Java. Posiada łatwy i przejrzysty interfejs graficzny, który w miarę możliwości dostosowuje się do tematu systemowego. Aplikacja nie posiada niestety pełnego spolszczenia, co jednak nie przeszkadza w korzystaniu z niej. Do pobrania są dostępne źródła i podstawowa wersja. Za niewielką opłatą, która jest przeznaczana na dalszy rozwój, możemy uzyskać rozszerzoną wersję:
- Szyfrowanie dokumentów PDF (RC40 bits, RC128 bits, AES128 bits) i ustawianie praw dostępu do nich
- Dodawanie dokumentu PDF, jako strony głównej lub dodatku, albo obu na raz
- Mieszanie różnych stron, pobranych z dwóch dokumentów PDF, w prostej lub odwrotnej kolejności w jednym dokumencie
- Rozpakowywanie załączonych plików z dokumentu PDF
- Deszyfrowanie plików PDF
- Zapisanie domyślnej akcji przeglądarki, jak powinna otwierać dokument
- Ustawianie meta danych dokumentu: autor, tytuł, temat i słowa kluczowe
Główne okno prezentuje praktycznie wszystkie najpotrzebniejsze nam opcje. Z jego poziomu możemy zobaczyć aktualnie posiadaną wersję aplikacji, a także wybrać interesujące nas menu. Z lewej strony możemy zauważyć drzewko wyboru poleceń. Menu Wtyczki to funkcje, jakie możemy wykonać na naszym dokumencie PDF. Opcje natomiast pozwalają nam na ustawienie polskiego interfejsu, wygląd, sprawdzanie aktualizacji, wybranie katalogu roboczego oraz wczytywanie domyślnego katalogu roboczebo.
Dziel
Pozwala na dzielenie dokumentu w zadany przez nas sposób, wybrany z opcji. Możemy wybrać docelowe miejsce zapisu, wersję PDF, a także sposób nazywania plików wyjściowych.
Mieszanie stron
Funkcja pozwala na mieszanie dowolnych stron z dwóch różnych dokumentów.
Rotate
Tutaj możemy obrócić nasze strony w dokumencie o kąt 90 – 270 stopni.
Visual Document Composer
Narzędzie pozwala nam graficznie dostosować ułożenie poszczególnych stron. W pierwszym wierszu pokazany mamy obecny stan. Do drugiego wiersza przeciągamy strony i układamy według własnego uznania, te które chcemy. Możemy także obracać je o dowolny kąt oraz zamieniać miejscami kilka stron na raz.
Visual Reorder
Mniej funkcjonalna wersja poprzedniego narzędzia, która pozwala jedynie na zmianę pozycji stron.
Łącz/Dziel
Tutaj otrzymaliśmy możliwość połączenia wielu dokumentów PDF w jedną całość.
pdftk
Pdftk jest prostym narzędziem do manipulowania dokumentami PDF. Nie wymaga zainstalowanego pakietu Adobe Reader, czy innego czytnika. Działa pod wieloma systemami operacyjnymi.
Poniżej możliwości programu:
- Łączenie dokumentów PDF
- Dzielenie stron na nowe pliki
- Obracanie stron lub dokumentów
- Deszyfracja dokumentu przy otwarciu, jeżeli konieczne (wymagane jest hasło)
- Szyfrowanie dokumentu podczas tworzenia
- Wypełnianie formularzy PDF z danymi FDF lub XFDF lub spłaszczanie formularzy
- Dodawanie znaku wodnego lub stempla w tle
- Raporty metryczne, jak meta dane, zakładki i etykiety stron
- Aktualizowanie meta danych
- Załączanie plików do stron albo dokumentu
- Wypakowywanie załączników PDF
- Dzielenie dokumentu PDF na poszczególne strony
- Dekompresja i ponowna kompresja strumieniowanych stron
- Naprawa uszkodzonego pliku PDF (jeżeli jest to możliwe)
Poniżej przykłady z użyciem kilku poleceń:
Łączenie dwóch lub więcej plików PDF w jeden dokument:
[bash]pdftk 1.pdf 2.pdf 3.pdf cat output 123.pdf[/bash]
używając zmiennych:
[bash]pdftk A=1.pdf B=2.pdf cat A B output AB.pdf[/bash]
wybierając wszystkie pliki:
[bash]pdftk *.pdf cat output razem.pdf[/bash]
Rozdzielanie konkretnych stron na pojedyncze dokumenty:
[bash]pdftk A=jeden.pdf B=dwa.pdf cat A1-7 B1-5 A8 output razem.pdf[/bash]
Obrót pierwszej strony o 90 stopni zgodnie z ruchem wskazówek zegara:
[bash]pdftk dok.pdf cat 1E 2-end output wynik.pdf[/bash]
Obrót całego dokumentu o 180 stopni:
[bash]pdftk dok.pdf cat 1-endS output wynik.pdf[/bash]
Szyfrowanie dokumentu PDF 128 bitowym kluczem, wraz z prawami dostępu danego użytkownika:
[bash]pdftk dok.pdf output dok.128.pdf owner_pw haslo[/bash]
Tak samo, jak wyżej, z tym, że tutaj jest wymagane hasło do otwarcia pliku:
[bash]pdftk dok.pdf output dok.128.pdf owner_pw haslo user_pw haslo1[/bash]
Tak samo, z dodaną możliwością wydruku (zaraz po otwarciu)
[bash]pdftk dok.pdf output dok.128.pdf owner_pw haslo user_pw haslo1 allow printing[/bash]
Deszyfracja PDF:
[bash]pdftk zabezpieczony.pdf input_pw haslo output niezabezpieczony.pdf[/bash]
Łączenie dwóch dokumentów, w tym jednego zaszyfrowanego (plik wyjściowy nie jest szyfrowany):
[bash]pdftk A=zabezpieczony.pdf dok.pdf input_pw A=haslo cat output razem.pdf[/bash]
Dekompresja strumieniowanych stron do edycji kodu, w edytorze tekstowym:
[bash]pdftk dok.pdf output dok.clear.pdf uncompress[/bash]
Naprawa uszkodzonej tabeli XREF i długości strumieni (jeżeli możliwe)
[bash]pdftk uszkodzony.pdf output naprawiony.pdf[/bash]
Dzielenie pojedynczego dokumentu PDF na strony i dodanie tego do raportu doc_data.txt
[bash]pdftk dok.pdf burst[/bash]
Raportowanie metryczne, takie jak meta dane, zakładki i etykiety stron:
[bash]pdftk dok.pdf dump_data output raport.txt[/bash]
pdftohtml
Polecenie to potrafi konwertować dokumenty PDF do plików HTML, XML i PNG. Należy tutaj zaznaczyć, iż wynikowych plików może być naprawdę sporo i należy to robić w osobnym katalogu.
Konwersja dokumentu PDF do HTML:
[bash]pdftohtml dok.pdf[/bash]
Konwersja konkretnych stron w dokumencie:
[bash]pdftohtml -f numer-pierwszej-strony -l numer-ostatniej-strony dok.pdf[/bash]
Konwersja zaszyfrowanego dokumentu. Można także obie opcje -opw
i -upw
dać razem, pamiętając ze hasła są inne.
[bash]pdftohtml -opw test dok.pdf
pdftohtml -upw test dok.pdf[/bash]
pdftotext
Polecenie to potrafi konwertować dokumenty PDF do plików tekstowych.
Konwersja dokumentu PDF do tekstowego:
[bash]pdftotext dok.pdf[/bash]
Konwersja konkretnych stron w dokumencie:
[bash]pdftotext -f numer-pierwszej-strony -l numer-ostatniej-strony dok.pdf[/bash]
Konwersja zaszyfrowanego dokumentu. Można także obie opcje -opw
i -upw
dać razem, pamiętając że hasła są inne.
[bash]pdftotext -opw test dok.pdf
pdftotext -upw test dok.pdf[/bash]
OSWorld.pl liked this on Facebook.
[…] Article from https://osworld.pl/manipulowanie-dokumentami-pdf/Manipulowanie dokumentami […]
Łukasz Wòjcik liked this on Facebook.
Istnieje również GUI do pdftk http://qt-apps.org/content/show.php/PdfTk-QGUI?co…
Takie lekko przestarzałe chyba :P Poza tym te aplikacje da się uruchomić i na Windowsie i na Linuksie, więc tutaj jest duża zaleta :)
Pdftk ma wersję i pod linuxa, i pod windows. Jedyne co znam do obcinania stron w pdf (np. za duże marginesy) to pdfpages w latexu.
Pdftk konsolowy ma wersję pod linuxa i pod windows. Do obcinania np. pustych marginesów na stronach można używać np. pakietu pdfpages z pdflatexa (np. w texlive).
[…] LibreOffice. Pracownicy miejscy wykorzystują GIMPa i Inkscape-a do tworzenia obrazów graficznych, PDF Split and Merge do używania PDF, Brasero do nagrywania dysków optycznych, Kdenlive do edycji wideo oraz Evince to […]