Tags Posts tagged with "pdf"

pdf

przez -
8 5414
Dokumenty, pliki

PDF to format plików służący do prezentowania, drukowania treści oraz obrazków w postaci cyfrowej. Został on stworzony przez firmę Adobe, która 29 stycznia 2007 postanowiła w całości otworzyć format i przekazać jego pełną specyfikację organizacji AIIM. 2 lipca 2008 Międzynarodowa Organizacja Normalizacyjna ogłosiła uznanie PDF 1.7 za obowiązujący standard ISO 32000-1:2008. Język opisu pliku PDF jest okrojoną wersją języka programowania PostScript, wzbogaconą dodatkowo o elementy hipertekstowe.

PDF Split and Merge

PDF SAM to wolne narzędzie do manipulowania dokumentami w formacie PDF. Program został napisany w języku Java, dzięki czemu może być uruchomiony na dowolnym systemie operacyjnym ze środowiskiem uruchomieniowym Java. Posiada łatwy i przejrzysty interfejs graficzny, który w miarę możliwości dostosowuje się do tematu systemowego. Aplikacja nie posiada niestety pełnego spolszczenia, co jednak nie przeszkadza w korzystaniu z niej. Do pobrania są dostępne źródła i podstawowa wersja. Za niewielką opłatą, która jest przeznaczana na dalszy rozwój, możemy uzyskać rozszerzoną wersję:

 • Szyfrowanie dokumentów PDF (RC40 bits, RC128 bits, AES128 bits) i ustawianie praw dostępu do nich
 • Dodawanie dokumentu PDF, jako strony głównej lub dodatku, albo obu na raz
 • Mieszanie różnych stron, pobranych z dwóch dokumentów PDF, w prostej lub odwrotnej kolejności w jednym dokumencie
 • Rozpakowywanie załączonych plików z dokumentu PDF
 • Deszyfrowanie plików PDF
 • Zapisanie domyślnej akcji przeglądarki, jak powinna otwierać dokument
 • Ustawianie meta danych dokumentu: autor, tytuł, temat i słowa kluczowe

Główne okno prezentuje praktycznie wszystkie najpotrzebniejsze nam opcje. Z jego poziomu możemy zobaczyć aktualnie posiadaną wersję aplikacji, a także wybrać interesujące nas menu. Z lewej strony możemy zauważyć drzewko wyboru poleceń. Menu Wtyczki to funkcje, jakie możemy wykonać na naszym dokumencie PDF. Opcje natomiast pozwalają nam na ustawienie polskiego interfejsu, wygląd, sprawdzanie aktualizacji, wybranie katalogu roboczego oraz wczytywanie domyślnego katalogu roboczebo.

PDF Split and Merge - strona główna PDF Split and Merge - Ustawienia

Dziel
Pozwala na dzielenie dokumentu w zadany przez nas sposób, wybrany z opcji. Możemy wybrać docelowe miejsce zapisu, wersję PDF, a także sposób nazywania plików wyjściowych.

PDF Split and Merge - Dziel

Mieszanie stron
Funkcja pozwala na mieszanie dowolnych stron z dwóch różnych dokumentów.

PDF Split and Merge - Mieszanie stron

Rotate
Tutaj możemy obrócić nasze strony w dokumencie o kąt 90 – 270 stopni.

PDF Split and Merge - Rotate

Visual Document Composer
Narzędzie pozwala nam graficznie dostosować ułożenie poszczególnych stron. W pierwszym wierszu pokazany mamy obecny stan. Do drugiego wiersza przeciągamy strony i układamy według własnego uznania, te które chcemy. Możemy także obracać je o dowolny kąt oraz zamieniać miejscami kilka stron na raz.

PDF Split and Merge - Visual Document Composer

Visual Reorder
Mniej funkcjonalna wersja poprzedniego narzędzia, która pozwala jedynie na zmianę pozycji stron.

PDF Split and Merge - Visual Reorder

Łącz/Dziel
Tutaj otrzymaliśmy możliwość połączenia wielu dokumentów PDF w jedną całość.

PDF Split and Merge - Łącz - Dziel

pdftk

Pdftk jest prostym narzędziem do manipulowania dokumentami PDF. Nie wymaga zainstalowanego pakietu Adobe Reader, czy innego czytnika. Działa pod wieloma systemami operacyjnymi.

Poniżej możliwości programu:

 • Łączenie dokumentów PDF
 • Dzielenie stron na nowe pliki
 • Obracanie stron lub dokumentów
 • Deszyfracja dokumentu przy otwarciu, jeżeli konieczne (wymagane jest hasło)
 • Szyfrowanie dokumentu podczas tworzenia
 • Wypełnianie formularzy PDF z danymi FDF lub XFDF lub spłaszczanie formularzy
 • Dodawanie znaku wodnego lub stempla w tle
 • Raporty metryczne, jak meta dane, zakładki i etykiety stron
 • Aktualizowanie meta danych
 • Załączanie plików do stron albo dokumentu
 • Wypakowywanie załączników PDF
 • Dzielenie dokumentu PDF na poszczególne strony
 • Dekompresja i ponowna kompresja strumieniowanych stron
 • Naprawa uszkodzonego pliku PDF (jeżeli jest to możliwe)

Poniżej przykłady z użyciem kilku poleceń:
Łączenie dwóch lub więcej plików PDF w jeden dokument:

[bash]pdftk 1.pdf 2.pdf 3.pdf cat output 123.pdf[/bash]

używając zmiennych:

[bash]pdftk A=1.pdf B=2.pdf cat A B output AB.pdf[/bash]

wybierając wszystkie pliki:

[bash]pdftk *.pdf cat output razem.pdf[/bash]

Rozdzielanie konkretnych stron na pojedyncze dokumenty:

[bash]pdftk A=jeden.pdf B=dwa.pdf cat A1-7 B1-5 A8 output razem.pdf[/bash]

Obrót pierwszej strony o 90 stopni zgodnie z ruchem wskazówek zegara:

[bash]pdftk dok.pdf cat 1E 2-end output wynik.pdf[/bash]

Obrót całego dokumentu o 180 stopni:

[bash]pdftk dok.pdf cat 1-endS output wynik.pdf[/bash]

Szyfrowanie dokumentu PDF 128 bitowym kluczem, wraz z prawami dostępu danego użytkownika:

[bash]pdftk dok.pdf output dok.128.pdf owner_pw haslo[/bash]

Tak samo, jak wyżej, z tym, że tutaj jest wymagane hasło do otwarcia pliku:

[bash]pdftk dok.pdf output dok.128.pdf owner_pw haslo user_pw haslo1[/bash]

Tak samo, z dodaną możliwością wydruku (zaraz po otwarciu)

[bash]pdftk dok.pdf output dok.128.pdf owner_pw haslo user_pw haslo1 allow printing[/bash]

Deszyfracja PDF:

[bash]pdftk zabezpieczony.pdf input_pw haslo output niezabezpieczony.pdf[/bash]

Łączenie dwóch dokumentów, w tym jednego zaszyfrowanego (plik wyjściowy nie jest szyfrowany):

[bash]pdftk A=zabezpieczony.pdf dok.pdf input_pw A=haslo cat output razem.pdf[/bash]

Dekompresja strumieniowanych stron do edycji kodu, w edytorze tekstowym:

[bash]pdftk dok.pdf output dok.clear.pdf uncompress[/bash]

Naprawa uszkodzonej tabeli XREF i długości strumieni (jeżeli możliwe)

[bash]pdftk uszkodzony.pdf output naprawiony.pdf[/bash]

Dzielenie pojedynczego dokumentu PDF na strony i dodanie tego do raportu doc_data.txt

[bash]pdftk dok.pdf burst[/bash]

Raportowanie metryczne, takie jak meta dane, zakładki i etykiety stron:

[bash]pdftk dok.pdf dump_data output raport.txt[/bash]

pdftohtml

Polecenie to potrafi konwertować dokumenty PDF do plików HTML, XML i PNG. Należy tutaj zaznaczyć, iż wynikowych plików może być naprawdę sporo i należy to robić w osobnym katalogu.

Konwersja dokumentu PDF do HTML:

[bash]pdftohtml dok.pdf[/bash]

Konwersja konkretnych stron w dokumencie:

[bash]pdftohtml -f numer-pierwszej-strony -l numer-ostatniej-strony dok.pdf[/bash]

Konwersja zaszyfrowanego dokumentu. Można także obie opcje -opw i -upw dać razem, pamiętając ze hasła są inne.

[bash]pdftohtml -opw test dok.pdf
pdftohtml -upw test dok.pdf[/bash]

pdftotext

Polecenie to potrafi konwertować dokumenty PDF do plików tekstowych.

Konwersja dokumentu PDF do tekstowego:

[bash]pdftotext dok.pdf[/bash]

Konwersja konkretnych stron w dokumencie:

[bash]pdftotext -f numer-pierwszej-strony -l numer-ostatniej-strony dok.pdf[/bash]

Konwersja zaszyfrowanego dokumentu. Można także obie opcje -opw i -upw dać razem, pamiętając że hasła są inne.

[bash]pdftotext -opw test dok.pdf
pdftotext -upw test dok.pdf[/bash]

przez -
7 2129
LibreOffice

Hybrydowe pliki PDF są funkcją, która raczej nie przebiła się do szerszej świadomości użytkowników, a szkoda, bo jest to świetne rozwiązanie łączące zalety obu formatów: PDF i ODF. Koncepcja działania jest prosta: połączmy przenośność PDF-a, z edytowalnością pliku źródłowego, a w efekcie otrzymamy właśnie plik hybrydowy. Wygenerowana w ten sposób hybryda jest zgodna z dostępnymi na rynku czytnikami PDF. Aby plik edytować, należy go po prostu przeciągnąć na okno programu LibreOffice.

Aby stworzyć taki plik, w LibreOffice należy wybrać po kolei opcje z menu: Plik > Eksportuj jako PDF > Ogólne > Osadź plik OpenDocument.

Magia hybrydowych plików PDF - tworzenie

Do poprawnego działania wymagany jest pakiet PDF Import. W LibreOffice jest on elementem standardowego wyposażenia, jednak może być niedostępny w niektórych dystrybucjach Linuksa.

Uwaga! Jeśli omawiana funkcja już raz została zaptaszkowana, każdy następny PDF będzie również plikiem hybrydowym.

przez -
11 5300
Prasa

Po zeskanowaniu książki posiadamy masę plików, którą ciężko się przegląda. Korzystając z Basha oraz pakietu ImageMagick możemy w prosty sposób wygenerować książkę w formacie PDF. ImageMagick można korzystać z wiersza poleceń dlatego bardzo chętnie jest on wykorzystywany w językach skryptowych. Poprzez specjalne API dostępny jest również dla takich języków jak Perl, C, C++, Python oraz PHP.

Po zeskanowaniu kartek książki, warto będzie pliki wynikowe przekonwertować na format GIF. Format ten lepiej nadaje się do przechowywania tekstu oraz czarno-białej grafiki. Pliki ponad to będą posiadały mniejszy format.

Korzystając ze wcześniej poznanego polecenia convert, zmienimy pliki na bardziej przyjazne.

[bash]for plik in *.jpg
do
convert $plik -colors 2 -normalize -monochrome $plik.gif
done[/bash]

A na samym końcu wystarczy wydać polecenie convert *.gif ksiazka.pdf. Operacja w drugą stronę, czyli uzyskanie plików graficznych z pliku PDF jest również prosta. Posłuży nam do tego prosty skrypt:

[bash]for plik in *.pdf;
do
convert -quality 100 $plik `echo $plik | sed -e ‚s/\.pdf/-%d\.jpg/g’`
done[/bash]

W wyniku otrzymamy ponumerowane pliki JPG. Zawierać one będą w nazwie pliku numer strony.

przez -
0 953
Dokumenty, ODF, Open Document Format, OpenDocument

Jak możemy przeczytać na portalu cnet.com, firma Microsoft ma zamiar wprowadzić do swojego pakietu możliwość zapisu PDF oraz odczytu i zapisu standardu Open Document. Jest to o tyle ciekawe, z racji niedawno, udanego przeforsowania swojego formatu zapisu dokumentów OOXML, który obecnie znany jest pod nazwą OXML i znajduje się pod opieką ISO.

Microsoft już wcześniej zapowiadał, że nie będzie wspierał natywnie standardu ISO, a da jedynie możliwość konwersji OOXML do ODF. Natomiast wsparcie dla PDF 1.5 i PDF/A jest zaskakujące, z racji formatu XPS, stworzonego również przez MS, jako konkurenta dla formatu Adobe. Wcześniejszy brak wsparcie dla PDF, spowodowany był niedogadaniem się z firmą Adobe w tej sprawie.

przez -
0 1027
Wolne Lektury

Ruszył projekt Wolne Lektury, czyli cyfrowa biblioteka lektur należących do domeny publicznej. Portal udostępnia je w różnych formatach (PDF, TXT, ODT), z licznymi przypisami i komentarzami opracowywanymi przez specjalistów.

Dodatkową atrakcją jest system powiązań między tekstami, który pozwala np. łączyć je na podstawie wspólnych motywów literackich, a wkrótce ma się pojawić także możliwość tworzenia własnych zestawów lektur.

“Wolne Lektury” to portal społecznościowy. To znaczy, że tworzy go specjalnie w tym celu zawiązana społeczność nauczycieli i naukowców, którzy wspólnie opracowują komentarze do lektur, proponują, jakie lektury dodatkowe warto w nim umieścić, i tworzą mapy, dzięki którym łatwiej jest się poruszać między książkami i między motywami literackimi.

Kolejną ważną funkcją naszej biblioteki internetowej jest to, że ma za zadanie aktywizować uczniów i nauczycieli. Tym samym pozostaje w zgodzie z filozofią ruchu wolnej kultury – to znaczy, że nie tylko zapewnia swobodny dostęp do prezentowanych na portalu treści, ale też umożliwia społeczności nauczycielskiej i naukowej, a także uczniom, twórcze działania w oparciu o te treści. Tym właśnie „Wolne Lektury” różnią się od licznych stron z opracowaniami lektur szkolnych – dostarczają narzędzi do pracy z tekstem, a nie gotowych ściąg.

Więcej o projekcie na stronie http://wolnelektury.pl/.

przez -
8 991
Adobe

Od jakiegoś czasu można zaobserwować zjawisko angażowania się Adobe w rozwój Open Source Software z różnych powodów. Najczęściej to posunięcie wynika z chęci dowalenia Microsoftowi i zdobycia miażdżącej przewagi nad konkurencją. W ostatnich miesiącach Adobe zaskoczyło nas mile kilkoma nowinkami, a i odnalazłem jedną plotkę.

Adobe udostępnia Mozilli silnik ActionScript

Adobe Systems poinformowało o udostępnieniu kodu źródłowego wirtualnej maszyny ActionScript fundacji Mozilla w ramach nowego projektu Tamarin. ActionScript to implementacja standardu EcmaScript na którym bazuje znany język JavaScript.

Decyzja Adobe tłumaczona jest chęcią zjednoczenia JavaScript, ponieważ każda z przeglądarek ma swoją własną implementację (IE – JScript, Mozilla – SpiderMonkey), a format Flash korzysta z ActionScript.

Warto zaznaczyć, że udostępniony Mozilli kompilator jest parę razy szybszy od SpiderMonkeya, co wg. Adobe daje zupełnie nowe możliwości, także w aplikacjach AJAX.

Adobe nie konsultowało przekazania Mozilli kodu źródłowego VM ActionScript z Microsoftem, jednak ma nadzieję, że Microsoft skorzysta ze zunifikowanej wersji JavaScript, co pozwoli na stworzenie implementacji na platformach Flash, Mozilla i Internet Explorer, która stałaby się niekwestionowanym standardem w Internecie. [src]

Nikt nie wierzy już w bajki z cyklu „Microsoft zaimplementuje w swoim oprogramowaniu konkurencyjne, lepsze i wolne rozwiązanie”, więc powinni postawić kawę na ławę: Dajemy wam naszą maszynę wirtualną, bo wierzymy, że odbierzecie kolejną część rynku MSIE, dzięki czemu nasze rozwiązania staną się jeszcze popularniejsze i nikt nie zagrozi naszej technologii!

Adobe InDesign będzie wspierał OpenDocument?

Wątek mieszczący się w kategorii „płotka i plotka” ;-) Paweł Tkaczyk w notatce poświęconej otwartym standardom wspomina w jednym zdaniu: „format OpenDocument będzie można importować do bardziej zaawansowanych programów do składu i łamania (jak Adobe InDesign czy Quark XPress)” + „Adobe planuje obsługę ODF w kolejnych wersjach swoich aplikacji (np. będzie można importować OpenDocument do InDesigna).”. To by tłumaczyło, dlaczego Adobe chce mieszać w specyfikacji OpenDocument 1.1. Niestety Google nie zwraca żadnych konkretów :(

PDF – standard przez duże S!

To już chyba nowością nie jest! :) LinuxNews.pl informuje, o zamiarach Adobe. Firma chce ujawnić pełną specyfikację PDF i ustandaryzować format w ISO. Środowisko wolnego oprogramowania dzięki temu tylko zyska natywne czytniki dla KDE/GNOME/…, które poradzą sobie z każdym plikiem! Koniec problemów z odczytywaniem druków! Koniec czekania aż Adobe łaskawie stworzy Windows-podobnego readera! Będzie można również tworzyć własne PDFy (może poprawią eksport w OpenOffice.org po ujawnieniu specyfikacji!). Dodatkowo OSDL chce wdrożyć PDF jako standardu przesyłania zadań wydruku, przy zachowaniu wstecznej zgodności z PostScriptem :)

Btw. Ciekawe czy po zestandaryzowaniu PDFa, Microsoft doda drukarkę do Officea 2007. Jak zapewne pamiętamy, Adobe chciało oskarżyć Microsoft o wykorzystanie pozycji monopolisty…

Ze względu na sprzeciw Adobe Microsoft został zmuszony do usunięcia możliwości zapisywania plików do formatu PDF w Office 2007.

Firma Adobe zagroziła, że jeśli Microsoft pozostawi możliwość zapisu do PDF w finalnej wersji Office, pozwie go przed instytucją Unii Europejskiej o wykorzystywanie pozycji monopolistycznej. Chociaż PDF jest otwartym formatem i obsługuje go np. OpenOffice.org i Mac OS X to w przypadku Microsoftu i jego pakietu Office stanowisko Adobe nie jest entuzjastyczne. Spór ciągnie się już od lutego.[src]

Gdy PDF zostanie zatwierdzony jak Standard przez ISO, żadne sądy nie będą już potrzebne. Czyżby Adobe zapomniało o tym kawałku swojej historii?

Standardy i standardy a wyścig po dominację nad wirtualnym światem

Dość głośno w ostatnich miesiącach jest o różnych procesach standaryzacji formatów plików w ECMA/ISO. Zaczęło się oczywiście od wojny OpenDocument vs Office”Open”XML, z której jasno wynika iż Microsoft jest na straconej pozycji. Unia Europejska zaleca korzystać z OpenDocumentu w administracji publicznej, a to m.in dzięki posiadaniu statusu międzynarodowego standardu ISO.

Liczne serwisy przy okazji informacji o standaryzacji formatu Adobe, piętnują firmę za opieszałość i czekanie aż do premiery XPS wraz z Vistą. Niektórzy ryzykują, stwierdzając, że to strach przed gigantem z Redmont i chęć zabezpieczenia się na rynku (teraz firmy będą wojować standardami ECMA/ISO a nie patentami). Jednak nie musi być to dokładnie ten powód. Na razie sam Microsoft nie promuje zbytnio elektronicznego papieru. Usunął funkcję eksportu do XPS z Officea 2007, chociaż była ona w becie2, a i nie było żadnych przeciwwskazań czy problemów prawnych. Być może XPS jest słaby i powtórzy się historia z WMA, które miało wygryźć mp3 a wygryzło się samo ;-)

Wygląda na to, że wszystko toczy się wg myśli Ruchu Wolnego Oprogramowania. To teraz czekamy na wolnego Flasha, bo częstość wydawania plajera jest dobijająca :)

Polecane

PyCode Conference

0 417
Pythonowi weterani, pasjonaci języka i mierzący wysoko początkujący programiści, zaznaczcie sobie w kalendarzu ważną datę.2-3 grudnia odbywa się 4 edycja PyCode Conference.
Konferencje

0 433

0 1461