Formát PDF/A Abbyy Finereader Finereader
Norma ISO 19005 (PDF/A) definuje požadavky na vytváření dokumentů připravených k archivaci na základě široce dostupného formátu PDF. Norma podrobně specifikuje, jaký obsah je povolen a jaký ne. Tyto a další specifikace mají zajistit, aby dokumenty zůstaly čitelné po celou dobu, bez ohledu na aplikační software a operační systém, ve kterém byly původně vytvořeny.
Soubor musí obsahovat všechny informace potřebné k tomu, aby se dokument pokaždé zobrazil beze změn. To zahrnuje veškerý obsah dokumentu: text, rastrové obrázky a vektorovou grafiku, fonty, informace o barvách atd.
- Omezení pro PDF/A-1, PDF/A-2, PDF/A-3 zahrnout:
Různé standardy PDF/A.
PDF/A-1První norma PDF/A (ISO 19005-1:2005) byla založena na PDF verze 1.4 a publikována v roce 2005. Chybějící funkce: komprese JPEG 2000, průhlednost, vrstvy a vnořování.
PDF/A-1a: Úroveň A – Splňuje všechny požadavky specifikace. Obsah musí být označen stromovou strukturou, což znamená, že prvky, jako je pořadí čtení, obrázky a tabulky, jsou jasně identifikovány pomocí metadat.
PDF/A-1b: Úroveň B je nižší úroveň shody, která pokrývá požadavky této části normy ISO 19005, které se týkají vzhledu elektronických dokumentů, ale nikoli jejich strukturálních nebo sémantických vlastností, ani požadavek, aby veškerý text odpovídal kódování Unicode. Toto je upřednostňováno pro skenované dokumenty.
PDF/A-2Norma (ISO 19005-2:2011). Založena na PDF 1.7 (ISO 32000-1:2008). Obsahuje několik funkcí, které nebyly k dispozici ve verzi PDF 1.4. Nabízí řadu užitečných technických inovací: vysoce efektivní kompresi ve formátu JPEG 2000, podporu pro průhlednost a efekty vrstev, vkládání písem OpenType a také možnosti digitálního tisku. Podpisy v souladu se standardem PAdES (PDF Advanced Electronic Signatures). Nabízí také možnost vkládání souborů PDF/A do formátu PDF/A-2, což umožňuje archivovat sady dokumentů jako samostatné dokumenty v jednom souboru.
PDF/A-2a: Označuje plný soulad s požadavky normy ISO 19005-2, včetně požadavků týkajících se strukturálních a sémantických vlastností dokumentů. Platný PDF/A úrovně a bude obsahovat text, který lze spolehlivě vyhledávat a kopírovat.
PDF/A-2b: Úroveň B – nižší úroveň shody v rámci požadavků této části normy ISO 19005, týkající se vizuálního vzhledu elektronických dokumentů, a nikoli jejich strukturálních a sémantických vlastností.
PDF/A-2u: Úroveň shody U je úroveň shody B s dodatečným požadavkem, aby veškerý text v dokumentu byl v kódování Unicode. Shoda s požadavkem úrovně U tedy bude obsahovat text, který lze spolehlivě vyhledávat a kopírovat, ale pořadí čtení není zaručeno.
PDF/A-3Norma (ISO 19005-3:2012). Založena na PDF 1.7 (ISO 32000-1:2008). PDF/A-3 přidává do specifikace (ISO 19005-2) jednu a velmi důležitou funkci, která umožňuje vkládání souborů PDF/A nebo souborů v jakémkoli jiném formátu, nejen do jiných souborů PDF/A (jak to umožňuje PDF/A-2). Soubory, které splňují tyto požadavky, se nazývají „přidružené“ soubory; mezi každým vloženým souborem a souborem PDF, který jej obsahuje, existuje propojení, nebo objektem či strukturou (například obrázkem, stránkou nebo logickou sekcí) v PDF.
Prohlížeč PDF/A však nemusí s těmito vloženými soubory dělat nic jiného, než zajistit jejich správnou extrakci. Standard proto nemůže zaručit, že budete moci tyto soubory v budoucnu číst nebo jinak používat.
PDF/A-3a: Označuje plný soulad s požadavky normy ISO 19005-3, včetně požadavků týkajících se strukturálních a sémantických vlastností dokumentů. Platný PDF/A úrovně a bude obsahovat text, který lze spolehlivě vyhledávat a kopírovat.
PDF/A-3b: Úroveň B je nižší úroveň shody, která splňuje minimální požadavky na zajištění vizuální prezentovatelnosti souboru. Soubor lze ukládat po dlouhou dobu. Specifikace uvádí, že soubory, které splňují úroveň B, nemusí mít dostatečně bohaté interní informace pro zachování logické struktury dokumentu a textový obsah je přenášen v přirozeném pořadí čtení, což je zajištěno shodou s úrovní A.
PDF/A-3u: Úroveň shody U je úroveň shody B s dodatečným požadavkem, aby veškerý text v dokumentu byl kompatibilní s Unicode. Shoda s požadavkem úrovně U tedy bude obsahovat text, který lze spolehlivě vyhledávat a kopírovat, ale pořadí čtení není zaručeno.
Takže pokud potřebujete uložit dokument jako PDF s úrovní kompatibility PDF/A-1b, stačí zadat několik řádků kódu.
DocumentCore dc = DocumentCore.Load(@"d:input.docx"); dc.Save(@"d:output.pdf", new PdfSaveOptions() < Compliance = PdfCompliance.PDF_A1b, >); Následující úryvek kódu ukazuje, jak můžete vytvořit nový dokument obsahující text a uložit jej ve formátu PDF/A-2a.
DocumentCore dc = new DocumentCore(); DocumentBuilder db = new DocumentBuilder(dc); db.CharacterFormat.FontName = "Times New Roman"; db.CharacterFormat.Size = 24; db.Writeln("Hello World!"); dc.Save(@"d:output.pdf", new PdfSaveOptions() < Compliance = PdfCompliance.PDF_A2a, >); U každého konkrétního dokumentu, jehož formát je deklarován jako PDF/A, nelze předem říci, že tomu tak skutečně je. Pro splnění formátových požadavků každého konkrétního dokumentu je nutné ověření.
Pokud chcete ověřit pravost svých PDF/A souborů, podívejte se na níže uvedené odkazy na bezplatné online služby.
- www.pdf-online.com
- www.bfo.com
- www.pdfrecover.herokuapp.com
Děkuji, že jste si na mě udělal/a čas.
Pokud potřebujete příklad kódu nebo máte dotaz: napište nám na adresu [email protected] nebo se zeptejte v online chatu (pravý dolní roh této stránky) nebo použijte níže uvedený formulář:
Autorská práva © 2002 — 2025 SautinSoft. Všechna práva vyhrazena.
- Kontakty
- @SautinSoftSupport
- +7 912 442 99 33
- Týmy: sautinsoft.support
- [email protected]
- Rusko, Votkinsk
Pokud chcete vytvořit dokument PDF s možností vyhledávání textu a bez ztráty vizuální kvality a pokud bude tento dokument v budoucnu uložen v archivu, vyberte formát uložení PDF/A.
Jak uložit text ve formátu PDF/A:
- Na hlavním panelu nástrojů v rozevíracím seznamu vyberte režim ukládání formátování dokumentu.
- Použijte položku nabídky Soubor>Uložit dokument jako>PDF dokument nebo tlačítko uložit výsledky na hlavním panelu nástrojů. Klikněte na šipku vedle tlačítka uložit výsledky a vyberte formát uložení ze seznamu. Pokud požadovaný formát v seznamu není, vyberte Uložit v jiném formátu…a v otevřeném dialogovém okně pro uložení vyberte požadovaný formát.
Tip: V případě potřeby můžete nastavit další možnosti ukládání na kartě Uložit > PDF/A v dialogovém okně Možnosti (nabídka Nástroje > Možnosti…).
Tato záložka obsahuje následující skupiny nastavení:
Můžete zadat velikost papíru, která bude použita při ukládání výsledků rozpoznávání do formátu PDF. Velikost papíru se zadává v rozevíracím seznamu Výchozí velikost papíru.
Volba režimu ukládání závisí na tom, jak budete vytvořený dokument v budoucnu používat:
- Pouze text a obrázky
Tento režim ukládá rozpoznaný text a ilustrace. Tento typ PDF souboru je relativně malý a lze v něm vyhledávat celý text. Vzhled dokumentu se může mírně lišit od originálu. - Text přes obrázek stránky
V tomto režimu se uloží pozadí a ilustrace původního dokumentu a rozpoznaný text se na ně navrství. Velikost takového PDF souboru je obvykle větší než soubor získaný při ukládání v režimu Pouze text a obrázky. Tento typ PDF dokumentu má možnost vyhledávání v celém textu, ale vzhled dokumentu se může mírně lišit od originálu. - Text pod obrázkem stránky
V tomto režimu se uloží obrázek stránky a rozpoznaný text se umístí na neviditelnou vrstvu pod obrázek. Výsledkem je dokument s možností vyhledávání podle textu, přičemž vzhled PDF dokumentu je prakticky nerozeznatelný od originálu. - Pouze obrázek
V tomto režimu se uloží obrázek stránky. Vzhled výsledného PDF dokumentu bude nerozeznatelný od originálu, ale takový dokument nelze vyhledávat podle textu.
- Zachovat barvu pozadí a písmen
Určuje, že barvy písmen a pozadí budou zachovány při ukládání textu do formátu PDF. - Zachovat záhlaví a zápatí
Zaškrtněte tuto možnost, pokud chcete uložit text záhlaví a zápatí. Pokud je tato možnost vypnuta, text záhlaví a zápatí se neuloží. - Povolit tagy PDF (pro Acrobat 5.0 nebo novější)
Určuje, že při ukládání rozpoznaného textu do formátu PDF budou automaticky uloženy tagy PDF. Kromě textu a ilustrací mohou soubory PDF obsahovat informace o struktuře dokumentu: logické části, ilustrace a tabulky. Tyto informace jsou uloženy jako tagy PDF. Tagy PDF usnadňují prohlížení dokumentu na obrazovkách různých velikostí, například na kapesních počítačích. Varování! Pokud rozpoznaný text obsahuje hebrejštinu nebo jidiš, není možné vytvořit tagovaný dokument PDF. Tato funkce není podporována. - Použít smíšený rastrový obsah (MRC)
Zaškrtněte tuto možnost, pokud chcete při silné kompresi dokumentu zachovat vysokou kvalitu textu a obrázků. V důsledku toho bude konečná velikost souboru malá a kvalita textu a obrázků vysoká.
Pokud rozpoznaný text obsahuje velký počet ilustrací, může být velikost výsledného souboru velmi velká. Kvalita obrázků a velikost výsledného souboru závisí na hodnotě vybrané v rozevíracím seznamu skupiny Kvalita obrazu.
- Chcete-li nastavit parametry pro ukládání obrázků, vyberte položku Vlastní. V otevřeném dialogovém okně vyberte požadované hodnoty a klikněte na tlačítko OK.
- Pokud nechcete v rozpoznaném textu zachovat obrázky, ujistěte se, že není zaškrtnuta možnost Zachovat obrázky.