Forum

Hab mal einige Fragen zu Scannen PDFs und JPGs
September 28, 2016, 17:58:07
Beim Scannen einer Vorlage wird doch eigentlich ein Bild erzeugt.
Ähnlich einem Bild aus einer Digitalkamera.
Man kann als Ausgabeformat aber auch PDF definieren.
Scannt man Textvorlage kann man aber nicht nach Textstellen suchen.
Dies ist mir schon klar, da es ja ein „Bild" ist.
Warum also die Möglichkeit Ausgabeformat PDF?

Weiterhin gibt es aber die Möglichkeit bei richtigen Textdokumenten:

Ablage > Als PDF exportieren
oder
Ablage > Drucken > Als PDF sichern

auszuwählen.

Worin unterscheiden sich die Scan PDFs zu den anderen Ablage ...?

Weiterhin habe ich die Frage zu dem screenshot.
Ist Bedienung Silverfast SE Plus.
Dort kann man Preset wählen und auch noch Auflösung am Balken manuell ändern.
Wieso?

Stelle ich ein:
JPG, 300 ppi, steht im Bedienpanel 24,6 MB. Im Finder werden aber bei erzeugten Scan 570 KB angezeigt.
PDF, 300 ppi, steht im Bedienpanel 24,6 MB. Im Finder werden aber bei erzeugten Scan 1,1 MB angezeigt.
Wieso?

Die Hilfe von Silverfast sagt dazu nichts.

Jochen
_______
Wenn Du es eilig hast, gehe langsam.
Re: Hab mal einige Fragen zu Scannen PDFs und JPGs
Antwort #1: September 28, 2016, 20:30:29
Warum also die Möglichkeit Ausgabeformat PDF?

Ja warum denn nicht?


Ablage > Als PDF exportieren

Das ist die PDF Funktion eines Programms

Zitat
Ablage > Drucken > Als PDF sichern

Das ist die PDF Funktion des Betriebssystems, die mit jedem Programm funktioniert, auch in solchen, wo der Programm Entwickler kein speichern als PDF eingebaut hat.

Das Speichern als PDF unter Drucken auftaucht, dafür gibt es imho nur historische, aber keine sachlichen Gründe.
« Letzte Änderung: September 28, 2016, 20:36:54 von radneuerfinder »

mbs

Re: Hab mal einige Fragen zu Scannen PDFs und JPGs
Antwort #2: September 29, 2016, 00:15:35
Warum also die Möglichkeit Ausgabeformat PDF?

Weil PDF ein Format zum Austauschen von gedruckten Dokumenten ist. Drucken kann man sowohl Text, als auch Bilder, die wie Text aussehen, und "normale" Bilder natürlich auch. Das eine sind Vektordaten (also quasi die Umrisse der einzelnen Buchstaben), das andere Pixeldaten (einzelne Bildpunkte).

Worin unterscheiden sich die Scan PDFs zu den anderen Ablage ...?

Wenn in dem PDF wirklich "gedruckter Text" enthalten ist, wird zumindest die Vektorgrafik zum Zeichnen des Textes abgespeichert. Sofern technisch möglich, wird gleichzeitig aber auch als Zusatzdaten der gedruckte Text selbst (also die einzelnen Zeichen als Textdaten), zusammen mit den Positionen, an welchem Ort sich jedes Wort geometrisch befindet, gespeichert. Dadurch wird der "Druck" durchsuchbar. Dieser durchsuchbare Text ist speziell aufbereitet, z.B. werden gedruckte Silbentrennstriche dort wieder entfernt, Spaltendruck wird wieder in eine "normale" Reihenfolge gebracht, usw.

Dort kann man Preset wählen und auch noch Auflösung am Balken manuell ändern.

Das eine ist die Auflösung, mit der der Scanner scannen soll, das andere die Auflösung innerhalb der Bilddatei. Indem man beides verschieden einstellt, kann man die physische Größe des Bildes ändern, es also vergrößern und verkleinern.

Wenn die Software aus niedrig aufgelösten Bilddaten hochaufgelöste Dateien machen soll, muss sie die Daten hochrechnen, wodurch die einzelnen Pixel gröber, die Bilder also "pixeliger" werden. Dies wird immer schlimmer, je stärker man die Bilder vergrößert, deshalb hat der Schieberegler dort eine immer röter werdende Warnmarkierung.

JPG, 300 ppi, steht im Bedienpanel 24,6 MB. Im Finder werden aber bei erzeugten Scan 570 KB angezeigt.
PDF, 300 ppi, steht im Bedienpanel 24,6 MB. Im Finder werden aber bei erzeugten Scan 1,1 MB angezeigt.

Die 24,6 MByte ist die echte, unkomprimierte Größe, die zur Speicherung der Pixel im Hauptspeicher nötig ist. Die Dateien arbeiten jedoch mit Datenkompression und sind je nach Format und Qualitätsstufe kleiner.
« Letzte Änderung: September 29, 2016, 00:20:11 von mbs »
Re: Hab mal einige Fragen zu Scannen PDFs und JPGs
Antwort #3: September 29, 2016, 07:38:59
Es gibt übrigens OCR-Programme, die in PDFs eingebettete Bilder (z.B. von Scans) nach Texten durchsuchen, diese in Texte umwandeln und wie von mbs beschrieben zusätzlich zu dem gescannten Bild an die richtige Stelle im Bild als Text hinterlegen. dadurch wird das PDF durchsuchbar, weil man die Textinformation zusätzlich gespeichert hat, bekommt aber trotzdem das Bild angezeigt.
_______
Was ist die Mehrheit? Mehrheit ist der Unsinn, Verstand ist stets bei wen´gen nur gewesen." -- Schiller
Re: Hab mal einige Fragen zu Scannen PDFs und JPGs
Antwort #4: September 29, 2016, 07:50:57
Es gibt übrigens OCR-Programme, die in PDFs eingebettete Bilder (z.B. von Scans) nach Texten durchsuchen, diese in Texte umwandeln und wie von mbs beschrieben zusätzlich zu dem gescannten Bild an die richtige Stelle im Bild als Text hinterlegen. dadurch wird das PDF durchsuchbar, weil man die Textinformation zusätzlich gespeichert hat, bekommt aber trotzdem das Bild angezeigt.

Ich weiss. Ich nutze DevonThink Pro Office. Damit geht das.

Jochen
_______
Wenn Du es eilig hast, gehe langsam.
Re: Hab mal einige Fragen zu Scannen PDFs und JPGs
Antwort #5: September 29, 2016, 07:58:13
Ich mache screenshots.
Ist PNG.
Datei ist groß.

Wandle um in JPG.
Datei ist klein.

Wandle um in PDF
Datei wird wieder sehr groß.

Weiss jemand wie ich kleinere PDFs bekommen kann?
Es gäbe da ein Programm PDF24, das läuft aber nur unter WIN.
https://www.youtube.com/watch?v=kVdiKjot7vg&feature=youtu.be

Weiss aber nicht ob das gut verkleinert.

Kennt jemand so was auch für Mac?

Jochen
_______
Wenn Du es eilig hast, gehe langsam.
Re: Hab mal einige Fragen zu Scannen PDFs und JPGs
Antwort #6: September 29, 2016, 08:21:34
Wandle um in PDF
Datei wird wieder sehr groß.

Das entscheidende ist dieser Schritt. Bilder können auf alle möglichen Arten, Auflösungen, Farbtiefen etc. in das PDF eingebettet sein. Die Standardeinstellung ist meist die höchste Qualität, was natürlich auch die größte Datei ergibt. Das ist unter Umständen aber nicht sinnvoll, schon kleines JPG erfolgt.

Google mal nach "pdf verkleinern mac". Dann kommen ganz oben bereits ein paar Anleitungen, wie man mit Bordmitteln unter OS X das Ziel erreichen kann.
_______
Was ist die Mehrheit? Mehrheit ist der Unsinn, Verstand ist stets bei wen´gen nur gewesen." -- Schiller

mbs

Re: Hab mal einige Fragen zu Scannen PDFs und JPGs
Antwort #7: September 29, 2016, 08:25:40
Wandle um in PDF
Datei wird wieder sehr groß.

Mit welchem Programm und welcher Funktion darin? Normalerweise erzeugt die Funktion "Als PDF exportieren" in "Vorschau" Dateien in etwa der gleichen Größe wie das ursprüngliche JPEG-Bild. Die Ergebnisse können je nach Systemversion variieren.

Im PDF-Standard gibt es die Funktion "DCTDecode Filter", die es erlaubt, ein JPEG-Bild völlig unverändert (also in exakt der gleichen Speichergröße) in ein PDF-Dokument einzubetten. Von daher gibt es keinen Grund, dass die PDF-Datei größer als die JPEG-Datei sein muss.
« Letzte Änderung: September 29, 2016, 08:33:05 von mbs »
Re: Hab mal einige Fragen zu Scannen PDFs und JPGs
Antwort #8: September 29, 2016, 08:46:34
Mit welchem Programm und welcher Funktion darin? Normalerweise erzeugt die Funktion "Als PDF exportieren" in "Vorschau" Dateien in etwa der gleichen Größe wie das ursprüngliche JPEG-Bild. Die Ergebnisse können je nach Systemversion variieren.

Das war eine sehr gutes feedback.
Ich habe immer das JPG über Ablage > Sichern unter > Format > PDF gesichert.
Dann wird es sehr groß.

Vielen Dank.

Jochen
_______
Wenn Du es eilig hast, gehe langsam.

mbs

Re: Hab mal einige Fragen zu Scannen PDFs und JPGs
Antwort #9: September 29, 2016, 08:59:06
Ich habe immer das JPG über Ablage > Sichern unter > Format > PDF gesichert.
Dann wird es sehr groß.

In dem Fall gehst Du ja vom Druckbild aus, d.h. Du hast nur noch einzelne Pixel in einer bestimmten Punktdichte auf einer bestimmten Papiergröße und keine JPEG-Daten mehr. An der Stelle liegen die Daten also nicht mehr als JPEG-Datenstrom vor und können auch nicht mehr in die Originalform zurückübersetzt werden.
Re: Hab mal einige Fragen zu Scannen PDFs und JPGs
Antwort #10: September 29, 2016, 09:38:32
Puuuh ???

Das mit den Möglichkeiten im Bedienpanel der Scannersoftware war mir bis dato nicht so bewusst, da ich es auch in der Vergangenheit nicht so benötigt hatte.
Man kann als Format TIFF, PSD, JPEG, JP2 oder PDF einstellen.
Man kann als Preset > Satz für Druck (600 ppi) bis web (72 ppi) einstellen
Man kann als Auflösung 100 ppi bis 9600 ppi einstellen.

Weiterhin habe ich bei Dokumenten Sichern als PDF oder Exportieren als PDF vermutlich nicht sinnvoll angewendet da mir das auch nicht so klar war.

Ich könnte mir denken dass die verwendeten Möglichkeiten davon abhängen was für ein Endprodukt man haben möchte?

Kennt da jemand eine Seite wo das alles gut erklärt ist?

Möchte Eure Zeit nicht strapazieren ;D

Jochen
_______
Wenn Du es eilig hast, gehe langsam.