Willkommen in der Webstatt Zum Webstatt Blog und Stories
Dinkel Dinkel am 15.03.06 23:14

Kann man irgendwie ein PDF per PHP durchsuchen, ohne pdflib zu verwenden?
oder geht es alternativ, dass man ein PDF in HTML/TXT umwandelt? Also auch per PHP

netcup.de Warum gibt es hier Werbung?
Julian am 16.03.06 00:02

Mit dem Thema "PDF mit PHP" habe ich mich auch noch nicht so beschäftigt, aber ich glaube kaum, dass du da ohne der pdflib auskommst.

Dinkel Dinkel am 16.03.06 00:06

boah, das ding ist aber arschteuer ;)

Julian am 16.03.06 00:25

Seit wann ist denn die pdflib kostenpflichtig?
Bei meinem XAMPP ist es dabei und in meinen PHP-Büchern ist auch nur von normalem "herunterladen" die Rede ...

pdf
PDF Support enabled
PDFlib GmbH Version 6.0.1
PECL Version 2.0.3
Revision $Revision: 1.143 $

Dinkel Dinkel am 16.03.06 00:28

ah, wie kann man das denn anzeigen lassen? vlt hat das mein server auch drauf ;) aber bei denen gibt es definitiv auch lizenzen zum kaufen...

Julian am 16.03.06 00:33

Das steht in der phpinfo.
Hab auch gesehen, dass es auf http://www.pdflib.com Lizenzen gibt...

In einem Buch stand, dass man mit php + pdflib und einem Formular ganz einfach und vor allem kostenlos eigene PDF-Dateien erstellen kann.

Dinkel Dinkel am 16.03.06 00:34

ja erstellen ist ja nicht das ding, das ist mit fpdf super einfach. Mir geht es darum, dass man in einem Dateisystem wenn man durchsucht, eben auch PDFs durchsucht werden. So a la Document Management System.

Michael Michael am 16.03.06 10:06

Soweit ich weiß ist die pdflib für den privaten Gebrauch nicht kostenpflichtig. Die Gebühren fallen erst bei einem kommerziellen Hintergrund an.

Zum Durchsuchen: Kannst du die Datei nicht einfach als Textdatei öffnen und durchsuchen. Du musst natürlich die PDF Spezifikationen übergeben aber die Inhalte kannst du meiner Meinung nach auch dort sehen.

Dinkel Dinkel am 16.03.06 10:08

tja, soll aber kommerziell sein ;)

und wie soll man mit php das pdf als text öffnen?

Michael Michael am 16.03.06 10:21

beispielsweise mit file_get_contents('dateiname.pdf')
;)

Dinkel Dinkel am 16.03.06 10:24

hm, muss ich mal probieren, ob das meinem Anspruch genügt. Geht das dann auch mit Office-Dokumenten?

Dinkel Dinkel am 16.03.06 10:31

ok, hier man nen Auszug, was da raus kommt ;)

Quote
%PDF-1.3 %Ç쏢 5 0 obj <> stream xœ ’AoÕ0 Çïù>¦/ÄIÇWBâ‚6Uâ€8mllêêƁÛ&mßc¡Ñª•ýãüb{ï0€ŸÞf\ÍëK†Û'3*âD2ä²Ë G“bÞÜ
aq ‰zAÝ¿)ßÌ'x0#Df™Ó±þÖ8Í“Ërf·ßÍ…¾3\¾¯Æã ’§gööÕÞôº=hÊ ýñšZbÉó:…è$

Michael Michael am 16.03.06 11:13

Hmm ich dachte da kämen unter anderem auch die lesbaren Inhalte heraus. Offensichtlich nicht.
Da wir aber eine solche Methode auf der Arbeit verwenden werde ich mir mal ansehen, wie s dort gelöst ist.

Dinkel Dinkel am 16.03.06 11:55

das wäre geil... bin gespannt

Creative Commons Lizenzvertrag
Alle Inhalte des Webstatt-Archivs stehen unter einer Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 3.0 Unported Lizenz.

Impressum & Kontakt