PDF-Dateien durchsuchen

Gesperrt
silicone
Beiträge: 299
Registriert: Di 15. Mär 2005, 10:33
Kontaktdaten:

PDF-Dateien durchsuchen

Beitrag von silicone »

Hallo liebe Coder,

ein Kunde von mir möchte eine Suchfunktion, die Dokumente durchsucht.
Im Speziellen PDFs. Ich glaube in typo3 gibt es ein Modul "Indexed search", das kann das.

Hat jemand einen Tip, wie das in Contenido umsetzbar wäre?

Besten Dank im Voraus.
emergence
Beiträge: 10653
Registriert: Mo 28. Jul 2003, 12:49
Wohnort: Austria
Kontaktdaten:

Beitrag von emergence »

umsetzbar ? klar...

man müsste das teil von grund auf neu schreiben und eventuell als plugin oder ähnliches in contenido integrieren... eine code übernahme aus typo3 ?? bringt es alleine vom zeitaufwand nicht...
gewisse server vorraussetzungen werden ja auch benötigt... mit php bordmittel ist die indizierung von pdf nicht machbar...

ist (sehr)viel arbeit...
*** make your own tools (wishlist :: thx)
silicone
Beiträge: 299
Registriert: Di 15. Mär 2005, 10:33
Kontaktdaten:

Beitrag von silicone »

Hallo Emercence,

danke für deine Antwort.
Kannst du in etwa abschätzen, wieviel Arbeit das wäre?
emergence
Beiträge: 10653
Registriert: Mo 28. Jul 2003, 12:49
Wohnort: Austria
Kontaktdaten:

Beitrag von emergence »

hmm...

also das mit den server vorraussetzungen -> xpdf -> damit hat an sich nur der provider arbeit...

vorgangsweise die ich nehmen würde
aus den pdf's die raufgeladen wurden den text extrahieren
text in einer db tabelle hinterlegen -> ähnlich wie bei der con_content
nur das der text dort mit der con_upl id verknüpft wäre...
die keywords generierung auf diese tabelle ausweiten...
und die class.search.php um dieses feature erweitern...

man könnte dann das standard suchmodul mit nutzen um ebenfalls texte der pdfs mit zu durchsuchen...

alles in allem damit das halbwegs sauber läuft -> 30 - 40 stunden...
man muss da auch einiges am core code von contenido umbauen...
*** make your own tools (wishlist :: thx)
silicone
Beiträge: 299
Registriert: Di 15. Mär 2005, 10:33
Kontaktdaten:

Beitrag von silicone »

Hallo Emergence,

danke für deine Ausführung. Leider ist der Aufwand dann doch zu groß.
Dummerweise hat der Kunde für die Erstellung seiner Seite schon ein Angebot von einem "Typo3-Typie". Da sehe ich dann für die Websiteerstellung plus die Kosten für Erweiterung alt aus...
nonano
Beiträge: 43
Registriert: Do 13. Apr 2006, 17:45
Kontaktdaten:

Beitrag von nonano »

Hallo,

ich weiss ja nicht, ob das so legitim wäre, aber rein theoretisch könnte man ja folgendes tun:

aus der Suchanfrage eine Google-Suche generieren, nach dem muster:

Code: Alles auswählen

// $sucheingabe wird im Formular geliefert
// $filetype wird im Formular geliefert

$suchbegriffe = strreplace(' ', '+', $sucheingabe);
$diesedomain = $HTTP_VARS['host'];
$googlesuche ="http://www.google.com/search?as_q=$suchbegriffe&num=100&as_filetype=" .$filetype ."&as_sitesearch=$diesedomain";

// jetzt die adresse $googlesuche aufrufen und nach dem muster
// $diesedomain (*) .$filetype
// durchsuchen. Entprechende Links generieren ...
Das Ganze funktioniert natürlich nur, wenn die Seiten bei google indiziert sind, und somit nur im öffentlich zugänglichen Bereich.

Vielleicht ist dieser Ansatz aber auch gant böse pfui pfui, weil man einfach so bei Google den Service durch die Hintertür nutzt ...

Aber vielleicht brintgt es ja auch jemanden auf einen ›vertretbaren‹ und ebenso einfachen Lösungsansatz ...
Gesperrt