Hallo liebe Coder,
ein Kunde von mir möchte eine Suchfunktion, die Dokumente durchsucht.
Im Speziellen PDFs. Ich glaube in typo3 gibt es ein Modul "Indexed search", das kann das.
Hat jemand einen Tip, wie das in Contenido umsetzbar wäre?
Besten Dank im Voraus.
PDF-Dateien durchsuchen
umsetzbar ? klar...
man müsste das teil von grund auf neu schreiben und eventuell als plugin oder ähnliches in contenido integrieren... eine code übernahme aus typo3 ?? bringt es alleine vom zeitaufwand nicht...
gewisse server vorraussetzungen werden ja auch benötigt... mit php bordmittel ist die indizierung von pdf nicht machbar...
ist (sehr)viel arbeit...
man müsste das teil von grund auf neu schreiben und eventuell als plugin oder ähnliches in contenido integrieren... eine code übernahme aus typo3 ?? bringt es alleine vom zeitaufwand nicht...
gewisse server vorraussetzungen werden ja auch benötigt... mit php bordmittel ist die indizierung von pdf nicht machbar...
ist (sehr)viel arbeit...
*** make your own tools (wishlist :: thx)
hmm...
also das mit den server vorraussetzungen -> xpdf -> damit hat an sich nur der provider arbeit...
vorgangsweise die ich nehmen würde
aus den pdf's die raufgeladen wurden den text extrahieren
text in einer db tabelle hinterlegen -> ähnlich wie bei der con_content
nur das der text dort mit der con_upl id verknüpft wäre...
die keywords generierung auf diese tabelle ausweiten...
und die class.search.php um dieses feature erweitern...
man könnte dann das standard suchmodul mit nutzen um ebenfalls texte der pdfs mit zu durchsuchen...
alles in allem damit das halbwegs sauber läuft -> 30 - 40 stunden...
man muss da auch einiges am core code von contenido umbauen...
also das mit den server vorraussetzungen -> xpdf -> damit hat an sich nur der provider arbeit...
vorgangsweise die ich nehmen würde
aus den pdf's die raufgeladen wurden den text extrahieren
text in einer db tabelle hinterlegen -> ähnlich wie bei der con_content
nur das der text dort mit der con_upl id verknüpft wäre...
die keywords generierung auf diese tabelle ausweiten...
und die class.search.php um dieses feature erweitern...
man könnte dann das standard suchmodul mit nutzen um ebenfalls texte der pdfs mit zu durchsuchen...
alles in allem damit das halbwegs sauber läuft -> 30 - 40 stunden...
man muss da auch einiges am core code von contenido umbauen...
*** make your own tools (wishlist :: thx)
Hallo,
ich weiss ja nicht, ob das so legitim wäre, aber rein theoretisch könnte man ja folgendes tun:
aus der Suchanfrage eine Google-Suche generieren, nach dem muster:
Das Ganze funktioniert natürlich nur, wenn die Seiten bei google indiziert sind, und somit nur im öffentlich zugänglichen Bereich.
Vielleicht ist dieser Ansatz aber auch gant böse pfui pfui, weil man einfach so bei Google den Service durch die Hintertür nutzt ...
Aber vielleicht brintgt es ja auch jemanden auf einen ›vertretbaren‹ und ebenso einfachen Lösungsansatz ...
ich weiss ja nicht, ob das so legitim wäre, aber rein theoretisch könnte man ja folgendes tun:
aus der Suchanfrage eine Google-Suche generieren, nach dem muster:
Code: Alles auswählen
// $sucheingabe wird im Formular geliefert
// $filetype wird im Formular geliefert
$suchbegriffe = strreplace(' ', '+', $sucheingabe);
$diesedomain = $HTTP_VARS['host'];
$googlesuche ="http://www.google.com/search?as_q=$suchbegriffe&num=100&as_filetype=" .$filetype ."&as_sitesearch=$diesedomain";
// jetzt die adresse $googlesuche aufrufen und nach dem muster
// $diesedomain (*) .$filetype
// durchsuchen. Entprechende Links generieren ...
Vielleicht ist dieser Ansatz aber auch gant böse pfui pfui, weil man einfach so bei Google den Service durch die Hintertür nutzt ...
Aber vielleicht brintgt es ja auch jemanden auf einen ›vertretbaren‹ und ebenso einfachen Lösungsansatz ...