Suchmaschinenfreundlichkeit mit mod_rewrite

spengel
Beiträge: 25
Registriert: Do 29. Apr 2004, 12:52
Kontaktdaten:

Beitrag von spengel »

FrankHoffmann hat geschrieben:@smac
Der technische Ansatz ist vermutlich okay. Aber für Google ist es egal ob die URL so oder lautet. Es ist ein Irrtum, das Google Seiten mit einer URL wie etwa http://www.domain.de/front_content.php? ... 1&idcat=48 nicht oder nur schlecht indiziert. Allerdings hat die URL Einfluss auf das Ranking. Perfekt wäre eine Lösung, die die Keywords als HTML Dateinamen schreibt. Eine Seite über Bleistifte wird bei Google eher vorne auftauchen, wenn sie beistift.html heisst als wenn sie 1_1_48.html heisst.

Suche mal bei Google nach front_content
Google ist es definitiv nicht egal wieviele Parameter folgen sofern die Seite nicht mit einem hohen PR gesegnet ist. Meine Seite (pr2-3) hatte z.B. 2 Jahre 2 Parameter und Unterseiten wurden nie gefunden. Beim Fotoalbum mit 2 Parametern ist es heut noch so. Nach Umstellung auf cont mit Links in dem oben genannten Format ist die Seite in 1 Woche zu 100% (250 Seiten) indexiert worden.
Auch Dateinamen als Keywords sind nicht (mehr) relevant. In den Serps wird der zwar hervorgehoben, für die Berechnung wird er aber (praktisch) nicht hinzugezogen.
kummer
Beiträge: 2423
Registriert: Do 6. Mai 2004, 09:17
Wohnort: Bern, Schweiz
Kontaktdaten:

Beitrag von kummer »

nun, ich mache andere erfahrungen. ich habe sites (und hier auch beispiele geposted), welche fünf übergabewerte benötigen und einwandfrei indexiert worden sind.

das deine site nicht vollständig indexiert worden ist, hatte vermutlich andere gründe... :roll:
aitsu.org :: schnell - flexibel - komfortabel :: Version 2.2.0 (since June 22, 2011) (jetzt mit dual license GPL/kommerziell)
spengel
Beiträge: 25
Registriert: Do 29. Apr 2004, 12:52
Kontaktdaten:

Beitrag von spengel »

ich bezweifle das es andere Gründe waren, es wurde nämlich rein garnichts sonst geändert :wink:

natürlich ist es möglich auch 5er und mehr Übergabewerte in google reinzubekommen, das habe ich auch nicht bestritten. Links dazu gibt es mehr als genug. Achte dabei aber mal auf den üblichen pr der Startseite. Ausnahmen gibt es aber natürlich auch hier, wodurch auch immer verursacht. Langfristige pr<4 mit 3-5 Übergabewerten sind allerdings so selten das ich sie doch als Ausnahme bezeichnen würde.
kummer
Beiträge: 2423
Registriert: Do 6. Mai 2004, 09:17
Wohnort: Bern, Schweiz
Kontaktdaten:

Beitrag von kummer »

suche mal in google nach 'contenido module'. an zweiter stelle findest du unserere site (vor der umstellung mit mod_rewrite).

inzwischen haben auch wir die umstellung vorgenommen. habe aber erst nachher festgestellt, dass die site einwandfrei indexiert worden ist.
aitsu.org :: schnell - flexibel - komfortabel :: Version 2.2.0 (since June 22, 2011) (jetzt mit dual license GPL/kommerziell)
spengel
Beiträge: 25
Registriert: Do 29. Apr 2004, 12:52
Kontaktdaten:

Beitrag von spengel »

hxxp://w3concepts.net/cms/front_content.php?idcat=51

ich sehe da nur einen Parameter. Den schafft google mittlerweile meist auch mit pr0-Seiten sofern 1-2 Links draufgehen. Problematischer wird es erst bei 2 und mehr Paras.
Eure Seite hat einen pr von >=4 und damit sind auch 2-3 Parameter problemlos indexierbar (mod-rewrite wäre so tatsächlich nicht notwendig). Einer frischen Seite ohne starke Backlinks würde das mit http://www.domain.de/front_content.php? ... &idcat=xxx aber nicht vergönnt sein und darum bleibt mod-rewrite für google aktuell.

"Gehen" wird es immer, es wird mit steigender Parameterzahl einfach nur (bedeutend) schwieriger.
kummer
Beiträge: 2423
Registriert: Do 6. Mai 2004, 09:17
Wohnort: Bern, Schweiz
Kontaktdaten:

Beitrag von kummer »

wenn ein crawler eine seite in seine todo-list aufnimmt für eine indexierung, dann kann eine gute oder schlechte indexierung nicht mehr von der url abhängen. dann ist es eine frage des inhalts.

die frage die sich also stellt ist: werden seiten, die die übergabe von vier oder fünf parametern erfordern indexiert oder nicht. und diese frage kann man unbesehen mit ja beantworten (ich habe dazu mehrere beispiele geposted).

dass dabei zufall im spiel sein soll ist nicht nur unwarscheinlich, sondern unsinn. ein crawler macht das, wozu er programmiert worden ist; ob der mond scheint oder auf der südlichen hemisphare ein nashorn niest ist dem crawler völlig egal und wird ihn auch nicht beeinflussen.
aitsu.org :: schnell - flexibel - komfortabel :: Version 2.2.0 (since June 22, 2011) (jetzt mit dual license GPL/kommerziell)
kummer
Beiträge: 2423
Registriert: Do 6. Mai 2004, 09:17
Wohnort: Bern, Schweiz
Kontaktdaten:

Beitrag von kummer »

ein kleiner nachtrag am rande: was google tatsächlich nicht mag, sind session-ids, welche als get-parameter übergeben werden. die sind zuweil zwar unvermeidlich, wenn man die entsprechenden informationen benötigt, stören indes die indexierung tatsächlich.
aitsu.org :: schnell - flexibel - komfortabel :: Version 2.2.0 (since June 22, 2011) (jetzt mit dual license GPL/kommerziell)
timo
Beiträge: 6284
Registriert: Do 15. Mai 2003, 18:32
Wohnort: Da findet ihr mich nie!
Kontaktdaten:

Beitrag von timo »

da im Frontend bei Cookie-Support keine SID angehängt wird, ist das auch nicht weiter tragisch (Google's Bot kann cookies ;))
spengel
Beiträge: 25
Registriert: Do 29. Apr 2004, 12:52
Kontaktdaten:

Beitrag von spengel »

@kummer ich weiß zwar nicht worauf Du da antwortest aber auf meine Beiträge kann es irgendwie nicht sein (und darum ist das auch mein letzter dazu). Google (bei Fireball würd ich das ja noch glauben^^) kann mehr als nur schwarz-weiß denken und seine Art zu indexieren auch von mehr als einer URL abhängig machen. Von Zufall war auch nie die Rede sondern von anderen nicht direkt sichtbaren Einflüssen. Warum Dein Beispiel (und mehr sehe ich hier nicht) auch mit 3 Parametern indexiert wird habe ich oben beschrieben.

session-ids sind wieder ein ganz anderes Thema
andrej
Beiträge: 333
Registriert: Mi 8. Okt 2003, 09:46
Kontaktdaten:

Beitrag von andrej »

@FrankHoffmann
Hast Du das Script wieder entfernt ? Ich finde es bei Dir auf der Webseite leider nicht. Würde mich freuen wenn Du mir behilflich seien kannst.
evok
Beiträge: 19
Registriert: Mo 21. Jun 2004, 03:45
Kontaktdaten:

Beitrag von evok »

Hallo @Spengel,

Das einige Unterseite mit 3 oder 4 Parameter in der URL nicht indexiert werden, hat seinen Grund darin, daß diese häufig in einer tieferen Ebene liegen. Damit diese ebenfalls schnell in dem Index erscheinen, ist ein mittlerer oder hoher PR sicher hilfreich.

Damit Du dich davon überzeugen kannst, habe ich mal eine mit Contenido erstellte Beispielseite gesucht:

http://www.google.de/search?q=allinurl: ... rt=10&sa=N

Von daher ist es sicher grundsätzlich sinnvoll, die neusten Artikel von der Startseite aus zu verlinken.
roman
Beiträge: 127
Registriert: Fr 25. Apr 2003, 15:36
Kontaktdaten:

Beitrag von roman »

Ich habe laurisilvas Ansatz umgesetzt und einfach etwas erweitert. Meine Zeile(n) in der .htaccess lautet:

RewriteRule ^([0-9]*)-(.*).html$ /front_content.php?idcat=$1

Somit habe ich das Format :

26-Buchhandlung.html
Das habe ich gut zum laufen bekommen. Leider nutze ich Umlaute und da kommt es ins stolpern.
In den jeweiligen Modulen müsste $data['name']. erst einmal ausgewertet werden um diesen ggfl. umzuschreiben (Umlaute, Lehrzeichen und div. in einer URL ungültige Sonderzeichen)

Vielleicht hat kemand einen passenden Scriptschnipsel zum einbauen.

Gruß Roman[/quote][/code]
llaron
Beiträge: 133
Registriert: Mi 14. Jul 2004, 12:54
Kontaktdaten:

was hast du denn in den pfaden geändert?

Beitrag von llaron »

ich habe genau das gleich problem - nur keine ahnung was ich an den pfaden in der htaccess ändern muss?!

merci im voraus,
greetz
roman
Beiträge: 127
Registriert: Fr 25. Apr 2003, 15:36
Kontaktdaten:

Umlaute

Beitrag von roman »

@IIaron
Das kannst Du nicht in der htaccess ändern.
Dafür müssen die Module bzw. Navigation angepasst werden.
Nämlich bevor die URL abgeschickt wird muss der Artikel oder Kategoriename angepasste werden (on the fly). Umlaute und Lehrzeichen umschreiben...

Und da bin ich nicht Code Experte genug.
Wie sieht es aus? Einer von den wirren Crack´s :shock: hat doch bestimmt schon eine Idee.

Gruß Roman
llaron
Beiträge: 133
Registriert: Mi 14. Jul 2004, 12:54
Kontaktdaten:

Beitrag von llaron »

roman hat geschrieben:@ IIaron
hier nocheinmal was im Anfang des Forum steht:

RewriteEngine on
RewriteRule ^(.*)_(.*)_(.*)_(.*).html$ /cms/front_content.php?client=$1&lang=$2&idcat=$3&idart=$4

Der "_" stellt das Trennzeichen dar und die einzelnen Teile zu trenne.

Nur muss das konform mit den Anweisungen der Module bzw. Navigation laufen

Also rufst Du:
www.domain.de/cms/1_6_5_12.html auf,

enstspricht dies:
http://www.domain.de/cms/front_contend? ... 5&idart=12

oder:
Mandant 1, Sprache 6, Kategorie 5, Artikelnummer 12


Nur hat dies mit dem von mir besprochenen Umlauteproblem leider nix zu tuhen.
Hier währe eine PHP auswertung notwendig, welche die Namen umschreibt.

Gruß Roman

hi roman,

vorab - ich glaube das hier ein mißverständnis. ich habe meinen beitrag aus unerfahrenheit an die falsche stelle gesetzt! :-)

ich beziehe mich auf folgendes, gleiches problem von anjin san:

"Hallo Leute,

Habe mit mod_rewrite mal herumprobiert.
Habe den Code von laurisilva genommen, aber leider geht gar nix.
Im quellcode der an den Browser ausgelieferten front_content.php steht zwar richtiger weise ...href="2.html"
aber beim Aufruf erscheint Fehler404 Seite nicht gefunden."


ich denke das ist nicht das problem. ich habe zudem das 2te posting von laurisilva verwendet. klicke ich in der navigation, dann sehe ich auch die geänderte url im adressfeld - nur kommt beim klick eine 404 seite! ich denke ich muss in der htaccess irgendwie den pfad anpassen??

Code: Alles auswählen

RewriteEngine On
RewriteRule ^(.*),(.*).html$ /front_content.php?idcat=$1&idart=$2
RewriteRule ^coaching(.*).html$ /front_content.php?idcatart=$1
RewriteRule ^(.*).html$ /front_content.php?idcat=$1
meine htaccess liegt im ordner cms. theoretisch müsste das doch passen oder? wie gesagt, die url wird schon richtig ausgegben..nur die 404 seite passt mir nicht!

merci schonmal..
nico
Gesperrt