Forumsmodul verursacht DuplicateContent in Google

Fragen zur Installation von CONTENIDO 4.10? Probleme bei der Konfiguration? Hinweise oder Fragen zur Entwicklung des Systemes oder zur Sicherheit?
Antworten
volupp11
Beiträge: 93
Registriert: Di 28. Nov 2006, 00:33
Wohnort: Berlin
Kontaktdaten:

Forumsmodul verursacht DuplicateContent in Google

Beitrag von volupp11 » Mo 3. Aug 2020, 14:03

Hat jemand eine Codezeile womit es möglich ist, bei einer Variable in der URL www.domain.de/dateiname.html?user_forum ... #new_forum aus der Zeile
<meta name="robots" content="index, follow">
zu entfernen und gegen
<meta name="robots" content="noindex, follow">
zu ersetzen.
Ich vermute, es liegt in der include.chain.content.createmetatags.php. Bedauerlicherweise erklärt sich mir die Logik nicht.

Also irgendwie in der Art:
<?php if ($user_forum_action=="new_forum") { ?><meta name="robots" content="noindex, follow"><?php } ?>

Sobald man das Forumsmodul nutzt, bildet sich DoubleContent bei Google.

Faar
Beiträge: 1915
Registriert: Sa 8. Sep 2007, 16:23
Wohnort: Brandenburg
Kontaktdaten:

Re: Forumsmodul verursacht DuplicateContent in Google

Beitrag von Faar » Mo 3. Aug 2020, 19:14

Ich nutze da lieber ein Canonical-Modul, damit Google weiß, welche URL gütlig sein soll.
Die kurze Liste aus 4.10: viewtopic.php?f=116&t=43497
Das etwas ältere Modul aus 4.9: viewtopic.php?f=89&t=35014

Ansonsten eine Frage? Lässt sich das für das Forum nicht im Artikel-Reiter "Seo" einstellen?
Ich benütze kein Forum, daher kann ich nicht nachschauen.
Fliegt der Bauer übers Dach, ist der Wind weißgott nicht schwach.

volupp11
Beiträge: 93
Registriert: Di 28. Nov 2006, 00:33
Wohnort: Berlin
Kontaktdaten:

Re: Forumsmodul verursacht DuplicateContent in Google

Beitrag von volupp11 » Di 4. Aug 2020, 10:28

Das Canonical- Modul benutze ich ebenfalls. Leider ist jede URL trotzdem zweimal indiziert. Bei diesem Problem erklärt Google man müsse URLs mit Variablen in der Zeile robots von index auf noindex setzen. Und genau an dieser Stelle "versagt" Contenido.

bodil
Beiträge: 340
Registriert: Fr 7. Okt 2011, 04:10
Kontaktdaten:

Re: Forumsmodul verursacht DuplicateContent in Google

Beitrag von bodil » Di 4. Aug 2020, 15:38

Ich habe mit dem Forumsmodul auch noch nicht gearbeitet.
Falls es für Contenido eine Möglichkeit gibt, Forumsbeiträge zu erkennen (zum Beispiel an der idcat), kannst du dein Meta-Tag in einer Chain suchen und ersetzen lassen. Wie das geht steht in etwa hier:
viewtopic.php?f=117&t=43719&p=180332
Es geht aber sicher auch eleganter.
Falls du eine xml-Sitemap zur Verfügung stellst, musst du die Seiten dort auch rausbekommen. noindex-Seiten in der xml-Sitemap würde dir Google sonst als nächstes ankreiden.

bodil
Beiträge: 340
Registriert: Fr 7. Okt 2011, 04:10
Kontaktdaten:

Re: Forumsmodul verursacht DuplicateContent in Google

Beitrag von bodil » Di 4. Aug 2020, 17:48

Noch ein vager Hinweise in dieser Sache:
Meta-Tags werden eigentlich nur gesetzt, wenn sie nicht bereits vorhanden sind. Du müsstest das korrekte Tag demzufolge lediglich vorher selbst korrekt in die Seite schreiben.

volupp11
Beiträge: 93
Registriert: Di 28. Nov 2006, 00:33
Wohnort: Berlin
Kontaktdaten:

Re: Forumsmodul verursacht DuplicateContent in Google

Beitrag von volupp11 » Mi 5. Aug 2020, 12:56

Ich befürchte, ich habe mich nicht eindeutig ausgedrückt.
URL A:
https://www.domain.de/dateiname.html
- Vorhanden in der Sitemap
- Aufgenommen von Google
- Quellcodeangabe im Header <meta name="robots" content="index, follow">
- SEO-Karteireiter bezüglich robots - keine Definition
URL B:
https://www.domain.de/dateiname.html?us ... #new_forum
- Nicht vorhanden in der Sitemap
- Aufgenommen von Google mit Warnungshinweis "Duplicate Content"
- Quellcodeangabe im Header <meta name="robots" content="index, follow">
- SEO-Karteireiter bezüglich robots - keine Definition

Ich benötige daher eine Lösung für die Umstellung von index auf noindex bei URL-Ausgabe einer Variablen.

volupp11
Beiträge: 93
Registriert: Di 28. Nov 2006, 00:33
Wohnort: Berlin
Kontaktdaten:

Re: Forumsmodul verursacht DuplicateContent in Google

Beitrag von volupp11 » Mi 5. Aug 2020, 14:56

Hallo Bodil,
Dein Ansatz hat mich auf die Lösung gebracht. Vielen Dank dafür.
Ich habe Datei um die Entfernung der Kommentare erweitert.

Code: Alles auswählen

<?php
defined('CON_FRAMEWORK') || die('Illegal call: Missing framework initialization - request aborted.');

function cecHtmlCodeOutput($htmlCode) {
	if (getEffectiveSetting('output', 'htmlcompress', 0) == 1) {
		preg_match_all('!(<(?:code|pre|script).*>[^<]+</(?:code|pre|script)>)!',$htmlCode,$pre);
		$htmlCode = preg_replace('!<(?:code|pre).*>[^<]+</(?:code|pre)>!', '#pre#', $htmlCode);
		$htmlCode = preg_replace('#<!–[^\[].+–>#', '', $htmlCode);
		$htmlCode = preg_replace('/[\r\n\t]+/', ' ', $htmlCode);
		$htmlCode = preg_replace('/<!--(.|\s)*?-->/' , '', $htmlCode); // Delete Comments
		$htmlCode = preg_replace('/>\s+</', '><', $htmlCode);
		$htmlCode = preg_replace('/\s+/', ' ', $htmlCode);
		if (!empty($pre[0])) {
				foreach ($pre[0] as $tag) {
						$htmlCode = preg_replace('!#pre#!', $tag, $htmlCode,1);
				}
		}
		
		if ($_GET["user_forum_action"]=='new_forum') {
			$htmlCode = preg_replace('<meta name="robots" content="index, follow">', 'meta name="robots" content="noindex, follow"', $htmlCode);
		}
	}
	return $htmlCode;
}
?>

Faar
Beiträge: 1915
Registriert: Sa 8. Sep 2007, 16:23
Wohnort: Brandenburg
Kontaktdaten:

Re: Forumsmodul verursacht DuplicateContent in Google

Beitrag von Faar » Mi 5. Aug 2020, 15:57

Ich würde schauen, ob man das in der Google Console lösen könnte, also Duplicate Content dort korrigieren.
Fliegt der Bauer übers Dach, ist der Wind weißgott nicht schwach.

volupp11
Beiträge: 93
Registriert: Di 28. Nov 2006, 00:33
Wohnort: Berlin
Kontaktdaten:

Re: Forumsmodul verursacht DuplicateContent in Google

Beitrag von volupp11 » Mi 5. Aug 2020, 17:35

Hallo Faar,
dort lässt es sich erst korrigieren, wenn im Header ein NOINDEX bei Variablenaufruf vorhanden ist. Daher auch der ganze Aufwand.

Faar
Beiträge: 1915
Registriert: Sa 8. Sep 2007, 16:23
Wohnort: Brandenburg
Kontaktdaten:

Re: Forumsmodul verursacht DuplicateContent in Google

Beitrag von Faar » Mi 5. Aug 2020, 18:16

Es gibt die Möglichkeit, den kompletten Ausgabecode der Seite nach zu bearbeiten.
Man kann schauen, ob eine Chain am Ende möglich ist oder ob man eine config-after.php in die /data rein schreibt.
Damit sucht man dann nach speziell solchen Seiten und ändert die Metaangaben.
Klingt kompliziert und ist es auch ein wenig.
Fliegt der Bauer übers Dach, ist der Wind weißgott nicht schwach.

Antworten