Duplicate Content

Duplicate Content? Kein Problem. In diesem Beitrag erklären wir, was Duplicate Content eigentlich ist, warum er vermieden werden sollte und welche Tools dafür zur Verfügung stehen.

Was versteht man unter Duplicate Content?

Duplicate Content ist gleicher oder nahezu gleicher Inhalt auf unterschiedlichen Seiten. Dabei wird zwischen externem und internem DC unterschieden. Externer Duplicate Content liegt vor, wenn es sich um mehrere Domains handelt, interner DC, wenn die Inhalte innerhalb einer Domain dupliziert werden. Doch nicht jeder Duplicate Content entsteht aus Absicht. Deshalb unterscheidet Google zwischen böswillig und nicht böswillig dupliziertem Inhalt. Absichtlich erstellter Duplicate Content entsteht, um schnell Klicks und Traffic zu generieren, ohne die nötige Arbeit in den Text zu stecken. Oft wird einfach bei der Konkurrenz geklaut. Nicht böswillig duplizierter Inhalt kommt dagegen häufig vor, ohne dass der Betreiber der Website es überhaupt merkt. Zum Beispiel nämlich dann, wenn es verschiedene Versionen einer Website gibt (Desktopversion, mobile Version, Druckversion).

Erkennt die Suchmaschine Duplicate Content als betrügerische Maßnahme, kann das für das Ranking der jeweiligen Website ernsthafte Konsequenzen haben. Denn Google selbst kommuniziert in einem Artikel zur Vermeidung von Duplicate Content klar, dass die Suchmaschine DC nicht duldet, wenn dieser erstellt wurde, um Suchergebnisse zu manipulieren. In schlimmen Fällen von duplizierten Inhalten kann es dazu kommen, dass die betroffenen Seiten Ranking einbüßen. Der Grund: Nutzerfreundlichkeit. Wenn der gleiche Inhalt auf verschiedenen Seiten zu sehen ist und diese bei der jeweiligen Suchanfrage nacheinander aufgelistet werden, sieht der User immer nur den gleichen Content, ohne einen Mehrwert an Informationen zu erhalten.

Wie lässt sich Duplicate Content vermeiden?

Um Duplicate Content zu vermeiden, ist es wichtig, sich darüber bewusst zu werden, wo DC überall vorkommen kann. Duplizierter Content wird häufig generiert durch:

  1. automatisch erzeugte Websites
  2. identische Internetseiten, die über verschiedene URLs zugänglich sind
  3. verschiedene Versionen einer Seite wie bsp. die Druckversion
  4. sich kaum voneinander unterscheidende Unterseiten zu einem Thema oder einem Produkt, z. B. Produktdetailseiten

Unique Content generieren

Damit Duplicate Content gar nicht erst entsteht, benötigt man möglichst viel "Unique Content", der nur auf der jeweiligen Website zu finden ist. Das bedeutet nicht, dass man nicht die gleichen Informationen wie andere Seiten haben darf, sondern lediglich, dass man übernommenes Wissen als solches kennzeichnet und dieses so umschreibt, dass es in dieser Form nur auf der eigenen Website zu finden ist.

Duplizierte URLs vermeiden

Die oberste Regel, um DC zu vermeiden, lautet: Jede Landing Page ist nur durch eine unique URL (die perfekte SEO-URL) erreichbar. Bei unterschiedlichen URLs, die alle zu einer Seite führen oder auch bei mehreren Versionen einer Website sucht sich Google nämlich eine URL als kanonisch aus, welche dann die Haupt-URL ist. Diese wird von der Suchmaschine dann gecrawlt, wohingegen die anderen URLs kaum noch relevant sind. Deshalb sollte man lieber von Anfang an selbst festlegen, welche URL kanonisch sein soll.

Nützliche Maßnahmen gegen Duplicate Content

Außerdem ist es wichtig,

  1. auf Einheitlichkeit zu achten, indem man nicht auf interne Linkvariationen zurückgreift, sondern immer die gleichen Links nutzt.
  2. Top-Level-Domains für landesspezifischen Content zu gebrauchen; bsp. ".de" statt ".com" für Deutschland.
  3. möglichst keine "Platzhalter" zu veröffentlichen, also Seiten, die noch keinen richtigen Content haben.
  4. ähnliche Inhalte und sich wiederholende Textbausteine ganz zu vermeiden oder zu reduzieren: Bei vielen Seiten mit ähnlichen Inhalten empfiehlt es sich, diese entweder zu einer einzelnen Seite zusammenzuführen oder so weit auszubauen, dass die Unterschiede deutlich werden und sich der Content nicht mehr überschneidet.
  5. bei gleichem Inhalt auf verschiedenen Websites die Originalseite festzulegen und mit der 301-Weiterleitung darauf zu leiten. Hier hilft ein Blick in die Google Search Console, um die Seite festzulegen, die Google als relevanter ansieht.

Content auf Duplikate überprüfen

Auf Nummer sicher gehen und den eigenen Content überprüfen? Das geht ganz einfach mit verschiedenen Tools:

Mit der "Google Search Console" kann man schnell & unkompliziert Duplicate Content ausfindig machen. Dafür geht man einfach auf den Reiter "Index", dann auf "Abdeckungen" und wählt im Diagramm den Filter "Ausgeschlossen". Innerhalb der Tabelle kann man sich dann etwaige Duplikate anzeigen lassen, ebenso wie die dazugehörigen URLs. Ist hier eine URL aufgelistet, die eigentlich für ein bestimmtes Keyword-Set ranken soll? Dann lohnt sich die Überprüfung der als Original angenommenen Landing Page.

Dieses Bild hat ein leeres Alt-Attribut. Der Dateiname ist googlesearchSEOBLOG1-1024x464.png
Google Search Console
Dieses Bild hat ein leeres Alt-Attribut. Der Dateiname ist googlesearhseoblog3.png
Google Search Console

Eine weitere Möglichkeit zur Content-Überprüfung ist das Tool "Siteliner". Die Anwendung überprüft die gesamte Domain und gibt einen Report zu möglichem Duplicate Content aus. Die kritischen Seiten können dann einzeln angesehen und überprüft werden. Das Tool färbt kritische Textteile ein und zeigt die URLs, die denselben Inhalt tragen - sowohl auf der eigenen wie auch auf fremden Domains.

Dieses Bild hat ein leeres Alt-Attribut. Der Dateiname ist siteliner.png
Siteliner

Alternativ dazu kann man Inhalte auch manuell prüfen, indem man einzelne Phrasen und Textbausteine googelt. Optimalerweise erscheint dann nur die eigene Seite. Wenn der jeweilige Textbaustein noch auf anderen Seiten zu finden ist, sollten diese genau unter die Lupe genommen werden:

Dieses Bild hat ein leeres Alt-Attribut. Der Dateiname ist ManuellerDup.png
Manuelle Überprüfung

Darüber hinaus gibt es zur Überprüfung von Duplicate Content noch zahlreiche weitere Tools, die teilweise kostenpflichtig sind.

Schutz vor DC durch andere Websites

Duplicate Content entsteht aber nicht nur durch eigenes Verschulden. Andere Domains bedienen sich häufig an guten Inhalten, indem sie diese einfach kopieren. Manchmal ranken dann die Websites, die den Inhalt von anderen geklaut haben, sogar höher als die originalen. Um seinen Unique Content auch als solchen zu erhalten, sollte man seine Inhalte also regelmäßig überprüfen oder den Alarm mancher Tools nutzen, der einen bei gleichem oder stark ähnelndem Content benachrichtigt. Des Weiteren ist es wichtig, von Anfang an kanonische URLs zu setzen und somit die eigene Seite als Original festzulegen.

Fazit zu Duplicate Content

Was auf den ersten Blick nach viel Aufwand aussieht, ist eigentlich gar nicht so kompliziert. Wir halten fest:

Duplicate Content kann das Ranking der eigenen Seite negativ beeinflussen. Setzt man sich jedoch früh mit dem Thema DC auseinander, kann man sich vor fremden Übergriffen schützen und die eigene Seite unique halten. Wir empfehlen die regelmäßige Prüfung auf duplizierte Inhalte sowie den sinnvollen Einsatz von kanonischen URLs.

Bei weiteren Fragen zu Duplicate Content sowie zu anderen Themen aus den Bereichen Suchmaschinenoptimierung oder SEO-Content steht das seowerk-Team gerne mit einer persönlichen Beratung zur Verfügung.

  |    |  
KI-Systeme verändern die Customer Journey fundamental. IBM zeigt in einem 12-teiligen GEO-Playbook, wie Unternehmen ihre Inhalte für ChatGPT, Gemini und Co. optimieren müssen, um in KI-generierten Antworten zitiert zu werden.
Weiterlesen
  |    |  
KI-Systeme verändern die Customer Journey fundamental. IBM zeigt in einem 12-teiligen GEO-Playbook, wie Unternehmen ihre Inhalte für ChatGPT, Gemini und Co. optimieren müssen, um in KI-generierten Antworten zitiert zu werden.
Weiterlesen
  |    |  
KI-Systeme verändern die Customer Journey fundamental. IBM zeigt in einem 12-teiligen GEO-Playbook, wie Unternehmen ihre Inhalte für ChatGPT, Gemini und Co. optimieren müssen, um in KI-generierten Antworten zitiert zu werden.
Weiterlesen
  |    |  
ChatGPT hat jetzt auch Core Updates! Der Rollout von GPT-5.5 wirbelte die Quellenangaben innerhalb von 48 Stunden massiv durcheinander. Erfahren Sie, welche Websites plötzlich dominieren, wer abstürzte und warum aktives KI-Monitoring ab sofort zur Pflicht wird.
Weiterlesen
  |    |  
Der Blindflug hat ein Ende: Google führt dedizierte KI-Performance-Berichte in der Search Console ein! Erfahren Sie, wie Sie ab sofort Ihre Sichtbarkeit in AI Overviews isoliert auswerten und Ihre KI-Erfolge endlich mit echten Daten messen können.
Weiterlesen
  |    |  
KI-Suchmaschinen lesen Ihre Artikel nicht im Ganzen, sondern bedienen sich an einzelnen Text-Fragmenten. Erfahren Sie, warum der Aufbau Ihrer Inhalte plötzlich über Ihre Sichtbarkeit entscheidet und wie Sie Ihre KI-Zitierrate erfolgreich verdoppeln.
Weiterlesen
  |    |  
Wie landen Ihre Inhalte in den Antworten von ChatGPT und Gemini? Eine Auswertung von 54 Studien enthüllt die 23 entscheidenden Kriterien für KI-Zitierungen. Erfahren Sie, worauf es bei der Optimierung für die generative Suche wirklich ankommt.
Weiterlesen
  |    |  
Google indexiert künftig deutlich selektiver. Aufgrund der wachsenden Flut an automatisiertem KI-Content reicht reine technische Erreichbarkeit längst nicht mehr aus. Erfahren Sie, wie Sie mit herausragender Content-Qualität, redaktioneller Tiefe und starken E-E-A-T-Signalen Ihre Sichtbarkeit in den Suchmaschinen erfolgreich sichern.
Weiterlesen
  |    |    |  
Wie viele Nutzer bringen ChatGPT und Gemini wirklich auf Ihre Website? Google Analytics erfasst Traffic aus KI-Assistenten ab sofort in einem eigenen Kanal! Erfahren Sie, wie die neue Messung funktioniert und warum KI-Traffic klassische Besucher oft übertrifft.
Weiterlesen
  |  
In der Welt der LLMs kosten Zeichen Rechenleistung – sogenannte Token. Wer Inhalte und Code auf Token-Effizienz optimiert, spart KI-Systemen wertvolle Energie. Die Folge: KIs bevorzugen Ihre Website als Primärquelle. Erfahren Sie, warum Token-Optimierung das neue Gold im GEO und SEO ist.
Weiterlesen
  |  
Es reicht nicht, wenn die KI Sie nur erwähnt – entscheidend ist das Wie. Erfahren Sie, wie Sie das Sentiment in ChatGPT & Gemini gezielt analysieren und steuern, um das Vertrauen Ihrer Kunden im KI-Zeitalter zu sichern.
Weiterlesen
  |    |  
Werden Sie von Sprachmodellen empfohlen oder einfach ignoriert? Erfahren Sie, wie Sie Ihren quantitativen „Share of Model“ in Systemen wie ChatGPT, Perplexity und Gemini ermitteln und Sichtbarkeitslücken zur Konkurrenz schließen.
Weiterlesen
Kontakt
Leichte Sprache
crossmenu linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram