Google berechnet Duplicate Content auf Basis der in Inhalten angewendeten Wörtern. Besser gesagt ermittelt Google aus den Inhalten jeweilige eine Checksumme genauer gesagt einen Hashwert. Diese werden dann miteinander abgeglichen. Das erläuterte in diesen Tagen Gary Illyes von Google.
Das symbolisiert aber auch, dass zwei Seiten mit derselben Message, aber individuellen Wörtern kein Duplicate Content in der Auswertung von Google sind. Das ist sagen wir mal mit Blick auf Übersetzungen relevant. In den Google Office Hours vom 30. Oktober sagte John Müller, Suchmaschinen seien ab und an relativ leicht. Sie inspizieren die Worte einer Webseite und sagen dann: „Oh, das sind andere Wörter, also sind die Seiten offensichtlich unterschiedlich.“ Sie schauen nicht auf eine Webseite und erkennen dann: „Diese Seite sagt das Gleiche aus, nur auf diese abstrakte Art, also ist es Duplicate Content.“ Die Beurteilung sehen so aus: „Wenn die Worte anders sind, dann sind auch die Inhalte anders.“
Vergleicht Google also zwei Inhalte mit dem identischen Inhalt, von denen einer auf Italienisch und einer auf Englisch geschrieben ist, dann betrachtet Google diese als verschiedene Seiten.
Bemerkenswert ist dies zum Beispiel auch für Nachrichten-Webseiten, deren Berichte auf Agenturmeldungen aufbauen. Wird der Content im Original angeboten. Findet allerdings eine Umformulierung statt, oder wird ein Artikel auf Basis einer Agenturmeldung neu verfasst, ohne weitere Informationen zu liefern, so wird jener Content von Google absolut nicht als Duplicate Content bewertet.