Entitäten in der Suchmaschinenoptimierung: Was sind sie und warum sind sie wichtig? (Festliche Rückblende)
Feiern Sie die Feiertage mit einigen der besten SEJ-Artikel des Jahres 2023.
Unsere festliche Flashback-Reihe läuft vom 21. Dezember bis 5. Januar und bietet tägliche Lektüren zu wichtigen Ereignissen, Grundlagen, umsetzbaren Strategien und Meinungen von Vordenkern.
Das Jahr 2023 war in der SEO-Branche ziemlich ereignisreich und unsere Mitwirkenden haben einige herausragende Artikel verfasst, um Schritt zu halten und diese Veränderungen widerzuspiegeln.
Informieren Sie sich über die besten Lektüre des Jahres 2023, damit Sie auf dem Weg ins Jahr 2024 viel zum Nachdenken haben.
Es herrscht große Verwirrung darüber, wie SEO-Profis „Entitäten“ im SEO verstehen und, was noch wichtiger ist, nutzen sollten.
Ich verstehe, woher das kommt, insbesondere angesichts der Tatsache, dass der traditionelle SEO-Ansatz auf Wörtern und Phrasen basiert.
Tatsächlich hatten die meisten Algorithmen, mit denen die erste Welle von SEO-Profis (wie ich) aufwuchs, kein Konzept einer „Entität“ in der Suche. SEO-Prinzipien – vom Verfassen von Inhalten über Ankertexte in Links bis hin zum SERP-Tracking – waren (und sind größtenteils immer noch) schlüsselwortgesteuert, und vielen Menschen fällt es immer noch schwer zu verstehen, was sich geändert hat.
Aber im letzten Jahrzehnt hat sich die gesamte Suche darauf konzentriert, die Welt als eine Folge von Wörtern und als eine Reihe miteinander verbundener Einheiten zu verstehen.
Die Zusammenarbeit mit Entitäten im SEO ist die Grundlage für eine zukunftssichere Suchstrategie.
Sie sind auch wichtig für eine Zukunft mit generativer KI und ChatGPT.
In diesem Artikel geht es darum, warum. Es bedeckt:
- Was sind Entitäten?
- Was ist der Knowledge Graph?
- Eine kurze Geschichte der gesuchten Entitäten: Freebase, Wikidata und Entitäten.
- Wie Entitäten funktionieren und wie sie für das Ranking verwendet werden.
- Beispiele für Entitäten in Google.
- So optimieren Sie für Entitäten.
- Verwendung von Schema zur Unterstützung der Definition von Entitäten.
Was sind Entitäten?
SEOs verwechseln Entitäten oft mit Schlüsselwörtern.
Eine Entität (in Suchbegriffen) ist ein Datensatz in einer Datenbank. Eine Entität hat im Allgemeinen eine bestimmte Datensatzidentität.
Bei Google könnte das sein:
„MREID=/m/23456“ oder „KGMID=/g/121y50m4.“
Es handelt sich sicherlich nicht um ein „Wort“ oder eine „Phrase“. Ich glaube, dass die Verwirrung mit Schlüsselwörtern zwei Hauptursachen hat:
- Das erste ist, dass SEO-Profis ihr Handwerk vor 2010 in Bezug auf Schlüsselwörter und Phrasen gelernt haben. Viele tun es immer noch.
- Die zweite besteht darin, dass jede Entität mit einer Bezeichnung versehen ist – bei der es sich im Allgemeinen um ein Schlüsselwort oder einen Deskriptor handelt.
Während „Eiffelturm“ für uns Menschen wie eine perfekt identifizierbare „Entität“ erscheinen mag, sieht Google ihn als „KGMID=/m/02j81“ und es ist ihm wirklich egal, ob Sie ihn „Eiffelturm“ oder „Torre“ nennen Eiffel“ oder „ایفل بورجو“ (Aserbaidschanisch für „Eiffelturm“). Es weiß, dass Sie sich wahrscheinlich auf die zugrunde liegende Entität in seinem Knowledge Graph beziehen.
Damit komme ich zum nächsten Punkt:
Was ist „Der Wissensgraph“?
Es gibt subtile, aber wichtige Unterschiede zwischen „einem Wissensgraphen“, „dem Wissensgraphen“ und „dem Wissenspanel“.
- Ein Wissensgraph ist eine halbstrukturierte Datenbank, die Entitäten enthält.
- Der Knowledge Graph ist im Allgemeinen die Bezeichnung für den Knowledge Graph von Google, obwohl es Tausende anderer gibt. Wikidata (selbst ein Wissensgraph) versucht, Identifikatoren aus verschiedenen seriösen Datenquellen miteinander zu vergleichen.
- Das Knowledge Panel ist eine spezifische Darstellung der Ergebnisse des Knowledge Graph von Google. Es handelt sich um den Bereich, der bei einer Desktop-Suche häufig rechts neben den Ergebnissen (SERPs) angezeigt wird und weitere Details zu einer Person, einem Ort, einem Ereignis oder einer anderen Entität enthält.
Eine kurze Geschichte der gesuchten Entitäten
Metaweb
Im Jahr 2005 begann Metaweb mit dem Aufbau einer Datenbank namens Freebase, die es als „offene, gemeinsame Datenbank des Weltwissens“ bezeichnete.
Ich würde es als eine halbstrukturierte Enzyklopädie beschreiben.
Es gab jeder „Entität“ (oder jedem Artikel, um die Metapher zu erweitern) eine eigene eindeutige ID-Nummer – und von dort aus versuchte das System, anstelle eines herkömmlichen Artikels in Worten, Artikel durch ihre Beziehungen mit anderen ID-Nummern im System zu verbinden.
Etwa 50 Millionen US-Dollar an Kapital, und fünf Jahre später wurde das Projekt an Google verkauft.
Es wurde nie ein kommerzielles Produkt entwickelt, aber der Grundstein für einen zehnjährigen Übergang von Google von einer schlüsselwortbasierten zu einer entitätsbasierten Suchmaschine wurde gelegt.
Wikidata
Im Jahr 2016 – etwa sechs Jahre nach dem Kauf – hat Google Freebase offiziell geschlossen, weil das Unternehmen die Ideen migriert und in einem eigenen „Wissensgraphen“ weiterentwickelt hatte, dem modernen Begriff für diese Datenbanken.
Zu diesem Zeitpunkt ist es nützlich anzumerken, dass Google öffentlich erklärte, dass es einen Großteil seiner Entitätsdaten mit Wikidata synchronisiert habe und dass Wikidata (das den in Wikipedia verwendeten Daten zugrunde liegt) in Zukunft eine Möglichkeit sei, Googles Knowledge Graph zu verbinden mit der Außenwelt.
Wie Entitäten funktionieren und wie sie für das Ranking verwendet werden
Entitäten im Kernalgorithmus
Entitäten werden in erster Linie verwendet, um Ideen eindeutig zu machen, und nicht, um Seiten mit denselben Ideen zu bewerten.
Das heißt nicht, dass der geschickte Einsatz von Entitäten nicht dazu beitragen kann, dass der Inhalt Ihrer Website besser rankt. Es kann. Aber wenn Google versucht, Ergebnisse für eine Nutzersuche bereitzustellen, zielt es in erster Linie auf eine genau Antwort.
Nicht unbedingt das Verdienstvollste.
Daher verbringt Google viel Zeit damit, Textpassagen in zugrunde liegende Entitäten umzuwandeln. Dies geschieht sowohl bei der Indizierung Ihrer Website als auch bei der Analyse einer Benutzeranfrage.
Wenn ich beispielsweise „Die Namen der Restaurants unter dem Eiffelturm“ eingebe, weiß Google, dass der Sucher nicht nach „Namen“ oder dem „Eiffelturm“ sucht.
Sie suchen nach Restaurants. Nicht irgendein Restaurant, sondern eines an einem bestimmten Ort. Die beiden relevanten Entitäten in dieser Suche sind „Restaurant“ im Kontext von „Champ de Mars, 5 Av. Anatole France, Paris“ (Die Adresse des Eiffelturms).
Dies hilft Google bei der Entscheidung, wie es seine verschiedenen Suchergebnisse zusammenfügt – Bilder, Karten, Google-Unternehmen, Anzeigen und organische Webseiten, um nur einige zu nennen.
Für den SEO-Profi ist es vor allem sehr wichtig, dass beispielsweise auf der Website des Restaurants Jules Verne über die spektakuläre Aussicht auf den Eiffelturm gesprochen wird, damit Google erkennen kann, dass die Seite für diese Suchanfrage relevant ist.
Dies könnte schwierig sein, da sich das Restaurant Jules Verne im Eiffelturm befindet.
Sprachagnostiker
Entitäten eignen sich hervorragend für Suchmaschinen, da sie sprachunabhängig sind. Darüber hinaus bedeutet diese Idee, dass eine Entität durch mehrere Medien beschrieben werden kann.
Ein Bild wäre eine naheliegende Möglichkeit, den Eiffelturm zu beschreiben, da er so ikonisch ist. Es könnte sich auch um eine Sprachdatei oder die offizielle Seite des Turms handeln.
Diese stellen alle gültige Bezeichnungen für die Entität und in einigen Fällen gültige Bezeichner in anderen Wissensgraphen dar.
Verbindungen zwischen Entitäten
Das Zusammenspiel zwischen Entities ermöglicht es einem SEO-Profi, kohärente Strategien für die Entwicklung relevanten organischen Traffics zu entwickeln.
Die „maßgeblichste“ Seite für den Eiffelturm dürfte natürlich die offizielle Seite oder Wikipedia sein. Sofern Sie nicht im wahrsten Sinne des Wortes der SEO-Profi für den Eiffelturm sind, können Sie wenig tun, um diese Tatsache in Frage zu stellen.
Das Zusammenspiel zwischen Entitäten ermöglicht es Ihnen jedoch, Inhalte zu schreiben, die ein Ranking erzielen. Wir haben bereits „Restaurants“ und „Eiffelturm“ erwähnt – aber was ist mit „Metro“ und „Eiffelturm“ oder „Rabatte“ und „Eiffelturm“?
Sobald zwei Entitäten ins Spiel kommen, sinkt die Anzahl relevanter Suchergebnisse dramatisch. Wenn Sie zu „Ermäßigte Tickets für den Eiffelturm bei Fahrten mit der U-Bahn“ gelangen, werden Sie zu einer von nur wenigen Seiten, die sich auf die Gegenüberstellung von U-Bahn-Tickets, Tickets für den Eiffelturm und Ermäßigungen konzentrieren.
Viel weniger Leute tippen diesen Satz ein, aber die Conversion-Rate wird viel höher sein.
Es könnte sich für Sie auch als monetarisierbareres Konzept erweisen! (Dieses Beispiel soll das Prinzip erläutern. Ich weiß nicht, ob es solche Rabatte gibt. Sie sollten es aber tun.)
Dieses Konzept kann skaliert werden, um außergewöhnlich starke Seiten zu erstellen, indem zunächst alle konkurrierenden Seiten für eine Suchphrase in eine Tabelle aufgeteilt werden, die die zugrunde liegenden Entitäten und ihre relative Bedeutung für die Hauptabfrage zeigt.
Dies kann dann als Inhaltsplan für einen Autor dienen, um einen neuen Inhalt zu erstellen, der maßgeblicher ist als alle anderen konkurrierenden Teile.
Auch wenn eine Suchmaschine behaupten mag, dass Entitäten kein Ranking-Faktor seien, trifft die Strategie den Kern der Philosophie: „Wenn du gute Inhalte schreibst, werden sie kommen.“
Beispiele für Entitäten in Google
Entitäten in der Bildsuche
Entitäten können auch bei der Optimierung von Bildern sehr hilfreich sein.
Google hat sehr hart daran gearbeitet, Bilder mithilfe von maschinellem Lernen zu analysieren. Normalerweise kennt Google die Hauptbilder der meisten Fotos.
So nimm [a dog on a skateboard] B. als Suchbegriff: Stellen Sie sicher, dass Ihr Inhalt das Bild vollständig unterstützt. Dies kann dazu beitragen, dass Ihr Inhalt besser sichtbar ist, genau dann, wenn der Benutzer danach sucht.
Entitäten in Google Discover
Eine der am meisten unterschätzten Traffic-Quellen für SEO-Profis ist Google Discover.
Google stellt Nutzern einen Feed mit interessanten Seiten zur Verfügung, auch wenn sie nicht aktiv nach etwas suchen.
Dies geschieht auf Android-Telefonen und auch in der Google-App auf iPhones. Während Nachrichten diesen Feed stark beeinflussen, können Nicht-Nachrichtenseiten Traffic über „Discover“ erhalten.
Wie? Nun – ich glaube, dass Entitäten eine große Rolle spielen!
Seien Sie nicht entmutigt, wenn in Ihrer Google Search Console kein Tab „Entdecken“ angezeigt wird. Wenn Sie dies jedoch tun, kann es ein willkommenes Zeichen sein, dass mindestens eine Ihrer Webseiten so weit mit Entitäten übereinstimmt, dass sich die Interessen mindestens einer Person ausreichend mit Ihrem Inhalt überschneiden, sodass die Seite in einem Feed speziell auf den Benutzer ausgerichtet ist.
Im obigen Beispiel werden die „Entdecken“-Ergebnisse zwar nicht genau zu dem Zeitpunkt angezeigt, zu dem ein Benutzer sucht, aber dennoch angezeigt werden Trotzdem eine Klickrate von 4,2 %.
Denn Google kann durch die Zuordnung von Entitäten die Interessen und Gewohnheiten vieler seiner Nutzer mit den Inhalten im Internet in Einklang bringen.
Wenn eine starke Korrelation besteht, kann Google einem Nutzer eine Seite anbieten.
So optimieren Sie für Entitäten
Einige Recherchen eines Googlers
Im Jahr 2014 erschien ein Papier, das meiner Meinung nach sehr hilfreich ist, um zu zeigen, dass Google (oder zumindest seine Forscher) daran interessiert war, die Idee der Verwendung von Schlüsselwörtern zum Verständnis von Themen von der Verwendung von Entitäten zu unterscheiden.
In diesem Artikel stellen Dunietz und Gillick fest, wie sich NLP-Systeme zu einer entitätsbasierten Verarbeitung entwickelten. Sie heben hervor, wie ein binäres „Salience“-System bei großen Datensätzen verwendet werden kann, um die Entitäten in einem Dokument (Webseite) zu definieren.
Ein „binäres Bewertungssystem“ legt nahe, dass Google entscheiden könnte, ob es sich bei einem Dokument um eine bestimmte Entität handelt oder nicht.
Spätere Hinweise deuten darauf hin, dass „Salience“ mittlerweile von Google auf einer gleitenden Skala von 0 bis 1 gemessen wird (zum Beispiel die in seiner NLP-API angegebene Bewertung).
Trotzdem finde ich dieses Papier wirklich hilfreich, um herauszufinden, wo „Entitäten“ laut der Google-Forschung auf einer Seite erscheinen sollten, um als hervorstechend zu gelten.
Ich empfehle die Lektüre des Papiers für ernsthafte Recherchen, aber sie führen auf, wie sie „Bedeutung als Studie von Artikeln der ‚New York Times‘“ einstufen.
Im Einzelnen führten sie Folgendes an:
1.-Lok
Dies war der erste Satz, in dem eine Entität zum ersten Mal erwähnt wird.
Der Vorschlag besteht darin, dass die Erwähnung der Entität zu Beginn Ihrer Webseite die Wahrscheinlichkeit erhöhen könnte, dass eine Entität als „hervorragend“ für den Artikel angesehen wird.
Anzahl der Mitarbeiter
Dies ist im Grunde die Häufigkeit, mit der das „Hauptwort“ der ersten Erwähnung der Entität vorkommt.
„Hauptwort“ wird im Artikel nicht speziell definiert, aber ich verstehe darunter das Wort verketten d in seiner einfachsten Form.
Erwähnungen
Dies bezieht sich nicht nur auf die Wörter/Bezeichnungen der Entität, sondern auch auf andere Faktoren, wie z. B. Verweise auf die Entität (er/sie/es).
Überschrift
Wobei, wenn eine Entität in einer Überschrift erscheint.
Kopf-Lex
Beschrieben als „kleingeschriebenes Hauptwort der ersten Erwähnung“.
Entitätszentralität
In dem Artikel geht es auch um die Verwendung einer PageRank-Variante – bei der Webseiten durch Freebase-Artikel ersetzt wurden!
Als Beispiel nannten sie eine Debatte im Senat, an der die FEMA, die Republikanische Partei, (Präsident) Obama und ein republikanischer Senator beteiligt waren.
Nachdem sie einen PageRank-ähnlichen iterativen Algorithmus auf diese Entitäten und ihre Nähe zueinander im Wissensgraphen angewendet hatten, konnten sie die Gewichtung der Wichtigkeit dieser Entitäten im Dokument ändern.
Zusammenfügen dieser Entitätssignale in SEO
Ohne spezifisch für Google zu sein, würde hier ein Algorithmus Werte für alle oben genannten Variablen erstellen für jede Entität dass ein NLP oder Named Entity Extraction Program (NEEP) auf einer Textseite findet (oder, was das betrifft, alle in einem Bild erkannten Entitäten).
Dann würde auf jede Variable eine Gewichtung angewendet, um eine Bewertung zu erhalten. In der besprochenen Arbeit wird dieser Wert zu 1 oder 0 (hervorragend oder nicht hervorstehend), wahrscheinlicher ist jedoch ein Wert zwischen 0 und 1.
Google wird niemals die Details dieser Gewichtungen preisgeben, aber das Papier zeigt auch, dass die Gewichtungen erst festgelegt werden, nachdem Hunderte Millionen Seiten „gelesen“ wurden.
Dies liegt in der Natur großer Sprachlernmodelle.
Aber hier sind einige Top-Tipps für SEO-Profis, die Inhalte nach zwei oder mehr Entitäten ordnen möchten. Zurück zum Beispiel „Restaurants in der Nähe des Eiffelturms“:
- Legen Sie für jede Entität einen „toten“ Begriff fest. Ich könnte „Restaurant“, „Eiffelturm“ und „Entfernung“ wählen, weil „Entfernung“ eine gültige Bedeutung und einen gültigen Artikel in Wikipedia hat. Café könnte ein passendes Synonym für Restaurant sein, ebenso wie „Restaurants“ im Plural.
- Versuchen Sie, alle drei Entitäten in der Kopfzeile und im ersten Satz zu haben. Zum Beispiel: „Restaurants in geringer Entfernung zum Eiffelturm.“
- Ziel des Textes ist es, über die Wechselbeziehung zwischen diesen Einheiten zu sprechen. Zum Beispiel: „Das Jules-Verne-Restaurant befindet sich buchstäblich darin.“ Vorausgesetzt, „es“ bezieht sich im Textkontext eindeutig auf den Eiffelturm, muss es nicht jedes Mal ausgeschrieben werden. Halten Sie die Sprache natürlich.
Reicht das für Entity SEO?
Nein wahrscheinlich nicht. (Gerne können Sie mein Buch lesen!) Allerdings unterliegen nicht alle Faktoren Ihrer Kontrolle als Autor oder Website-Betreiber.
Zwei Ideen, die jedoch tatsächlich Auswirkungen zu haben scheinen, sind die Verknüpfung von Inhalten anderer Seiten im Kontext und das Hinzufügen von Schemata, um die Definitionen zu erleichtern.
Verwenden von Schemas zur Definition von Entitäten
Für mehr Klarheit könnten Suchmaschinen gesorgt werden, indem das „Über“- und „Erwähnungs“-Schema verwendet wird, um einer Suchmaschine dabei zu helfen, Inhalte eindeutig zu machen.
Diese beiden Schematypen helfen dabei, zu beschreiben, worüber eine Seite spricht.
Indem ein SEO-Experte eine Seite „über“ ein oder zwei Entitäten erstellt und vielleicht noch ein paar weitere „erwähnt“, kann er einen langen Inhalt schnell in seine Schlüsselbereiche auf eine Weise zusammenfassen, die für die Verwendung durch Wissensdiagramme bereit ist.
Es ist jedoch zu beachten, dass Google auf die eine oder andere Weise nicht ausdrücklich angegeben hat, ob es dieses Schema in seinen Kernalgorithmen verwendet.
Ich würde wahrscheinlich dieses Schema zu meinem Artikel hinzufügen:
Die genaue Wahl des Schemas ist ebenso eine philosophische Frage wie eine SEO-Frage.
Aber stellen Sie sich das Schema, das Sie verwenden, als „Disambiguierung“ Ihrer Inhalte und nicht als „Optimierung Ihrer Inhalte“ vor, und Sie werden hoffentlich einen gezielteren Suchverkehr erzielen.
Anmerkung des Herausgebers: Dixon Jones ist der Autor von Entity SEO: Moving from Strings to Things.
Mehr Ressourcen:
- Bewertete Entitäten in den Suchergebnissen bei Google
- Patent enthüllt, wie Google Abfragen basierend auf Entitätsinformationen interpretieren kann
- Wie Suchmaschinen funktionieren
Ausgewähltes Bild: optimarc/Shutterstock