Zum Inhalt springen
Contentman > Der besondere Content: Information Gain

Der besondere Content: Information Gain

4.7
(6)

Manchmal findet sich ein schicker Begriff für eine traditionelle, gut geübte Herangehensweise. Und manchmal hilft das sogar. Siehe da: Information Gain ist so ein neuer, trendiger Schlauch für guten, alten Wein.

Information Gain: überraschende Elemente als Faktor (Foto: Eric)
Information Gain: überraschende Elemente als Faktor (Foto: Eric)

Was ist der Information Gain?

Information Gain ist ein Konzept aus der Informationstheorie und wird im Bereich des maschinellen Lernens verwendet. Es steht für den Informationszuwachs, der durch die Kenntnis eines zusätzlichen Merkmals entsteht. WHAT? Praktisch bedeutet das, dass man berechnet, wie viel genauer etwa Entscheidungen getroffen werden können, wenn ein neues Merkmal in Betracht gezogen wird.

Wenn wir die dazu notwendigen Berechnungsmodelle mal beiseitelassen, kann ich das in einfachen Worten so sagen: Wie viel nützlicher wird ein Text, wenn du einen bestimmten Aspekt hinzufügst? Stell dir vor, du schreibst über Barfußschuhe und hast dazu die üblichen Informationen aus Wikipedia und andere Top-Ergebnisse gesampelt. Wie viel „Nutzen“ (Information Gain) bringt es, wenn du die Erfahrungen eines Orthopäden oder Tipps für die Verwendung von Barfußschuhen im Winter hinzufügst?

Das ist der Inhalt eines Patents, das Google für den „Information Gain Score“ eingereicht hat.

Um das etwas komplizierter zu machen, spielt dabei die sogenannte Entropie eine Rolle – auch solch ein Begriff aus der Informationstheorie. Die Entropie misst die Unvorhersehbarkeit in einem System: Wenn du eine Münze wirfst, ist die Wahrscheinlichkeit für Kopf und Zahl jeweils 50 Prozent. Deshalb ist hier die Entropie maximal – es gibt eine maximale Unsicherheit.

Beispiele für verschiedene Information Gains

Und wie hängt das mit dem Information Gain zusammen? Also: Hast du einen Topf mit nur weißen Kugeln, ist hier die Entropie extrem gering. Denn selbst, wenn du blind eine Kugel herausnimmst, wird diese sehr sicher weiß sein – die Unvorhersehbarkeit ist maximal gering. Hast du 1⁄3 weiße und 2⁄3 schwarze Kugeln im Topf, ist die Entropie mittelgroß. Denn es kann sein, dass du eine schwarze oder eine weiße Kugel ziehst, das ist nicht vorhersehbar. Es ist immerhin etwas wahrscheinlicher, dass du eine schwarze Kugel ziehst.

Und nun kommt der Information Gain ins Spiel: Dieser ist ein Maß dafür, wie sehr eine Information die Unsicherheit reduziert. Auf das Beispiel mit dem Topf (1⁄3 weiße Kugeln, 2⁄3 schwarze Kugeln) bezogen heißt das: Wenn du eine Kugel ziehst und sie anschaust, wird die schwarz oder weiß sein – was wieder ein maximaler Information Gain ist, weil die Frage damit beantwortet ist. Wenn du dagegen nur erfährst, dass die Kugel rund und nicht grün oder 100 Gramm wiegt, ist das ein minimaler Information Gain. Denn das hilft dir bei der Frage nach ihrer Farbe nicht weiter.

Um zu verstehen, was ein mittlerer Information Gain sein können, müssen wir das System komplexer machen. Stell dir deshalb einen Topf vor, in dem verschiedenfarbige Kugeln sind: 50 Prozent sind rot, 30 Prozent sind blau und 20 Prozent sind grün. Wenn du nun eine Kugel ziehst und erfährst, dass sie nicht rot ist, dann ist das ein mittlerer Information Gain. Denn das reduziert die Unsicherheit, aber es gibt immer noch die Chance auf blau und grün. Falls du erfährst, dass die Kugel nicht grün ist, gilt dasselbe. Allerdings reduziert sich die Unsicherheit geringer. Denn nur 20 Prozent sind grün, aber 50 Prozent sind rot. Für die Information „ist nicht rot“ ist der Information Gain also höher als für „ist nicht grün“. Check?

Übersetzt auf die Nützlichkeit von Texten (also auch für SEO) heißt das:

  1. Es ist niemals besonders hilfreich, wenn du deinen Leser:innen nur das bietest, was sie ohnehin auch auf anderen Seiten lesen können. Du musst etwas liefern, das die Unsicherheit ihrer Entscheidung reduziert.
  2. Es kann auch hilfreich sein, zu sagen, was nicht der Fall ist. Damit meine ich z. B. eine Hilfestellung, für welche Zielgruppe etwas sinnvoll ist und für wen nicht.
  3. Je komplexer das System ist, umso vielfältiger können diese Informationen sein. Und umso wichtiger wird sein, auch die anderen Webseiten zu kennen.

Was ist daran neu – und was nicht?

Neu ist am Information Gain gar nichts. Denn das ist kein Begriff, den die Suchmaschine im vergangenen Jahr erfunden hat. Und ich bin mir sicher, dass Google schon seit Jahren, vielleicht seit Jahrzehnten, damit arbeitet. Nun ist zwar ein Patent mit dem Namen „Information Gain Score“ (hier) aufgetaucht, deshalb wird das diskutiert. Doch das heißt nicht, dass Google nicht bereits damit arbeitet. Denn der Information Gain beantwortet die wichtigste aller Fragen: Ob ein Suchergebnis den Nutzer:innen etwas bringt – oder nicht.

Neu ist allerdings, dass dieser Begriff endlich im SEO angekommen ist. Und neu ist auch, dass dieser Begriff die vielen Online-Marketern bekannte Technik der Nebenkeywords oder des WDF*IDF bzw. TF*IDF (google bitte selbst danach) sinnvoll ergänzt.

Das will ich kurz erklären: Die übliche Technik von SEO-Tools ist, die Texte der Top-Suchergebnisse nach Wörtern zu analysieren, die wir verwenden sollten. Dafür gibt es unterschiedliche Algorithmen, die unterschiedlich begründet werden. Die Idee dahinter: Wenn du das in deinen Text schreibst, was in den Top-Ergebnissen steht, dann wirst du auch dort ranken.

Diese Idee ist – sobald wir den Information Gain einbeziehen – natürlich falsch, oder zumindest unvollständig. Denn wenn du in der Entropie der vorhandenen Suchergebnisse mitschwimmst, hat Google eigentlich kein Interesse an dir. Spannend wird es für die Suchmaschine erst, wenn du zusätzlich (!) noch einen Information Gain mitbringst.

Trotzdem: Die Ähnlichkeit zu den Top-Suchergebnissen würde ich nicht ganz außen vor lassen. Denn damit gibst du der Suchmaschine ein gutes Gefühl, dass du ein guter Kandidat für ein Top-Ranking bist. Aber nur durch einen Information Gain bist du auch attraktiv.

Ist das nachvollziehbar?

Wie lässt sich der Information Gain im Content verbessern?

Noch einmal: Eine gewisse Ähnlichkeit zu den schon vorhandenen Top-Suchergebnissen ist hilfreich, ein gutes Ranking bekommst du aber via Information Gain. Also: Wie diesen herstellen?

Du benötigst also zwei Ebenen:

  1. Eine Bestätigung der Themenzugehörigkeit. Und das kann je nach Entropie unterschiedlich umfangreich sein. Hierfür kannst du dich an den vorhandenen SEO-Tools orientieren. Wobei ich empfehle, nicht allen Empfehlungen darin zu folgen. Das ist nämlich gar nicht nötig.
  2. Zusätzliche Informationen, die den Informationsgewinn sicherstellen. Das können sein:
    • besondere Erfahrungen oder Studieninformationen die du einbringst
    • spezielle Empfehlungen für Zielgruppen
    • persönliche Einschätzungen oder Praxiserfahrungen
    • ein Ausblick in die Zukunft
    • relevantes zusätzliches „Party-Wissen“
    • und so weiter (DU bist der/die Expert:in)

Wir hatten mal die Regel, in jeden Text mindestens eine Information zu schreiben, die die Leser:innen bis jetzt nicht kannten. Das ist sehr einfach formuliert und trifft den Information Gain auf den Kopf. Und dieser Regel ist aus dem Jahr 2008.

Ist der Information Gain eine sichere Sache?

Nein, natürlich ist ein guter Information Gain keine sichere Sache. Es gibt viele Gründe, warum du trotzdem nicht gut ranken könntest: Weil deine Technik Mist ist. Weil deine Seite nicht als Autorität für das Thema wahrgenommen wird. Weil die Konkurrenz viel stärker ist. Weil du nur glaubst, sinnvolle Informationen hinzugefügt zu haben – und Google das anders sieht.

Doch der Information Gain ist ein ausgezeichneter zusätzlicher Punkt auf deiner Checkliste, die du dir für die Erstellung von hilfreichem Content ohnehin schon gemacht hast. Ergänze diese Liste mit: „Enthält der Text Informationen, die die Leser:innen bislang nicht kannten.“

Und nun?

Jetzt wirfst du einen Blick auf deine stärksten und wichtigsten Webseiten und schaust, ob da etwas vorhanden ist, was nicht auf vielen anderen Webseiten auch steht. Das ist vielleicht das beste Training für die zukünftige Entwicklung eines Information Gain. Und du wirst diese Seiten mit wenig Aufwand schnell voran bringen.

Wie hilfreich war dieser Beitrag?

Klicke auf die Sterne um zu bewerten!

Durchschnittliche Bewertung 4.7 / 5. Anzahl Bewertungen: 6

Bisher keine Bewertungen! Sei der Erste, der diesen Beitrag bewertet.

Es tut uns leid, dass der Beitrag für dich nicht hilfreich war!

Lasse uns diesen Beitrag verbessern!

Wie können wir diesen Beitrag verbessern?

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Cookie Consent mit Real Cookie Banner