WDF*IDF

Mit der WDF*IDF Methodik lassen sich die Art und Anzahl von Keywords in Online-texten berechnen.  WDF*IDF steht dabei für „Witihin-document frequency * Inverse document frequency“. Mit Hilfe dieser Formel wird ermittelt, in welcher Häufigkeit bestimmte Wörter in Bezug auf einen Schlüsselbegriff auf den Top-15 Webseiten der SERPs vorkommen. Dieses Verhältnis stellt für Google einen Ranking Faktor dar und sollte daher bei einer On-Page Optimierung berücksichtigt werden. Auf diese Weise kann die mögliche Relevanz einer Webseite in Bezug auf eine Suchanfrage ermittelt und der Content dahingehend optimiert werden.

WDF

WDF ist die Abkürzung für „within document frequency“. Hierbei wird bestimmt, wie relativ häufig ein Term (also ein Wort oder eine Kombination) innerhalb eines Dokumentes vorkommt.

Während die Keyword-Dichte lediglich die prozentuale Verteilung eines einzelnen Wortes in Bezug auf die Gesamtwortzahl eines Textes berechnet, bezieht die Within-Document-Frequency auch das Verhältnis aller im Text verwendeten Wörter mit ein. Die dahinterliegende Logik auf Basis eines Logarithmus verhindert, dass bei der Ermittlung eine enorme Erhöhung eines Hauptkeywords dieses zu einem besseren Wert führt.

IDF

IDF bedeutet „inverse document frequency“ und ermittelt die Häufigkeit an Dokumenten zu einem bestimmten Term. Mit IDF wird ermittelt, wie relevant ein Text hinsichtlich eines bestimmten Keywords ist. Der IDF Wert setzt dabei die Anzahl aller bekannten Dokumente ins Verhältnis zur Zahl der Texte, welche den Term beinhalten und stellt somit eine Korrektiv-Variable (zur Stauchung der Ergebnisse) zum WDF Wert dar.

WDF*IDF

Beide Formeln miteinander multipliziert ergeben die relative Termgewichtung eines Dokuments im Verhältnis zu allen potentiell möglichen Dokumenten, die das gleiche Keyword enthalten.