Caching

From WaveCDN Wiki
Jump to navigation Jump to search

Einleitung

Das folgende Dokument soll eine grundlegende Einführung in das Thema Caching bieten.

WaveCDN fungiert als Schnittstellen zwischen den Webusern und dem Origin. Anfragen der Webuser werden also an WaveCDN gerichtet. WaveCDN prüft, ob die angefragte Ressource bereits im weltweiten Cache vorhanden ist. Wenn das der Fall ist, kann die Anfrage enorm schnell aus dem Cache beantwortet werden. Andernfalls muss die Ressource zunächst beim Origin angefragt werden und kann erst dann ausgeliefert werden. Caching bedeutet also, dass Ressourcen im weltweiten Cache von WaveCDN zwischengespeichert werden und dadurch stark beschleunigte Auslieferungszeiten ermöglicht werden. Ziel beim Caching soll es sein, durch geschicktes Wählen einer Strategie und eines Partitionierungsmechanismus möglichst viele Inhalte zu cachen.

Im weiteren Verlauf wird davon ausgegangen, dass bereits ein CDN-Setup im Webpanel von WaveCDN erstellt wurde.

Das Caching kann durch Regeln beeinflusst werden. Die Regeln können im Webpanel definiert werden.

Voraussetzungen für Caching

Ob eine Ressource in den Cache von WaveCDN aufgenommen werden kann, hängt von folgenden Voraussetzungen ab:

  • Cookie-Header: Die Anfrage vom Webuser enthält keinen Cookie-Header oder die Regel "Remove Cookie" bzw. alternativ "Cache with Cookie" wird eingesetzt.
  • Set-Cookie-Header: Die Antwort vom Origin enthält keinen Set-Cookie-Header oder die Regel "Remove Set-Cookie" wird eingesetzt.
  • Caching-Anweisung: Es muss eine Caching-Anweisung vorliegen, entweder durch einen Header in der Antwort vom Origin ("Expires" oder "Cache-Control: max-age=") oder durch eine Regel "Set Max-Age".

Der Vollständigkeit halber sollen noch zwei weitere Voraussetzungen angesprochen werden, die in der Regel jedoch erfüllt sind: Die Anfrage des Webusers muss die Methode GET oder HEAD haben und es darf kein Authorization-Header vorhanden sein. Nur wenn alle Voraussetzungen erfüllt sind, kann eine Ressource in den Cache aufgenommen werden.

Um herauszufinden, ob eine bestimmte Seite gecached wird, kann man den Age-Header aus der Antwort von WaveCDN verwenden. Ebenfalls interessant sind die <Debug Header>. Falls eine Page nicht in den Cache aufgenommen werden kann, geben sie die entsprechenden Gründe an.

Caching-Strategien

Die Caching-Strategie dient dazu Inhalten einer Website als statisch oder dynamisch zu klassifizieren. Nur statische Inhalte können in den Cache aufgenommen werden. Die Caching-Strategie ist anhand der Struktur der gegebenen Website auszurichten.

Vollständige Domain

Die wohl simpelste Caching-Strategie ist das Cachen einer vollständigen Domain. Dabei wird vorausgesezt, dass sämtliche Inhalte der Domain statischer Natur sind. Ein Beispiel für ein CDN-Setup mit ausschließlich statischen Inhalten ist das Beschleunigen eines Media-Servers.

Folgende Regeln werden empfohlen:

   Always -> Remove Cookie
   Always -> Remove Set-Cookie
   Always -> Max-Age (Sofern der Origin keine Gültigkeitsdauer übermittelt)

Da es sich um eine Domain mit ausschließlich statischen Inhalten handelt, haben Cookies keine Bedeutung. Die ersten beiden Regeln sorgen also dafür, dass etwaig vorhadene Cookies ignoriert werden und die Voraussetzungen für das Caching erfüllt sind.

Bestimmte Verzeichnisse

Wenn die statischen und dynamischen Inhalte in verschiedenen Verzeichnissen liegen, macht es Sinn, anhand der Verzeichnisse zu cachen. Typischerweise handelt es sich um Verzeichnisse wie /images/ oder /static/. Bei den folgenden beispielhaften Regeln wird davon ausgegangen, dass das Verzeichnis /static/ gecached werden soll.

   If URL begins with "/static/ -> Remove Cookie
   If URL begins with "/static/" -> Remove Set-Cookie
   Always -> Max-Age (Sofern der Origin keine Gültigkeitsdauer übermittelt)

Durch die Regeln ist gewährleistet, das etwaig vorhandene Cookies der Domain sich nicht auf das statische Verzeichnis auswirken. Durch Entfernen der Cookies sollen die Voraussetzungen für das Caching sichergestellt werden.

Bestimmte Dateitypen

Angenommen auf einer Website liegen sowohl statische als auch dynamische Inhalte und es ist keine Trennung durch verschiedene Verzeichnisse gegeben. Dann ist es trotzdem noch möglich anhand der Dateitypen festzustellen, ob eine Seite statischer oder dynamischer Natur ist. Beispielhaft wurden Regeln für die Dateitypen jpg, gif und png realisiert:

   If URL (without Query-String) ends with ".jpg" -> Remove Cookie
   If URL (without Query-String) ends with ".jpg" -> Remove Set-Cookie
   If URL (without Query-String) ends with ".jpg" -> Max-Age (Sofern der Origin keine Gültigkeitsdauer übermittelt)
   If URL (without Query-String) ends with ".gif" -> Remove Cookie
   If URL (without Query-String) ends with ".gif" -> Remove Set-Cookie
   If URL (without Query-String) ends with ".gif" -> Max-Age (Sofern der Origin keine Gültigkeitsdauer übermittelt)
   If URL (without Query-String) ends with ".png" -> Remove Cookie
   If URL (without Query-String) ends with ".png" -> Remove Set-Cookie
   If URL (without Query-String) ends with ".png" -> Max-Age (Sofern der Origin keine Gültigkeitsdauer übermittelt)

Bestimmte Seiten

   If URL is equal to "/static-content.html" -> Remove Cookie
   If URL is equal to "/static-content.html" -> Remove Set-Cookie
   If URL is equal to "/static-content.html" -> Max-Age (Sofern der Origin keine Gültigkeitsdauer übermittelt)

Bestimmte Seitenelemente

ESI mit Screenshot.


Partitionierung des Caches

WaveCDN erlaubt es den Cache in mehrere sogenannte Partitionen aufzuteilen. Standardmäßig zieht WaveCDN folgendes für die Partitionierung heran:

  • Die URL inkl. Query-String (aus der Anfrage des Webusers)
  • Die Attribute des Vary-Headers (aus der Antwort des Origins)
  • Den Cookie-Header, sofern die Regel "Cache with Cookie" eingesetzt wird (aus der Anfrage des Webusers)