Die meisten Proxy-Server, die Caching unterstützen, speichern eine Datei nur dann im Cache, wenn ein Benutzer sie anfordert. Caching Proxy verfügt über einen Cache-Agenten, der ein automatisches Vorabladen in den Cache durchführt. Sie können festlegen, dass der Cache-Agent bestimmte URLs automatisch abruft und/oder dass er die am häufigsten angeforderten URLs abruft und diese im Cache speichert, bevor sie angefordert werden.
In einigen Fällen müssen der Hostname des Proxy-Servers und das Cache-Zugriffsprotokoll angegeben werden, damit der Cache vorab geladen werden kann. Wählen Sie zum Konfigurieren des Cache-Agenten in den Konfigurations- und Verwaltungsformularen Cache-Konfiguration aus und rufen Sie dann die Formulare Vorabladen des Cache und Cache-Aktualisierung auf. Dateien, die Abfrageergebnisse enthalten (d. h. deren URLs das Fragezeichen (?) enthalten), werden nur dann zwischengespeichert, wenn das Caching von Abfragen aktiviert ist.
Die automatische Cache-Aktualisierung und das automatische Vorabladen des Cache bieten folgende Vorteile:
Die Nachteile sind:
Aus Gründen der Effizienz sollte der Agent zur Cache-Aktualisierung so konfiguriert werden, dass er ausgeführt wird, wenn der Server freie Kapazitäten aufweist und bevor der Server durch Clientanforderungen in Anspruch genommen wird. In diesem Fall stehen die Dateien im Cache bereit und können schnell abgerufen werden, wenn der Benutzer diese zum ersten Mal anfordert. Standardmäßig wird der Cache-Agent jede Nacht um 3 Uhr Ortszeit gestartet.
Spezielle Hinweise für Reverse-Proxy-Konfigurationen:
Aus Sicherheitsgründen sollte die Regel Proxy http:* standardmäßig inaktiviert werden, wenn eine Reverse-Proxy-Konfiguration verwendet wird (d. h. diese Regel ist in der Datei ibmproxy.conf auf Kommentar gesetzt). Wenn diese Regel inaktiviert ist, kann der Cache-Agent jedoch keine Anforderungen senden und den Cache-Inhalt von Caching Proxy aktualisieren. Im Fehlerprotokoll erscheint der Fehler "403 Forbidden By Rule Error", und die Cache-Aktualisierung wird nicht durchgeführt.
Sie können dieses Problem vermeiden, indem Sie den Service cacheAgentService verwenden, einen internen Service, der von Caching Proxy bereitgestellt wird. Zum Aktivieren des Service fügen Sie die folgende Service-Anweisung vor den anderen Zuordnungsregeln in der Datei ibmproxy.conf ein:
Service /gültige_Zeichenfolge* INTERNAL:cacheAgentService
Die Variable gültige_Zeichenfolge steht für eine beliebige Zeichenfolge, die gültig ist und mit keiner der anderen Zuordnungsregeln in der Datei ibmproxy.conf in Konflikt steht.
Caching Proxy und der Cacheagent analysieren die Syntax des URI basierend auf dieser Service-Anweisung. Anstatt den URI direkt an Caching Proxy zu senden, stellt der Cache-Agent dem URI das Muster /gültige_Zeichenfolge aus der Service-Anweisung voran.
Beispiel: Der Cacheagent setzt den URI
http://www.ibm.com/
in die folgende Angabe um:
/gültige_Zeichenfolge/http://www.ibm.com/
Der Cache-Agent sendet den URI mit dem Präfix an Caching Proxy. Beim Empfang der Anforderung entfernt Caching Proxy das Präfix /gültige_Zeichenfolge/. Wenn der verbleibende URI eine vollständig qualifizierte Einheit ist, bearbeitet Caching Proxy die Anforderung direkt, ohne den URI mit anderen Regeln abzugleichen.
Außerdem kann der Cache-Agent einen relativen URI an Caching Proxy senden. Wenn Sie beispielsweise LoadURL /abc/ mit der zuvor beschriebenen Service-Anweisung in der Datei ibmproxy.conf hinzufügen, setzt der Cache-Agent diesen URI in /gültige_Zeichenfolge/abc/ um und sendet ihn an Caching Proxy. Caching Proxy empfängt den URL, entfernt das Präfix, gleicht /abc/ mit anderen Zuordnungsregeln ab und bearbeite die Anforderung, sofern eine Übereinstimmung vorliegt.
Weitere Informationen zur Anweisung Service finden Sie im Abschnitt Service - Schritt "Service" anpassen.
Legen Sie auf Linux- und UNIX-Plattformen den Hostnamen des Proxy-Servers fest, dessen Cache vorab geladen oder aktualisiert werden soll. Legen Sie auf Windows-Plattformen den Hostnamen nur dann fest, wenn der zu aktualisierende Proxy-Server nicht auf der lokalen Maschine ausgeführt wird. (Beachten Sie, dass das Aktualisieren des Cache eines fernen Servers basierend auf den Dateien, auf die am häufigsten zugegriffen wird, nicht möglich ist, da der lokale Cache-Agent keinen Zugriff auf das Cache-Zugriffsprotokoll eines fernen Servers hat.)
Zum Festlegen des Hostnamens für den Proxy-Server wählen Sie in den Konfigurations- und Verwaltungsformularen Cache-Konfiguration –> Cache-Aktualisierung: Cache-Zielserver angeben aus.
Um den Inhalt bestimmter URLs vorab in den Cache zu laden, wählen Sie in den Konfigurations- und Verwaltungsformularen Cache-Konfiguration –> Vorabladen des Cache aus. In diesem Formular können Sie die URLs angeben, die der Cache-Agent laden soll. Der Proxy-Server ruft diese Seiten ab, wenn der Cache-Agent gestartet wird, unabhängig davon, ob diese bereits im Cache enthalten waren. (Diese URLs werden in der Konfigurationsdatei des Proxy-Servers mit der Anweisung LoadURL angegeben.) Dieses Formular kann auch verwendet werden, um URLs zu definieren, deren Inhalt nicht im Cache gespeichert werden soll. Für diese Art des Vorabladens in den Cache ist kein Zugriff auf ein Cache-Zugriffsprotokoll erforderlich.
Mit dem Formular Vorabladen des Cache können folgende Optionen konfiguriert werden:
Damit die am häufigsten aufgerufenen Seiten automatisch vorab geladen werden, verwenden Sie das Formular Cache-Konfiguration –> Cache-Aktualisierung. Diese Funktion setzt voraus, dass der Proxy-Server über ein Cache-Zugriffsprotokoll verfügt. (Position und Name des Protokolls können geändert werden. Nähere Informationen finden Sie in Caching Proxy überwachen.) Die am häufigsten aufgerufenen URLs werden automatisch anhand des Cache-Zugriffsprotokolls ermittelt. Der Administrator kann darüber hinaus eine Anzahl von häufig verwendeten Seiten festlegen, die in den Cache geladen werden sollen. (Diese Anzahl wird in der Konfigurationsdatei des Proxy-Servers mit der Anweisung LoadTopCached festgelegt.)
Mit dem Formular Cache-Aktualisierung können Sie folgende Optionen konfigurieren:
Delving ist eine optionale Teilfunktion der Funktion für automatische Cache-Aktualisierung. Die meisten Webseiten enthalten Links zu anderen Seiten mit zugehörigen Informationen. Benutzer folgen oft den Link-Pfaden von einer Seite zu einer anderen und von einer Site zu einer anderen. Mit Delving können diese logischen Informationspfade im Cache gespeichert werden. Beim Delving folgt der Cache-Agent einer festgelegten Anzahl von HTML-Links auf den Seiten, die er lädt, und lädt auch alle diese über Links verknüpften Seiten in den Cache. Die über Links verknüpften Seiten können sich auf demselben Host wie die Ursprungsseite oder auf anderen Hosts befinden. Abb. 1 zeigt eine grafische Darstellung dieser Links.
Zum Steuern des Delving-Prozesses legt der Administrator für den Cache-Agenten eine maximale Anzahl URLs fest, die dieser laden kann (die Standardeinstellung ist 2000), sowie eine maximale Zeitdauer für die Ausführung (die Standardeinstellung ist zwei Stunden) und eine maximale Anzahl Threads, die verwendet werden kann (die Standardeinstellung ist vier). Darüber hinaus kann der Administrator weitere Steuerelemente konfigurieren. Standardmäßig ist Delving für zwei Hierarchieebenen aktiviert, aber nicht hostübergreifend möglich. Zusätzlich dazu wird zwischen den einzelnen Anforderungen eine Verzögerung eingefügt. Informationen zum Ändern dieser Einstellungen enthält der Abschnitt Zugehörige Anweisungen in der Konfigurationsdatei des Proxy-Servers.
Der Cache-Agent lädt und aktualisiert den Cache anschließend in dieser Reihenfolge:
Beachten Sie, dass der Cacheagent erst beim Starten des Link-übergreifenden Delving prüft, ob die maximale Anzahl Seiten erreicht wurde. Wenn der Wert für die maximale Anzahl Seiten (in der Konfigurationsdatei des Proxy-Servers mit MaxURLs festgelegt) kleiner ist als die Anzahl Seiten, die in den Schritten 1 und 2 bereits abgerufen wurden, werden keine weiteren über Links verknüpften Seiten abgerufen.
Die folgenden Beispiele veranschaulichen, wie der Cache-Agent die Prioritäten für die Cache-Aktualisierung und die Delving-Funktion abhängig von der festgelegten maximalen Anzahl URLs behandelt. (Dabei wird angenommen, dass die Delving-Funktion für alle diese Beispiele konfiguriert ist.)
Einstellung in der Konfigurationsdatei | Ergebnis |
---|---|
|
Wenn das Cache-Zugriffsprotokoll mehr als 30 eindeutige URLs enthält, ruft der Cache-Agent die Seiten main.html, welcome.htm und die 30 URLs ab, die gemäß dem Cache-Zugriffsprotokoll am häufigsten angefordert wurden. Da der Wert für MaxURLs nicht erreicht wurde, ruft der Cache-Agent ausgehend von den Seiten, die bereits im Cache gespeichert wurden, bis zu 18 über Links verknüpfte URLs ab und lädt sie. |
|
Wenn das Cache-Zugriffsprotokoll mehr als 30 eindeutige URLs enthält, ruft der Cache-Agent die Seiten favorites.html und dislikes.html sowie die 30 URLs ab, die gemäß dem Cache-Zugriffsprotokoll am häufigsten angefordert wurden. Es werden keine anderen Dateien abgerufen, da der Wert von MaxURLs erreicht wurde. |
|
Wenn das Cache-Zugriffsprotokoll mehr als 20 eindeutige URLs enthält, ruft der Cache-Agent die Seiten hi.htm und index.html, die 20 URLs, die gemäß dem Cache-Zugriffsprotokoll am häufigsten angefordert wurden, und 3 über Links verknüpfte URLs von bereits abgerufenen Seiten ab. Es werden keine anderen Dateien abgerufen, da der Wert von MaxURLs erreicht wurde. |
Der Cacheagent kann auch durch direktes Editieren der entsprechenden Anweisungen in der Konfigurationsdatei des Proxy-Servers konfiguriert werden. Informationen zu den Anweisungen in der Konfigurationsdatei des Proxy-Servers, die sich auf den Cache-Agenten beziehen, finden Sie auf den folgenden Referenzseiten in Anhang B. Anweisungen in der Konfigurationsdatei:
Wenn die automatische Cacheaktualisierung aktiviert ist, führt der Cacheagent zur angegebenen Zeit automatisch eine Cacheaktualisierung durch. Sie können den Cache-Agenten jedoch auch zu einem beliebigen Zeitpunkt von einer Befehlszeile aus starten.
Verwenden Sie hierfür die folgende ausführbare Datei:
Dabei steht Serverstammverzeichnis für das Laufwerk und das Verzeichnis, in dem Caching Proxy installiert wurde (z. B. C:\Programme\IBM\edge\cachingproxy\cp).
Auf Linux- und UNIX-Plattformen können Sie den Cache-Agenten über den Dämon cron automatisch zu verschiedenen Zeitpunkten ausführen. Über cron gesteuerte Jobs werden durch Hinzufügen einer Zeile zur Systemdatei crontab angegeben. Beispiel für einen Eintrag in der Befehlsdatei unter Linux und UNIX:
45 16 * * * /usr/sbin/cacheagt
Mit diesem Befehl wird der Cache-Agent jeden Tag um 16:45 Ortszeit gestartet. Wenn der Cache-Agent mehrmals täglich ausgeführt werden soll, können Sie mehrere Einträge verwenden. Nähere Informationen hierzu finden Sie in der Dokumentation zum Betriebssystem zum Thema Dämon cron.
Wenn Sie den Dämon cron verwenden, um den Cache-Agenten auszuführen, achten Sie darauf, dass Sie die Option für automatische Aktualisierung entweder über das Konfigurationsformular Cache-Konfiguration –> Cache-Aktualisierung oder durch Editieren der Konfigurationsdatei des Proxy-Servers inaktivieren. Andernfalls wird der Cache-Agent mehr als einmal täglich ausgeführt.