IBM Books
(C) IBM Corp. 2003

DB2 Net Search Extender Verwaltung und Programmierung


Hauptkonzepte

Ein volles Verständnis des Leistungsspektrums von DB2 Net Search Extender setzt das Verständnis der Schlüsselbegriffe, die in diesem Abschnitt fett hervorgehoben sind, sowie der verschiedenen verfügbaren Optionen voraus. Darüber hinaus ist ein grundlegendes Verständnis der Konzepte und Begriffe von DB2 Universal Database erforderlich.

DB2 Net Search Extender dient in erster Linie dem Zweck, Textdokumente zu durchsuchen, die in der Spalte einer Datenbanktabelle gespeichert sind.

Die Textdokumente müssen eindeutig identifizierbar sein. Net Search Extender verwendet zu diesem Zweck den Primärschlüssel der Tabelle.

Die Dokumente können in verschiedenen Formaten, wie zum Beispiel HTML oder XML, vorliegen.

Statt eines sequenziellen Durchsuchens der Textdokumente, das eine beträchtliche Zeit dauern würde, erstellt Net Search Extender einen Textindex, um Dokumente suchbar zu machen.

Ein Textindex besteht aus wichtigen Begriffen, die aus den Textdokumenten extrahiert wurden.

Abbildung 1. Erstellen eines Textindexes

Erstellen eines Textindexes

Die Textindexerstellung ist der Prozess der Definition und Deklaration der Merkmale des Index, wie zum Beispiel die Speicherposition des Index. Nach der Erstellung enthält der Textindex noch keine Daten. Die Indexaktualisierung ist der Prozess, durch den Daten dem Textindex hinzugefügt werden. Die erste Indexaktualisierung fügt dem Index alle Textdokumente aus der Textspalte hinzu. Sie wird als einleitende Aktualisierung bezeichnet.

Bei der Verwendung eines Textindexes für die Suche sind gewisse Aspekte der Synchronisation zwischen der Tabelle und dem Textindex zu berücksichtigen, da alle Änderungen durch Hinzufügen, Löschen oder Aktualisieren an den Textdokumenten auf den Textindex übertragen werden müssen.

Die Synchronisation in Net Search Extender basiert auf Auslösern, die automatisch Informationen über neue, geänderte und gelöschte Dokumente in einer Protokolltabelle speichern. Für jeden Textindex gibt es eine Protokolltabelle. Die Anwendung des Inhalts der Protokolltabelle auf den entsprechenden Textindex wird als Teilaktualisierung (bzw. inkrementelle Aktualisierung) bezeichnet.

Abbildung 2. Verfahren der Teilaktualisierung

Teilaktualisierungen

Sie können den Textindex mit Hilfe einer Option für die manuelle oder die automatische Ausführung aktualisieren. Die Option für die automatische Ausführung arbeitet mit einem Aktualisierungszeitplan, durch den Tage und Uhrzeiten definiert werden.

Beachten Sie, dass keine dieser Optionen den Textindex im Rahmen einer Transaktion synchronisiert, die Textdokumente aktualisiert, löscht und einfügt. Die asynchrone Textindexierung von Net Search Extender verbessert die Leistung und den gemeinsamen Zugriff. Die Aktualisierung wird in einer separaten Transaktion auf eine Kopie eines sehr kleinen Teils des Indexes angewendet. Der Index wird nur während eines sehr kurzen Zeitraums für den Lesezugriff gesperrt, wenn die Kopie an die Position des Originals gesetzt wird. Dies ist für Suchoperationen nicht sichtbar. Weitere Informationen finden Sie in Kapitel 5, Net Search Extender-Exemplarservices.

Ein Textindex besitzt bestimmte Merkmale, wie zum Beispiel die Speicherposition der Indexdatei und die automatischen Aktualisierungsmerkmale. Bei Bedarf können Sie einige dieser Merkmale ändern. Dieser Vorgang wird als Änderung des Indexes bezeichnet.

Ein solches Merkmal legt z. B. fest, ob der Textindex mit ORDER BY für die Tabellenspalten vorsortiert werden soll. In einem solchen Fall indexiert die einleitende Aktualisierung das Textdokument in der angegebenen Reihenfolge und die Suchergebnisse werden in dieser Reihenfolge zurückgegeben.

Zum Beispiel können nach den Buchpreisen vorsortierte Kurzinformationen über Bücher angegeben werden. Wenn Sie nach den preisgünstigsten Büchern über relationale Datenbanksysteme suchen, können Sie Ihre Textsuche so einschränken, dass nur die ersten paar Bücher zurückgegeben werden, da diese in diesem Fall die günstigsten sind. Ohne vorsortierte Indizes müssten Sie nach allen Büchern suchen und diese mit einer Liste der günstigsten Bücher verknüpfen, was eine aufwändigere Operation wäre.

Net Search Extender ermöglicht mehrere vorsortierte Indizes pro Textspalte. Zum Beispiel kann ein Index Bücher nach dem Erscheinungsdatum und ein zweiter Index Bücher nach dem Preis vorsortieren.

In der Regel ist die erste Aktualisierung nach der Erstellung des Textindexes eine einleitende Aktualisierung, während es sich bei den nachfolgenden Aktualisierungen um Teilaktualisierungen handelt. Wenn Sie jedoch mit vorsortierten Indizes arbeiten, ist es sinnvoll, die Indexreihenfolge auch bei Aktualisierungen beizubehalten. Dies wird durch die Option RECREATE INDEX ON UPDATE ermöglicht, die bei jeder Durchführung einer Aktualisierung für eine komplette Neuerstellung des Indexes sorgt.

Nachdem der Textindex aktualisiert wurde, können Sie Ihre Textsuchen mit einer der folgenden Optionen durchführen:

Da die Suchoptionen verschiedene Ausführungsmerkmale haben, werden sie in den folgenden Abschnitten erläutert.


[ Seitenanfang | Vorherige Seite | Nächste Seite | Inhaltsverzeichnis | Index ]