IBM Books
(C) IBM Corp. 2003

DB2 Net Search Extender Verwaltung und Programmierung

Erstellen eines Textindexes

Wenn Sie den Befehl Erstellen auswählen, wird der Assistent zum Erstellen eines Textindexes angezeigt. Mit Hilfe dieses Assistenten können Sie die Konfigurationsoptionen für den Textindex in einer Reihe von Anzeigen angeben. Um zur jeweils nächsten Anzeige zu gelangen, geben Sie alle verbindlichen Informationen ein und klicken den Knopf Weiter an, bis der Knopf Fertig stellen aktiviert wird. Klicken Sie auf den Knopf Fertig stellen, um den Textindex zu erstellen.

Um einen Textindex für Sichten zu erstellen, verwenden Sie den im Abschnitt CREATE INDEX beschriebenen Befehl CREATE INDEX.

Anzeige 'Name'

In dieser Anzeige können Sie das Schema und den Namen für den Textindex angeben. Außerdem können Sie ein Arbeits- und Indexverzeichnis für die Textindexdateien angeben. Die Verwaltungstabellen für den Index werden im Verwaltungstabellenbereich erstellt.

Abbildung 10. Assistent: Textindex erstellen - Anzeige 'Name'

Assistent: Textindex erstellen - Anzeige 'Name'

Die Felder der Anzeige werden im Folgenden beschrieben:

Tabelle 1. Textfelder der Anzeige 'Name'

Name des Feldes Verbindlich/ Optional Standard- wert Beschreibung
Indexschema Verbindlich Benutzer-ID Wählen Sie einen Schemanamen für den Textindex. Dies ist der DB2-Schemaname für die indexspezifischen Verwaltungstabellen.
Indexname Verbindlich n/v Geben Sie einen gültigen DB2-Indexnamen für den Textindex ein. Zusammen mit dem Schemanamen dient dieser Name zur eindeutigen Identifikation eines Volltextindexes in einer Datenbank.
Indexverzeichnis Optional Siehe Pfadname. Geben Sie den Verzeichnispfad an, in dem der Textindex gespeichert werden soll. Das Verzeichnis muss vorhanden sein, und der Benutzer-ID des DB2-Exemplareigners müssen die Berechtigungen zum Schreiben, Lesen und Ausführen erteilt sein.
Arbeitsverzeichnis Optional Siehe Pfadname. Geben Sie das Arbeitsverzeichnis für temporäre Dateien an, die während der Such- und Verwaltungsoperationen gespeichert werden müssen. Das Verzeichnis muss vorhanden sein, und der Benutzer-ID des DB2-Exemplareigners müssen die Berechtigungen zum Schreiben, Lesen und Ausführen erteilt sein.
Verwaltungstabellenbereich Optional Standardtabellenbereich verwenden Wählen Sie einen Tabellenbereichsnamen für die Textindexverwaltungstabellen aus. Der Tabellenbereich muss in der gleichen Knotengruppe wie der Tabellenbereich für die Benutzertabelle definiert sein.

Anzeige 'Ziel'

Mit Hilfe dieser Anzeige können Sie das Schema und den Namen der Tabelle oder Kurznamentabelle sowie den Namen der Textspalte mit den zu indexierenden Daten angeben. Sie können eine Umsetzungsfunktion verwenden, um den Inhalt der Textspalte zu modifizieren. Zusätzlich zu der Textspalte können Sie auch numerische Attribute angeben, wenn Sie den Inhalt eines Tabellenspaltenausdrucks indexieren möchten.

Abbildung 11. Assistent: Textindex erstellen - Anzeige 'Ziel'

Assistent: Textindex erstellen - Anzeige 'Ziel'

Die Felder der Anzeige werden im Folgenden beschrieben:

Tabelle 2. Textfelder der Anzeige 'Ziel'

Name des Feldes Verbindlich/ Optional Standard- wert Beschreibung
Tabellenschema (1) Verbindlich Benutzer-ID Wählen Sie das Schema der Tabelle oder den Kurznamen der Tabelle aus, für die Sie den Textindex erstellen.
Tabellenname (2) Verbindlich n/v Wählen Sie den Namen der Tabelle oder den Kurznamen der Tabelle aus, für die Sie den Index erstellen. Die Tabelle muss einen Primärschlüssel besitzen.
Textspalte (3) Verbindlich n/v Wählen Sie den Namen der Spalte aus, die zur Erstellung des Textindexes verwendet werden soll. Die Spalte muss in einen der folgenden Typen umgesetzt bzw. einen solchen Typ besitzen: CHAR (for bit data), VARCHAR (for bit data), LONG VARCHAR (for bit data), CLOB, DBCLOB, BLOB, GRAPHIC, VARGRAPHIC, LONG VARGRAPHIC oder DATALINK.
Umsetzungsfunktion Optional Inaktiviert Wählen Sie die Option aus, um eine Umsetzungsfunktion zu verwenden.
Umsetzungsfunktion: Schema Verbindlich (wenn Funktion ausgewählt) Benutzer-ID Wählen Sie das Schema der benutzerdefinierten Funktion (UDF) aus, die für den Zugriff auf die Textdokumente verwendet wird.
Umsetzungsfunktion: Name Wie oben n/v Wählen Sie den Namen einer benutzerdefinierten Funktion (UDF) aus, die für den Zugriff auf die Textdokumente verwendet wird.

Beachten Sie, dass die Felder Tabellenschema (1), Tabellenname (2) und Textspalte (3) nur in dieser Reihenfolge angegeben werden können.

Abbildung 12. Dialog 'Numerische Attribute'

Dialog 'Numerische Attribute'

Klicken Sie den Knopf Zusätzliche numerische Attribute an, um Attribute anzuzeigen oder hinzuzufügen. Ein Fenster wird angezeigt. Klicken Sie den Knopf Hinzufügen an, wenn Sie dem Index numerische Attribute hinzufügen wollen. Ein weiteres Fenster wird angezeigt. Geben Sie den SQL-Spaltenausdruck und den Namen für das Attribut an.

Alternativ können Sie auch ein Attribut auswählen und die entsprechenden Knöpfe anklicken, um einen Eintrag zu ändern, zu versetzen oder zu entfernen.

Erläuterung zu numerischen Attributen

Verwenden Sie numerische Attribute, um neben der Textspalte Spaltenausdrücke zu indexieren. Wenn Sie zum Bespiel die Spalte date des Typs TIMESTAMP neben der Textspalte indexieren wollen, geben Sie ein numerisches Attribut "cast(julian_day(date) as double)" und einen Namen für das Attribut an.

Geben Sie ein numerisches Attribut an, wenn Sie einen numerischen Ausdruck in einer Suchabfrage verwenden wollen. Wenn Sie mit Hilfe von SQL-Abfragen suchen, können Sie eine kombinierte Suche anstelle von numerischen Attributen verwenden. Zum Beispiel: WHERE numattrib = 123 AND contains('...'). Wenn Sie mit Hilfe einer gespeicherten Prozedur suchen, müssen Sie numerische Attribute angeben, wenn zusätzliche Informationen zu den Textdokumenten durchsucht werden sollen.

Anzeige 'Textmerkmale'

In dieser Anzeige können Sie die Sprache und das Format der Textdokumente angeben. Wenn die Dokumente nicht die gleiche ID für codierten Zeichensatz (CCSID) wie die Datenbank haben und die Textspalte einen binären Typ hat, geben Sie die CCSID an. Beachten Sie, dass die Datenbank-CCSID zu Anfang ausgewählt wird. Wenn Ihre Dokumente ein strukturiertes GPP-, HTML-, Outside-In- oder XML-Format aufweisen, können Sie ein Dokumentmodell angeben.

Anmerkung

Im Listenfenster für das Format wird das Outside-In-Filterformat als INSO-Format bezeichnet.

Abbildung 13. Assistent: Textindex erstellen - Anzeige 'Textmerkmale'

Assistent: Textindex erstellen - Anzeige 'Textmerkmale'

Die Felder der Anzeige werden im Folgenden beschrieben:

Tabelle 3. Textfelder der Anzeige 'Textmerkmale'

Name des Feldes Verbindlich/ Optional Standard- wert Beschreibung
Sprache Optional EN_US Wählen Sie eine Sprache aus, um die Begrenzungszeichen für Satzenden und Absätze für die Indexierung festzulegen.
CCSID Optional CCSID der Datenbank Wählen Sie die CCSID für die Indexierung von Textdokumenten aus.
Format Optional TEXT Wählen Sie das Textdokumentformat aus: HTML, XML, TEXT, INSO oder GPP.
Standarddokumentmodell Optional Aktiviert Wählen Sie die Option aus, um das Standarddokumentmodell zu verwenden.
Benutzerdokument- modell Optional Inaktiviert Wählen Sie die Option aus, um Ihr Benutzerdokumentmodell zu verwenden.
Modellname Verbindlich (wenn Benutzerdokument- modell ausgewählt) n/v Geben Sie den Namen des Dokumentmodells ein. Sie können für das HTML-, XML-, Outside-In- und das GPP-Format ein Dokumentmodell angeben. Beachten Sie, dass der Name nur in der Modelldatei zu finden ist.
Modelldatei Wie oben n/v Geben Sie die Dokumentmodelldatei an. Die Datei muss DB2-Exemplareignern einen Lesezugriff ermöglichen.
Modell-CCSID Wie oben CCSID der Datenbank Wählen Sie die CCSID zur Interpretation des Inhalts der Dokumentmodelldatei aus.
Zahlen wie Wörter behandeln Optional Inaktiviert Wählen Sie aus, ob Folgen von Ziffern als getrennte Wörter interpretiert werden sollen, auch wenn sie mit Zeichen benachbart sind.
Indexstoppwörter Optional Aktiviert Wählen Sie diese Option aus, wenn Sie die sprachspezifische Stoppwörterverarbeitung aktivieren möchten. Die Datei <sprache>.tsw im Verzeichnis sqllib/db2ext/resources enthält die Stoppwörterliste.

Anzeige 'Aktualisierungsmerkmale'

In dieser Anzeige können Sie angeben, ob der Index inkrementell aktualisiert (Teilaktualisierung) oder völlig neu erstellt werden soll. Sie können die Aktualisierungseinstellungen so angeben, dass der Index automatisch zum angegebenen Zeitpunkt aktualisiert wird.

Abbildung 14. Assistent: Textindex erstellen - Anzeige 'Aktualisierungsmerkmale'

Assistent: Textindex erstellen - Anzeige 'Aktualisierungsmerkmale'

Die Felder der Anzeige werden im Folgenden beschrieben:

Tabelle 4. Textfelder der Anzeige 'Aktualisierungsmerkmale'

Name des Feldes Verbindlich/ Optional Standard- wert Beschreibung
Teilaktualisierung Optional Aktiviert Wählen Sie diese Option, um eine Indexteilaktualisierung zu definieren. Wenn Sie das Markierungsfeld nicht aktivieren, wird der Index beim Ausführen einer Aktualisierung neu erstellt.
COMMIT-Anzahl Optional 0 Anzahl von Änderungen, die während einer Aktualisierung innerhalb einer Transaktion verarbeitet werden.

Die Verwendung von "Commitcount" hat Auswirkungen auf die Systemleistung. Weitere Informationen hierzu finden Sie im Abschnitt Leistungsaspekte.

Kenndaten der Capture-Tabelle Optional n/v Wählen Sie diese Option aus, wenn Sie eine Replikationserfassungstabelle (Capture-Tabelle) zum Aufzeichnen von Änderungen an der Quellentabelle verwenden möchten. Die Replikationserfassungstabelle kann entweder eine CD-Tabelle (CD = Capture Data) oder eine CCD-Tabelle (CCD = Capture Change Data) sein. Sie ersetzt die von DB2 Net Search Extender generierte Protokolltabelle.
Schemaname der Replikationserfassungskomponente Optional Benutzer-ID Der Schemaname der Replikationserfassungstabelle. Beachten Sie, dass die Tabelle zu einem früheren Zeitpunkt unter Verwendung der Vervielfältigungsfunktion von DB2 (Replikation) erstellt worden sein muss.
Tabellenname der Replikationserfassungskomponente Verbindlich, wenn die Kenndaten der Capture-Tabelle aktiviert sind n/v Der Name der Replikationserfassungstabelle. Beachten Sie, dass die Tabelle zu einem früheren Zeitpunkt unter Verwendung der Vervielfältigungsfunktion von DB2 (Replikation) erstellt worden sein muss.
Schemaname für Steuertabellen Verbindlich, wenn die Kenndaten der Capture-Tabelle aktiviert sind n/v Der Schemaname der Steuertabelle. Beachten Sie, dass die Tabelle zu einem früheren Zeitpunkt unter Verwendung der Vervielfältigungsfunktion von DB2 (Replikation) erstellt worden sein muss.
Radioknopf 'Reorganisieren': Automatisch oder Manuell Optional oder verbindlich Aktiviert/ inaktiviert Wählen Sie aus, ob die Indexreorganisation automatisch oder manuell durchgeführt werden soll.
Mindestanzahl Änderungen für die Aktualisierung Optional 1 Geben Sie die Mindestanzahl der Änderungen an Textdokumenten an, bevor für den Index eine Teilaktualisierung zum angegebenen Zeitpunkt durchgeführt wird.
Plan für die Aktualisierung Optional Inaktiviert Wählen Sie diese Option, um Einstellungen für automatische Aktualisierungen hinzuzufügen.

Zum Hinzufügen von Einstellungen zur Indexaktualisierung klicken Sie den Knopf Einstellungen an. Beachten Sie, dass dieser Knopf nur aktiviert wird, wenn Sie Plan für die Aktualisierung auswählen. Wählen Sie in dem Dialog die Tage, Stunden und Minuten für den Zeitpunkt der Aktualisierung aus. Werden mehrere Tage ausgewählt, findet die Aktualisierung zum gleichen Zeitpunkt an allen ausgewählten Tagen statt.

Anzeige 'Cachetabelle'

In dieser Anzeige können Sie zusätzlich zu dem Index eine im Cache zwischengespeicherte Tabelle angeben. Sie können die Ergebnisspalten angeben, die im Cache gespeichert werden, und Sie können den Cache mit Hilfe einer gespeicherten Prozedur durchsuchen. Andere Cacheparameter, wie den Typ, die maximale Größe und die Reihenfolge, in der der Benutzertabelleninhalt bei der einleitenden Indexierung abgerufen wird, können ebenfalls angegeben werden.

Abbildung 15. Assistent: Textindex erstellen - Anzeige 'Cachetabelle'

Assistent: Textindex erstellen - Anzeige 'Cachetabelle'

Die Felder der Anzeige werden im Folgenden beschrieben:

Tabelle 5. Textfelder der Anzeige 'Cachetabelle'

Name des Feldes Verbindlich/ Optional Standard- wert Beschreibung
Tabellencache aktivieren Optional Inaktiviert Wählen Sie diese Option, um die Erstellung einer im Cache zwischengespeicherten Tabelle zu aktivieren.
Ergebnisspaltentabelle Verbindlich (wenn 'Tabellencache aktivieren' ausgewählt) n/v Zeigt eine Liste von SQL-Spaltenausdrücken an, durch die die Suchergebnisspalten angegeben werden.
Maximale Anzahl der Dokumente Verbindlich Zeilenzahl der Tabelle Siehe hierzu den folgenden Abschnitt zum Ermitteln der Cacheauslastung und der Cachegröße
Durchschnittliche Cachezeilenlänge Verbindlich n/v Siehe hierzu den folgenden Abschnitt zum Ermitteln der Cacheauslastung und der Cachegröße
Prozentsatz der erstmaligen Cacheauslastung Optional 50 % Wählen Sie den Prozentsatz des Caches aus, der für weitere Dokumente freigehalten werden soll.
Maximale Cachegröße Optional n/v Geben Sie eine maximale Größe für die im Cache gespeicherte Tabelle an, die während der Indexaktivierung erstellt wird. Wenn der Wert zu klein ist, schlägt die Aktivierung fehl.
Reihenfolge für Suchergebnisse bei Erstindexierung Optional Inaktiviert Wählen Sie diese Option aus, um die Reihenfolge der Suchergebnisse zu definieren. Wenn die dynamische Rangordnung von Volltextsuchergebnissen übersprungen wird, werden Dokumente in der gleichen Indexierungsreihenfolge wie in der im Cache gespeicherten Tabelle zurückgegeben. Diese Reihenfolge kann nach einer Teilaktualisierung nicht sichergestellt werden.
Persistenten Cache verwenden Optional Aktiviert Diese Option ermöglicht eine rasche Aktivierungsausführung nach einer Inaktivierung oder einem Systemneustart. Beachten Sie, dass Sie einen Verzeichnispfad für den persistenten Cache angeben müssen. Lassen Sie diese Option inaktiviert, wenn der Cache temporär sein soll.
Ermitteln der Cacheauslastung und der Cachegröße

Die Option Prozentsatz der erstmaligen Cacheauslastung gibt den Prozentsatz des Caches an, der für weitere Dokumente freizuhalten ist. Die Maximale Cachegröße gibt die maximale Größe der im Cache gespeicherten Tabelle an, die bei der Aktivierung des Caches zu erstellen ist. Diese Optionen sind von folgenden Faktoren abhängig:

  • Tatsächliche Anzahl der Dokumente in der Tabelle.
  • Zu erwartende Anzahl der Aktualisierungen.
  • Durchschnittliche Größe der SQL-Ausdrücke, die Sie im Cache speichern möchten.

Sie können die empfohlenen Werte für Prozentsatz der erstmaligen Cacheauslastung und Maximale Cachegröße entweder eingeben oder jedes Mal neu berechnen, wenn Werte für die Felder Maximale Anzahl der Dokumente oder Durchschnittliche Cachezeilenlänge eingegeben werden.

Der Wert für Maximale Anzahl der Dokumente wird zu Anfang auf die Anzahl der Zeilen der Tabelle gesetzt. Modifizieren Sie diesen Wert entsprechend der Anzahl von Dokumenten und der erwarteten Anzahl von Änderungen. Berücksichtigen Sie alle Aktualisierungen, Hinzufügungen und Löschungen von Dokumenten.

Wenn Sie der Cachetabellenliste einen SQL-Ausdruck hinzufügen, wird die Durchschnittliche Cachezeilenlänge gemäß der Länge des Ergebnisses berechnet. Da dieser Prozess auf der Anzahl der Tabellenzeilen basiert, kann die Berechnung relativ zeitaufwändig sein. Wenn Sie wissen, dass dieser Wert im Durchschnitt kleiner ist, modifizieren Sie den Wert.

Wenn Ihre Tabelle zum Beispiel zehn Einträge hat und die Summe Ihrer Spaltenausdrücke 100 beträgt, werden diese Werte zu Anfang definiert. Wenn Sie erwarten, dass die maximale Anzahl der Dokumente (einschließlich gelöschter Dokumente) 10.000 beträgt, geben Sie diesen Wert ein. Wenn Sie wissen, dass Spaltenausdrücke im Durchschnitt kleiner als der berechnete Wert sind, zum Beispiel VARCHAR(100) und eine eingefügte Textgröße von 10, verwenden Sie diesen Wert als durchschnittliche Zeilengröße.

Zum Definieren der Anfangsreihenfolge der Suchergebnisse klicken Sie den Knopf Definieren an. Beachten Sie, dass dieser Knopf nur aktiviert wird, wenn Sie das Markierungsfeld für die Reihenfolge der Suchergebnisse bei Erstindexierung auswählen. Ein Dialog zeigt alle angegebenen SQL-Spaltenausdrücke an. Zum Hinzufügen einer Ergebnisreihenfolge klicken Sie den Knopf Hinzufügen an und geben Sie in dem Dialog die SQL-Ergebnisreihenfolge an.

Zum Ändern, Versetzen oder Entfernen eines Eintrags wählen Sie den Ausdruck aus und klicken die entsprechenden Knöpfe an.

Abbildung 16. Dialog 'Reihenfolge für Suchergebnisse bei Erstindexierung'

Dialog 'Reihenfolge für Suchergebnisse bei Erstindexierung'

Zum Hinzufügen eines SQL-Spaltenausdrucks klicken Sie den Knopf Hinzufügen neben der Ergebnisspaltentabelle an. Geben Sie in dem Dialog den Ausdruck und den Namen der Ergebnisspalte an.

Zum Ändern oder Entfernen eines Eintrags klicken Sie auf den Spaltenausdruck, der die entsprechenden Knöpfe aktiviert.

Abbildung 17. Dialog 'Spaltenausdruck ändern'

Dialog 'Spaltenausdruck ändern'

Anzeige 'Zusammenfassung'

Diese Anzeige fasst die zuvor ausgewählten Parameter in einer Übersicht zusammen.

Abbildung 18. Assistent: Textindex erstellen - Anzeige 'Zusammenfassung'

Assistent: Textindex erstellen - Anzeige 'Zusammenfassung'

Klicken Sie den Knopf Befehl anzeigen an, um die Befehle anzuzeigen, die ausgeführt werden, wenn der Knopf Fertig stellen angeklickt wird. Mit dieser Aktion wird der Textindex erstellt.


[ Seitenanfang | Vorherige Seite | Nächste Seite | Inhaltsverzeichnis | Index ]