Wählen Sie den Befehl Erstellen aus, und wählen Sie im erweiterten Menü Textindex aus. Der Assistent zum Erstellen von Textindizes wird aufgerufen. Mit Hilfe dieses Assistenten können Sie die Konfigurationsoptionen für den Textindex in einer Reihe von Anzeigen angeben.
Um zur jeweils nächsten Anzeige zu gelangen, geben Sie alle verbindlichen Informationen ein und klicken den Knopf Weiter an, bis der Knopf Fertig stellen aktiviert wird. Klicken Sie auf den Knopf Fertig stellen, um den Textindex zu erstellen.
Um einen Textindex für Sichten zu erstellen, verwenden Sie den im Abschnitt CREATE INDEX beschriebenen Befehl CREATE INDEX.
In dieser Anzeige können Sie das Schema und den Namen für den Textindex angeben. Außerdem können Sie ein Arbeits- und Indexverzeichnis für die Textindexdateien angeben. Die Verwaltungstabellen für den Index werden im Verwaltungstabellenbereich erstellt.
Die Felder der Anzeige werden im Folgenden beschrieben:
Name des Feldes | Verbindlich/ Optional | Standard- wert | Beschreibung |
Indexschema | Verbindlich | Benutzer-ID | Wählen Sie einen Schemanamen für den Textindex. Dies ist der DB2-Schemaname für die indexspezifischen Verwaltungstabellen. |
Indexname | Verbindlich | n/v | Geben Sie einen gültigen DB2-Indexnamen für den Textindex ein. Zusammen mit dem Schemanamen dient dieser Name zur eindeutigen Identifikation eines Volltextindexes in einer Datenbank. |
Indexverzeichnis | Optional | Siehe Pfadname. | Geben Sie den Verzeichnispfad an, in dem der Textindex gespeichert werden soll. Das Verzeichnis muss vorhanden sein, und der Benutzer-ID des DB2-Exemplareigners müssen die Berechtigungen zum Schreiben, Lesen und Ausführen erteilt sein. |
Arbeitsverzeichnis | Optional | Siehe Pfadname. | Geben Sie das Arbeitsverzeichnis für temporäre Dateien an, die während der Such- und Verwaltungsoperationen gespeichert werden müssen. Das Verzeichnis muss vorhanden sein, und der Benutzer-ID des DB2-Exemplareigners müssen die Berechtigungen zum Schreiben, Lesen und Ausführen erteilt sein. |
Verwaltungstabellenbereich | Optional | Standardtabellenbereich verwenden | Wählen Sie einen Tabellenbereichsnamen für die Textindexverwaltungstabellen aus. Der Tabellenbereich muss in der gleichen Knotengruppe wie der Tabellenbereich für die Benutzertabelle definiert sein. |
Mit Hilfe dieser Anzeige können Sie das Schema und den Namen der Tabelle oder Kurznamentabelle sowie den Namen der Textspalte mit den zu indexierenden Daten angeben. Sie können eine Umsetzungsfunktion verwenden, um den Inhalt der Textspalte zu modifizieren. Zusätzlich zu der Textspalte können Sie auch numerische Attribute angeben, wenn Sie den Inhalt eines Tabellenspaltenausdrucks indexieren möchten.
Die Felder der Anzeige werden im Folgenden beschrieben:
Name des Feldes | Verbindlich/ Optional | Standard- wert | Beschreibung |
Tabellenschema (1) | Verbindlich | Benutzer-ID | Wählen Sie das Schema der Tabelle oder den Kurznamen der Tabelle aus, für die Sie den Textindex erstellen. |
Tabellenname (2) | Verbindlich | n/v | Wählen Sie den Namen der Tabelle oder den Kurznamen der Tabelle aus, für die Sie den Index erstellen. Die Tabelle muss einen Primärschlüssel besitzen. |
Textspalte (3) | Verbindlich | n/v | Wählen Sie den Namen der Spalte aus, die zur Erstellung des Textindexes verwendet werden soll. Die Spalte muss in einen der folgenden Typen umgesetzt bzw. einen solchen Typ besitzen: CHAR (for bit data), VARCHAR (for bit data), LONG VARCHAR (for bit data), CLOB, DBCLOB, BLOB, GRAPHIC, VARGRAPHIC, LONG VARGRAPHIC oder DATALINK. |
Umsetzungsfunktion | Optional | Inaktiviert | Wählen Sie die Option aus, um eine Umsetzungsfunktion zu verwenden. |
Umsetzungsfunktion: Schema | Verbindlich (wenn Funktion ausgewählt) | Benutzer-ID | Wählen Sie das Schema der benutzerdefinierten Funktion (UDF) aus, die für den Zugriff auf die Textdokumente verwendet wird. |
Umsetzungsfunktion: Name | Wie oben | n/v | Wählen Sie den Namen einer benutzerdefinierten Funktion (UDF) aus, die für den Zugriff auf die Textdokumente verwendet wird. |
Beachten Sie, dass die Felder Tabellenschema (1), Tabellenname (2) und Textspalte (3) nur in dieser Reihenfolge angegeben werden können.
Klicken Sie den Knopf Zusätzliche numerische Attribute an, um Attribute anzuzeigen oder hinzuzufügen. Ein Fenster wird angezeigt. Klicken Sie den Knopf Hinzufügen an, wenn Sie dem Index numerische Attribute hinzufügen wollen. Ein weiteres Fenster wird angezeigt. Geben Sie den SQL-Spaltenausdruck und den Namen für das Attribut an.
Alternativ können Sie auch ein Attribut auswählen und die entsprechenden Knöpfe anklicken, um einen Eintrag zu ändern, zu versetzen oder zu entfernen.
Verwenden Sie numerische Attribute, um neben der Textspalte Spaltenausdrücke zu indexieren. Wenn Sie zum Bespiel die Spalte date des Typs TIMESTAMP neben der Textspalte indexieren wollen, geben Sie ein numerisches Attribut "cast(julian_day(date) as double)" und einen Namen für das Attribut an.
Geben Sie ein numerisches Attribut an, wenn Sie einen numerischen Ausdruck in einer Suchabfrage verwenden wollen. Wenn Sie mit Hilfe von SQL-Abfragen suchen, können Sie eine kombinierte Suche an Stelle von numerischen Attributen verwenden. Zum Beispiel: WHERE numattrib = 123 AND contains('...').
In dieser Anzeige können Sie die Sprache und das Format der Textdokumente angeben. Wenn die Dokumente nicht die gleiche ID für codierten Zeichensatz (CCSID) wie die Datenbank haben und die Textspalte einen binären Typ hat, geben Sie die CCSID an. Beachten Sie, dass die Datenbank-CCSID zu Anfang ausgewählt wird. Wenn Ihre Dokumente ein strukturiertes GPP-, HTML-, Outside In- oder XML-Format aufweisen, können Sie ein Dokumentmodell angeben.
Im Listenfenster für das Format wird das Outside In-Filterformat als INSO-Format bezeichnet.
Die Felder der Anzeige werden im Folgenden beschrieben:
Name des Feldes | Verbindlich/ Optional | Standard- wert | Beschreibung |
Sprache | Optional | EN_US | Wählen Sie eine Sprache aus, um die Begrenzungszeichen für Satzenden und Absätze für die Indexierung festzulegen. |
CCSID | Optional | CCSID der Datenbank | Wählen Sie die CCSID für die Indexierung von Textdokumenten aus. |
Format | Optional | TEXT | Wählen Sie das Textdokumentformat aus: HTML, XML, TEXT, INSO oder GPP. |
Standarddokumentmodell | Optional | Aktiviert | Wählen Sie die Option aus, um das Standarddokumentmodell zu verwenden. |
Benutzerdokument- modell | Optional | Inaktiviert | Wählen Sie die Option aus, um Ihr Benutzerdokumentmodell zu verwenden. |
Modellname | Verbindlich (wenn Benutzerdokument- modell ausgewählt) | n/v | Geben Sie den Namen des Dokumentmodells ein. Sie können für das HTML-, XML-, Outside In- und das GPP-Format ein Dokumentmodell angeben. Beachten Sie, dass der Name nur in der Modelldatei zu finden ist. |
Modelldatei | Wie oben | n/v | Geben Sie die Dokumentmodelldatei an. Die Datei muss DB2-Exemplareignern einen Lesezugriff ermöglichen. |
Modell-CCSID | Wie oben | CCSID der Datenbank | Wählen Sie die CCSID zur Interpretation des Inhalts der Dokumentmodelldatei aus. |
Zahlen wie Wörter behandeln | Optional | Inaktiviert | Wählen Sie aus, ob Folgen von Ziffern als getrennte Wörter interpretiert werden sollen, auch wenn sie mit Zeichen benachbart sind. |
Indexstoppwörter | Optional | Aktiviert | Wählen Sie diese Option aus, wenn Sie die sprachspezifische Stoppwörterverarbeitung aktivieren möchten. Die Datei <sprache>.tsw im Verzeichnis sqllib/db2ext/resources enthält die Stoppwörterliste. |
In dieser Anzeige können Sie angeben, ob der Index inkrementell aktualisiert (Teilaktualisierung) oder völlig neu erstellt werden soll. Sie können die Aktualisierungseinstellungen so angeben, dass der Index automatisch zum angegebenen Zeitpunkt aktualisiert wird.
Die Felder der Anzeige werden im Folgenden beschrieben:
Name des Feldes | Verbindlich/ Optional | Standard- wert | Beschreibung |
Teilaktualisierung | Optional | Aktiviert | Wählen Sie diese Option, um eine Indexteilaktualisierung zu definieren. Wenn Sie das Markierungsfeld nicht aktivieren, wird der Index beim Ausführen einer Aktualisierung neu erstellt. |
COMMIT-Anzahl | Optional | 0 | Anzahl von Änderungen, die während einer Aktualisierung
innerhalb einer Transaktion verarbeitet werden.
Die Verwendung von "Commitcount" hat Auswirkungen auf die Systemleistung. Weitere Informationen hierzu finden Sie im Abschnitt Leistungsaspekte. |
Kenndaten der Capture-Tabelle | Optional | n/v | Wählen Sie diese Option aus, wenn Sie eine Replikationserfassungstabelle (Capture-Tabelle) zum Aufzeichnen von Änderungen an der Quellentabelle verwenden möchten. Die Replikationserfassungstabelle kann entweder eine CD-Tabelle (CD = Capture Data) oder eine CCD-Tabelle (CCD = Capture Change Data) sein. Sie ersetzt die von DB2 Net Search Extender generierte Protokolltabelle. |
Schemaname der Replikationserfassungskomponente | Optional | Benutzer-ID | Der Schemaname der Replikationserfassungstabelle. Beachten Sie, dass die Tabelle zu einem früheren Zeitpunkt unter Verwendung der Vervielfältigungsfunktion von DB2 (Replikation) erstellt worden sein muss. |
Tabellenname der Replikationserfassungskomponente | Verbindlich, wenn die Kenndaten der Capture-Tabelle aktiviert sind | n/v | Der Name der Replikationserfassungstabelle. Beachten Sie, dass die Tabelle zu einem früheren Zeitpunkt unter Verwendung der Vervielfältigungsfunktion von DB2 (Replikation) erstellt worden sein muss. |
Schemaname für Steuertabellen | Verbindlich, wenn die Kenndaten der Capture-Tabelle aktiviert sind | n/v | Der Schemaname der Steuertabelle. Beachten Sie, dass die Tabelle zu einem früheren Zeitpunkt unter Verwendung der Vervielfältigungsfunktion von DB2 (Replikation) erstellt worden sein muss. |
Radioknopf 'Reorganisieren': Automatisch oder Manuell | Optional oder verbindlich | Aktiviert/ inaktiviert | Wählen Sie aus, ob die Indexreorganisation automatisch oder manuell durchgeführt werden soll. |
Mindestanzahl Änderungen für die Aktualisierung | Optional | 1 | Geben Sie die Mindestanzahl der Änderungen an Textdokumenten an, bevor für den Index eine Teilaktualisierung zum angegebenen Zeitpunkt durchgeführt wird. |
Plan für die Aktualisierung | Optional | Inaktiviert | Wählen Sie diese Option, um Einstellungen für automatische Aktualisierungen hinzuzufügen. |
Zum Hinzufügen von Einstellungen zur Indexaktualisierung klicken Sie den Knopf Einstellungen an. Beachten Sie, dass dieser Knopf nur aktiviert wird, wenn Sie Plan für die Aktualisierung auswählen. Wählen Sie in dem Dialog die Tage, Stunden und Minuten für den Zeitpunkt der Aktualisierung aus. Werden mehrere Tage ausgewählt, findet die Aktualisierung zum gleichen Zeitpunkt an allen ausgewählten Tagen statt.
In dieser Anzeige können Sie zusätzlich zu dem Index eine im Cache zwischengespeicherte Tabelle angeben. Sie können die Ergebnisspalten angeben, die im Cache gespeichert werden, und Sie können den Cache mit Hilfe einer gespeicherten Prozedur durchsuchen. Andere Cacheparameter, wie den Typ, die maximale Größe und die Reihenfolge, in der der Benutzertabelleninhalt bei der einleitenden Indexierung abgerufen wird, können ebenfalls angegeben werden.
Die Felder der Anzeige werden im Folgenden beschrieben:
Name des Feldes | Verbindlich/ Optional | Standard- wert | Beschreibung |
Tabellencache aktivieren | Optional | Inaktiviert | Wählen Sie diese Option, um die Erstellung einer im Cache zwischengespeicherten Tabelle zu aktivieren. |
Ergebnisspaltentabelle | Verbindlich (wenn 'Tabellencache aktivieren' ausgewählt) | n/v | Zeigt eine Liste von SQL-Spaltenausdrücken an, durch die die Suchergebnisspalten angegeben werden. |
Maximale Anzahl der Dokumente | Verbindlich | Zeilenzahl der Tabelle | Siehe hierzu den folgenden Abschnitt zum Ermitteln der Cacheauslastung und der Cachegröße |
Durchschnittliche Cachezeilenlänge | Verbindlich | n/v | Siehe hierzu den folgenden Abschnitt zum Ermitteln der Cacheauslastung und der Cachegröße |
Prozentsatz der erstmaligen Cacheauslastung | Optional | 50 % | Wählen Sie den Prozentsatz des Caches aus, der für weitere Dokumente freigehalten werden soll. |
Maximale Cachegröße | Optional | n/v | Geben Sie eine maximale Größe für die im Cache gespeicherte Tabelle an, die während der Indexaktivierung erstellt wird. Wenn der Wert zu klein ist, schlägt die Aktivierung fehl. |
Reihenfolge für Suchergebnisse bei Erstindexierung | Optional | Inaktiviert | Wählen Sie diese Option aus, um die Reihenfolge der Suchergebnisse zu definieren. Dokumente werden in der gleichen Indexierungsreihenfolge wie in der im Cache gespeicherten Tabelle zurückgegeben. Diese Reihenfolge kann nach einer Teilaktualisierung nicht unbedingt beibehalten werden. |
Persistenten Cache verwenden | Optional | Aktiviert | Diese Option ermöglicht eine rasche Aktivierungsausführung nach einer Inaktivierung oder einem Systemneustart. Beachten Sie, dass Sie einen Verzeichnispfad für den persistenten Cache angeben müssen. Lassen Sie diese Option inaktiviert, wenn der Cache temporär sein soll. |
Die Option Prozentsatz der erstmaligen Cacheauslastung gibt den Prozentsatz des Caches an, der für weitere Dokumente freizuhalten ist. Die Maximale Cachegröße gibt die maximale Größe der im Cache gespeicherten Tabelle an, die bei der Aktivierung des Caches zu erstellen ist. Diese Optionen sind von folgenden Faktoren abhängig:
Sie können die empfohlenen Werte für Prozentsatz der erstmaligen Cacheauslastung und Maximale Cachegröße entweder eingeben oder jedes Mal neu berechnen, wenn Sie in die Felder Maximale Anzahl der Dokumente oder Durchschnittliche Cachezeilenlänge Werte eingeben.
Der Wert für Maximale Anzahl der Dokumente wird zu Anfang auf die Anzahl der Zeilen der Tabelle gesetzt. Modifizieren Sie diesen Wert entsprechend der Anzahl von Dokumenten und der erwarteten Anzahl von Änderungen. Berücksichtigen Sie dabei alle Aktualisierungs-, Hinzufüge- und Löschoperationen.
Wenn Sie der Cachetabellenliste einen SQL-Ausdruck hinzufügen, wird die Durchschnittliche Cachezeilenlänge gemäß der Länge des Ergebnisses berechnet. Da dieser Prozess auf der Anzahl der Tabellenzeilen basiert, kann die Berechnung relativ zeitaufwändig sein. Wenn Sie wissen, dass dieser Wert im Durchschnitt kleiner ist, modifizieren Sie den Wert.
Wenn Ihre Tabelle zum Beispiel zehn Einträge hat und die Summe Ihrer Spaltenausdrücke 100 beträgt, werden diese Werte zu Anfang definiert. Wenn Sie erwarten, dass die maximale Anzahl der Dokumente (einschließlich gelöschter Dokumente) 10.000 beträgt, geben Sie diesen Wert ein. Wenn Sie wissen, dass Spaltenausdrücke im Durchschnitt kleiner als der berechnete Wert sind, zum Beispiel VARCHAR(100) und eine eingefügte Textgröße von 10, verwenden Sie diesen Wert als durchschnittliche Zeilengröße.
Zum Definieren der Anfangsreihenfolge der Suchergebnisse klicken Sie den Knopf Definieren an. Beachten Sie, dass dieser Knopf nur aktiviert wird, wenn Sie das Markierungsfeld für die Reihenfolge der Suchergebnisse bei Erstindexierung auswählen. Ein Dialog zeigt alle angegebenen SQL-Spaltenausdrücke an. Zum Hinzufügen einer Ergebnisreihenfolge klicken Sie den Knopf Hinzufügen an und geben Sie in dem Dialog die SQL-Ergebnisreihenfolge an.
Zum Ändern, Versetzen oder Entfernen eines Eintrags wählen Sie den Ausdruck aus und klicken die entsprechenden Knöpfe an.
Zum Hinzufügen eines SQL-Spaltenausdrucks klicken Sie den Knopf Hinzufügen neben der Ergebnisspaltentabelle an. Geben Sie in dem Dialog den Ausdruck und den Namen der Ergebnisspalte an.
Zum Ändern oder Entfernen eines Eintrags klicken Sie auf den Spaltenausdruck, der die entsprechenden Knöpfe aktiviert.
Diese Anzeige fasst die zuvor ausgewählten Parameter in einer Übersicht zusammen.
Klicken Sie den Knopf Befehl anzeigen an, um die Befehle anzuzeigen, die ausgeführt werden, wenn der Knopf Fertig stellen angeklickt wird. Mit dieser Aktion wird der Textindex erstellt.