Glossar
Dieses Glossar enthält Definitionen von in diesem Handbuch verwendeten Begriffen und
Abkürzungen. Falls Sie einen gesuchten Begriff nicht finden, greifen Sie auf den Index
zurück.
A
- Abrufen
- Auffinden eines Textdokuments mit Hilfe eines
Sucharguments in einer der Suchfunktionen von DB2 Net Search Extender.
- Aktivieren
- Vorbereiten einer Datenbank zur Verwendung durch
DB2 Net Search Extender.
- Aktualisierungshäufigkeit
- Die Häufigkeit, mit
der ein Textindex aktualisiert wird und die durch den Wochentag, die Stunde und die
Minute sowie die Mindestanzahl von Dokumentennamen, die in der
Protokolltabelle zum Indexieren aufgelistet sein müssen, bevor
eine Indexierung stattfinden kann, definiert wird.
- Auslöser
- Ein Mechanismus, der einer
Protokolltabelle automatisch Informationen über Dokumente
hinzufügt, die indexiert werden müssen, wenn in einer Textspalte ein Dokument
hinzugefügt, geändert oder gelöscht wird.
B
- Befehlszeilenprozessor
- Ein Programm mit dem Namen 'db2text',
das folgenden Zwecken dient:
- Eingabe von DB2 Net Search Extender-Befehlen
- Verarbeitung der Befehle
- Anzeigen des Ergebnisses
- Benutzerdefinierte Funktion (UDF)
- Eine SQL-Funktion, die von
einem DB2-Benutzer erstellt wird, im Gegensatz zu einer SQL-Funktion, die von DB2
bereitgestellt wird.
- Benutzerdefinierter Datentyp (UDT)
- Ein Datentyp, der von einem
DB2-Benutzer erstellt wird, im Gegensatz zu einem Datentyp, der durch DB2 bereitgestellt
wird, wie zum Beispiel LONG VARCHAR.
- Boolesche Suche
- Eine Suche, bei der mindestens ein Suchbegriff
mit Booleschen Operatoren kombiniert wird.
C
- CCSID
- ID für codierten Zeichensatz (Coded Character Set
Identifier).
- Codepage
- Eine Zuordnung von grafischen Zeichen und
Steuerfunktionscodes zu allen verfügbaren Codepunkten. Zum Beispiel eine Zuordnung von
Zeichen und Bedeutungen zu den 256 Codepunkten eines 8-Bitcodes.
D
- DBCS
- Doppelbytezeichensatz (Double-Byte Character Set).
- Dokument
- Siehe Textdokument.
- Dokumentmodell
- Die Definition der Struktur eines
Dokuments in Bezug auf die Abschnitte, die es enthält. Ein Dokumentmodell gibt DB2 Net Search Extender die
Möglichkeit, beim Indexieren Abschnitte innerhalb eines Dokuments zu erkennen. In einem
Dokumentmodell werden die Formatierungssteuerbefehle (Tags) aufgelistet, durch die die
Abschnitte gekennzeichnet werden. Für jeden Formatierbefehl können Sie einen
beschreibenden Abschnittsnamen definieren, der in Abfragen auf diesen Abschnitt verwendet
werden kann. Sie können ein oder mehrere Dokumentmodelle in einer Datei für
Dokumentmodelle angeben.
E
- Erweitern
- Das Hinzufügen zusätzlicher Begriffe, die einem
Thesaurus entnommen werden, zu einem Suchbegriff.
- Escapezeichen
- Ein Zeichen, das angibt, dass das nachfolgende
Zeichen nicht als Platzhalterzeichen zu interpretieren ist.
F
- Format
- Der Typ eines Dokuments wie ASCII oder HTML.
- Freitextsuche
- Eine Suche, bei der der Suchbegriff in freier
Textform angegeben wird, d. h. als Phrase oder Satz, der das zu suchende Thema in
natürlicher Sprache beschreibt.
- Funktion
- Siehe Zugriffsfunktion.
H
- Hybridsuche
- Eine kombinierte Suche aus
Boolescher Suche und Freitextsuche.
I
- Inaktivieren
- Das Wiederherstellen einer Datenbank in ihren
Zustand vor der Aktivierung für DB2 Net Search Extender Text durch Entfernen der Elemente, die durch den
Aktivierungsprozess erstellt wurden.
- Indexieren
- Das Extrahieren relevanter Begriffe aus einem Text und Speichern dieser Begriffe
in einem Textindex.
- Indexmerkmale
- Merkmale eines Textindex, die folgende Eigenschaften festlegen:
- Die Häufigkeit, mit der der Index aktualisiert wird
- Wann die erste Aktualisierung des Indexes stattzufinden hat
K
- Katalogsicht
- Eine Sicht (engl. view) einer Systemtabelle, die
von DB2 Net Search Extender zu Verwaltungszwecken erstellt wird. Eine Katalogsicht enthält Informationen
über die Tabellen und Spalten, die zur Verwendung durch DB2 Net Search Extender Text aktiviert wurden.
- Knotengruppe
- Eine benannte Untergruppe eines oder mehrerer
Datenbankpartitionsserver. Knoten, der einer separaten physischen
Maschine zugeordnet ist. Siehe auch logischer Knoten.
L
- LEVEL(S)
- Ein Schlüsselwort, das zur Angabe der Anzahl von Ebenen
(Tiefe) von Begriffen im Thesaurus verwendet wird, die verwendet werden sollen, um den
Suchbegriff für eine gegebene Relation zu erweitern.
M
- Maskierungszeichen
- Siehe
Platzhalterzeichen.
N
- Ngram-Index
- Ein Textindex, der
DBCS-Dokumente und das Suchen nach groben Übereinstimmungen in SBCS-Dokumenten
unterstützt. Siehe auch linguistischer Index und
präziser Index.
P
- Platzhalterzeichen
- Ein Zeichen, das zur Darstellung optionaler
Zeichen am Anfang, in der Mitte und am Ende eines Suchbegriffs verwendet werden kann.
Platzhalterzeichen dienen in der Regel zum Auffinden von Varianten eines Begriffs in
einem präzisen Index.
- Protokolltabelle
- Eine von DB2 Net Search Extender erstellte Tabelle, die
Informationen darüber enthält, welche Textdokumente zu indexieren sind.
Diese Informationen werden über Auslöser in einer
Protokolltabelle gespeichert, wenn ein Dokument in einer aktivierten Textspalte
hinzugefügt, geändert oder gelöscht wird.
R
- Regelmäßiges Indexieren
- Indexieren in vorher
festgelegten Intervallen, die in Form von Wochentagen, Stunden und Minuten sowie der
Mindestanzahl von Dokumentennamen angegeben werden, die in der Protokolltabelle zum Indexieren aufgelistet sein müssen, bevor eine Indexierung
stattfinden kann.
S
- SBCS
- Einzelbytezeichensatz (Single-Byte Character Set).
- SCORE (Quote)
- Ein absoluter Wert des Typs DOUBLE zwischen 0 und 1, der
angibt, wie gut ein Dokument die Suchkriterien in Relation zu den anderen gefundenen
Dokumenten erfüllt. Der Wert gibt die Anzahl gefundener Übereinstimmungen im Verhältnis
zur Größe des Dokuments an.
- Suchargument
- Die für eine Suche angegebenen Bedingungen, die
aus einem oder mehreren Suchbegriffen und Suchparametern bestehen.
- Suche nach grober Übereinstimmung
- Eine Suche, die Wörter
finden kann, deren Schreibweise der des Suchbegriffs ähnlich ist.
T
- Textdokument
- Text der Datentypen CHAR, GRAPHIC, VARGRAPHIC,
LONG VARGRAPHIC, DBCLOB, VARCHAR, LONG VARCHAR oder CLOB, der in einer DB2-Tabelle
gespeichert ist.
- Textindex
- Eine Datensammlung aus signifikanten Begriffen, die
aus Textdokumenten extrahiert wurden. Jedem Begriff ist das Dokument zugeordnet, aus dem
er extrahiert wurde. Erheblich verbesserte Suchzeiten lässen sich erzielen, wenn an Stelle
der Dokumente der zugehörige Index durchsucht wird.
- Textspalte
- Eine Spalte, die
Textdokumente enthält.
- Tracing
- Das Speichern von Informationen in einer Datei, die
später zur Ermittlung von Fehlerursachen verwendet werden können.
U
- UDF
- Benutzerdefinierte Funktion (User-defined Function).
- UDT
- Benutzerdefinierter Datentyp (User-defined Type).
- Übereinstimmung
- Das Vorkommen eines Suchbegriffs in einem
Textdokument.
Z
- Zugriffsfunktion
- Eine vom Benutzer gestellte Funktion, die den
Datentyp von in einer Spalte gespeichertem Text in einen Typ umwandelt, der durch DB2 Net Search Extender
verarbeitet werden kann.