IBM Books
(C) IBM Corp. 2003

DB2 Net Search Extender Verwaltung und Programmierung

Standarddokumentmodelle

Für HTML- und XML-Dokumente stellt Net Search Extender Standarddokumentmodelle bereit, die verwendet werden, wenn Sie kein Dokumentmodell definieren. Für strukturierte einfache Textdokumente müssen Sie ein Dokumentmodell bereitstellen und angeben.

Wenn Sie eines der Standarddokumentmodelle verwenden, gelten folgende Regeln:


Tabelle 6. Funktionsweisen der Standarddokumentmodelle für die unterstützten Dokumentformate

Dokumenttyp Funktionen des Standarddokumentmodells
HTML Akzeptiert die folgenden Tags als Textfelder: <a> <address> <au> <author> <h1> <h2> <h3> <h4> <h5> <h6> <title>.
Feldname ist der Tagname, zum Beispiel "address".
XML Akzeptiert alle Tags als Textfelder.
Feldname ist der Tagpfadname in Xpath-Notation, zum Beispiel "/play/title".
Strukturierter reiner Text (GPP) Kein Standarddokumentmodell vorhanden.
Outside-In (INSO) Akzeptiert als Textfelder die Dokumentmerkmale unter Elementparameter, die von den Outside-In-Filtern zurückgegeben werden. Der Feldname ist der von Outside-In verwendete Name des Dokumentmerkmals, z. B. "SCCCA_TITLE". Es werden keine Attribute unterstützt.

Für jeden Dokumenttyp wird ein Dokumentmodell definiert. Da die Modelle jeweils unterschiedlich sind, wird für jedes Modell ein Beispiel mit Erläuterung gegeben.

Anmerkung

Obwohl die Standarddokumentmodelle Dokumente korrekt verarbeiten, sollten Sie zur besseren Indexierung und Suche eigene Dokumentmodelle definieren.

Mit dem Standarddokumentmodell wird der Text eines Dokuments vollständig indexiert, ungeachtet dessen, ob er Teil eines Textfelds ist oder nicht. Dies bedeutet, dass uneingeschränkte Textsuchen auch ein Durchsuchen dieses Texts beinhalten.


[ Seitenanfang | Vorherige Seite | Nächste Seite | Inhaltsverzeichnis | Index ]