Für HTML- und XML-Dokumente stellt Net Search Extender Standarddokumentmodelle bereit, die verwendet werden, wenn Sie kein Dokumentmodell definieren. Für strukturierte einfache Textdokumente müssen Sie ein Dokumentmodell bereitstellen und angeben.
Wenn Sie eines der Standarddokumentmodelle verwenden, gelten folgende Regeln:
Tabelle 6. Funktionsweisen der Standarddokumentmodelle für die unterstützten Dokumentformate
Dokumenttyp | Funktionen des Standarddokumentmodells |
---|---|
HTML | Akzeptiert die folgenden Tags als Textfelder: <a>
<address> <au> <author> <h1> <h2> <h3>
<h4> <h5> <h6> <title>.
Feldname ist der Tagname, zum Beispiel "address". |
XML | Akzeptiert alle Tags als Textfelder.
Feldname ist der Tagpfadname in Xpath-Notation, zum Beispiel "/play/title". |
Strukturierter reiner Text (GPP) | Kein Standarddokumentmodell vorhanden. |
Outside-In (INSO) | Akzeptiert als Textfelder die Dokumentmerkmale unter Elementparameter, die von den Outside-In-Filtern zurückgegeben werden. Der Feldname ist der von Outside-In verwendete Name des Dokumentmerkmals, z. B. "SCCCA_TITLE". Es werden keine Attribute unterstützt. |
Für jeden Dokumenttyp wird ein Dokumentmodell definiert. Da die Modelle jeweils unterschiedlich sind, wird für jedes Modell ein Beispiel mit Erläuterung gegeben.
Anmerkung |
---|
Obwohl die Standarddokumentmodelle Dokumente korrekt verarbeiten, sollten Sie zur besseren Indexierung und Suche eigene Dokumentmodelle definieren. Mit dem Standarddokumentmodell wird der Text eines Dokuments vollständig indexiert, ungeachtet dessen, ob er Teil eines Textfelds ist oder nicht. Dies bedeutet, dass uneingeschränkte Textsuchen auch ein Durchsuchen dieses Texts beinhalten. |