Mit einem Dokumentmodell können Sie Abschnitte von Dokumenten angeben, die entweder zu einem bestimmten Textfeld gehören oder ein Dokumentattribut darstellen sollen, oder beides.
Der Text eines Dokuments wird vollständig indexiert, ungeachtet dessen, ob er Teil eines Textfelds ist oder nicht. Wenn das Dokumentmodell Text als zu einem Textfeld gehörig definiert, wird der Text als Teil des Textinhalts des Dokuments betrachtet und auf herkömmliche Weise indexiert. Dies bedeutet also, dass aussagekräftige Begriffe extrahiert und im Index gespeichert werden. Dies wiederum bedeutet, dass uneingeschränkte Textsuchvorgänge auch ein Durchsuchen dieses Texts beinhalten.
Auf diese Weise können Sie in einem bestimmten Feld selektiv nach Text suchen. Sie können z. B. im Textfeld Abstract nach Dokumenten suchen, die das Wort structure enthalten.
Ein Textfeld kann in einem Dokument mehr als einmal auftreten. Sie können z. B. ein Textfeld definieren, das alle Abbildungsunterschriften enthält. Ein Textfeld kann sogar ein anderes Textfeld überlappen.
Wenn Sie den Inhalt bestimmter Textfelder nicht indexieren möchten, können Sie eine Felddefinition angeben, die exclude="YES" enthält. Unter Begrenzungen für Textfelder und Dokumentattribute finden Sie eine Liste mit Begrenzungen für Textfelder und Dokumentattribute.
Dokumentattribute enthalten kurze, formatierte Informationen des Typs number. Zum Durchsuchen von Dokumenten mit diesen Attributen können Sie Wertebereiche verwenden.
Attribute werden nicht mit indexierten Textelementen sondern in einem separaten Elementindex gespeichert. Wenn Sie also auf der Basis des Inhalts eines Attributs nach Dokumenten suchen möchten, müssen Sie eine Attributsuche explizit für das Attribut durchführen.
Net Search Extender stellt einen Parser zur Verfügung, der Gleitkommazahlen erkennt. Im Folgenden sind Beispiele korrekter und inkorrekter Formate für ganzzahlige Werte aufgeführt.
Korrektes Format | Inkorrektes Format |
---|---|
1000 1 000 1.000 - Hierbei ist der Punkt eine Dezimalzeichen |
1,000 |
100 000 100 000.00123 |
1 000 000 - Zwei Leerzeichen zwischen 1 und 0 |
Beachten Sie, dass keine Leerzeichen im Dezimalbereich einer Zahl erlaubt sind. So wird z. B. die Zahl 1 000.000 100 wie zwei separate Zahlen behandelt: 1000.000 und 100.
Sprachspezifische Trennzeichen und länderspezifische Währungsformate werden nicht unterstützt.