文書モデルを使用することにより、文書の特定の部分またはセクションを、 特定のテキスト・フィールドに属するもの、または文書属性、 あるいはその両方として識別できます。
文書のテキストは、テキスト・フィールドの一部であるかどうかに関係無く、 完全に索引付けされます。 文書モデルがテキストをテキスト・フィールドに属していると識別すると、 そのテキストは文書のテキストの内容の一部であると見なされ、 通常の方法で索引が付けられます。 つまり、意味のある用語は抽出されて索引に保管されます。 したがって、テキスト検索に制約がない場合、そのテキストは検索の対象となります。
このように、特定のフィールドのテキストを選択的に検索することが可能です。 たとえば、structure というワードを テキスト・フィールド Abstract に持つ文書を検索することができます。
1 つの文書に同じテキスト・フィールドが複数回出現してもかまいません。 たとえば、すべての図のキャプションに適用されるテキスト・フィールドを定義することができます。 あるテキスト・フィールドが別のテキスト・フィールドにオーバーラップすることもあります。
特定のテキスト・フィールドの内容に索引付けをしないようにしたい場合は、 exclude="YES" を含むフィールド定義を指定できます。 テキスト・フィールドおよび文書属性の制限のリストが、 テキスト・フィールドおよび文書属性の制限に示されています。
文書属性には、number というタイプの短い定様式の情報が組み込まれています。 この属性を含む文書の検索には、値の範囲を使用できます。
属性は索引テキストとともには保管されず、別個の項目索引に保管されます。 そのため、属性の内容で文書を検索するには、属性を明示的に指定した属性検索を行う必要があります。
Net Search Extender には浮動小数点数を認識するパーサーが備わっています。
整数値のフォーマットの正しい例と誤った例を以下に示します。
表 6. サポートされる文書フォーマットに対するデフォルトの文書モデルの動作
正しいフォーマット | 誤ったフォーマット |
---|---|
1000 1 000 1.000 - ピリオドは小数点文字 | 1,000 |
100 000 100 000.00123 |
1 000 000 - 1 と 0 の間にスペースが 2 つ |
数値の小数部にはスペース文字を使用することができないことに注意してください。 たとえば、1 000.000 100 は 2 つの数 1000.000 と 100 であるものとして扱われます。
言語固有の区切り記号および言語固有の通貨フォーマットはサポートされていません。