IBM Books
(C) IBM Corp. 2000

Net Search Extender 管理およびユーザーズ・ガイド

テキスト・フィールドおよび文書属性

文書モデルを使用することにより、文書の特定の部分またはセクションを、 特定のテキスト・フィールドに属するもの、または文書属性、 あるいはその両方として識別できます。

テキスト・フィールド

文書のテキストは、テキスト・フィールドの一部であるかどうかに関係無く、 完全に索引付けされます。 文書モデルがテキストをテキスト・フィールドに属していると識別すると、 そのテキストは文書のテキストの内容の一部であると見なされ、 通常の方法で索引が付けられます。 つまり、意味のある用語は抽出されて索引に保管されます。 したがって、テキスト検索に制約がない場合、そのテキストは検索の対象となります。

このように、特定のフィールドのテキストを選択的に検索することが可能です。 たとえば、structure というワードを テキスト・フィールド Abstract に持つ文書を検索することができます。

1 つの文書に同じテキスト・フィールドが複数回出現してもかまいません。 たとえば、すべての図のキャプションに適用されるテキスト・フィールドを定義することができます。 あるテキスト・フィールドが別のテキスト・フィールドにオーバーラップすることもあります。

特定のテキスト・フィールドの内容に索引付けをしないようにしたい場合は、 exclude="YES" を含むフィールド定義を指定できます。 テキスト・フィールドおよび文書属性の制限のリストが、 テキスト・フィールドおよび文書属性の制限に示されています。

文書属性

文書属性には、number というタイプの短い定様式の情報が組み込まれています。 この属性を含む文書の検索には、値の範囲を使用できます。

属性は索引テキストとともには保管されず、別個の項目索引に保管されます。 そのため、属性の内容で文書を検索するには、属性を明示的に指定した属性検索を行う必要があります。

名前属性

Net Search Extender には浮動小数点数を認識するパーサーが備わっています。 整数値のフォーマットの正しい例と誤った例を以下に示します。

表 6. サポートされる文書フォーマットに対するデフォルトの文書モデルの動作

正しいフォーマット 誤ったフォーマット
1000
1 000
1.000 - ピリオドは小数点文字
1,000
100 000
100 000.00123
1 000 000 - 1 と 0 の間にスペースが 2 つ

数値の小数部にはスペース文字を使用することができないことに注意してください。 たとえば、1 000.000 100 は 2 つの数 1000.000 と 100 であるものとして扱われます。

言語固有の区切り記号および言語固有の通貨フォーマットはサポートされていません。


[ ページのトップ | 前ページ | 次ページ | 目次 | 索引 ]