IBM Books
(C) IBM Corp. 2000

Net Search Extender 管理およびユーザーズ・ガイド

テキスト索引の作成

作成コマンドを選択し、 拡張メニューで「テキスト索引」を強調表示します。 「テキスト索引の作成ウィザード」がポップアップ表示されます。 このウィザードのいくつかのパネルを使用して、 テキスト索引の構成オプションを指定します。

パネル間を移動するには、 「完了」ボタンが使用可能になるまで、 すべての必須情報を入力して、 「次へ」ボタンをクリックします。 テキスト索引を作成するには、 「完了」ボタンをクリックします。

ビューにテキスト索引を作成するには、 CREATE INDEXで説明されている CREATE INDEX コマンドを使用します。

「名前」パネル

このパネルによって、テキスト索引のスキーマと名前を指定できます。 テキスト索引ファイルのための作業ディレクトリーと索引ディレクトリーも指定できます。 管理表スペース上に、索引の管理表を作成します。

図 10. 「テキスト索引の作成ウィザード」:「名前」パネル

「テキスト索引の作成ウィザード」:「名前」パネル

次は、パネル内の各フィールドについての説明です。

表 1. 「名前」パネルのテキスト・フィールド

フィールド名 必須/オプション デフォルト 説明
索引スキーマ 必須 ユーザー ID テキスト索引のスキーマ名を選択します。 これは、索引固有の管理表の DB2 スキーマ名です。
索引名 必須 N/A テキスト索引用の有効な DB2 索引名を入力します。 この名前は、索引スキーマと共にデータベース内のフルテキスト索引を一意に識別します。
索引ディレクトリー オプション パス名を参照 テキスト索引の保管先ディレクトリー・パスを指定します。 このディレクトリーは、 DB2 インスタンス所有者のユーザー ID に対する読み取り/書き込み/実行の各権限付きで存在している必要があります。
作業ディレクトリー オプション パス名を参照 検索操作と管理操作中に一時ファイルを保管先作業ディレクトリーを指定します。 このディレクトリーは、 DB2 インスタンス所有者のユーザー ID に対する読み取り/書き込み/実行の各権限付きで存在している必要があります。
管理表スペース オプション デフォルトの表スペースを使用 テキスト索引の管理表の表スペース名を選択します。 この表スペースは、 ユーザー表の表スペースと同じノード・グループ上に定義する必要があります。

「ターゲット」パネル

このパネルによって、表またはニックネーム表のスキーマと名前、 および索引付けしたいデータを含むテキスト列の名前を指定できます。 トランスフォーメーション機能を使用して、 テキスト列の内容を変更できます。 テキスト列に加えて、表の列式の内容に索引付けしたい場合には、 数値属性を指定することもできます。

図 11. 「テキスト索引の作成ウィザード」:「ターゲット」パネル

「テキスト索引の作成ウィザード」:「ターゲット」パネル

次は、パネル内の各フィールドについての説明です。

表 2. 「ターゲット」パネルのテキスト・フィールド

フィールド名 必須/オプション デフォルト 説明
表スキーマ (1) 必須 ユーザー ID テキスト索引を作成している表またはニックネーム表のスキーマを選択します。
表名 (2) 必須 N/A 索引を作成している表またはニックネーム表の名前を選択します。 表には、主キーが必要です。
テキスト列 (3) 必須 N/A テキスト索引を作成するために使用する列の名前を選択します。 列は、以下のいずれかのタイプにトランスフォームするか、 またはそのいずれかのタイプである必要があります。 すなわち、CHAR (ビット・データの場合)、 VARCHAR (ビット・データの場合)、LONG VARCHAR (ビット・データの場合)、 CLOB、DBCLOB、BLOB、 GRAPHIC、 VARGRAPHIC、 LONG VARGRAPHIC、および DATALINK。
トランスフォーメーション機能 オプション 使用不可 変換関数を使用するために選択します。
トランスフォーメーション機能: スキーマ 必須 (機能が選択されている場合) ユーザー ID テキスト文書にアクセスするために使用する UDF のスキーマを選択します。
トランスフォーメーション機能: 名前 同上 N/A テキスト文書にアクセスするために使用する UDF の名前を選択します。

「表スキーマ (1)」、「表名 (2)」、および「テキスト列 (3)」は、この順序でのみ指定できます。

図 12. 「数値属性」ダイアログ

「数値属性」ダイアログ

属性を表示または追加するには、 「追加の数値属性」ボタンをクリックします。 ウィンドウが表示されます。 数値属性を索引に追加するには、 「追加」ボタンをクリックします。 すると、さらにウィンドウが表示されます。 SQL 列式と属性の名前を指定します。

別の方法では、属性を選択し、該当するボタンを押して、項目を変更、移動または除去します。

数値属性の説明

テキスト列に加えて、列式に索引付けしたい場合には、 数値属性を指定します。 例:テキスト列に加えて、 タイプ TIMESTAMP の列日付に索引付けしたい場合は、 数値属性 "cast(julian_day(date) as double)" を指定し、 属性の名前を指定します。

検索照会内で数値表現を使用したい場合は、数値属性を指定します。 SQL 照会を使用して検索する場合は、 数値属性を使用する代わりに結合検索を使用できます。 例:WHERE numattrib = 123 AND contains('...') のようにします。

「テキスト・プロパティー」パネル

このパネルによって、テキスト文書の言語とフォーマットを指定できます。 文書がデータベースと同じ CCSID でなく、 テキスト列がバイナリー形式の場合には、 その CCSID を指定します。 データベースの CCSID は、最初に選択していることに注意してください。 文書が GPP、HTML、Outside-In、 または XML 構造化フォーマットであれば、文書モデルを指定できます。

フォーマット・リスト・ボックスでは、Outside-In フィルター・フォーマットは INSO と記載されています。

図 13. 「テキスト索引の作成ウィザード」:「テキスト・プロパティー」パネル

「テキスト索引の作成ウィザード」:「テキスト・プロパティー」パネル

次は、パネル内の各フィールドについての説明です。

表 3. 「テキスト・プロパティー」パネルのテキスト・フィールド

フィールド名 必須/オプション デフォルト 説明
言語 オプション EN_US 言語を選択することによって、文書に索引を付ける場合に、 文の終わりと段落の終わりの区切り文字を判別できるようにします。
CCSID オプション データベースの CCSID テキスト文書に索引を付けるための CCSID を選択します。
フォーマット オプション TEXT HTML、XML、TEXT、INSO、または GPP からテキスト文書フォーマットを選択します。
デフォルトの文書モデル オプション 使用可能 デフォルトの文書モデルを使用します。
ユーザー文書モデル オプション 使用不可 ユーザーの文書モデルを使用します。
モデル名 必須 (ユーザー文書モデルが選択されている場合) N/A 文書モデルの名前を入力します。 HTML、XML、Outside-In、および GPP フォーマットの場合は、文書モデルを指定できます。 名前は、モデル・ファイル内でのみ検出されることに注意してください。
モデル・ファイル 同上 N/A 文書モデル・ファイルを指定します。 ファイルは DB2 インスタンス所有者にとって、読み取り可能でなければなりません。
モデル CCSID 同上 データベースの CCSID CCSID を選択して、文書モデル・ファイルの内容を解釈できるようにします。
数字をワードとして処理する オプション 使用不可 数字のシーケンスを、文字に隣接している場合でも、別個のワードとして解釈するために選択します。
索引ストップワード オプション 使用可能 言語特有のストップワード処理を使用可能にするために選択します。 ディレクトリー sqllib/db2ext/resources 内の <language>.tsw に、 ストップワード・リストが含まれています。

「特性の更新」パネル

このパネルによって、索引を増大して更新するか、 または最初から再作成するかを指定できます。 指定した時刻に索引が自動的に更新されるように更新設定を指定できます。

図 14. 「テキスト索引の作成ウィザード」:「特性の更新」パネル

「テキスト索引の作成ウィザード」:「特性の更新」パネル

次は、パネル内の各フィールドについての説明です。

表 4. 「特性の更新」パネルのテキスト・フィールド

フィールド名 必須/オプション デフォルト 説明
インクリメンタル更新 オプション 使用可能 インクリメンタル索引更新用に選択します。 チェック・ボックスを使用可能にしない場合は、 更新操作が実行されるときに索引を再作成してください。
コミット・カウント オプション 0 1 つのトランザクションでの更新中に処理される変更の数。

コミット・カウントはパフォーマンスに影響します。 詳しくは、パフォーマンスに関する考慮事項を参照してください。

表特性のキャプチャー オプション N/A ソース表の変更をキャプチャーするために、 レプリケーション・キャプチャー表を使用する場合に選択します。 レプリケーション・キャプチャー表は、 変更データ (CD) 表か整合変更データ (CCD) 表のいずれかでなければならず、 DB2 Net Search Extender 生成のログ表を置き換えます。
スキーマ名のレプリケーション・キャプチャー オプション ユーザー ID レプリケーション・キャプチャー表のスキーマ名。 表は、DB2 レプリケーションを使用して事前に作成しておく必要があります。
表名のレプリケーション・キャプチャー 「表特性のキャプチャー」が使用可能になっている場合は必須 N/A レプリケーション・キャプチャー表の表名 表は、DB2 レプリケーションを使用して事前に作成しておく必要があります。
表のスキーマ名の制御 「表特性のキャプチャー」が使用可能になっている場合は必須 N/A 表のスキーマ名の制御。 表は、DB2 レプリケーションを使用して事前に作成しておく必要があります。
REORG (「自動」または「手動」ラジオ・ボタン) オプションまたは必須 使用可能/使用不可 索引再編成を自動または手動で実行します。
更新のための変更の最小数 オプション 1 指定された時刻に索引をインクリメンタル更新するには、 テキスト文書に少なくともいくつの変更が加えられていることが必要かを指定します。
更新スケジュール オプション 使用不可 自動更新設定値を追加するために選択します。

索引更新の設定値を追加するには、 「設定」ボタンをクリックします。 このボタンは、「更新スケジュール」を選択した場合のみ使用可能になります。 ダイアログで、更新時刻の日、時、分を選択します。 複数の日を選択した場合、 更新は選択したすべての日の同じ時刻に行われます。

「キャッシュ表」パネル

このパネルによって、索引に加えてキャッシュ表を指定できます。 キャッシュする結果列を指定することができます。 キャッシュは、ストアード・プロシージャーを使用して検索できます。 タイプ、最大サイズ、および初期索引作成時にユーザー表の内容を検索する順序などの、 他のキャッシュ・パラメーターも指定できます。

図 15. 「テキスト索引の作成ウィザード」: 「キャッシュ表」パネル

「テキスト索引の作成ウィザード」: 「キャッシュ表」パネル

次は、パネル内の各フィールドについての説明です。

表 5. 「結果キャッシュ (Result Cache)」パネルのテキスト・フィールド

フィールド名 必須/オプション デフォルト 説明
表キャッシュを使用可能にする オプション 使用不可 キャッシュ表の作成を使用可能にするために選択します。
結果列表 (Result column table) 必須 (「表キャッシュを使用可能にする」が選択されている場合) N/A 検索結果列を指定する SQL 列式のリストが表示されます。
文書の最大数 必須 表の行数 『キャッシュ使用率およびキャッシュ・サイズの決定』のセクションを参照してください。
平均キャッシュ行長 必須 N/A 『キャッシュ使用率およびキャッシュ・サイズの決定』のセクションを参照してください。
初期キャッシュ使用率のパーセンテージ オプション 50% 追加の文書のためにフリーにしておくキャッシュのパーセンテージを選択します。
最大キャッシュ・サイズ オプション N/A 索引をアクティブにするときに作成するキャッシュ表の最大サイズを指定します。 この数値が小さすぎると、アクティブ化は失敗します。
初期検索結果順序 オプション 使用不可 検索結果の順序の定義を選択します。 文書はキャッシュ表内と同じ索引付け順序で戻されます。 この順序は、インクリメンタル更新後には保証されません。
永続キャッシュの使用 オプション 使用可能 このオプションは、非アクティブ化またはシステム・リブート後の高速アクティブ化の実行を可能にします。 永続キャッシュにはディレクトリー・パスを指定する必要があることに注意してください。 キャッシュを一時的なものにする必要がある場合は、使用不可にしておいてください。
キャッシュ使用率およびキャッシュ・サイズの決定

「初期キャッシュ使用率のパーセンテージ」は、 追加の文書のためにフリーにしておくキャッシュのパーセンテージを指定します。 「最大キャッシュ・サイズ」は、 キャッシュのアクティブ化の際に作成するキャッシュ表の最大サイズを指定します。 これらのオプションは、以下の要因によって異なります。

  • 表にある実際の文書数。
  • 予想更新数。
  • キャッシュに入れたい SQL 式の平均サイズ。

「初期キャッシュ使用率のパーセンテージ」および「最大キャッシュ・サイズ」に推奨値を入力できます。 あるいは、「文書の最大数」または「平均キャッシュ行長」に値を入力するたびに、 再計算させることもできます。

「文書の最大数」の値は、最初は、表の行数に設定されます。 この値は、文書の数および予想変更数に従って変更してください。 文書のすべての更新数、追加数、および削除数を含めます。

キャッシュ表リストに SQL 式を追加する場合は、結果の長さに従って、 「平均キャッシュ行長」が計算されます。 これは表の中の行数を基にしているため、 計算に相当の時間を要することがあります。 この平均値が小さい場合は、値を変更してください。

たとえば、表に 10 個の項目があり、 列式の合計が 100 である場合は、これらの値を最初に設定します。 文書の最大数 (削除された文書を含む) が 10 000 であると予測した場合は、 その数値を入力します。 平均の列式の数が、VARCHAR(100) などの計算値より小さく、 テキスト・サイズが 10 と入力されている場合は、 平均行サイズとしてこの計算値を使用します。

初期検索結果順序を定義するには、 「定義」ボタンをクリックします。 このボタンは、「初期検索結果順序」チェック・ボックスを選択した場合のみ使用可能であることに注意してください。 ダイアログに、すべての指定した SQL 列式が表示されます。 結果順序を追加するには、 「追加」ボタンをクリックし、 ダイアログで SQL の結果順序を指定します。

項目を変更、移動、または除去するには、 式を選択し、該当するボタンをクリックします。

図 16. 「初期検索結果順序」ダイアログ

「初期検索結果順序」ダイアログ

SQL 列式を追加するには、 「結果列表 (Result Column table)」の横の「追加」ボタンをクリックします。 ダイアログで、結果列の式と名前を指定します。

項目を変更または除去するには、列式をクリックします。 すると、該当するボタンが使用可能になります。

図 17. 「列式の変更」ダイアログ

「列式の変更」ダイアログ

「サマリー」パネル

このパネルは、以前に選択したパラメーターの概要を示します。

図 18. 「テキスト索引の作成ウィザード」:「サマリー」パネル

「テキスト索引の作成ウィザード」:「サマリー」パネル

「コマンドの表示」ボタンをクリックすると、 「完了」ボタンをクリックしたときに実行されるコマンドが表示されます。 このアクションによって、テキスト索引が作成されます。


[ ページのトップ | 前ページ | 次ページ | 目次 | 索引 ]