IBM Books
(C) IBM Corp. 2000

DB2 Extension Net Search - Guide d'administration et d'utilisation

Création d'un index de texte

Sélectionnez la commande Créer, mettez en évidence Index de Texte dans le menu développé, l'assistant Création d'index de texte apparaît. Cet assistant permet de spécifier les options de configuration pour l'index de texte dans un certain nombre de panneaux.

Pour passer d'un panneau à l'autre, entrez toutes les informations obligatoires et cliquez sur le bouton Suivant jusqu'à ce que le bouton Fin soit activé. Cliquez sur le bouton Fin pour créer l'index de texte.

Pour créer un index de texte sur des vues, utilisez la commande CREATE INDEX décrite à la section CREATE INDEX.

Ecran Nom

Cet écran permet de spécifier le schéma et le nom de l'index de texte. Vous pouvez également spécifier un répertoire de travail et d'index pour les fichiers d'index de texte. Créez les tables administratives pour l'index sur l'espace table d'administration.

Figure 10. Assistant Création d'index texte : écran Nom

Assistant Création d'index texte : écran Nom

Ci-dessous figure la description des zones de cet écran.

Tableau 1. Zones texte de l'écran Nom

Nom de la zone Obligatoire/ Facultatif Valeur par défaut Description
Schéma d'index Obligatoire ID utilisateur Sélectionnez un nom de schéma de l'index de texte. Il s'agit du nom de schéma DB2 pour les tables d'administration spécifiques à l'index.
Nom d'index Obligatoire N/A Entrez un nom d'index DB2 valide pour l'index de texte. Avec le schéma d'index, il identifie de manière unique un index en texte intégral dans la base de données.
Répertoire d'index Facultatif Voir le chemin d'accès Spécifiez le chemin d'accès au répertoire dans lequel l'index de texte serra stocké. Le répertoire doit exister avec des droits d'accès en lecture, écriture et exécution pour l'ID utilisateur du propriétaire d'instance DB2.
Répertoire de travail Facultatif Voir le chemin d'accès Spécifiez le répertoire de travail dans lequel les fichiers temporaires seront stockés pendant les opérations de recherche et d'administration. Le répertoire doit exister avec des droits d'accès en lecture, écriture et exécution pour l'ID utilisateur du propriétaire d'instance DB2.
Espace table d'administration Facultatif Utilisez l'espace table par défaut Sélectionnez un nom d'espace table pour les tables d'administration de l'index de texte. Vous devez définir l'espace de table sur le même groupe de noeuds que l'espace table pour la table utilisateur.

Ecran Cible

Cet écran permet de spécifier le schéma et le nom de la table ou de la table d'alias de type nickname, ainsi que le nom de la colonne de texte contenant les données à indexer. Il est possible d'utiliser une fonction de transformation pour modifier le contenu de la colonne de texte. En plus de la colonne de texte, vous pouvez également spécifier des attributs numériques si vous souhaitez indexer le contenu de l'expression d'une colonne de table.

Figure 11. Assistant Création d'index texte : écran Cible

Assistant Création d'index texte : écran Cible

Ci-dessous figure la description des zones de cet écran.

Tableau 2. Zones texte de l'écran Cible

Nom de la zone Obligatoire/ Facultatif Valeur par défaut Description
Schéma de la table (1) Obligatoire ID utilisateur Sélectionnez le schéma de la table ou de la table d'alias de type nickname sur laquelle vous créez un index de texte.
Nom de la table (2) Obligatoire N/A Sélectionnez le nom de la table ou de la table d'alias de type nickname sur laquelle vous créez un index. La table doit comporter une clé primaire.
Colonne texte (3) Obligatoire N/A Sélectionnez le nom de la colonne utilisée pour la création de l'index de texte. La colonne doit être ou être transformée dans l'un des types suivants : CHAR (pour données binaires), VARCHAR (pour données binaires), LONG VARCHAR (pour données binaires), CLOB, DBCLOB, BLOB, GRAPHIC, VARGRAPHIC, LONG VARGRAPHIC et DATALINK.
Fonction de transformation Facultatif Désactivée Cochez cette case pour utiliser une fonction de transformation.
Fonction de transformation: Schéma Obligatoire (si la fonction est sélectionnée) ID utilisateur Sélectionnez le schéma de la fonction UDF utilisée pour accéder aux documents texte.
Fonction de transformation: Nom Comme ci-dessus. N/A Sélectionnez le nom de la fonction UDF utilisée pour accéder aux documents texte.

Notez que vous ne pouvez spécifier que le schéma de table (1), le nom de table (2) et la colonne de texte (3), dans cet ordre.

Figure 12. Boîte de dialogue Attributs numériques

Boîte de dialogue Attributs numériques

Pour afficher ou ajouter des attributs, cliquez sur le bouton Attributs numériques. Une fenêtre s'ouvre. Pour ajouter des attributs numériques à l'index, cliquez sur le bouton Ajout. Une seconde fenêtre s'ouvre. Spécifiez l'expression et le nom de la colonne SQL pour l'attribut.

Vous pouvez également sélectionner un attribut et appuyer sur les boutons appropriés pour modifier, déplacer ou supprimer une entrée.

Explication des attributs numériques

Les attributs numériques permettent d'indexer des expressions de colonne en plus de la colonne de texte. Par exemple, si vous souhaitez indexer la date de la colonne de type TIMESTAMP en plus de la colonne de texte, indiquez un attribut numérique "cast(julian_day(date) as double)" et un nom pour l'attribut.

Spécifiez un attribut numérique si vous souhaitez utiliser une expression numérique dans une requête de recherche. Si vous effectuez des recherches à l'aide de requêtes SQL, vous pouvez utiliser une recherche combinée, au lieu d'attributs numériques, par exemple : WHERE numattrib = 123 AND contains('...').

Ecran Propriétés de type texte

Cet écran permet de spécifier la langue et le format des documents texte. Si les documents n'ont pas le même CCSID que la base de données et que la colonne de texte est de type binaire, spécifiez le CCSID. Notez que celui de la base de données est initialement sélectionné. Si vos documents sont de format structuré GPP, HTML, Outside-In ou XML, vous pouvez spécifier un modèle de document.

Remarque

Dans la boîte à liste de format, le format de filtrage Outside-In est aussi connu sous le nom d'INSO.

Figure 13. Assistant Création d'index texte : écran Propriétés de type texte

Assistant Création d'index texte : écran Propriétés de type texte

Ci-dessous figure la description des zones de cet écran.

Tableau 3. Zones texte de l'écran Propriétés de type texte

Nom de la zone Obligatoire/ Facultatif Valeur par défaut Description
Langue Facultatif EN_US Sélectionnez une langue afin de définir les délimiteurs de fin de phrase et de fin de paragraphe lors de l'indexation des documents.
CCSID Facultatif CCSID de la base de données Sélectionnez le CCSID pour l'indexation des documents texte.
Format Facultatif TEXT Sélectionnez le format du document texte : HTML, XML, TEXT, INSO ou GPP.
Modèle de document par défaut Facultatif Activé Utilisez le modèle de document par défaut.
Modèle de document utilisateur Facultatif Désactivé Utilisez le modèle de votre document.
Nom du modèle Obligatoire (si l'option Modèle de document utilisateur est sélectionnée) N/A Entrez le nom du modèle de document. Pour les formats HTML, XML, Outside-In et GPP, vous pouvez spécifier un modèle de document. Notez que le nom ne figure que dans le fichier du modèle.
Fichier du modèle Comme ci-dessus. N/A Spécifiez le fichier du modèle de document. Le fichier doit être lisible par les propriétaires d'instance DB2.
CCSID du modèle Comme ci-dessus. CCSID de la base de données Sélectionnez le CCSID pour interpréter le contenu du fichier du modèle de document.
Considérer les nombres comme des mots Facultatif Désactivé Cochez cette case pour que les séquences de chiffres soient interprétées comme des mots distincts, même si elles sont accolées à des caractères.
Mots vides de l'index Facultatif Activé Cochez cette case pour activer le traitement des mots vides spécifiques à la langue. Le fichier <langue>.tsw dans le répertoire sqllib/db2ext/resources contient la liste des mots vides.

Ecran Mise à jour des caractéristiques

Cet écran permet de spécifier si l'index est mis à jour de manière incrémentielle ou s'il est totalement recréé. Vous pouvez définir les paramètres de mise à jour de telle sorte que l'index se mette à jour automatiquement au moment spécifié.

Figure 14. Assistant Création d'index texte : écran Mise à jour des caractéristiques

Assistant Création d'index texte : écran Mise à jour des caractéristiques

Ci-dessous figure la description des zones de cet écran.

Tableau 4. Zones texte de l'écran Mise à jour des caractéristiques

Nom de la zone Obligatoire/ Facultatif Valeur par défaut Description
Mise à jour incrémentielle Facultatif Activé Cochez cette case pour que l'index soit mis à jour de manière incrémentielle. Si vous ne la cochez pas, l'index sera recréé chaque fois qu'une opération de mise à jour est effectuée.
Nombre de validations Facultatif 0 Nombre de modifications traitées au cours d'une mise à jour dans une transaction.

Le nombre de validations a des effets sur les performances. Pour plus d'informations, reportez-vous à la section Remarques sur les performances.

Caractéristiques de la table de capture Facultatif N/A Cette option permet d'utiliser une table de capture de réplication pour capturer les modifications sur la table source. La table de capture de réplication doit être une table CD (capture des données) ou une table CCD (capture des modifications de données).
Nom du schéma de capture de réplication Facultatif ID utilisateur Nom du schéma de la table de capture de réplication. Notez que la table doit d'abord avoir été créée à l'aide de la réplication DB2.
Nom de la table de capture de réplication Obligatoire, si l'option Caractéristiques de la table de capture est activée N/A Nom de la table de capture de réplication. Notez que la table doit d'abord avoir été créée à l'aide de la réplication DB2.
Nom du schéma de la table de contrôle Obligatoire, si l'option Caractéristiques de la table de capture est activée N/A Nom du schéma de la table de contrôle. Notez que les tables doivent d'abord avoir été créées à l'aide de la réplication DB2.
Réorganisation Automatique ou Manuelle Facultatif ou Obligatoire Activé/ Désactivé Ces boutons d'option permettent d'effectuer automatiquement ou manuellement la réorganisation de l'index.
Nombre minimal de modifications dans la mise à jour Facultatif 1 Spécifiez le nombre minimal de modifications des documents texte avant que l'index ne soit mis à jour de manière incrémentielle au moment spécifié.
Programmation de la mise à jour Facultatif Désactivée Cochez cette case pour ajouter des paramètres de mise à jour automatique.

Pour ajouter des paramètres de mise à jour de l'index, cliquez sur le bouton Paramètres. Notez que ce bouton est uniquement activé si vous sélectionnez Programmation de la mise à jour. Dans la boîte de dialogue, sélectionnez les jours, les heures et les minutes pour la mise à jour. Notez que si vous sélectionnez plusieurs jours, la mise à jour a lieu à la même heure, tous les jours sélectionnés.

Ecran Table de mémoire cache

Cet écran permet de spécifier une table mise en cache en plus de l'index. Vous pouvez spécifier la mise en mémoire cache des colonnes de résultats et vous pouvez effectuer la recherche sur la mémoire cache à l'aide d'une procédure mémorisée. D'autres paramètres de mémoire cache peuvent également être spécifiés, par exemple le type, la taille maximale et l'ordre dans lequel le contenu de la table utilisateur est extrait au cours de l'indexation initiale.

Figure 15. Assistant Création d'index texte : écran Table de mémoire cache

Assistant Création d'index texte : écran Table de mémoire cache

Ci-dessous figure la description des zones de cet écran.

Tableau 5. Zones texte de l'écran Table de mémoire cache

Nom de la zone Obligatoire/ Facultatif Valeur par défaut Description
Activer la mémoire cache de la table Facultatif Désactivé Cochez cette case pour activer la génération d'une table mise en cache.
Table de colonne de résultats Obligatoire (si la case Activer la mémoire cache de la table est cochée) N/A Affiche la liste des expressions de la colonne SQL spécifiant les colonnes de résultats de la recherche.
Nombre maximal de documents Obligatoire Nombre de lignes d'une table Voir la section suivante : Détermination de l'utilisation et de la taille de la mémoire cache.
Longueur moyenne de ligne de cache Obligatoire N/A Voir la section suivante : Détermination de l'utilisation et de la taille de la mémoire cache.
Pourcentage d'utilisation initiale de la mémoire cache Facultatif 50% Sélectionnez le pourcentage de mémoire cache, gardé disponible pour les documents supplémentaires.
Taille de la mémoire cache maximale Facultatif N/A Spécifiez la taille maximale de la table mise en cache générée pendant l'activation de l'index. Si la valeur est trop faible, l'activation échouera.
Ordre initial d'affichage des résultats de la recherche Facultatif Désactivé Cochez cette case pour définir l'ordre d'affichage des résultats de la recherche. Les documents sont renvoyés dans le même ordre d'indexation que celui de la table placée en mémoire cache. Cet ordre ne peut pas être garanti après une mise à jour incrémentielle.
Utiliser la mémoire cache persistante Facultatif Activé Cette option permet une exécution rapide de l'activation, après une désactivation ou un réamorçage du système. Notez que vous devez spécifier le chemin d'accès au répertoire pour la mémoire cache persistante. N'activez pas cette option si la mémoire cache doit être temporaire.
Détermination de l'utilisation et de la taille de la mémoire
cache

La valeur Pourcentage d'utilisation initiale de la mémoire cache indique le pourcentage de mémoire cache libre pour des documents supplémentaires. La valeur Taille de la mémoire cache maximale indique la taille maximale de la table mise en cache devant être générée pendant l'activation du cache. Ces options dépendent des facteurs suivants :

  • Le nombre réel de documents présents dans la table.
  • Le nombre attendu de mises à jour.
  • La taille moyenne des expressions SQL à mettre en cache.

Vous pouvez entrer les valeurs recommandées pour le Pourcentage d'utilisation initiale de la mémoire cache et la Taille de la mémoire cache maximale. Vous pouvez également les laisser être calculées chaque fois que vous entrez des valeurs dans les zones Nombre maximal de documents ou Longueur moyenne de ligne de cache.

La valeur Nombre maximal de documents est initialement définie au nombre de lignes de la table. Modifiez cette valeur en fonction du nombre de documents et du nombre de modifications attendues. Incluez toutes les mises à jour, ajouts et suppressions de documents.

Lorsque vous ajoutez une expression SQL à la liste de table de mémoire cache, la valeur Longueur moyenne de ligne de cache est calculée en fonction de la longueur du résultat. Comme le nombre de lignes de votre table est pris en considération, le calcul peut prendre beaucoup de temps. Si vous savez qu'en moyenne, cette valeur est plus petite, modifiez-la.

Par exemple, si votre table comporte 10 entrées et que la somme des expressions de colonne est 100, cela signifie que ces valeurs sont initialement définies. Si vous vous attendez à ce que le nombre maximal de documents (y compris ceux qui ont été supprimés) soit égal à 10 000, entrez ce nombre. Si vous savez que les expressions de colonne en moyenne sont inférieures à la valeur calculée, par exemple VARCHAR(100) et une taille de texte plein de 10, utilisez ce nombre comme taille de ligne moyenne.

Pour définir l'ordre initial d'affichage des résultats de la recherche, cliquez sur le bouton Définition. Notez que ce bouton n'est disponible que si vous avez coché la case Ordre initial d'affichage des résultats de la recherche. Une boîte de dialogue affiche toutes les expressions de la colonne SQL spécifiée. Pour ajouter un ordre d'affichage, cliquez sur le bouton Ajouter, puis dans la boîte de dialogue, spécifiez l'ordre d'affichage des résultats SQL.

Pour modifier, déplacer ou supprimer une entrée, sélectionnez l'expression et cliquez sur les boutons appropriés.

Figure 16. Boîte de dialogue Ordre initial d'affichage des résultats de la recherche

Boîte de dialogue Ordre initial d'affichage des résultats de la recherche

Pour ajouter des expressions de la colonne SQL, cliquez sur le bouton Ajouter, en regard de la table Colonne de résultats. Dans la boîte de dialogue, spécifiez l'expression et le nom de la colonne de résultats.

Pour modifier ou déplacer une entrée, cliquez sur l'expression de colonne qui active les boutons appropriés.

Figure 17. Boîte de dialogue Modification d'une expression de colonne

Boîte de dialogue Modification d'une expression de colonne

Ecran Récapitulatif

Cet écran présente un aperçu des paramètres précédemment sélectionnés.

Figure 18. Assistant Création d'index texte : écran Récapitulatif

Assistant Création d'index texte : écran Récapitulatif

Cliquez sur le bouton Afficher la commande pour afficher les commandes exécutées lorsque vous cliquez sur le bouton Fin. Cette action aboutit à la création de l'index de texte.


[ Début de page | Page précédente | Page suivante | Table des matières | Index ]