IBM Books
(C) IBM Corp. 2000

DB2 Extension Net Search - Guide d'administration et d'utilisation


Glossaire

Ce glossaire donne une définition des termes et abréviations utilisés dans ce manuel. Si vous ne trouvez pas le terme que vous recherchez, reportez-vous à l'index ou à la Terminologie du traitement de l'information, New York : McGraw-Hill, 1994.

A

acivation (enable)
Préparation d'une base de données pour que DB2 Extension Net Search puisse l'utiliser.

API (API)
Interface de programme d'application.

argument de recherche (search argument)
Conditions spécifiées lors de la recherche, constituées d'un ou de plusieurs termes recherchés et de paramètres de recherche.

B

base de données partitionnée (partitioned database)
Base de données constituée de plusieurs parties, chacune étant gérée par un serveur de partition de base de données séparé.

C

caractère d'échappement (escape character)
Caractère indiquant que le caractère sous-jacent ne doit pas être interprété comme étant un caractère de masquage.

caractère de masquage (masking character)
Caractère de remplacement utilisé pour représenter un ou plusieurs caractères au début, au milieu ou à la fin d'une chaîne de recherche. Les caractères de masquage sont généralement employés pour retrouver les variantes d'un terme dans un index.

caractère générique (wildcard character)
Voir caractère de masquage.

caractéristiques d'un index (index characteristics)
Propriétés d'un index de texte déterminant :

la fréquence à laquelle l'index est mis à jour

la date de la première mise à jour d'index

CCSID (CCSID)
ID de jeu de caractères codés.

colonne de texte (text column)
Colonne contenant des documents texte.

configuration de texte (text configuration)
Paramètres par défaut pour un index, un texte et des valeurs de traitement.

correspondance étendue (extended matching)
Processus impliquant l'utilisation d'un dictionnaire pour mettre en évidence des termes qui ne sont pas des occurrences évidentes du terme recherché.

D

DBCS (DBCS)
jeu de caractères à deux octets.

déclencheur (trigger)
Mécanisme qui ajoute automatiquement des informations sur des documents devant être indexés dans une table de journalisation à chaque ajout, mise à jour ou suppression d'une colonne de texte.

désactivation (disable)
Restauration d'une base de données à l'état dans lequel elle se trouvait avant d'être activée pour DB2 Extension Net Search Text par retrait des éléments créés durant le processus d'activation.

descripteur de document (document handle)
Voir descripteur.

descripteur de fichier (file handle)
Voir descripteur.

descripteur (handle)
Valeur binaire qui identifie un document texte. Elle comprend :

un ID document

le nom et l'emplacement de l'index associé

les informations texte du document

Si le document est situé dans un fichier externe qui n'est pas sous le contrôle de DB2, il s'agit du chemin et du nom du fichier.

Un descripteur est créé pour chaque document texte dans une colonne texte lorsque cette colonne est activée pour une utilisation par DB2 Extension Net Search.

descripteur initialisé (initialized handle)
Descripteur, préparé en avance, contenant uniquement du format texte, la langue texte ou les deux.

détailler (refine)
Ajout de critères de recherche de la recherche précédente à d'autres critères pour réduire le nombre d'occurrences.

dictionnaire (dictionary)
Ensemble d'informations linguistiques dépendantes de la langue employée, qui sont utilisées par l'DB2 Extension Net Search lors des analyses de texte, de l'indexation, de l'extraction et de la mise en évidence de documents dans une langue spécifique.

document (document)
Voir document texte.

document texte (text document)
Texte de type CHAR, GRAPHIC, VARGRAPHIC, LONG VARGRAPHIC, DBCLOB, VARCHAR, LONG VARCHAR ou types de données CLOB, stocké dans une table DB2.

E

extension (expand)
Action d'ajouter des termes supplémentaires dérivés d'un thésaurus à un terme recherché.

extension (extender)
Voir Extensions DB2 (DB2 Extender).

Extensions DB2 (DB2 Extender)
Programme d'un groupe de programmes vous permettant de stocker et d'extraire les types de données autres que les données alphanumériques traditionnelles (par exemple, images, données audio et vidéo, documents complexes).

extraire (retrieve)
Rechercher un document texte utilisant un argument de recherche dans une des fonctions de recherche de DB2 Extension Net Search.

F

fichier externe (external file)
Document texte sous forme de fichier stocké dans le système de fichiers du système d'exploitation, plutôt que sous forme d'une cellule dans une table sous le contrôle de DB2.

flux de données (data stream)
Informations renvoyées par une fonction API, contenant du texte (au moins un paragraphe) avec le terme recherché et informations pour la mise en évidence du terme trouvé pour ce texte.

fonction d'accès (access function)
Fonction utilisateur permettant de convertir le type de données d'un texte stocké dans une colonne en un type pouvant être traité par DB2 Extension Net Search.

fonction définie par l'utilisateur (user-defined function)
Fonction SQL fournie par un utilisateur de DB2, en opposition avec une fonction SQL fournie par DB2.

fonction (function)
Voir fonction d'accès.

fonction UDF (UDF)
Fonction définie par l'utilisateur.

format (format)
Type de document, par exemple ASCII ou HTML.

fréquence de mise à jour (update frequency)
Fréquence de mise à jour d'un index, exprimée en jours, heures et minutes, et le nombre minimal de noms de documents devant être répertoriés dans la table de journalisation pour l'indexation, avant que celle-ci ne puisse avoir lieu.

G

groupe de noeuds (nodegroup)
Sous-ensemble nommé d'un ou plusieurs serveurs de partitions de bases de données. Noeud attribué à une machine physique distincte. Voir noeud logique.

I

indexation périodique (periodic indexing)
Indexation à des intervalles de temps prédéterminés, exprimés en jours, heures et minutes, et nombre minimal de noms de documents devant être répertoriés dans la table de journalisation pour l'indexation, avant que celle-ci ne puisse avoir lieu.

index de texte (text index)
Ensemble de termes importants extraits de documents texte. Chaque terme est associé au document duquel il est extrait. Le temps de recherche est considérablement amélioré en effectuant la recherche dans l'index plutôt que dans les documents mêmes.

index exact (precise index)
Index de texte contenant des termes exacts tels qu'ils apparaissent dans le document d'où ils sont extraits. Voir aussi index linguistique et index Ngram.

index (index)
Extraction de termes importants d'un texte et stockage de ces termes dans un index de texte.

index linguistique (linguistic index)
Index de texte contenant des termes qui ont été réduit à leur forme de base par traitement linguistique. "Journaux" serait par exemple indexé sous "journal". Voir également index exact et index Ngram.

index Ngram (Ngram index)
Index de texte prenant en charge les documents à jeu de caractères à deux octets (DBCS) et la recherche floue des documents à jeu de caractères mono-octet (SBCS). Voir aussi index linguistique et index exact.

informations texte (text information)
Propriétés d'un document texte décrivant :

le CCSID

le format

la langue.

instance (instance)
Environnement logique DB2 Extension Net Search. Plusieurs instances de DB2 Extension Net Search peuvent se trouver sur un même poste de travail mais il ne peut exister qu'une seule instance pour chaque instance DB2. Vous pouvez utiliser ces instances pour :

Séparer l'environnement de développement de l'environnement de fabrications

Réduire les informations sensibles à un groupe particulier de personnes.

interface de programme d'application (API, application programming interface)
Interface universelle entre les programmes d'application et les services d'extraction d'informations DB2 Extension Net Search.

interpréteur de commandes (command line processor)
Programme appelé db2text qui :

vous permet d'entrer des commandes DB2 Extension Net Search

traite les commandes

affiche le résultat

L

langue (language)
Nom d'un dictionnaire à utiliser lors de l'indexation, la recherche et l'exploration.

M

mise en évidence des informations (highlighting information)
Voir flux de données.

modèle de document (document model)
Définition de la structure d'un document par rapport aux sections qu'il contient. Grâce au modèle de document, DB2 Extension Net Search tiendra compte des sections des documents lors de l'indexation. Un modèle de document répertorie les balises HTML identifiant les sections. Pour chaque balise, vous pouvez spécifier un nom de section descriptif pour faciliter l'utilisation de cette section dans les requêtes. Vous pouvez spécifier un ou plusieurs modèles de document dans un fichier de modèles de documents.

mot vide (stop word)
Mot courant, tel que "avant", dans un document texte, qui doit être exclus de l'index de texte et ignoré s'il est inclus dans un argument de recherche.

N

navigateur (browser)
Fonction DB2 Extension Net Search vous permettant d'afficher du texte sur un écran d'ordinateur.

noeud logique (logical node)
Noeud attribués avec d'autres noeuds à la même machine physique. Voir aussi noeud physique.

noeud (node)
Serveur dans un environnement de base de données partitionnée. Voir aussi noeud logique, noeud physique et groupe de noeuds.

noeud physique (physical node)
Noeud attribué à une machine physique distincte. Voir aussi noeud logique.

nombre (count)
Mot clé utilisé pour spécifier le nombre de niveaux (la profondeur) des termes du thésaurus, utilisés pour étendre la recherche pour une relation donnée.

O

occurrence (match)
Occurrence d'un terme recherché dans un document texte.

P

page de codes (code page)
Attribution de caractères graphiques et de définitions de fonctions de contrôle à tous les points de code. Par exemple, attributions de caractères et de définitions à 256 points de code pour un code à 8 octets.

parcourir (browse)
Visualiser du texte affiché sur un écran d'ordinateur.

profil d'environnement (environment profile)
Script fourni avec DB2 Extension Net Search contenant des paramètres pour les variables d'environnement.

profil de shell (shell profile)
Voir profil d'environnement.

profil (profile)
Voir profil d'environnement.

R

recherche booléenne (Boolean search)
Recherche impliquant la combinaison d'un ou de plusieurs termes à l'aide d'opérateurs booléens.

recherche de fonctions (feature search)
Recherche de termes, tels que des noms propres, des noms de lieux ou d'entreprises effectuée dans un index linguistique créé à l'aide de l'option d'indexation FEATURE_EXTRACTION.

recherche de texte libre (free-text search)
Recherche dans laquelle le terme recherché est exprimé sous forme de texte à format libre - une phrase décrivant le sujet recherché en langue naturelle.

recherche floue (fuzzy search)
Recherche pouvant trouver des mots dont l'orthographe est similaire à celle du terme recherché.

recherche hybride (hybrid search)
Combinaison de la Recherche booléenne et de la recherche en texte libre.

S

SBCS (SBCS)
Jeu de caractères mono-octet

score (Score)
Valeur absolue de type DOUBLE comprise entre 0 et 1, indiquant l'efficacité de la correspondance entre le document et les critères de recherche relatifs aux autres documents trouvés. La valeur indique le nombre d'occurrences détectées dans le document en relation avec la taille du document.

T

table à index commun (common-index table)
Table DB2 dont les colonnes de texte ont un même index de texte en commun. Voir aussi table à index multiples.

table à index multiples (multi-index table)
Table DB2 dont les colonnes de texte possèdent des index de texte individuels. Voir aussi table à index commun.

table de journalisation (log table)
Table créée par DB2 Extension Net Search contenant des informations sur lesquels les documents texte doivent être indexés. Des déclencheurs sont utilisés pour stocker ces informations dans une table de journalisation à chaque ajout, modification ou suppression d'un document dans une colonne de texte activée.

table de texte (text table)
Table DB2 contenant des colonnes de texte.

traçage (tracing)
Action de stocker des informations dans un fichier qui peut ensuite être utilisé pour la recherche de la cause d'une erreur.

type défini par l'utilisateur (user-defined type)
Type de données créé par un utilisateur de DB2, en opposition avec un type de données fourni par DB2, tel que LONG VARCHAR.

type d'index (index type)
Caractéristique d'un index de texte déterminant s'il contient des formes exactes ou linguistiques des termes du document. Voir index exact index linguistique et index Ngram.

type distinct (distinct type)
Voir type distinct défini par l'utilisateur.

type UDT (UDT)
Type défini par l'utilisateur.

V

variable d'environnement (environment variable)
Variable utilisée pour fournir des valeurs par défaut à l'environnement DB2 Extension Net Search.

variable d'instance (instance variable)
Variable utilisée pour fournir une valeur par défaut pour le nom de du propriétaire de l'instance ou le nom du répertoire personnel du propriétaire.

vue catalogue (catalog view)
Vue d'une table système créée par DB2 Extension Net Search Text pour des tâches administratives. Une vue catalogue comporte des informations sur les tables et colonnes activées pour être utilisées par DB2 Extension Net Search Text.

W

WLM (WLM)
Gestionnaire de charge de travail (Work Load Manager)


[ Début de page | Page précédente | Page suivante | Table des matières | Index ]