IBM Books
(C) IBM Corp. 2000

DB2 Extension Net Search - Guide d'administration et d'utilisation

Argument de recherche

Syntaxe des arguments de recherche

>>-+----------------------+--+-------------------------+-------->
   '-RESULT LIMIT--nombre-'  '-EXPANSION LIMIT--nombre-'
 
>--+------------------------------------------+----------------->
   '-STOP SEARCH AFTER--nombre--+-DOCUMENT--+-'
                                '-DOCUMENTS-'
 
>--+-| expression-recherche-booléenne |-+----------------------><
   '-| argument-texte-libre |-----------'
 
Expression-recherche-booléenne
 
|--+-| terme-recherché |-------------------------------------------------------+--|
   '-| expression-recherche-booléenne |--| opérateur-or |--| terme-recherché |-'
 
terme-recherché
 
|--+-| facteur-recherche |---------------------------------------------------+--|
   +-| terme-recherché |--| opérateur-and |--| facteur-recherche |-----------+
   +-| terme-recherché |--| opérateur-accum |--| facteur-recherche |---------+
   '-| terme-recherché |--| opérateur-minus |--| facteur-recherche-positif |-'
 
Facteur-recherche
 
|--+-----+--| facteur-recherche-positif |-----------------------|
   '-NOT-'
 
Facteur-recherche-positif
 
|--+-+-----------------------------------------------------------+--| recherche-primaire |-+--|
   | |                  .-,---------------------------------.    |                         |
   | |                  V                                   |    |                         |
   | '-+-SECTION--+--(----"nom-section"--+----------------+-+--)-'                         |
   |   '-SECTIONS-'                      '-WEIGHT--nombre-'                                |
   '-facteur-attribut----------------------------------------------------------------------'
 
Recherche-primaire
 
|--+-| littéral-texte |-----------------------+-----------------|
   +-| condition-contexte |-------------------+
   +-| invocation-thésaurus |-----------------+
   +-(--| expression-recherche-booléenne |--)-+
   '-(--| liste-littéraux-texte |--)----------'
 
Opérateur-and
 
|--&------------------------------------------------------------|
 
Opérateur-or
 
|--|------------------------------------------------------------|
 
Opérateur-accum
 
|--ACCUM--------------------------------------------------------|
 
Opérateur-minus
 
|--MINUS--------------------------------------------------------|
 
Condition-contexte
 
|----| argument-contexte |--| IN-SAME |--| unité-contexte |--| AS |--| argument-contexte |---->
 
>--+--------------------------------+---------------------------|
   | .----------------------------. |
   | V                            | |
   '---AND--| Argument-contexte |-+-'
 
Argument-contexte
 
|--+-| littéral-texte |--------------+--------------------------|
   +-(--| liste-littéraux-texte |--)-+
   '-| invocation-thésaurus |--------'
 
Liste-littéraux-texte
 
   .-,--------------.
   V                |
|----littéral-texte-+-------------------------------------------|
 
Unité-contexte
 
|--+-PARAGRAPH-+------------------------------------------------|
   '-SENTENCE--'
 
Littéral-texte
 
|--+------------------------------------------+----------------->
   +-PRECISE-FORM-OF--------------------------+
   +-STEMMED-FORM-OF--------------------------+
   '-FUZZY-FORM-OF--+-----------------------+-'
                    '-niveau-correspondance-'
 
>--+----------------+--"mot-ou-expression"---------------------->
   '-WEIGHT--nombre-'
 
>--+---------------------------------+--------------------------|
   '-ESCAPE--"caractère-échappement"-'
 
invocation-thésaurus
 
|--THESAURUS--"nom-thésaurus"--EXPAND--------------------------->
 
>--+-+-SYNONYM------------+--TERM OF--| littéral-texte |--------------------+--|
   | +-RELATED------------+                                                 |
   | '-RELATION--(nombre)-'                                                 |
   '-+-BROADER--+--TERM OF--| littéral-texte |--+-------------------------+-'
     '-NARROWER-'                               '-FOR--nombre--+-LEVEL--+-'
                                                               '-LEVELS-'
 
Facteur-attribut
 
|--ATTRIBUTE--"nom-attribut"------------------------------------>
 
>--+-BETWEEN--valeurDe AND valeurA-+----------------------------|
   +->--valeurDe-------------------+
   '-<--valeurA--------------------'
 
argument-texte-libre
 
|--IS-ABOUT--+--------+--"mot-ou-expression"-------------------->
             '-langue-'
 
>--+---------------------------------+--------------------------|
   '-ESCAPE--"caractère-échappement"-'
 
 

Exemples

Des exemples figurent à la section Spécification des arguments de recherche SQL.

Paramètres de recherche

RESULT LIMIT nombre
Mot clé spécifiant le nombre maximal de résultats à renvoyer par la recherche en texte intégral.

L'argument RESULT LIMIT doit être utilisé avec la fonction SCORE pour garantir l'évaluation des résultats renvoyés et le traitement des meilleurs résultats uniquement.

EXPANSION LIMIT nombre
Mot clé spécifiant le nombre maximal de fois qu'un terme peut être développé pour la recherche. Par exemple, pour déterminer combien de fois vous pouvez développer le terme recherché 'a*'.

STOP SEARCH AFTER nombre DOCUMENTS(S)
Mot clé spécifiant le seuil de recherche. La recherche est arrêtée lorsque le nombre de documents est atteint pendant la recherche et qu'un résultat intermédiaire est renvoyé. Une valeur plus faible augmente les performances de la recherche, mais aboutit à des résultats moins nombreux avec un rang potentiellement élevé.

Notez qu'il n'y a pas de valeur par défaut et que la valeur de nombre doit être un entier positif.

expression-recherche-booléenne
Les termes recherchés et les facteurs de recherche peuvent être associés à l'aide d'opérateurs booléens NOT, AND, OR, ACCUM et MINUS en fonction des diagrammes de syntaxe. Les opérateurs ont priorité les uns par rapport aux autres, dans l'ordre suivant (le premier ayant la plus forte priorité) : NOT > MINUS = ACCUM = AND > OR comme le montre l'exemple suivant :
"Pilote" MINUS "passager" & "véhicule" |
"transport" & "public"

est évalué comme :

(("Pilote" MINUS "passager") & ("véhicule")) | ("transport" &
"public")

L'opérateur correspond à la valeur true, si l'un des arguments booléens correspond à cette même valeur (qui est comparable à l'opérateur OR). La valeur de rang est calculée en accumulant les valeurs de rang des deux opérandes. L'opérateur ACCUM a la même liaison (priorité) que AND. L'opérateur MINUS correspond à la valeur true, si l'opérande de gauche correspond à la même valeur. La valeur de rang est calculée en prenant la valeur de rang de l'opérande de gauche et en soustrayant une pénalité, si l'opérande de droite correspond à la valeur true.

recherche-primaire
Une recherche primaire constituée d'un appel de thésaurus est évaluée à la valeur true, si l'un des littéraux texte étendus se trouve dans la section spécifiée du document. Une recherche primaire constituée d'une liste de littéraux texte est évaluée à la valeur true, si l'un des littéraux texte se trouve dans la section spécifiée du document.

SECTION(S) nom-section

Mot clé spécifiant une ou plusieurs sections dans un document structuré sur la ou lesquelles la recherche doit se limiter. Le nom de la section doit être spécifié dans un fichier modèle au moment de la création de l'index. Reportez-vous à la section CREATE INDEX.

Les noms de section font la distinction majuscules-minuscules. Assurez-vous que le nom de la section dans le fichier modèle est identique à celui de la requête.

Ce modèle décrit la structure des documents qui contiennent les sections identifiables, de telle sorte que des recherches peuvent être effectuées individuellement dans le contenu de ces sections. Les noms de section ne peuvent pas contenir de caractères génériques. Le facteur-recherche-positive utilisant la clause SECTION correspond à la valeur true, si la recherche primaire se trouve dans l'une des sections.

argument-contexte IN SAME unité-contexte AS argument-contexte AND argument-contexte ...
Cette condition permet de rechercher une combinaison de littéraux texte se trouvant dans le même paragraphe ou la même phrase. Les arguments de contexte sont toujours équivalents aux listes de littéraux texte et l'extension du thésaurus peut être utilisée pour étendre un littéral texte en une telle liste.

La condition est évaluée à true, si une unité-contexte se trouve dans le document (paragraphe, respectivement phrase) qui contient au moins l'un des littéraux texte de chaque argument-contexte développé, comme le montre l'exemple suivant :

("a","b") IN SAME PARAGRAPH AS ("c","d") 
          AND THESAURUS "t1" EXPAND SYNONYM TERM OF "e".

Si l'on présume que e1, e2 sont synonymes de e, les paragraphes suivants correspondent :

".. a c e .." ,  ".. a c e1..",  "a c e2..",
".. a d e .." ,  ".. a d e1..",  "a d e2..",
".. b c e .." ,  ".. b c e1..",  "b c e2..",
".. b d e .." ,  ".. b d e1..",  "b d e2..".

PRECISE FORM OF
Mot clé entraînant le mot (ou chaque mot de l'expression) suivant PRECISE FORM OF à être recherché exactement tel qu'il est saisi. Cette forme de recherche fait la distinction majuscules-minuscules. Autrement dit, le respect de la casse est important. Par exemple, si vous recherchez le terme souris, vous ne trouverez pas "Souris".

STEMMED FORM OF
Mot clé entraînant le mot (ou chaque mot de l'expression) suivant STEMMED FORM OF à être réduit à sa racine avant d'être recherché. Cette forme de recherche ne fait pas de distinction entre les majuscules et les minuscules. Par exemple, si vous recherchez le terme souris, vous trouverez également "Souris".

La façon dont les mots sont réduits à leur racine dépend de la langue. Actuellement, seule la langue anglaise est prise en charge et le mot doit respecter les terminaisons standard.

FUZZY FORM OF
Mot clé destiné à la réalisation d'une recherche "floue" qui est une recherche des termes ayant une orthographe similaire au terme recherché. Ceci est particulièrement utile lors de la recherche dans des documents qui ont été créés par un programme de reconnaissance optique des caractères (OCR). De tels documents incluent souvent des mots mal orthographiés. Par exemple, le mot économie peut être reconnu comme écononie par un programme OCR. Notez que les trois premiers caractères doivent correspondre et que la recherche floue ne peut pas être utilisée si un mot de l'atome de recherche contient un caractère générique.

niveau de correspondance
Entier compris entre 1 et 100, spécifiant le degré de similitude, où 100 est plus proche que 1. 100 spécifie une "correspondance exacte" et 60 est déjà considéré comme une valeur très "floue". Plus le niveau de correspondance est flou, plus la durée de la recherche est longue, du fait que davantage de documents sont qualifiés pour la recherche. Le niveau de correspondance par défaut est 70.

WEIGHT nombre
Associe un littéral texte à une valeur WEIGHT pour modifier le score par défaut. Les valeurs WEIGHT autorisées sont des entiers compris entre 0 (valeur du score la plus faible) et 100 (la plus élevée). La valeur par défaut est 100.

mot-ou-expression
Mot ou expression à rechercher. Les caractères pouvant être utilisés dans un mot dépendent de la langue. Le fait que les mots doivent être séparés par des caractères séparateurs dépend également de la langue. En anglais et dans la plupart des autres langues, chaque mot d'une expression doit être séparé par un espace.

Pour rechercher une chaîne de caractères contenant des guillemets, saisissez les guillemets deux fois. Par exemple, pour rechercher le texte caractère "générique", tapez :

"caractère ""générique"""

Notez que dans l'exemple, il n'est possible de rechercher qu'un seul ensemble de guillemets. Il n'est pas possible de rechercher deux guillemets dans une séquence. La longueur de chaque mot ou expression est également limitée à 128 octets.

Caractères génériques
Un mot peut contenir les caractères génériques suivants :

_ (trait de soulignement)
Représente n'importe quel caractère simple.

% (pour cent)
Représente n'importe quel nombre de caractères arbitraires. Si un mot est constitué d'un seul caractère %, il représente alors un mot facultatif de n'importe quelle longueur. Un mot ne peut pas être composé exclusivement de caractères génériques, sauf lorsqu'un seul % est utilisé pour représenter un mot facultatif. Si vous utilisez un caractère générique, vous ne pouvez pas utilisez le THESAURUS. Les caractères génériques ne peuvent pas suivre un caractère non alphanumérique.

ESCAPE caractère-échappement
Caractère identifiant le caractère suivant comme étant à rechercher et non à utiliser comme caractère générique. Par exemple, si un caractère d'échappement est $, alors $%, $_ et $$ représentent respectivement %, _ et $. Tous les caractères % et _ non précédés de $ représentent des caractères génériques.

THESAURUS nom-thésaurus
Mot clé utilisé pour spécifier le nom du thésaurus à utiliser pour étendre un littéral texte. Le nom du thésaurus est celui du fichier (sans son extension) d'un thésaurus compilé à l'aide du compilateur de thésaurus. Il doit se trouver dans <selon-OS>/sqllib/db2ext/thes. Le chemin d'accès peut être également spécifié, précédant le nom de fichier.

EXPAND relation
Spécifie la relation devant être utilisée pour étendre le littéral texte à l'aide du thésaurus. Le thésaurus a prédéfini les relations décrites dans la commande DB2EXTTH. Elles sont référées à l'aide des mots clés suivants :

Pour les relations définies par l'utilisateur, utilisez RELATION(nombre) qui correspond à la définition de relation dans DB2TEXTTH.

TERM OF littéral-texte

Littéral texte auquel d'autres termes de recherche doivent être ajoutés du thésaurus.

nombre LEVELS

Mot clé utilisé pour spécifier le nombre de niveaux (la profondeur) des termes du thésaurus, utilisés pour étendre la recherche pour une relation donnée. Si ce mot clé n'est pas spécifié, un nombre égal à 1 est présumé. La valeur de profondeur doit être un entier positif.

ATTRIBUTE Nom-attribut
Recherches de documents ayant des attributs correspondant à la condition spécifiée. Le nom-attribut fait référence au nom d'une expression d'attribut dans la commande CREATE INDEX ou à une définition d'attribut dans le fichier modèle de document.

Le facteur-attribut est autorisé pour les attributs de type DOUBLE uniquement. La précision de la valeur est garantie jusqu'à 15 chiffres. Les nombres de 16 chiffres et plus sont arrondis. L'utilisation de caractères génériques n'est pas autorisée dans nom-attribut, valeurDe et valeurA. Pour plus d'informations, reportez-vous à ce qui suit :

BETWEEN valeurDe AND valeurA
Un facteur d'attribut BETWEEN correspond à la valeur true, si la valeur de l'attribut est supérieure à (différente de) valeurDe et inférieure à (différente de) valeurA.

>valueDe
Un facteur d'attribut ">" correspond à la valeur true si la valeur de l'attribut est supérieure (différente de) à valeurDe.

<valeurA
Un facteur d'attribut "<" correspond à la valeur true, si la valeur de l'attribut est inférieure (différente de) valeurA.

Si le nom de l'attribut dans la commande CREATE INDEX est spécifié avec des guillemets ou est défini dans un fichier modèle, le nom de l'attribut spécifié doit correspondre exactement. En revanche, si aucun guillemet n'est spécifié dans la commande CREATE INDEX, le nom de l'attribut doit être en majuscules.

IS ABOUT langue mot-ou-expression
Option permettant de spécifier un argument de recherche en texte libre. Elle doit être utilisée pour obtenir un type différent d'algorithme de score, du fait qu'elle vérifie le positionnement des termes dans les documents. Plus les termes utilisés dans le mot-ou-expression sont proches, plus le nombre de mots inclus dans le document sont nombreux et plus le score renvoyé est élevé.

Les valeurs autorisées pour la langue sont décrites à l'Annexe E, Langues prises en charge et ne s'appliquent qu'à la langue Thaï. Si elle n'est pas spécifiée, la langue en_US est utilisée par défaut. La langue est utilisée uniquement pour la tokenisation du mot ou de l'expression.

Notez que l'argument IS ABOUT est utile uniquement si les valeurs des scores sont demandées et que les résultats de la recherche sont triés par valeur de score.


[ Début de page | Page précédente | Page suivante | Table des matières | Index ]