IBM Books
(C) IBM Corp. 2000

DB2 Extension Net Search - Guide d'administration et d'utilisation


Comment un modèle de document décrit des documents structurés

Les documents au format HTML ou XML sont des exemples de documents structurés ; ils contiennent des balises qui identifient des zones de texte ou des attributs de document. Les zones de texte peuvent contenir des informations telles que le titre, l'auteur ou une description du document. Les attributs de documents peuvent contenir un nombre.

Vous trouverez ci-dessous un extrait d'un document en texte clair structuré. Il contient des zones et des attributs délimités par des balises de type HTML.

[head]Gestion des documents structurés
[/head]
 
[abstract]Ce document décrit le concept des documents structurés
et l'utilisation des modèles de document pour ...
[/abstract]
:
:
 

Lorsque l'Extension Net Search indexe des documents structurés, il doit reconnaître leur structure pour pouvoir indexer la zone de texte et les attributs, et les enregistrer sous un nom unique qui identifie la zone ou l'attribut qui les contient. Cela permet à l'Extension Net Search de faire une recherche sélective dans une zone de texte ou de rechercher des documents ayant un attribut particulier.

Pour que l'Extension Net Search puisse reconnaître la structure d'un format de document spécifique, vous devez lui en donner une définition dans un modèle de document.

Indiquez le nom du modèle de document en tant qu'argument lorsque vous appelez la commande CREATE INDEX pour indexer les documents.

Avant d'indexer des documents à l'aide d'un modèle de document, vous devez tout d'abord définir un modèle de document puis l'ajouter à l'index.


[ Début de page | Page précédente | Page suivante | Table des matières | Index ]