IBM Books
(C) IBM Corp. 2000

DB2 Net Search Extender Guía de administración y del usuario

Qué sucede cuando se indexa un documento XML

La tabla siguiente muestra qué elementos se colocan en el índice.

Tabla 8. Entradas del índice de texto

Información de límite de campo Texto indexado
inicio del campo "addresses" inicio del campo "customerName" Alice Smith [1] y [2]
final del campo "customerName" 123 Maple Street
Mill Hill
CA 90999
[2]
final del campo "addresses" 123 1
S&B Cortacésped tipo ABC-x
239.90 2001-01-25
987Z 1
Rastrillo multifuncional ZYX
69.90 2001-01-24

Nombre de atributo Valor(es) de atributo
Número de pieza 123, 987

Tenga en cuenta que los campos anidados son posibles, como se muestra en este ejemplo. El campo addresses selecciona un nodo en el documento XML que domina el nodo seleccionado por el campo customerName. El contenido de ese nodo integrado, por lo tanto, pertenece lógicamente a ambos campos. Aunque puede que los campos de texto se solapen, el texto dentro de esos campos se indexa sólo una vez. En este ejemplo, al realizar una búsqueda con una restricción de campo, Alice Smith se encuentra tanto en addresses como en customerName.

El contenido de los campos se determina siguiendo las reglas siguientes:

El documento debe contener XML bien formado pero no es necesario especificar una DTD en el documento XML. No se lleva a cabo ninguna validación de la DTD ni resolución de entidades externa; Net Search Extender sólo se corresponde con el documento XML frente al modelo de documento. Las entidades internas se sustituyen según lo solicite XML.

Para obtener información sobre las definiciones de tipo de documento, consulte el apartado DTD para modelos de documento.

Para ver las restricciones, consulte el apartado Limitaciones de campos de texto y atributos de documento.


Definición de un modelo de documento para documentos filtrados Outside In

Los modelos de documento para el formato Outside In se parecen mucho a los modelos de documento HTML en que permiten correlacionar elementos estructurales identificados por un conjunto determinado de identificadores con campos de texto de NSE y atributos de documentos. Supongamos que tiene un conjunto de documentos de Microsoft Word y desea indexar las propiedades de documento "título", "tema" y "palabra clave" como campos y las propiedades de documento "autor" y "categoría" como atributos de documento. El siguiente ejemplo para un modelo de documento Outside In realizará esta correlación:

<?xml version="1.0"?>
<INSOModel>
 
<INSOFieldDefinition
name="título"
tag="SCCCA_TITLE"/>
 
<INSOFieldDefinition
name="título"
tag="SCCCA_SUBJECT"/>
 
<INSOFieldDefinition
name="título"
tag="SCCCA_KEYWORDS"/>
 
<INSOAttributeDefinition
name="autor"
tag="SCCCA_AUTHOR"
type="STRING"/>
 
<INSOAttributeDefinition
name="categoría"
tag="SCCCA_CATEGORY"
type="STRING"/>
 
</INSOModel>
 


[ Principio de página | Página anterior | Página siguiente | Contenido | Índice ]