IBM Books
(C) IBM Corp. 2000

Manual de administración y del usuario de DB2 Net Search Extender

Modelos de documento por omisión

Para los documentos HTML y XML, Net Search Extender proporciona modelos de documento por omisión que se utilizan si no define un modelo de documento. Para documentos de texto plano estructurados, es necesario proporcionar y especificar un modelo de documento.

Si utiliza uno de los modelos de documento por omisión:


Tabla 6. Comportamiento de los modelos de documento por omisión para los formatos de documentos soportados

Tipo de documento Comportamiento del modelo de documento por omisión
HTML Acepta los siguientes campos de texto: <a> <address> <au> <author> <h1> <h2> <h3> <h4> <h5> <h6> <title>.
El nombre de campo es el nombre de identificador como, por ejemplo, "address".
XML Acepta todos los identificadores como campos de texto.
El nombre de campo es el nombre de vía de acceso del identificador en notación Xpath como, por ejemplo, "/play/title".
Texto plano estructurado (GPP) Ningún modelo de documento por omisión.
Outside-In (INSO) Acepta como campos de texto las propiedades del documento que se muestran en la sección Parámetros de elementos tal como las devuelven los filtros Outside-In. El Nombre de campo es el nombre de la propiedad del documento que Outside-In utiliza como, por ejemplo, "SCCCA_TITLE". No hay soporte para los atributos.

Para cada tipo de documento se define un modelo de documento. Como todos los modelos son diferentes, se proporciona un ejemplo y una explicación para cada uno.

Nota

Aunque los modelos de documento por omisión procesan los documentos correctamente, para mejorar la indexación y la búsqueda debería definir sus propios modelos de documento.

Con el modelo de documento por omisión, el texto de un documento se indexa completamente, sin tener en cuenta si forma parte de un campo de texto o no. Esto significa que las búsquedas de texto no restringida incluirán una búsqueda de este texto.


[ Principio de página | Página anterior | Página siguiente | Contenido | Índice ]