IBM Books
(C) IBM Corp. 2000

DB2 Net Search Extender Guía de administración y del usuario

Modelos de documento por omisión

Para documentos filtrados HTML, XML y Outside In, Net Search Extender proporciona modelos de documento por omisión que se utilizan si no se define un modelo de documento. Para documentos de texto plano estructurados, es necesario proporcionar y especificar un modelo de documento.

Si utiliza uno de los modelos de documento por omisión:


Tabla 7. Comportamiento de los modelos de documento por omisión para los formatos de documentos soportados

Tipo de documento Comportamiento del modelo de documento por omisión
HTML Acepta los siguientes campos de texto: <a> <address> <au> <author> <h1> <h2> <h3> <h4> <h5> <h6> <title>.
El nombre de campo es el nombre de identificador como, por ejemplo, "address".
XML Acepta todos los identificadores como campos de texto.
El nombre de campo es el nombre de vía de acceso completamente calificada del identificador, por ejemplo "/play/title".
Texto plano estructurado (GPP) Ningún modelo de documento por omisión.
Outside In (INSO) Acepta como campos de texto, las propiedades del documento que se muestran en el apartado Parámetros de elementos tal como las devuelven los filtros Outside In. El Nombre de campo es el nombre de la propiedad del documento que Outside In utiliza, por ejemplo: "SCCCA_TITLE".

Para cada tipo de documento se define un modelo de documento. Como todos los modelos son diferentes, se proporciona un ejemplo y una explicación para cada uno.

Nota

Aunque los modelos de documento por omisión procesan los documentos correctamente, para mejorar la indexación y la búsqueda debería definir sus propios modelos de documento.

Con el modelo de documento por omisión, el texto de un documento se indexa completamente, sin tener en cuenta si forma parte de un campo de texto o no. Esto significa que las búsquedas de texto no restringidas incluirán una búsqueda de este texto.


Definición de un modelo de documento para documentos de texto plano estructurados

El siguiente es un ejemplo de un documento de texto plano estructurado de finalidad general (GPP):

[head]Manejo de documentos estructurados
[/head]
[year]2002
[/year]
[abstract]Este documento describe el concepto de los documentos estructurados
y la utilización de modelos de documento para...
[/abstract]

A continuación se muestra un ejemplo de un modelo de documento GPP:

<?xml version="1.0"?>
<GPPModel>
 
  <GPPFieldDefinition
  name="Head"
  start="[head]"
  end="[/head]" 
 exclude="YES" /> 
 
  <GPPFieldDefinition                 - Éste es el inicio del campo de texto
  name="Abstract"
  start="[abstract]"
  end="[/abstract]" 
  exclude="NO" />                     - Éste es el final de un campo de texto
 
  <GPPAttributeDefinition             - Éste es el inicio de un atributo de
 name="year"                                   documento
  start="[year]"
  end="[/year]" 
  type="NUMBER" />                    - Éste es el final de un atributo de
                                           documento
</GPPModel>

La primera línea, <?xml version="1.0"?> especifica que el modelo de documento está escrito con identificadores XML. Tenga en cuenta que este modelo no está escrito para documentos en formato XML.

Cada campo se define con un identificador GPPFieldDefinition o GPPAttributeDefinition, que contiene parámetros de elemento.

Todas las definiciones deben estar contenidas en el identificador <GPPModel>.


[ Principio de página | Página anterior | Página siguiente | Contenido | Índice ]