IBM Books
(C) IBM Corp. 2000

Manual de administración y del usuario de DB2 Net Search Extender


Formatos de documentos y páginas de códigos soportadas

DB2 Net Search Extender necesita conocer el formato (o tipo) de los documentos de texto en los que tiene intención de realizar búsquedas. Esta información es necesaria para indexar documentos de texto.

DB2 Net Search Extender da soporte a los siguientes formatos de documento:

TEXT
Texto plano (por ejemplo, ASCII plano)

HTML
Lenguaje de marcación de hipertexto

XML
Lenguaje de marcación ampliado

GPP
Formato de finalidad general (texto plano con identificadores definidos por el usuario)

Outside-In (INSO)
Software de filtrado para extraer contenido textual de archivos PDF y de otras herramientas de tratamiento de texto como, por ejemplo, Microsoft Word. Para obtener más información, vea el apartado Software de filtrado Outside-In.

Para los formatos de documento HTML, XML, GPP y los formatos de filtrado Outside-In, se puede restringir la búsqueda a partes específicas de un documento. El Capítulo 9, Cómo trabajar con documentos estructurados explica cómo definir modelos de documento y trabajar con ellos.

Para formatos de documentos no soportados en los que no se puede utilizar filtros Outside-In, se puede escribir una función definida por el usuario (UDF). Esta UDF se debe especificar durante la creación del índice y convierte los datos de formato no soportado a un formato soportado.

Vea CREATE INDEX para obtener más información.

Los documentos se pueden indexar si están en uno de los identificadores de juego de caracteres codificados (CCSID) soportados. También se conocen como páginas de códigos. Vea la lista de estas páginas de códigos en el Apéndice D, CCSID soportados.

Para comprobar la página de códigos de la base de datos, utilice el siguiente mandato de DB2:

db2 GET DB CFG for <nombrebd>

Por coherencia, DB2 normalmente convierte la página de códigos de un documento a la página de códigos de la base de datos. Sin embargo, cuando almacena datos en una base de datos DB2 en una columna con un tipo de datos binario como, por ejemplo, BLOB, FOR BIT DATA o un valor Datalink, DB2 no convierte los datos y los documentos retienen los CCSID originales.

Tenga en cuenta que si existen dos páginas de códigos diferentes podrían producirse problemas al crear un índice de texto o realizar búsquedas. Consulte la sección Creación de un índice de texto en tipos de datos binarios para obtener más información.


[ Principio de página | Página anterior | Página siguiente | Contenido | Índice ]