Por omisión, todo el texto se indexa como no perteneciente a ningún campo. Siempre que un identificador inicial que aparezca en la serie de texto coincida con un elemento de definición del modelo de documento que esté actualmente activo, el texto entre el identificador inicial y su correspondiente identificador final se tratará de acuerdo con dicho término de definición. Por ejemplo, como un campo indexado, un campo excluido, como un atributo o ambas cosas.
Si no existen definiciones coincidentes, el identificador inicial y su correspondiente identificador final se pasarán por alto.
Puesto que los filtros Outside In reconocen automáticamente el formato y la página de códigos del documento, la especificación de CCSID no tiene ningún efecto. Si los filtros Outside In no pueden determinar el formato y la página de códigos correctos, el documento se trata como un archivo ASCII.
Ésta es la sintaxis de cada grupo de definiciones:
Sintaxis de una definición de diccionario tesauro >>-:WORDS--+--------------------------------+--\n---------------> +-:SYNONYM-----------------------+ '-:RELATED--+------------------+-' '- ( --número-- ) -' .-----------------------------------------------------------------. V | >----+-término-miembro--+----------------------+---------------+--\n-+->< | '- ( --intensidad-- ) -' | '-+-.SYNONYM_OF-----------------------+--término-asociado-' +-.RELATED_TO--+------------------+-+ | '- ( --número-- ) -' | +-.BROADER--+------------------+----+ | '- ( --número-- ) -' | '-.NARROWER--+------------------+---' '- ( --número-- ) -'
Tenga en cuenta que \n no forma parte de la sintaxis, sino que representa el final de una línea del archivo de definición de diccionario tesauro.
Puede insertar líneas de comentario en el archivo de definición de diccionario tesauro, de la siguiente manera:
# mi texto de comentario
Los nombres de relación consisten en un tipo de relación y un número. Si se omite el número, se utiliza cero, que es el nombre de relación proporcionado por el sistema. :SYNONYM siempre es el nombre de relación proporcionado por el sistema.
Los nombres de relación que empiezan por dos puntos como :SYNONYM, preceden a una lista de palabras que están relacionadas entre sí por la misma relación. Por ejemplo:
:WORDS:SYNONYM azafata miembro del personal de cabina auxiliar de vuelo
Este parámetro puede ser útil si no desea que una búsqueda en diccionario tesauro incluya palabras que tienen poca relación con el término buscado. La intensidad es un valor numérico que va del 1 al 100. El valor por omisión es 100.
Los nombres de relación que empiezan por un punto, como .SYNONYM_OF, definen la relación entre una palabra y otra. Por ejemplo:
:WORDS azafata .SYNONYM_OF miembro del personal de cabina .SYNONYM_OF auxiliar de vuelo
El número opcional identifica una relación definida por el usuario. Debe ser un número exclusivo para todo el archivo de definición de diccionario (actualmente de 1 a 128). Por ejemplo: RELATED_TO(42).
Si desea utilizar nombres simbólicos para las relaciones del diccionario tesauro en la aplicación en lugar del nombre y número de relación, la aplicación debe gestionar la correlación del nombre con el número. Por ejemplo, si define la relación opuesto_a como RELATED_TO(1), la aplicación debe correlacionar este nombre con el nombre interno de la relación RELATED_TO(1).
A continuación se ofrece un ejemplo de un término asociado:
:WORDS:SYNONYM reject decline RELATED_TO(1) accept
DB2 Net Search Extender Versión 8.1.x se ha modificado en gran medida para dar cabida a la interfaz de búsqueda y a las funciones de DB2 Text Information Extender Versión 7.2. En consecuencia, hay tres opciones de migración:
Si está migrando de DB2 Versión 7.2 y Text Information Extender Versión 7.2, debe empezar por la migración de la instancia de DB2 y las bases de datos de la instancia. Consulte la documentación apropiada de DB2 para obtener la sintaxis y el uso correctos de los mandatos de DB2, tales como db2imigr que debe utilizar para migrar la instancia de DB2 de la versión 7 a la versión 8, y db2 migrate db <nombre bd> que debe utilizar para migrar las bases de datos de la instancia.
El procedimiento de migración de DB2 Net Search Extender se llama db2extmdb y devuelve mensajes en inglés. Si se produce un error durante la migración, intente solucionar el error y vuelva a llamar a db2extmdb.
db2extmdb recopila toda la información de administración de db2ext relevante para la migración en una nueva tabla llamada DB2EXT.TMIGRATION, donde cada índice de texto está representado por una sola fila en la tabla. Esta tabla de información de migración permanece hasta que la base de datos se ha migrado satisfactoriamente. No se permite descartar esta tabla.
Durante la migración de índices de texto, el proceso difiere dependiendo del estado de la tabla de anotaciones cronológicas, y de la disponibilidad de los archivos de índice:
Tenga en cuenta que la migración puede llevar una cantidad considerable de tiempo. Mientras la migración esté en ejecución, no se deben realizar cambios en las tablas de usuario.
Nota |
---|
Para conocer la información sobre migración más reciente, compruebe el archivo release.txt del CD-ROM y el sitio Web de DB2 Net Search Extender. |
No existen pasos previos necesarios al realizar el paso de Net Search Extender Versión 8.1 a Net Search Extender Versión 8.1.x. Por lo tanto, puede eliminar la instalación anterior e instalar la versión más reciente de Net Search Extender.
Migre la instancia de DB2 de la Versión 8.1 a la Versión 8.1.x o 8.2 utilizando db2iupdt tanto para UNIX como para Windows. A continuación, migre todas las bases de datos habilitadas de esta instancia utilizando la nueva herramienta db2extmdb. Quien realice la llamada debe ser el propietario de la instancia y la sintaxis es la siguiente:
db2extmdb <nombre base datos>
Mientras se esté ejecutando la migración, no se deben realizar cambios en las tablas de usuario con índices de texto.
Notas y recomendaciones |
---|
Los pasos de migración se registran en el siguiente archivo: <según-so>/sqllib/db2ext/db2extm <nombre-base-datos>.log Antes de llamar al programa db2extmdb, el usuario debe realizar una copia de seguridad de todos los directorios de índice y de la base de datos. |
Si ha estado utilizando Net Search Extender Versión 7.2 y no necesita las nuevas funciones, simplemente continúe utilizando las interfaces anteriores instalando las interfaces de compatibilidad de Net Search Extender Versión 7.2, que están disponibles en el CD-ROM o se pueden descargar. Consulte el archivo release.txt para obtener información adicional. Para utilizar las nuevas funciones de Net Search Extender, debe cambiar los scripts de administración para que se correspondan con la sintaxis de administración modificada y debe cambiar la sintaxis de búsqueda para las nuevas interfaces de búsqueda.
Tenga en cuenta que no existe ninguna forma automática de migrar de Net Search Extender Versión 7.2 a Net Search Extender Versión 8.1.x.
Tenga en cuenta también que estas interfaces de compatibilidad no se recomiendan y que no estarán disponibles en futuros releases.
Migre la instancia de DB2 de la Versión 7.2 a la Versión 8.1.x utilizando la herramienta de DB2 db2imgr para empezar, seguida de db2iupdt, tanto para UNIX como para Windows. Por ejemplo:
db2imigr -u <ID usuario delimitado> <nombre instancia> db2iupdt -u <ID usuario delimitado> <nombre instancia>
A continuación, migre todas las bases de datos de esta instancia utilizando el mandato de DB2 migrate y la nueva herramienta db2extmdb. Por ejemplo:
db2 migrate database <nombre base datos> db2extmdb <nombre base datos>
El llamador debe ser el propietario de la instancia.
El programa db2extmdb reúne toda la información de administración de db2ext relevante para la migración en una tabla nueva, denominada DB2EXT.TMIGRATION. En la tabla, cada índice de texto se representa como una sola fila. La tabla de información de migración permanecerá hasta que la base de datos se haya migrado satisfactoriamente y el usuario no la debe descartar.
Si se produce un error, soluciónelo y vuelva a llamar a db2extmdb.
Durante la migración del índice de texto, se llevan a cabo distintos procesos. Dependen del estado de la 'tabla de anotaciones cronológicas'. Si la tabla de anotaciones cronológicas está vacía, el índice se migrará. Este debería ser el procedimiento más rápido. Si la tabla de anotaciones cronológicas no está vacía, no se podrá garantizar un estado coherente con la base de datos y se deberá volver a crear el índice. Este proceso puede necesitar una cantidad de tiempo considerable.
Mientras se esté ejecutando la migración, no se deben realizar cambios en las tablas de usuario con índices de texto.
Recomendación |
---|
Antes de llamar al programa db2extmdb, el usuario debe realizar una copia de seguridad de todos los directorios de índice y de la base de datos, y debe verificar que todos los archivos de modelos de documentos utilizados para la creación de índices de texto de la versión 7.2 todavía existan y se pueda acceder a ellos para leerlos. Tras la migración de instancias de DB2, el directorio anterior sqllib pasa a llamarse sqllib_v71. Si tiene índices de texto almacenados en el directorio de índices por omisión, mueva el directorio sqllib_v71/db2ext/indexes al nuevo directorio sqllib, sqllib/db2ext/indexes. |
Notas y recomendaciones |
---|
Los pasos de migración se registran en el siguiente archivo: <según-so>/sqllib/db2ext/db2extm <nombre-base-datos>.log Para HP-UX o Linux, este paso no resulta necesario, ya que Text Information Extender no está disponible para estas plataformas. Tenga en cuenta también que DB2 Text Information Extender Versión 7.2 ya no está disponible. |
La utilización de la antememoria para una búsqueda de procedimiento almacenado requiere una gran cantidad de memoria y diferentes requisitos de memoria para las plataformas siguientes:
Configuración de los límites del sistema:
Configuración de los límites de la memoria compartida:
Configuración del espacio de intercambio:
Tenga en cuenta que el límite del tamaño máximo de antememoria en AIX es 1536 MB aproximadamente (1,5 GB = 1610612736 bytes).
En AIX (32 bits) la búsqueda en grandes tablas de antememoria utilizando la interfaz de búsqueda de procedimiento almacenado requiere un cambio en el valor maxdata del ejecutable db2fmp. Para realizar estos cambios, inicie la sesión como propietario de la instancia y emita los siguientes mandatos:
db2stop cd ~/sqllib/adm cp db2fmp db2fmp.org /usr/bin/echo '\0040\0\0\0' | dd of=db2fmp bs=4 count=1 seek=19 conv=notrunc
Si todavía no tiene suficiente memoria, reduzca aún más la cantidad de almacenamiento de pila de la siguiente manera:
cp db2fmp db2fmp.org /usr/bin/echo '\0000 \0 \0 \0' | dd of=db2fmp bs=4 count=1 seek=19 conv=notrunc
Esto reducirá maxdata a 1 (256 MB).
Si desea volver al valor original, emita lo siguiente:
db2stop cd ~/sqllib/adm cp db2fmp.org db2fmp
Tenga en cuenta que este cambio reduce el tamaño máximo de pila de 1,2 GB a 0,5 GB. Esto puede influir en otras aplicaciones que utilicen esta instancia de DB2.
Ajuste del tamaño del archivo de paginación:
Tenga en cuenta que el límite de tamaño máximo de antememoria en Windows es 1000 MB aproximadamente (1 GB = 1073741824 bytes).
Configuración de los límites del sistema:
rlim_fd_cur -> Por omisión 64, recomendado >= 1024
rlim_fd_cur_max -> Por omisión 1024, recomendado >= 4096
Configuración de los límites de la memoria compartida:
También puede que tenga que aumentar los siguientes valores de parámetros:
establezca shmsys:shminfo_shmmni=512
establezca shmsys:shminfo_shmseg=128 y, a continuación, rearranque el sistema.
Configuración del espacio de intercambio:
Consulte la documentación del sistema Solaris para obtener información sobre cómo añadir espacio de intercambio.
Tenga en cuenta que el límite de tamaño máximo de antememoria en Solaris es 2000 MB aproximadamente (2 GB = 2147483647 bytes).
Consulte la Guía rápida de iniciación de DB2 para obtener información sobre los parámetros de kernel recomendados en Linux.
El estado de validación para los nuevos kernels y distribuciones de Linux se actualiza frecuentemente. Para obtener la información más reciente sobre los niveles de software de Linux soportados, consulte la siguiente página Web: http://www.ibm.com/software/data/db2/linux/validate
Para ver los límites actuales de recursos compartidos, utilice el mandato ipcs -l. Para comprobar los límites del sistema, utilice el mandato ulimit -a.
Consulte la Guía rápida de iniciación de DB2 para obtener información sobre los parámetros de kernel recomendados en HP-UX.
DB2 Net Search Extender almacena información importante sobre los valores por omisión, las configuraciones, los índices de texto y los formatos en tablas de catálogo. Para ver esa información, es posible consultar algunas vistas en las tablas.
Las vistas y tablas siguientes reflejan la configuración actual del sistema:
Tenga en cuenta que, por razones de compatibilidad, las vistas de DB2 Text Information Extender todavía están disponibles. Son db2ext.textcolumns, db2ext.models y db2ext.formats.
La vista db2ext.dbdefaults visualiza todos los valores por omisión para la base de datos.
Los valores por omisión a nivel de base de datos no pueden cambiarse y están disponibles con pares de valor-atributo en esta vista:
db2ext.dbdefaults db2 select DEFAULTNAME, DEFAULTVALUE from DB2EXT.DBDEFAULTS
Tabla 9. Vista db2ext.dbdefaults
Atributo | Valor por omisión | Notas |
---|---|---|
CCSID | CCSID de base de datos | CCSID por omisión para documentos. Se aplica si no se especifica ningún CCSID en el mandato CREATE INDEX. |
FORMAT | TEXT | Formato por omisión del documento. Se aplica si no se especifica ningún formato en el mandato CREATE INDEX. |
INDEXDIRECTORY | Vea el nombre de la vía de acceso en Notas | Directorio de los archivos de índices de texto completo. Se aplica si no se especifica ningún directorio de índice en el mandato CREATE INDEX. El nombre de la vía de acceso es el siguiente: $DB2EXT_INSTOWNERHOMEDIR/sqllib/ db2ext/indexes |
LANGUAGE | EN_US | Idioma del documento. |
MODELCCSID | CCSID de base de datos | CCSID de los archivos de modelos de documento. |
UPDATECOMMITCOUNT | 0 | Número de cambios procesados en una transacción durante una actualización. |
CLEARCOMMITCOUNT | 0 | Número de cambios procesados en una transacción durante el mandato CLEAR INDEX. |
UPDATEFREQUENCY | NONE | Cuándo comprobar actualizaciones en índices nuevos. |
UPDATEMINIMUM | 1 | Número mínimo de cambios antes de ejecutar la actualización. |
WORKDIRECTORY | Vea el nombre de la vía de acceso en Notas | Directorio de los archivos temporales del índice. El nombre de la vía de acceso es el siguiente: <dependiente_del_so>/sqllib/db2ext/ indexes |
CACHEDIRECTORY | Vea el nombre de la vía de acceso en Notas | Directorio por omisión para la opción PERSISTENT CACHE del mandato CREATE INDEX. El nombre de la vía de acceso es el siguiente: <dependiente_del_sot>/sqllib/ db2ext/memory |
PCTFREE | 50 | Porcentaje de la antememoria que queda libre para inserciones posteriores. |
USERPERSISTENTCACHE | 1 | Utilice la antememoria permanente. |
AUTOMATICREORG | 1 | La opción REORGANIZE del mandato CREATE INDEX. Indica una reorganización automática. |
TREATNUMBERSASWORDS | 0 | No interprete secuencias como palabras independientes, aunque sean caracteres adyacentes. Por ejemplo, el valor por omisión 0 significa que tea42at5 se considera una sola palabra. |
INDEXSTOPWORDS | 1 | Ignora palabras de exclusión durante la indexación. |
VERSION |
| NSE V8.1.4 Número de versión actual de Net Search Extender. |
UPDATEDELAY | 0 | Sólo se utilizan entradas de anotaciones cronológicas para actualizaciones incrementales con una indicación de la hora. Si la entrada de anotación cronológica es anterior a la indicación de la hora actual, se trata de un retraso de actualización. Esto sólo se debe utilizar para transacciones que se ejecuten durante largo tiempo en la tabla de usuario durante un mandato de actualización para evitar la pérdida de actualizaciones. Tenga en cuenta que no se utiliza ninguna tabla de capturas con entradas de anotaciones cronológicas ni con actualizaciones incrementales. |