La tabla siguiente muestra qué elementos se colocan en el índice.
Tabla 8. Entradas del índice de texto
Información de límite de campo | Texto indexado |
|
---|---|---|
inicio del campo "addresses" inicio del campo "customerName" | Alice Smith | [1] y [2] |
final del campo "customerName" |
123 Maple Street Mill Hill CA 90999 | [2] |
final del campo "addresses" |
123 1 S&B Cortacésped tipo ABC-x 239.90 2001-01-25 987Z 1 Rastrillo multifuncional ZYX 69.90 2001-01-24 |
|
Nombre de atributo | Valor(es) de atributo |
|
Número de pieza | 123, 987 |
|
Tenga en cuenta que los campos anidados son posibles, como se muestra en este ejemplo. El campo addresses selecciona un nodo en el documento XML que domina el nodo seleccionado por el campo customerName. El contenido de ese nodo integrado, por lo tanto, pertenece lógicamente a ambos campos. Aunque puede que los campos de texto se solapen, el texto dentro de esos campos se indexa sólo una vez. En este ejemplo, al realizar una búsqueda con una restricción de campo, Alice Smith se encuentra tanto en addresses como en customerName.
El contenido de los campos se determina siguiendo las reglas siguientes:
El documento debe contener XML bien formado pero no es necesario especificar una DTD en el documento XML. No se lleva a cabo ninguna validación de la DTD ni resolución de entidades externa; Net Search Extender sólo se corresponde con el documento XML frente al modelo de documento. Las entidades internas se sustituyen según lo solicite XML.
Para obtener información sobre las definiciones de tipo de documento, consulte el apartado DTD para modelos de documento.
Para ver las restricciones, consulte el apartado Limitaciones de campos de texto y atributos de documento.
Los modelos de documento para el formato Outside In se parecen mucho a los modelos de documento HTML en que permiten correlacionar elementos estructurales identificados por un conjunto determinado de identificadores con campos de texto de NSE y atributos de documentos. Supongamos que tiene un conjunto de documentos de Microsoft Word y desea indexar las propiedades de documento "título", "tema" y "palabra clave" como campos y las propiedades de documento "autor" y "categoría" como atributos de documento. El siguiente ejemplo para un modelo de documento Outside In realizará esta correlación:
<?xml version="1.0"?> <INSOModel> <INSOFieldDefinition name="título" tag="SCCCA_TITLE"/> <INSOFieldDefinition name="título" tag="SCCCA_SUBJECT"/> <INSOFieldDefinition name="título" tag="SCCCA_KEYWORDS"/> <INSOAttributeDefinition name="autor" tag="SCCCA_AUTHOR" type="STRING"/> <INSOAttributeDefinition name="categoría" tag="SCCCA_CATEGORY" type="STRING"/> </INSOModel>