对 GPP 文档建立索引时的情况

通用解析器将扫描文档以查找其中一个开始边界字符串。当它找到一个开始边界字符串时,它将对后续字段进行语法分析,直到找到相应的结束边界字符串为止。

然后将根据定义词条对字段的内容建立索引,即,作为文本字段或文档属性。如果文本字段和文档属性具有相同的开始和结束边界字符串,则将把字段的内容同时作为文本字段和文档属性来对其建立索引。

不允许字段的嵌套;如果在到达结束边界字符串前发现新的开始边界字符串,则会将新的开始边界字符串解释为普通文本。

如果未找到相应的结束边界字符串,则假定该字段扩展至文档结束,并将报告适当的原因码。

如果在文档模型中未指定结束边界字符串,则新的开始边界字符串指示先前字段的结束。