IBM Books
(C) IBM Corp. 2000, 2003.

Net Search Extender

管理和用户指南


词汇表

本词汇表定义本手册中所使用的术语和缩写词。如果找不到您要查找的术语,则参考索引或者 Dictionary of Computing, New York: McGraw-Hill, 1994。

A

存取函数(access function)
用户提供的一个函数,它将一列中存储的文本的数据类型转换为可以由 DB2 Net Search Extender 处理的类型。

B

布尔搜索(Boolean search)
一种搜索方法,在该搜索方法中,将使用布尔运算符来组合一个或多个搜索术语。

C

目录视图(catalog view)
DB2 Net Search Extender Text 为了便于管理而创建的系统表的视图。目录视图包含有关已启用以供 DB2 Net Search Extender Text 使用的表和列的信息。

CCSID
编码字符集标识符。

代码页(code page)
将图形字符和控制功能含义指定给所有代码点。例如,对于 8 位代码,将字符和含义指定给 256 个代码点。

命令行处理器(command line processor)
一个称为 db2text 的程序,它可以:

允许您输入 DB2 Net Search Extender 命令

处理命令

显示结果

计数(count)
一个关键字,用来指定同义字中术语的层数(深度),这些同义字将用来扩展给定关系的搜索术语。

D

DBCS
双字节字符集。

禁用(disable)
通过除去在启用过程中创建的项,将数据库复原为 DB2 Net Search Extender Text 启用之前的状态。

文档(document)
参见文本文档(text document)

文档模型(document model)
用文档包含的各节来表示的文档结构的定义。文档模型使 DB2 Net Search Extender 在建立索引时能够了解文档中的各节。文档模型列示用来标识各节的标记(markup tag)。对于每个标记,可以指定一个描述性节名,以便在对该节进行查询时使用。可以在文档模型文件中指定一个或多个文档模型。

E

启用(enable)
准备数据库以供 DB2 Net Search Extender 使用。

转义字符(escape character)
用来指示不要将后续字符解释为屏蔽字符(masking character)的字符。

扩展(expand)
它是将从同义字派生的附加术语添加至搜索术语的一种操作。

F

格式(format)
文档的类型,例如,ASCII 或 HTML。

自由文本搜索(free-text search)
一种搜索方法,在该搜索方法中,搜索术语是以自由格式的文本(用自然语言描述要搜索的主题的短语或句子)表示的。

函数(function)
参见存取函数(access function)

模糊搜索(fuzzy search)
一种搜索方法,它可以找到其拼写与搜索术语的拼写相似的词语。

H

混合搜索(hybrid search)
它将布尔搜索(Boolean search)自由文本搜索(free-text search)组合起来使用。

I

索引(index)
从文本中抽取重要术语,并将它们存储在文本索引(text index)中。

索引特征(index characteristics)
用来确定以下内容的文本索引(text index)的属性:

更新索引的频率

发生第一次索引更新的时间

L

日志表(log table)
由 DB2 Net Search Extender 创建的一个表,它包含有关要对哪些文本文档建立索引的信息。每当添加、更改或删除已启用的文本列中的文档时,就使用触发器(Trigger)来将此信息存储在日志表中。

M

屏蔽字符(masking character)
在搜索术语前面、中间或末尾用来表示可选字符的字符。屏蔽字符通常用于在精确索引中查找术语的变体。

匹配(match)
搜索术语在文本文档中的出现。

P

定期建立索引(periodic indexing)
按预先确定的时间间隔建立索引,时间间隔是用天、小时、分钟以及在可建立索引之前日志表(log table)中应当列出的最小文档名称数来表示。

R

检索(retrieve)
在 DB2 Net Search Extender 的其中一个搜索函数中使用搜索自变量来查找文本文档。

S

SBCS
单字节字符集。

分数(Score)
从 0 到 1 之间的、类型为 DOUBLE 的一个绝对值,它指示一个文档相对于找到的其它文档来说满足搜索条件的程度。该值指示在文档中找到的匹配数与文档大小的比例。该值指示在文档中找到的匹配数与文档大小成比例。

搜索自变量(search argument)
在进行搜索时所指定的条件,它由一个或几个搜索术语以及搜索参数组成。

T

文本列(text column)
包含文本文档(text document)的列。

文本文档(text document)
存储在 DB2 表中的类型为 CHAR、GRAPHIC、VARGRAPHIC、LONG VARGRAPHIC、DBCLOB、VARCHAR、LONG VARCHAR 或 CLOB 数据类型的文本。

文本索引(text index)
从文本文档中抽取的重要术语的集合。每个术语都与抽取该术语的文档相关联。通过在索引中而不是在文档本身中进行搜索,明显缩短了搜索时间。

跟踪(tracing)
它是这样一种操作:将信息存储在文件中,然后可以使用这些信息来查明错误原因。

触发器(trigger)
触发器是以下一种机制:每当对文本列添加、更改或删除文档时,自动地将有关需要建立索引的文档的信息添加到日志表(log table)中。

U

UDF
用户定义函数。

UDT
用户定义类型。

更新频率(update frequency)
更新文本索引的频率,是用天、小时、分钟以及在可建立索引之前日志表(log table)中应当列出的最小文档名称数来表示。

用户定义类型(user-defined type)(UDT)
由 DB2 的用户创建的一种数据类型,与 DB2 提供的数据类型(例如,LONG VARCHAR)相对。

用户定义函数(user-defined function)(UDF)
由 DB2 的用户创建的 SQL 函数,与 DB2 提供的 SQL 函数相对。

W

通配符(wildcard character)
参见屏蔽字符(masking character)


[ 页的顶部 | 上一页 | 下一页 | 目录 | 索引 ]