使用文本搜索

文本搜索可用于在表中快速搜索单个 CHAR、VARCHAR、LONG VARCHAR、VARBINARY 或 LONG VARBINARY 字段的内容,以查找特定关键字。

可以对要重复查询其内容的列使用此功能。创建文本索引之后,对源表的 DML 操作会变得稍慢。这种性能变化是对文本索引和源表进行同步所导致的。每次对源表执行操作时,文本索引都会在后台进行更新。对源表的定期查询不受影响。

文本索引包含源表文本字段以及在创建索引期间包含的任何其他额外列中的所有单词。不会为额外列编制索引,仅将其值传递到文本索引中。文本索引就像任何其他 Vertica 表一样,除了它在内部链接至源表。

首先对计划搜索的表创建文本索引。然后,在对表创建索引后,针对文本索引运行查询,以查找特定关键字。此查询会为每个关键字实例返回一个 doc_id。与直接在源表中查询其文本字段的内容相比,在查询文本索引之后将文本索引联接回源表的性能会有显著提高。