区域设置和 UTF-8 支持

Vertica 支持 Unicode 转换格式 8 或 UTF8,其中 8 表示 8 位。UTF-8 是由 Ken Thompson 和 Rob Pike 创建的 Unicode 可变长度字符编码。UTF-8 可以表示 Unicode 标准中的任何通用字符。UTF-8 的字节代码和字符分配的初始编码与 ASCII 一致。因此,对于处理 ASCII 但保留其他值的软件,UTF8 仅需略加更改,或者无需更改。

Vertica 数据库服务器要求以 UTF-8 格式接收所有数据,且 Vertica 以 UTF-8 格式输出所有数据。ODBC API 对 Windows 系统上采用 UCS-2 形式的数据进行操作,通常 UTF-8 位于 Linux 系统上。JDBC 和 ADO.NET API 对采用 UTF-16 形式的数据进行操作。在使用 API 调用向 Vertica 发送数据并接收数据时,客户端驱动程序会自动在数据和 UTF-8 之间进行转换。驱动程序不会转换通过执行 COPYCOPY LOCAL 语句加载的数据。

UTF-8 字符串函数

以下字符串函数会将 VARCHAR 实参视为 UTF-8 字符串(未指定 USING OCTETS 时),而不管区域设置如何。