加载并行度

Vertica 可以拆分加载数据的工作,从而利用并行度来加快操作速度。Vertica 支持多种类型的并行度:

  • 分布式加载:Vertica 会将多文件加载中的文件分配给多个节点以并行加载,而不是在单个节点上加载所有文件。Vertica 会管理分布式加载;您无需在 UDL 中执行任何特殊操作。

  • 协作解析:在单个节点上加载的源会使用多线程来并行执行解析。协作解析会根据线程的调度方式在执行时拆分加载。您必须在解析器中启用协作解析。请参阅协作解析

  • 分摊加载:Vertica 会将单个大型文件或其他单个源拆分成多个段,以将段分配给多个节点进行并行加载。分摊加载会根据每个节点上的可用节点和核心在计划时拆分加载。您必须在源代码和解析器中启用分摊加载。请参阅分摊加载

您可以在同一 UDL 中同时支持协作解析和分摊加载。Vertica 可确定要对每个加载操作使用哪个并行度,也可能同时使用这两者。请参阅组合协作解析和分摊加载