Importación y exportación de datos de GaussDB(DWS)

GaussDB(DWS) proporciona una gama de soluciones que permiten importar y exportar datos en múltiples formatos.

Herramientas de importación y exportación

      Puede elegir entre las siguientes herramientas según sea necesario para importar datos a GaussDB(DWS) o exportarlos desde GaussDB(DWS).

Tabla 3-1 Herramientas de importación y exportación de datos

Uso
Herramienta

Importación o exportación por lotes de una gran cantidad de datos

GDS

Importación o exportación por lotes de una pequeña cantidad de datos

copiar en/desde (archivo/Stdin)

Exportación del conjunto de resultados de la consulta

copiar consulta en/desde (archivo/Stdin)

Importar una pequeña cantidad de datos a otras bases de datos o exportar dicha cantidad a otras bases de datos

insertar valores / ETL

Respaldo/restauración de metadatos de base de datos

gs_dump/gs_restore

Importación de datos desde HDFS

Tabla externa HDFS

Importación de datos desde OBS

Tabla externa de texto de OBS, tabla externa ORC de OBS

Migración / copia de seguridad de datos entre clústeres

Roach

Servicio de datos de Gauss (GDS)

      Puede utilizar la herramienta de servicio de datos Gauss (GDS) para importar y exportar texto de manera eficiente.

      Como se muestra en la siguiente figura, se emplea un servidor GDS en cada nodo físico de un clúster para importar y exportar datos en paralelo. La velocidad de un solo nodo puede alcanzar los 700 MBps.

Figura 3-1 Importación y exportación de datos en paralelo mediante GDS

      GDS puede trabajar conjuntamente con Foreign Data Wrapper (FDW), que permite el acceso a los datos de distintos clústeres, para migrar datos de un clúster a otro de forma rápida y sencilla. Como se muestra en la siguiente figura, GDS establece un canal de transferencia de datos entre dos clústeres. Los datos pueden exportarse desde el clúster de origen e importarse directamente al clúster de destino sin escribirse en discos.

Figura 3-2 Migración de datos entre clústeres

   Ventajas

  • Facilidad de uso. Puede migrar los datos ejecutando una sola sentencia SQL: “INSERT INTO... SELECT... FROM... [WHERE];”.
  • Alto rendimiento: La potencia informática de ambos clústeres se puede utilizar completamente.
  • Los datos no se escriben en los discos durante la migración, por lo que no ocupan espacio en disco.

   Uso

  • Migración de datos completa entre los clústeres de GaussDB(DWS).
  • Migración parcial de datos basada en condiciones de filtrado entre clústeres de GaussDB(DWS).