Qué es DLI

  • Facilidad de uso

    DLI le permite explorar fácilmente terabytes de datos en su lago de datos usando SQL estándar en segundos, sin carga de operación y mantenimiento.

    DLI le permite explorar fácilmente terabytes de datos en su lago de datos usando SQL estándar en segundos, sin carga de operación y mantenimiento.

  • Análisis unificado

    Totalmente compatible con Apache Spark, Flink y openLooKeng; procesamiento de flujos y por lotes, así como análisis interactivo en un solo lugar.

    Totalmente compatible con Apache Spark, Flink y openLooKeng; procesamiento de flujos y por lotes, así como análisis interactivo en un solo lugar.

  • Recursos escalables

    Acceso compartido y bajo demanda a grupos de recursos, escalamiento flexible basado en prioridades preestablecidas.

    Acceso compartido y bajo demanda a grupos de recursos, escalamiento flexible basado en prioridades preestablecidas.

  • Conexión entre fuentes

    Fácil acceso a datos de distintas fuentes para lograr el análisis colaborativo con conexiones de fuentes de datos de DLI, sin necesidad de migrar datos.

    Fácil acceso a datos de distintas fuentes para lograr el análisis colaborativo con conexiones de fuentes de datos de DLI, sin necesidad de migrar datos.

Características

  • Totalmente compatible con SQL

    Realice análisis de big data de forma simple con instrucciones SQL. La sintaxis es totalmente compatible con SQL ANSI 2003.

    Realice análisis de big data de forma simple con instrucciones SQL. La sintaxis es totalmente compatible con SQL ANSI 2003.

  • Spark/Flink/openLooKeng sin servidor

    Migre sin problemas sus aplicaciones fuera de línea a la nube utilizando tecnología sin servidor. DLI es totalmente compatible con los ecosistemas y las API de Apache Spark, Apache Flink y Presto.

    Migre sin problemas sus aplicaciones fuera de línea a la nube utilizando tecnología sin servidor. DLI es totalmente compatible con los ecosistemas y las API de Apache Spark, Apache Flink y Presto.

  • Análisis entre fuentes

    Analice sus datos en diferentes bases de datos sin necesidad de realizar migraciones. Contar con una visión unificada de sus datos lo ayudará a comprenderlos de forma integral y a innovar con mayor celeridad. No hay restricciones relacionadas con el formato ni con la fuente de los datos en la nube, así como tampoco resulta relevante si las bases de datos se crearon en línea o fuera de línea.

    Analice sus datos en diferentes bases de datos sin necesidad de realizar migraciones. Contar con una visión unificada de sus datos lo ayudará a comprenderlos de forma integral y a innovar con mayor celeridad. No hay restricciones relacionadas con el formato ni con la fuente de los datos en la nube, así como tampoco resulta relevante si las bases de datos se crearon en línea o fuera de línea.

  • Capacidad multitenant empresarial

    Gestione los permisos relacionados con el cómputo o los recursos por proyecto o por usuario. Disfrute de un control preciso que facilita mantener la independencia de los datos en cada tarea.

    Gestione los permisos relacionados con el cómputo o los recursos por proyecto o por usuario. Disfrute de un control preciso que facilita mantener la independencia de los datos en cada tarea.

Escenarios de aplicación

Análisis de bases de datos

Los datos de aplicaciones almacenados en bases de datos relacionales deben ser analizados para generar valor. Por ejemplo, la big data proveniente de detalles de registros ayudan a la toma de decisiones comerciales.

Dificultades

- No se admiten consultas complejas para bases de datos relacionales de mayor tamaño.

- No es posible efectuar un análisis completo porque las particiones de las bases de datos y de las tablas están repartidas en múltiples bases de datos relacionales. El análisis de datos del negocio podría sobrecargar los recursos disponibles.

Ventajas

  • Capacidad de transferir la experiencia en SQL

    Acelere la puesta en marcha de sus nuevos servicios. DLI es compatible con la sintaxis estándar de las bases de datos relacionales SQL ANSI 2003, por lo que prácticamente no hay curva de aprendizaje.

  • Rendimiento versátil y robusto

    Los modelos de cómputo en memoria distribuido procesan sin esfuerzo consultas complicadas, análisis entre particiones y procesamiento de inteligencia empresarial.

Servicios relacionados

Marketing de precisión

El análisis asociativo combina la información de múltiples canales para mejorar las tasas de conversión.

Ventajas

  • Análisis entre fuentes

    Los datos de CTR de anuncios, almacenados en OBS, y los datos de registros de usuarios en RDS pueden consultarse directamente sin necesidad de migrar a DLI.

  • Solo SQL

    Las fuentes de datos interconectadas, puede mapearse junto con una tabla creada únicamente con instrucciones SQL.

Servicios relacionados

Análisis de registros

Las empresas de videojuegos necesitan una plataforma de análisis de datos de calidad para mejorar la colocación de anuncios, la retención de jugadores nuevos, las operaciones y los comentarios para futuras iteraciones de los juegos.

Dificultades

- El análisis de registros suele realizarse por períodos. Durante los períodos de inactividad entre cada tarea, se desperdician recursos.

Ventajas

  • Pago por uso y escalamiento automático

    Libere recursos inactivos con políticas de escalamiento flexibles y ahorre la mitad de los costos de los clústeres exclusivos.

  • Análisis convergente

    Solo se necesita una copia de los metadatos para la limpieza en tiempo real y el procesamiento ETL fuera de línea. Los resultados del procesamiento de datos pueden utilizarse directamente en análisis interactivos para la minería de datos.

Servicios relacionados

Control de permisos

Cuando múltiples departamentos necesitan administrar recursos de forma independiente, la gestión de permisos detallada mejora la seguridad de los datos y la eficiencia de las operaciones.

Ventajas

  • Asignación de permisos más sencilla

    Otorgue permisos por columna o por operación específica, como INSERT INTO/OVERWRITE, y configure los metadatos en modo de solo lectura.

  • Gestión unificada

    Una sola cuenta de IAM gestiona los permisos para todos los usuarios del personal.

Integración de bibliotecas

El análisis genómico requiere del uso de bibliotecas de análisis de terceros, basadas en el marco de trabajo distribuido de Spark.

Dificultades

- Se requieren grandes habilidades técnicas para instalar bibliotecas de análisis como ADAM y Hail.

- Cada vez que se crea un clúster, hay que volver a instalar estas bibliotecas de análisis.

Ventajas

  • Imágenes personalizadas

    En lugar de instalar bibliotecas mediante un proceso exigente en términos técnicos, empaquételas en imágenes personalizadas que se cargan directamente en SoftWare Repository for Container (SWR). Cuando se utiliza DLI para crear un clúster, las imágenes personalizadas en SWR se extraen automáticamente para no tener que volver a instalar estas bibliotecas.

  • Imágenes base incorporadas

    Las imágenes Spark y Flink mejoradas de Huawei (múltiples versiones) y las imágenes de IA de código abierto (TensorFlow/Keras/PyTorch) están disponibles para su conveniencia.

Servicios relacionados

Control de riesgos en tiempo real

Casi todos los aspectos relacionados con los servicios financieros requieren la gestión y la mitigación exhaustivas de los riesgos.

Dificultades

- Cuando se trata del control de riesgos, hay muy poca tolerancia a la latencia excesiva.

Ventajas

  • Alto throughput

    El análisis de datos en tiempo real en DLI con la ayuda de un modelo de flujo de datos de Apache Flink mantiene baja la latencia. Una sola CPU procesa entre 1,000 y 20,000 mensajes por segundo.

  • Cobertura del ecosistema

    Guarde flujos de datos en tiempo real en múltiples servicios en la nube, como CloudTable y SMN, para una aplicación integral.

Servicios relacionados

Pantallas en tiempo real

Con el COVID-19 presente en todo el mundo, los gobiernos deben ser capaces de monitorear los datos clave en el momento en que se presentan los hechos.

Dificultades

- Los empleados gubernamentales no están necesariamente capacitados en big data. SQL suele ser mucho más conocido.

Ventajas

  • Capacidad de respuesta en milisegundos

    Gracias a su potente marco de cómputo en memoria, el motor openLooKeng integrado optimiza el rendimiento de las consultas para el análisis interactivo en el momento.

  • Compatibilidad general

    Las consultas de DLI usan sintaxis SQL, por lo que el personal no necesita estar especializado en big data. Esta sintaxis conocida es totalmente compatible con SQL ANSI 2003 estándar.

Servicios relacionados

Análisis de big data

Volúmenes masivos de datos que incluyen petabytes de imágenes satelitales y muchos tipos de datos: datos rasterizados de teledetección estructurados, datos vectoriales y datos de ubicación espacial no estructurados. El análisis y la minería de todos estos datos requieren herramientas eficientes.


Ventajas

  • Análisis de datos espaciales

    Los operadores de algoritmos de Spark en DLI habilitan el procesamiento de flujos en tiempo real y el procesamiento por lotes fuera de línea. Admiten tipos de datos masivos, entre los que se incluyen los datos estructurados de imágenes de teledetección, el modelado 3D no estructurado y los datos de puntos láser en la nube.

  • Funcionalidad de SQL CEP

    Instrucciones SQL son todo lo que se necesita para la detección de guiñada y las geovallas.

  • Procesamiento de datos pesados

    Migre rápidamente hasta exabytes de imágenes de teledetección a la nube y luego divídalas en fuentes de datos para realizar el procesamiento por lotes distribuido.

Servicios relacionados

DLI vs. Hadoop de construcción propia

Data Lake Insight

Sistema Hadoop de construcción propia

Costo

Facturado por el volumen real de datos analizados o la cantidad de unidades de cómputo por hora (CUH) utilizadas.

Se ahorran costos.

Facturado por recursos ocupados.

La ocupación a largo plazo es costosa y excesiva.

Escalabilidad elástica

Inteligente con Kubernetes basado en contenedores

N/A

O&M y disponibilidad

Arquitectura sin servidor y lista para usar, y recuperación ante desastres (DR) entre AZ

Se requieren sólidas capacidades técnicas para la configuración y las tareas de O&M

Costo de aprendizaje

Los parámetros de optimización están estandarizados sobre la base de 10 años de experiencia en miles de proyectos.

Además, DLI proporciona una interfaz gráfica de usuario (GUI) para la optimización inteligente.

Es necesario aprender cientos de parámetros de ajuste.

Fuentes de datos compatibles

Nube: OBS/RDS/DWS/CSS/MongoDB/Redis

Local: MongoDB/Redis/bases de datos de construcción propia

Nube: OBS

Local: HDFS

Compatibilidad con ecosistemas

Data Lake Visualization (DLV), Tableau, Yonghong BI y Fanruan BI

Herramienta del ecosistema de big data

Imagen personalizada

Se admite. Pueden agregarse dependencias según sea necesario para cumplir con los requerimientos de diversidad de los servicios.

N/A

Planificación de flujos de trabajo

Planificación a través de Data Lake Factory (DLF) en DataArts Studio

Herramientas de planificación de construcción propia, como Airflow

Permisos de tenant empresarial

Gestión basada en tablas con granularidad a nivel de columna

Gestión basada en archivos

Rendimiento

Mayor, gracias al software y hardware optimizados

Coincide con el de las versiones de Hadoop de código abierto

Costo

Data Lake Insight

Facturado por el volumen real de datos analizados o la cantidad de unidades de cómputo por hora (CUH) utilizadas.

Se ahorran costos.

Sistema Hadoop de construcción propia

Facturado por recursos ocupados.

La ocupación a largo plazo es costosa y excesiva.

Escalabilidad elástica

Data Lake Insight

Inteligente con Kubernetes basado en contenedores

Sistema Hadoop de construcción propia

N/A

O&M y disponibilidad

Data Lake Insight

Arquitectura sin servidor y lista para usar, y recuperación ante desastres (DR) entre AZ

Sistema Hadoop de construcción propia

Se requieren sólidas capacidades técnicas para la configuración y las tareas de O&M

Costo de aprendizaje

Data Lake Insight

Los parámetros de optimización están estandarizados sobre la base de 10 años de experiencia en miles de proyectos.

Además, DLI proporciona una interfaz gráfica de usuario (GUI) para la optimización inteligente.

Sistema Hadoop de construcción propia

Es necesario aprender cientos de parámetros de ajuste.

Fuentes de datos compatibles

Data Lake Insight

Nube: OBS/RDS/DWS/CSS/MongoDB/Redis

Local: MongoDB/Redis/bases de datos de construcción propia

Sistema Hadoop de construcción propia

Nube: OBS

Local: HDFS

Compatibilidad con ecosistemas

Data Lake Insight

Data Lake Visualization (DLV), Tableau, Yonghong BI y Fanruan BI

Sistema Hadoop de construcción propia

Herramienta del ecosistema de big data

Imagen personalizada

Data Lake Insight

Se admite. Pueden agregarse dependencias según sea necesario para cumplir con los requerimientos de diversidad de los servicios.

Sistema Hadoop de construcción propia

N/A

Planificación de flujos de trabajo

Data Lake Insight

Planificación a través de Data Lake Factory (DLF) en DataArts Studio

Sistema Hadoop de construcción propia

Herramientas de planificación de construcción propia, como Airflow

Permisos de tenant empresarial

Data Lake Insight

Gestión basada en tablas con granularidad a nivel de columna

Sistema Hadoop de construcción propia

Gestión basada en archivos

Rendimiento

Data Lake Insight

Mayor, gracias al software y hardware optimizados

Sistema Hadoop de construcción propia

Coincide con el de las versiones de Hadoop de código abierto

Historias de éxito

Mengxiang.com

Mengxiang utiliza DLI y DataArts Studio de Huawei Cloud para analizar datos de comportamiento en tiempo real y relacionar productos con los clientes.

Esta empresa de rápido crecimiento se enfrentó a desafíos relacionados con la estabilidad del servicio durante las horas de mayor tráfico y las promociones. La solución “DLI+DataArts Studio” proporciona a Mengxiang una arquitectura elástica y un lago de datos de alto rendimiento para el procesamiento integral de flujos y por lotes.

DIANCHU Technology

DIANCHU utilizó DLI de Huawei Cloud y el lago de datos inteligente DataArts Studio para establecer una plataforma de análisis de datos para videojuegos. La plataforma analiza los ingresos, la tasa de retención de jugadores y la tasa de pago en tiempo real para la planificación de actividades, el marketing de precisión y la toma de decisiones.

Dragonest

Dragonest colabora con Huawei Cloud para consultar y analizar datos de videojuegos. El análisis es útil para los diferentes departamentos durante el lanzamiento de nuevos servicios. Las aplicaciones de datos están integradas, lo que beneficia a toda la organización.

Regístrese y comience un increíble viaje a la nube

Probar gratis