Data Lake Insight

Contacto de ventas

Qué es DLI

Facilidad de uso

DLI le permite explorar fácilmente terabytes de datos en su lago de datos usando SQL estándar en segundos, sin carga de operación y mantenimiento.

DLI le permite explorar fácilmente terabytes de datos en su lago de datos usando SQL estándar en segundos, sin carga de operación y mantenimiento.
Análisis unificado

Totalmente compatible con Apache Spark, Flink y openLooKeng; procesamiento de flujos y por lotes, así como análisis interactivo en un solo lugar.

Totalmente compatible con Apache Spark, Flink y openLooKeng; procesamiento de flujos y por lotes, así como análisis interactivo en un solo lugar.

Recursos escalables

Acceso compartido y bajo demanda a grupos de recursos, escalamiento flexible basado en prioridades preestablecidas.

Acceso compartido y bajo demanda a grupos de recursos, escalamiento flexible basado en prioridades preestablecidas.
Conexión entre fuentes

Fácil acceso a datos de distintas fuentes para lograr el análisis colaborativo con conexiones de fuentes de datos de DLI, sin necesidad de migrar datos.

Fácil acceso a datos de distintas fuentes para lograr el análisis colaborativo con conexiones de fuentes de datos de DLI, sin necesidad de migrar datos.

Características

Totalmente compatible con SQL

Realice análisis de big data de forma simple con instrucciones SQL. La sintaxis es totalmente compatible con SQL ANSI 2003.

Realice análisis de big data de forma simple con instrucciones SQL. La sintaxis es totalmente compatible con SQL ANSI 2003.
Spark/Flink/openLooKeng sin servidor

Migre sin problemas sus aplicaciones fuera de línea a la nube utilizando tecnología sin servidor. DLI es totalmente compatible con los ecosistemas y las API de Apache Spark, Apache Flink y Presto.

Migre sin problemas sus aplicaciones fuera de línea a la nube utilizando tecnología sin servidor. DLI es totalmente compatible con los ecosistemas y las API de Apache Spark, Apache Flink y Presto.

Análisis entre fuentes

Analice sus datos en diferentes bases de datos sin necesidad de realizar migraciones. Contar con una visión unificada de sus datos lo ayudará a comprenderlos de forma integral y a innovar con mayor celeridad. No hay restricciones relacionadas con el formato ni con la fuente de los datos en la nube, así como tampoco resulta relevante si las bases de datos se crearon en línea o fuera de línea.

Analice sus datos en diferentes bases de datos sin necesidad de realizar migraciones. Contar con una visión unificada de sus datos lo ayudará a comprenderlos de forma integral y a innovar con mayor celeridad. No hay restricciones relacionadas con el formato ni con la fuente de los datos en la nube, así como tampoco resulta relevante si las bases de datos se crearon en línea o fuera de línea.
Capacidad multitenant empresarial

Gestione los permisos relacionados con el cómputo o los recursos por proyecto o por usuario. Disfrute de un control preciso que facilita mantener la independencia de los datos en cada tarea.

Gestione los permisos relacionados con el cómputo o los recursos por proyecto o por usuario. Disfrute de un control preciso que facilita mantener la independencia de los datos en cada tarea.

Adecuado a sus necesidades

Recursos compactos

64 unidades de cómputo
Colas SQL
Análisis de menos de 1 TB de datos en lagos/almacenes de datos; análisis de IA; costos predecibles; escalamiento elástico de recursos sin O&M

Aplicaciones empresariales Pruebas comerciales limitadas

Desde $0.91 USD

/hora

Recursos amplios

256 unidades de cómputo
Colas SQL
Análisis de menos de 10 TB de datos en lagos/almacenes de datos que involucran una gran cantidad de tareas JOIN y shuffles

Cómputo de alto rendimiento Lago de datos nativo de la nube

Desde $14.59 USD

/hora

Análisis de bases de datos

Los datos de aplicaciones almacenados en bases de datos relacionales deben ser analizados para generar valor. Por ejemplo, la big data proveniente de detalles de registros ayudan a la toma de decisiones comerciales.

Dificultades

- No se admiten consultas complejas para bases de datos relacionales de mayor tamaño.

- No es posible efectuar un análisis completo porque las particiones de las bases de datos y de las tablas están repartidas en múltiples bases de datos relacionales. El análisis de datos del negocio podría sobrecargar los recursos disponibles.

Ventajas

Capacidad de transferir la experiencia en SQL

Acelere la puesta en marcha de sus nuevos servicios. DLI es compatible con la sintaxis estándar de las bases de datos relacionales SQL ANSI 2003, por lo que prácticamente no hay curva de aprendizaje.
Rendimiento versátil y robusto

Los modelos de cómputo en memoria distribuido procesan sin esfuerzo consultas complicadas, análisis entre particiones y procesamiento de inteligencia empresarial.

Servicios relacionados

CDM

Marketing de precisión

El análisis asociativo combina la información de múltiples canales para mejorar las tasas de conversión.

Ventajas

Análisis entre fuentes

Los datos de CTR de anuncios, almacenados en OBS, y los datos de registros de usuarios en RDS pueden consultarse directamente sin necesidad de migrar a DLI.
Solo SQL

Las fuentes de datos interconectadas, puede mapearse junto con una tabla creada únicamente con instrucciones SQL.

Servicios relacionados

OBS

Análisis de registros

Las empresas de videojuegos necesitan una plataforma de análisis de datos de calidad para mejorar la colocación de anuncios, la retención de jugadores nuevos, las operaciones y los comentarios para futuras iteraciones de los juegos.

Dificultades

- El análisis de registros suele realizarse por períodos. Durante los períodos de inactividad entre cada tarea, se desperdician recursos.

Ventajas

Pago por uso y escalamiento automático

Libere recursos inactivos con políticas de escalamiento flexibles y ahorre la mitad de los costos de los clústeres exclusivos.
Análisis convergente

Solo se necesita una copia de los metadatos para la limpieza en tiempo real y el procesamiento ETL fuera de línea. Los resultados del procesamiento de datos pueden utilizarse directamente en análisis interactivos para la minería de datos.

Servicios relacionados

MySQL

Control de permisos

Cuando múltiples departamentos necesitan administrar recursos de forma independiente, la gestión de permisos detallada mejora la seguridad de los datos y la eficiencia de las operaciones.

Ventajas

Asignación de permisos más sencilla

Otorgue permisos por columna o por operación específica, como INSERT INTO/OVERWRITE, y configure los metadatos en modo de solo lectura.
Gestión unificada

Una sola cuenta de IAM gestiona los permisos para todos los usuarios del personal.

Integración de bibliotecas

El análisis genómico requiere del uso de bibliotecas de análisis de terceros, basadas en el marco de trabajo distribuido de Spark.

Dificultades

- Se requieren grandes habilidades técnicas para instalar bibliotecas de análisis como ADAM y Hail.

- Cada vez que se crea un clúster, hay que volver a instalar estas bibliotecas de análisis.

Ventajas

Imágenes personalizadas

En lugar de instalar bibliotecas mediante un proceso exigente en términos técnicos, empaquételas en imágenes personalizadas que se cargan directamente en SoftWare Repository for Container (SWR). Cuando se utiliza DLI para crear un clúster, las imágenes personalizadas en SWR se extraen automáticamente para no tener que volver a instalar estas bibliotecas.
Imágenes base incorporadas

Las imágenes Spark y Flink mejoradas de Huawei (múltiples versiones) y las imágenes de IA de código abierto (TensorFlow/Keras/PyTorch) están disponibles para su conveniencia.

Servicios relacionados

SWR

Control de riesgos en tiempo real

Casi todos los aspectos relacionados con los servicios financieros requieren la gestión y la mitigación exhaustivas de los riesgos.

Dificultades

- Cuando se trata del control de riesgos, hay muy poca tolerancia a la latencia excesiva.

Ventajas

Alto throughput

El análisis de datos en tiempo real en DLI con la ayuda de un modelo de flujo de datos de Apache Flink mantiene baja la latencia. Una sola CPU procesa entre 1,000 y 20,000 mensajes por segundo.
Cobertura del ecosistema

Guarde flujos de datos en tiempo real en múltiples servicios en la nube, como CloudTable y SMN, para una aplicación integral.

Servicios relacionados

SMN

DIS

Pantallas en tiempo real

Con el COVID-19 presente en todo el mundo, los gobiernos deben ser capaces de monitorear los datos clave en el momento en que se presentan los hechos.

Dificultades

- Los empleados gubernamentales no están necesariamente capacitados en big data. SQL suele ser mucho más conocido.

Ventajas

Capacidad de respuesta en milisegundos

Gracias a su potente marco de cómputo en memoria, el motor openLooKeng integrado optimiza el rendimiento de las consultas para el análisis interactivo en el momento.
Compatibilidad general

Las consultas de DLI usan sintaxis SQL, por lo que el personal no necesita estar especializado en big data. Esta sintaxis conocida es totalmente compatible con SQL ANSI 2003 estándar.

Servicios relacionados

MySQL

DLV

CDM

Análisis de big data

Volúmenes masivos de datos que incluyen petabytes de imágenes satelitales y muchos tipos de datos: datos rasterizados de teledetección estructurados, datos vectoriales y datos de ubicación espacial no estructurados. El análisis y la minería de todos estos datos requieren herramientas eficientes.

Ventajas

Análisis de datos espaciales

Los operadores de algoritmos de Spark en DLI habilitan el procesamiento de flujos en tiempo real y el procesamiento por lotes fuera de línea. Admiten tipos de datos masivos, entre los que se incluyen los datos estructurados de imágenes de teledetección, el modelado 3D no estructurado y los datos de puntos láser en la nube.
Funcionalidad de SQL CEP

Instrucciones SQL son todo lo que se necesita para la detección de guiñada y las geovallas.
Procesamiento de datos pesados

Migre rápidamente hasta exabytes de imágenes de teledetección a la nube y luego divídalas en fuentes de datos para realizar el procesamiento por lotes distribuido.

Servicios relacionados

DIS

CDM

DES

DLI vs. Hadoop de construcción propia

	Data Lake Insight	Sistema Hadoop de construcción propia
Costo	Facturado por el volumen real de datos analizados o la cantidad de unidades de cómputo por hora (CUH) utilizadas. Se ahorran costos.	Facturado por recursos ocupados. La ocupación a largo plazo es costosa y excesiva.
Escalabilidad elástica	Inteligente con Kubernetes basado en contenedores	N/A
O&M y disponibilidad	Arquitectura sin servidor y lista para usar, y recuperación ante desastres (DR) entre AZ	Se requieren sólidas capacidades técnicas para la configuración y las tareas de O&M
Costo de aprendizaje	Los parámetros de optimización están estandarizados sobre la base de 10 años de experiencia en miles de proyectos. Además, DLI proporciona una interfaz gráfica de usuario (GUI) para la optimización inteligente.	Es necesario aprender cientos de parámetros de ajuste.
Fuentes de datos compatibles	Nube: OBS/RDS/DWS/CSS/MongoDB/Redis Local: MongoDB/Redis/bases de datos de construcción propia	Nube: OBS Local: HDFS
Compatibilidad con ecosistemas	Data Lake Visualization (DLV), Tableau, Yonghong BI y Fanruan BI	Herramienta del ecosistema de big data
Imagen personalizada	Se admite. Pueden agregarse dependencias según sea necesario para cumplir con los requerimientos de diversidad de los servicios.	N/A
Planificación de flujos de trabajo	Planificación a través de Data Lake Factory (DLF) en DataArts Studio	Herramientas de planificación de construcción propia, como Airflow
Permisos de tenant empresarial	Gestión basada en tablas con granularidad a nivel de columna	Gestión basada en archivos
Rendimiento	Mayor, gracias al software y hardware optimizados	Coincide con el de las versiones de Hadoop de código abierto

Costo

Escalabilidad elástica

O&M y disponibilidad

Costo de aprendizaje

Fuentes de datos compatibles

Compatibilidad con ecosistemas

Imagen personalizada

Planificación de flujos de trabajo

Permisos de tenant empresarial

Rendimiento

Nuevas funciones

ENE/2020

Trabajos de flujos de Flink

MAR/2020

Acceso de Spark a los metadatos de DLI

ABR/2020

Autorización precisa mediante IAM

ABR/2020

Flink 1.10

MAY/2020

Paquete de análisis de datos

MAY/2020

Configuración de variables globales

JUN/2020

Colas de cómputo en dos AZ

JUN/2020

Modo de desarrollador de trabajos de Spark

AGO/2020

Paquete facturado por almacenamiento

OCT/2020

Imágenes personalizadas

FEB/2021

Múltiples versiones de datos

FEB/2021

Flink 1.11

SEP/2021

Sintaxis de SQL de código abierto de Flink para ClickHouse y tablas definidas por el usuario

DIC/2021

Discontinuación de API

Historias de éxito

Mengxiang.com

Mengxiang utiliza DLI y DataArts Studio de Huawei Cloud para analizar datos de comportamiento en tiempo real y relacionar productos con los clientes.

Esta empresa de rápido crecimiento se enfrentó a desafíos relacionados con la estabilidad del servicio durante las horas de mayor tráfico y las promociones. La solución “DLI+DataArts Studio” proporciona a Mengxiang una arquitectura elástica y un lago de datos de alto rendimiento para el procesamiento integral de flujos y por lotes.

DIANCHU Technology

DIANCHU utilizó DLI de Huawei Cloud y el lago de datos inteligente DataArts Studio para establecer una plataforma de análisis de datos para videojuegos. La plataforma analiza los ingresos, la tasa de retención de jugadores y la tasa de pago en tiempo real para la planificación de actividades, el marketing de precisión y la toma de decisiones.

Dragonest

Dragonest colabora con Huawei Cloud para consultar y analizar datos de videojuegos. El análisis es útil para los diferentes departamentos durante el lanzamiento de nuevos servicios. Las aplicaciones de datos están integradas, lo que beneficia a toda la organización.

Documentación

Regístrese y comience un increíble viaje a la nube

Probar gratis

Data Lake Insight (DLI)

Data Lake Insight (DLI)

Qué es DLI

Características

Escenarios de aplicación

DLI vs. Hadoop de construcción propia

Nuevas funciones

Historias de éxito

Mengxiang.com

DIANCHU Technology

Dragonest

Documentación

Data Lake Insight (DLI)

Data Lake Insight (DLI)

Qué es DLI

Características

Escenarios de aplicación

DLI vs. Hadoop de construcción propia

Nuevas funciones

Historias de éxito

Mengxiang.com

DIANCHU Technology

Dragonest

Documentación

Pasos iniciales

Profesionalización

Desarrolladores