Abstracto

Machine Learning 2018: Virtualización de datos: uso de la virtualización de datos para una plataforma de análisis integrada - Manoj Mishra-Union Insurance

Manoj Mishra

Para tener una ventaja competitiva, las organizaciones de todo el mundo están impulsando la necesidad de un mejor análisis (histórico, en tiempo real, predictivo y cognitivo) del conocimiento en varios dominios, incluidos los clientes, los productos, los servicios y las operaciones. Gracias a esto, los datos disponibles para dicho análisis están creciendo en tamaño, tecnología y complejidad. Durante varios años, las empresas han invertido en tecnologías como almacenes de datos, marts de datos, herramientas OLAP, sistemas de Big Data/Hadoop y plataformas de análisis en tiempo real en tiempo real para aprovechar esas oportunidades. La propuesta de valor total para el negocio se maximiza solo cuando estos se combinan en una plataforma de análisis integrada. Sin embargo, las herramientas tradicionales no pueden integrar datos en tiempo real y en tiempo real, especialmente cuando los datos están distribuidos en las instalaciones, la nube, sitios web y documentos en todas partes. La virtualización de datos a menudo se utiliza para proporcionar vistas lógicas multiplataforma del conocimiento y perspectivas analíticas en toda la empresa para proporcionar una plataforma de análisis integrada. Al utilizar la integración nativa con cuadrículas de datos en memoria para el procesamiento, la virtualización de datos puede ofrecer una estructura de servicios de datos unificada y centralizada con seguridad e integración en tiempo real en múltiples fuentes de datos tradicionales y de gran tamaño, incluidos Hadoop, NoSQL, la nube y el software como servicio (SaaS). Por lo tanto, la virtualización de datos se está convirtiendo en un requisito para abordar los desafíos únicos de la explosión de conocimiento en el cambiante clima empresarial actual. La virtualización de datos presenta un enfoque contemporáneo para la integración de datos. A diferencia de las soluciones ETL, que replican los datos, la virtualización de datos deja la información en los sistemas de origen, simplemente exponiendo una vista integrada de toda la información a los consumidores de datos. A medida que los usuarios comerciales profundizan en los informes, la virtualización de datos recupera la información en tiempo real de los sistemas de origen subyacentes. La virtualización de datos demuestra que conectarse a los datos es mucho mejor que recopilarlos. La virtualización de datos puede ser una capa de datos virtual unificada con la que las aplicaciones empresariales y los usuarios pueden acceder a cualquier información empresarial sin importar su ubicación, formato o protocolo, utilizando los métodos que mejor se adapten a sus necesidades de trabajo, como el descubrimiento y la búsqueda de datos. La virtualización de datos es un enfoque de la gestión de datos que permite a una aplicación recuperar y manipular datos sin requerir detalles técnicos sobre la información, como cómo está formateada en la fuente o dónde está ubicada físicamente, y puede proporcionar una vista de cliente (o una vista única de la otra entidad) de los datos generales. A diferencia del proceso normal de extracción, transformación y carga ("ETL"), la información permanece in situ y se da acceso en tiempo real al sistema de origen para la información. Esto reduce el peligro de errores de datos, de que la carga de trabajo mueva datos que nunca se usarán, y no planea imponer un modelo de datos sobre la información (un ejemplo de datos heterogéneos puede ser un sistema de base de datos federado).La tecnología también admite la escritura de actualizaciones de datos de transacciones en los sistemas de origen. Para resolver las diferencias en los formatos y la semántica de origen y consumidor, se utilizan varias técnicas de abstracción y transformación. Esta idea y este software pueden ser un subconjunto de la integración de conocimientos y, por lo general, se utilizan en inteligencia empresarial, servicios de datos de arquitectura orientada a servicios, computación en la nube, búsqueda empresarial y gestión de datos maestros. La virtualización de datos también se puede considerar como una alternativa a la ETL y el almacenamiento de datos. La virtualización de datos está inherentemente orientada a producir información rápida y oportuna de múltiples fuentes sin tener que iniciar un proyecto de datos serio con ETL y almacenamiento de datos extensos. Sin embargo, la virtualización de datos también se puede ampliar y adaptar para satisfacer los requisitos de almacenamiento de datos. Esto puede requerir una comprensión de los requisitos de almacenamiento e historial de información junto con la planificación y el estilo para incluir el tipo adecuado de virtualización de datos, integración y estrategias de almacenamiento, y optimizaciones de infraestructura/rendimiento (por ejemplo, transmisión, en memoria, almacenamiento híbrido).

Biografía :

Manoj Mishra completó su Licenciatura en Ingeniería en Ciencias de la Computación y obtuvo una Certificación en Ciencias de Datos de la Universidad Johns Hopkins. Tiene más de dos décadas de experiencia en diversas geografías (EE. UU., Europa, India y Medio Oriente) trabajando con organizaciones como Adobe Systems, Dell, Perot Systems, CEB-Gartner, Rolta y Tata Group. Actualmente es Director de Inteligencia de Negocios y Datos en Union Insurance y actualmente lidera su estrategia de datos y transformaciones tecnológicas a través de análisis de datos, investigación y varias iniciativas de IA.

Descargo de responsabilidad: este resumen se tradujo utilizando herramientas de inteligencia artificial y aún no ha sido revisado ni verificado.

Indexado en

Google Académico
Academic Journals Database
Open J Gate
Academic Keys
ResearchBible
CiteFactor
Biblioteca de revistas electrónicas
Búsqueda de referencia
Universidad Hamdard
director académico
Factor de impacto de revistas innovadoras internacionales (IIJIF)
Instituto Internacional de Investigación Organizada (I2OR)
Cosmos

Ver más