Robert S. Laramee
Algunas personas creen que vivimos en la era de la información. Yo creo que es mucho más preciso decir que vivimos en la era de los datos. Con el rápido avance de las tecnologías de almacenamiento masivo de datos y, por lo tanto, los costos cada vez menores del hardware, nuestra capacidad para derivar y almacenar datos no tiene precedentes. Sin embargo, sigue habiendo una brecha enorme entre nuestra capacidad para obtener y almacenar grandes colecciones de datos complejos y dependientes del tiempo y nuestra capacidad para derivar información y conocimiento útiles de ellos. La visualización de datos aprovecha nuestro sentido más poderoso, la vista, para derivar conocimiento y obtener información sobre grandes conjuntos de datos multivariados que describen comportamientos complicados y, a veces, dependientes del tiempo. Esta charla presenta el procesamiento de datos desde la actitud de la visualización del conocimiento con tres aplicaciones muy diferentes: dinámica de fluidos computacional (CFD), biología marina y rugby, mostrando una serie de fortalezas, debilidades y objetivos de la visualización. La visualización de datos es fundamental para el éxito del procesamiento de datos y la extracción de conocimientos y perspectivas de los grandes datos. La minería de datos se utiliza para encontrar patrones, anomalías y correlaciones en el gran conjunto de datos para hacer predicciones utilizando una amplia gama de técnicas; la organización utiliza esta información extraída para aumentar sus ingresos, reducir los costos y los riesgos, mejorar la relación con los clientes, etc., mientras que la visualización de datos es la representación gráfica de los datos y la información extraída de la minería de datos utilizando elementos visuales como gráficos, diagramas y mapas; las herramientas y técnicas de visualización de datos ayudan a analizar una gran cantidad de datos y tomar decisiones en función de ellos. Sin el concepto de visualización, la minería y el análisis no desempeñan ningún papel de importancia, ya que el procesamiento de datos es la idea de encontrar inferencias analizando la información a través de patrones y esos patrones solo se pueden representar mediante diferentes técnicas de visualización. La minería de datos es el proceso de identificar nuevos patrones y perspectivas en los datos. A medida que aumenta el volumen de conocimiento recopilado y almacenado en bases de datos, existe una creciente necesidad de proporcionar un resumen de datos (por ejemplo, a través de la visualización), identificar patrones y tendencias importantes y actuar en función de los hallazgos. La información derivada del procesamiento de datos puede proporcionar un valor enorme, a menudo crucial para las empresas que intentan encontrar ventajas competitivas. Se proporciona una breve revisión de la minería de conocimientos y los resultados teóricos importantes, seguido de los avances y desafíos recientes. La cantidad de datos almacenados en medios electrónicos está creciendo exponencialmente rápido. Los almacenes de datos actuales eclipsan las bases de datos más importantes creadas hace una década, y dar sentido a esos datos es cada vez más difícil. El comercio minorista en línea en la era de Internet, por ejemplo, es muy diferente al comercio minorista de hace una década porque los tres factores más importantes del pasado (ubicación, ubicación y ubicación) son irrelevantes para las tiendas en línea. Uno de los mayores desafíos que enfrentamos hoy es dar sentido a todos estos datos. Minería de datos,o descubrimiento de conocimiento, es el proceso de identificar nuevos patrones y perspectivas en los datos, ya sea para comprender el genoma humano para desarrollar nuevos medicamentos, para descubrir nuevos patrones en datos del censo reciente para advertir sobre tendencias ocultas o para comprender mejor a sus clientes en una tienda web electrónica con el fin de brindar una experiencia personalizada uno a uno. Los ejemplos incluidos en este artículo provienen del mundo del comercio electrónico, pero el procesamiento de datos se ha utilizado ampliamente en múltiples dominios, incluidas muchas aplicaciones científicas. El artículo también se limita a la minería estructurada; existe una literatura significativa sobre minería de texto y recuperación de conocimiento.
Biografía:
Robert S Laramee se licenció en Física en la Universidad de Massachusetts, Amherst. En 2000, obtuvo una maestría en Ciencias de la Computación en la Universidad de New Hampshire, Durham. En 2005, obtuvo un doctorado en el Instituto de Gráficos Informáticos y Algoritmos de la Universidad Tecnológica de Viena (Austria). De 2001 a 2006, fue investigador en el Centro de Investigación VRVis (www.vrvis.at) e ingeniero de software en AVL (www.avl.com) en el Departamento de Tecnologías de Simulación Avanzadas. Actualmente, es profesor asociado en el Departamento de Ciencias de la Computación de la Universidad de Swansea (Gales). Sus intereses de investigación se centran en las áreas de visualización de macrodatos, análisis visual e interacción hombre-computadora. Ha publicado más de 100 artículos revisados ??por pares en revistas científicas.