Fionn Murtagh
El análisis geométrico de datos permite “dejar que los datos hablen” e integra análisis cualitativos y cuantitativos. El alcance y el potencial son importantes en muchos campos. Los estudios de caso aquí son análisis de redes sociales a gran escala, asociados con un vecindario de práctica social y un vecindario de salud y bienestar. La interesante encuesta de Keiding y Louis, “Peligros y potenciales de la entrada autoseleccionada a estudios y encuestas epidemiológicas” señala cuestiones muy interesantes en el análisis de big data. Mi contribución está en la parte de discusión de este artículo. A través de la geometría y la topología del conocimiento y el conocimiento, con la inclusión del contexto, la cronología y los modelos de marco, estamos abordando estos problemas con el muestreo y la representatividad. Los estudios de caso que se discutirán en esta presentación están relacionados con la salud mental y con eventos y contextos de entretenimiento social, en este último caso con muchos millones de tuits de Twitter, utilizando muchos idiomas. Se presta especial atención al uso y la implementación de nuestras perspectivas analíticas. Esto incluye la determinación del contenido de conocimiento de nuestras nubes de datos y su mapeo en espacios de factores semánticos dotados de distancia euclidiana, también debido a la topología ultramétrica o jerárquica, que es característica de todas las formas de sistemas complejos. Análisis de Datos Geométricos (GDA) es el nombre sugerido por P. Suppes (Universidad de Stanford) para designar el enfoque de Estadística Multivariante iniciado por Benzécri como Análisis de Correspondencias, un enfoque que se ha vuelto cada vez más utilizado y apreciado a lo largo de los años. Este libro presenta la formalización completa de GDA en términos de álgebra - la característica original y de gran alcance más importante del enfoque - y muestra también cómo integrar las herramientas estadísticas de calidad como el Análisis de Varianza, incluidos los métodos bayesianos. El Capítulo 9, Estudios de casos de investigación, es casi un libro en sí mismo; presenta la metodología en acción en tres aplicaciones extensas, una para la medicina, otra para la política y otra para la educación (datos tomados del programa basado en computadora de Stanford para Youth presentado). Por lo tanto, el libro está dirigido tanto a matemáticos curiosos sobre las aplicaciones de las matemáticas como a investigadores dispuestos a dominar un enfoque excepcionalmente poderoso del análisis estadístico de datos. El análisis de datos es el proceso de limpieza, transformación, modelado o comparación de datos, con el fin de inferir información útil y obtener conocimientos sobre fenómenos complejos. Desde una perspectiva geométrica, cuando una instancia (un fenómeno natural, un ser privado, etc.) se da como una colección de tamaño fijo de observaciones de valor real, se identifica naturalmente con un punto geométrico que tiene estas observaciones como coordenadas. Cualquier colección de tales instancias se ve entonces como una nube de puntos muestreada en algún espacio métrico o normalizado. Los macrodatos tienen características 4V de volumen, variedad, velocidad y veracidad, lo que implica auténticamente el análisis de macrodatos. Sin embargo,¿Cuáles son las características dominantes del análisis de datos masivos? Aquí, se dice que la analítica se refiere a toda la metodología en lugar del análisis específico individual. En este artículo, se proponen seis técnicas relacionadas con el análisis de big data, que incluyen: (1) análisis de conjunto asociado con un volumen descomunal de conocimiento, (2) análisis de asociación asociado con un muestreo de datos desconocidos, (3) análisis de alta dimensión asociado con una dispersión de conocimiento, (4) análisis profundo asociado con la veracidad del conocimiento, (5) análisis de precisión asociado con la veracidad del conocimiento y (6) análisis de divide y vencerás asociado con la velocidad del conocimiento. Lo esencial del análisis de datos masivos es que el análisis estructural de datos masivos en un criterio óptimo de física, computación y cognición humana. Fundamentalmente, se plantean dos desafíos teóricos, es decir, la violación de la distribución independiente e idéntica y, por lo tanto, la extensión de la teoría general de conjuntos. En particular, hemos ilustrado tres tipos de asociación en los macrodatos geográficos, es decir, asociaciones geométricas en el espacio y el tiempo, correlaciones espaciotemporales en las estadísticas y relaciones espaciotemporales en la semántica. Además, hemos ilustrado tres tipos de análisis de datos espaciotemporales, es decir, ajuste de la medición (observación) de cantidades geométricas, análisis del comportamiento espacial humano con trayectorias, asimilación de datos de modelos físicos y varias observaciones, de las cuales también se podría derivar en gran medida el análisis de macrodatos espaciotemporales.asimilación de datos de modelos físicos y diversas observaciones, de las que también se podría derivar en gran medida el análisis de big data espaciotemporal.asimilación de datos de modelos físicos y diversas observaciones, de las que también se podría derivar en gran medida el análisis de big data espaciotemporal.
Biografía:
Fionn Murtagh es profesor de Ciencias de Datos y anteriormente se dedicó al Big Data en Educación, Astrofísica y Cosmología. Fue Director de Financiación Nacional de Investigación en muchos dominios, incluidos Computación e Ingeniería, Energía, Nanotecnología y Fotónica. Ha sido Profesor de Ciencias de la Computación, incluso Jefe de Departamento y Director de Escuela en muchas universidades. Fue Editor en Jefe de Computer Journal durante más de 10 años y es Miembro de los Consejos Editoriales de muchas otras revistas.