Nabil Belgasmi
El sistema actual de aprendizaje de fortalecimiento depende de un avance de ejecución de objetivo único que amplifica las ganancias normales basadas en recompensas escalares que se originan ya sea de la respuesta de condición univariante a las actividades del operador o de un total ponderado de una respuesta multivariante. Sin embargo, en numerosas circunstancias certificables, se deben hacer concesiones entre varios destinos en conflicto que tienen diferentes grados significativos, unidades de estimación y configuraciones comerciales específicas relacionadas con el problema que se explica (por ejemplo, costos, tiempo de entrega, naturaleza del servicio, beneficios, etc.). La suma de tales subpremios para obtener un premio escalar espera una información ideal sobre las inclinaciones del líder y la forma en que ve la importancia de cada objetivo. En esta investigación, analizamos el problema de aprender los mejores enfoques de renovación de efectivo en cajeros automáticos en un entorno cuestionable de múltiples objetivos dado un historial subjetivo de retiros de efectivo que puede no ser fijo y puede contener excepciones. Proponemos un enfoque de aprendizaje profundo de refuerzo multiobjetivo sin modelo que nos permite competir con el líder humano y encontrar la mejor estrategia por cajero automático que supere la disposición humana actual. La idea es desagregar la presentación de una estrategia de recarga para formar un vector de capacidades objetivo. La presentación de la disposición humana es entonces un punto de referencia multidimensional (Rh). La tarea del cálculo de aprendizaje profundo de refuerzo es descubrir una disposición que genere muchos puntos de ejecución que superen en el sentido de Pareto la disposición humana actual (Rh). Para mejorar las cifras de solicitud de efectivo de los cajeros automáticos, este documento aboga por la expectativa de interés en efectivo para grupos de cajeros automáticos con patrones comparativos de solicitud de efectivo por día de la semana. Anteriormente agrupamos los hábitats de los cajeros automáticos en grupos de cajeros automáticos que tenían patrones comparativos de retiro por día de la semana. Para recuperar los límites de irregularidad de retiro por "día de la semana" (impacto de un lunes, etc.) construimos un modelo de arreglo de período para cada cajero automático. Para agrupar, se discretiza la progresión de siete límites de irregularidad de retiro diarios ininterrumpidos de los cajeros automáticos. A continuación, se estima la similitud entre la sucesión de irregularidades de retiro diario discretizado de varios cajeros automáticos mediante el método de alineación de secuencias (SAM). Para cada grupo de cajeros automáticos, se utilizan cuatro sistemas neuronales, a saber, el sistema neuronal de recaída general (GRNN), el sistema neuronal de avance multicapa (MLFF), la estrategia de grupo para el manejo de información (GMDH) y el sistema neuronal wavelet (WNN) para predecir la solicitud de dinero de un cajero automático. La estrategia propuesta se aplica en el conjunto de datos de competencia NN5. Observamos que GRNN arrojó el mejor resultado de 18,44% de error de tasa máxima media simétrica (SMAPE), que es mejor que el resultado de Andrawis, Atiya y El-Shishiny (2011). Esto se debe al agrupamiento seguido de una etapa determinante. Además,El enfoque propuesto produjo valores SMAPE mucho más pequeños que el método de predicción directa sobre el conjunto de la muestra sin agrupar. Desde un punto de vista administrativo, el indicador de solicitud de efectivo por grupo ayuda a la alta dirección del banco a diseñar planes de renovación de efectivo comparables para todos los cajeros automáticos de un mismo grupo. Estos planes de renovación a nivel de grupo podrían resultar en un ahorro de enormes gastos operativos para los cajeros automáticos que operan en una ubicación geográfica similar. (c) 2013 Elsevier BV Todos los derechos reservados. El componente, que más tarde se incorporó a Google Photos en 2015, fue visto ampliamente como una ventaja distintiva, una prueba de que la programación de visión artificial podía agrupar imágenes en medidas humanas, lo que incluía un incentivo de varias maneras diferentes: Los clientes ya no tenían que etiquetar las fotografías con etiquetas como "playa" para organizar el contenido de las imágenes, lo que eliminaba una tarea manual que podía resultar muy tediosa al gestionar conjuntos de cientos o miles de imágenes. Los clientes podían explorar su colección de fotografías de nuevas formas, utilizando términos de búsqueda para encontrar fotografías con objetos que tal vez nunca hubieran etiquetado. Por ejemplo, podrían escanear en busca de "palmera" para mostrar todas las fotografías de sus excursiones que tuvieran palmeras fuera de la vista. La programación podría "ver" diferenciaciones taxonómicas que los propios clientes finales probablemente no podrían ver (por ejemplo, reconocer felinos siameses y abisinios), ampliando adecuadamente la información de área de los clientes.
Biografía :
Nabil Belgasmi tiene un doctorado y una licenciatura en Ingeniería en Ciencias de la Computación de la Universidad de Manouba. Es un científico de datos full stack en el Banco de Túnez, Túnez. Está involucrado en tres actividades principales: (1) I+D aplicada, (2) Vigilancia tecnológica de análisis de datos y (3) Consultoría de ciencia de datos. Ha logrado muchas pruebas de concepto y ganancias rápidas de ciencia de datos exitosas: calificación crediticia, pronóstico, planificación de efectivo, detección de anomalías/fraude, elaboración de perfiles de clientes, calificación y monitoreo de transacciones inteligentes, etc. Es miembro del Consejo Editorial Industrial de la revista Engineering Applications of Artificial Intelligence (EAAI).