Código y Datos: Sistema de Trading Algorítmico con Aprendizaje por Refuerzo (PPO y DQN) aplicado al S&P 500 y EUR/USD.

Name: Código y Datos: Sistema de Trading Algorítmico con Aprendizaje por Refuerzo (PPO y DQN) aplicado al S&P 500 y EUR/USD.
Creator: Pablo Díaz Pérez
Published: 2026-05-21T00:22:34.848Z
Keywords: Interaction of Financial Markets and Macroeconomy, Deep Reinforcement Learning

Díaz Pérez, Pablo; Santos , Andre

doi:10.17632/vxm8swkwhn.2

Código y Datos: Sistema de Trading Algorítmico con Aprendizaje por Refuerzo (PPO y DQN) aplicado al S&P 500 y EUR/USD.

Published: 21 May 2026| Version 2 | DOI: 10.17632/vxm8swkwhn.2

Contributors:

Pablo Díaz Pérez,

Description

Este repositorio contiene el código fuente (Jupyter Notebook) y los datos (archivos CSV) de un Trabajo Fin de Máster (TFM) que diseña, entrena y compara modelos de Aprendizaje por Refuerzo Profundo (PPO y DQN) para trading algorítmico, evaluando su desempeño ajustado al riesgo. Contenido del repositorio: TFM_RL_Trading_SP500_CUNEF.ipynb: Notebook reproducible que abarca todo el pipeline: Variables (Estado 4D): Precio, retornos a 5 días, momentum y volatilidad a 10 días. TradingEnv: Entorno personalizado (Gymnasium) con capital de 30.000€, costes de transacción (0,1%) y un sistema de recompensas que usa un umbral de ruido para penalizar el exceso de operativa. Backtesting: Entrenamiento y validación Out-of-Sample imponiendo límites máximos de operaciones (10, 20 y 50). Archivos .csv: Datos históricos diarios del S&P 500 y EUR/USD que abarcan desde enero de 2019 hasta diciembre de 2024. Incluyen cotizaciones (Open, High, Low, Close), volumen, retornos simples y retornos logarítmicos. Resultados Clave (Out-of-Sample): S&P 500: El modelo óptimo logra batir de manera consistente a la estrategia Buy & Hold, obteniendo un crecimiento de capital más estable y una reducción controlada del Max Drawdown. EUR/USD: En un entorno con mayor ruido a corto plazo, el modelo se adapta controlando estrictamente las operaciones permitidas, mitigando los costes (0,1%) y defendiendo el capital ante rachas de pérdidas. Detalles Técnicos: Python 3. Librerías: stable-baselines3, gymnasium, pandas, torch. Semillas globales (SEED = 42) fijadas para garantizar la reproducibilidad estocástica. Material ideal para replicar y expandir estudios de IA aplicada a finanzas.

Files

Institutions

CUNEF Universidad
Madrid, Madrid

Código y Datos: Sistema de Trading Algorítmico con Aprendizaje por Refuerzo (PPO y DQN) aplicado al S&P 500 y EUR/USD.

Description

Files

Institutions

Categories

Licence