Venta de Opciones: ¿Es realmente rentable?
1 junio, 2020

Cuando los árboles permiten ver el bosque: Árboles de decisión y selección de carteras

Ideas principales en este artículo:

  • En el paper “Forest through the trees: Building cross-sections of stock returns[i] se perfecciona el primer paso de la metodología de valoración de activos con herramientas de machine learning, combinadas con la teoría de selección de carteras.
  • La rentabilidad ajustada por el riesgo (ratio de Sharpe) obtenida con este método es hasta tres veces superior a la obtenida mediante métodos estándar de formación de carteras.

La investigación académica en el área de valoración de activos financieros se ha concentrado mayoritariamente durante los últimos 40 años en documentar los “factores” económicos que determinan la rentabilidad de los activos financieros, en especial la rentabilidad de las acciones. Tradicionalmente, para verificar la capacidad predictiva de los factores se realizan grosso modo dos pasos. En primer lugar, se forman carteras basadas en las características que subyacen a los factores de riesgo. En segundo lugar, se demuestra hasta qué punto esas carteras explican cuantitativamente la rentabilidad de las acciones.

En el paper “Forest through the trees: Building cross-sections of stock returns[i] se perfecciona el primer paso de la metodología de valoración de activos con herramientas de machine learning, combinadas con la teoría de selección de carteras. La figura inferior, extraída del paper en cuestión, ilustra cómo se forman las carteras en el método tradicional para un caso en el que se analizan dos factores: “Size” y “Book-to-Market” (B2M). Los activos se dividen en distintos grupos en función de su posición en la distribución de las características que subyacen a los factores. Las acciones que aparezcan dentro de cada “celda” del gráfico representan una cartera para evaluar su rentabilidad. Este tipo de clasificaciones son independientes, se agrupan activos en función de una característica sin tener en cuenta su posición en la distribución de la otra característica. La clasificación independiente genera un problema fundamental. Si las características están fuertemente correlacionadas entre sí habrá celdas en el gráfico anterior que se encuentren poco pobladas. Por tanto, esas carteras pueden generar retornos poco representativos.

Para evitar este tipo de problemas, en el paper se proponen métodos de árboles de decisión. Esta metodología permite agrupar activos con características que generan rentabilidades similares mediante decisiones secuenciales. Este procedimiento tiene ventajas para la estimación de retornos. En primer lugar, los árboles de decisión tienen en cuenta la correlación existente entre las características de los activos, incluso relaciones no lineales.  Segundo, como consecuencia de lo anterior, evita la existencia de carteras semivacías. La figura inferior ilustra cómo los árboles de decisión generan clasificaciones mucho más complejas al tener en consideración más información.

A su vez, los métodos con árboles de decisión generan un problema. Existen multitud de secuencias de clasificación de los activos en función de sus características. Por ejemplo, podemos clasificar los activos en función de Size y después en función de B2M, o al revés. Además, podemos generar una tercera clasificación en función de Size, o sucesivas clasificaciones con otros factores distintos. Para resolver este problema, los autores realizan un “podado” o “pruning” de las carteras que surgen de los árboles basado en el método de elección de cartera de Markowitz al que se le añaden términos de regularización (LASSO y Ridge). La regularización está determinada por unos hiperparámetros que son ajenos en principio al objetivo primitivo de la estimación, que es la selección de carteras. Este método reduce la totalidad de clasificaciones a un número deseable de carteras con un comportamiento eficiente en términos de rentabilidad y riesgo.

El algoritmo que determina las carteras que entran dentro del modelo de predicción se desarrolla en tres etapas, un aspecto que es común a la mayoría de las aplicaciones en machine learning. En primer lugar, los autores “entrenan” el algoritmo con una muestra inicial datos. En esa etapa se seleccionan las carteras eficientes dados unos hiperparámetros. En segundo lugar, los hiperparámetros se determinan utilizando una muestra de validación, en el que las carteras seleccionadas en el entrenamiento deben generar el máximo Sharpe ratio que se observe en los datos validación. En tercer lugar, en la etapa de evaluación, se determina la capacidad predictiva del modelo estimado.

Los resultados fundamentales del paper aparecen ilustrados en el gráfico inferior. La selección con árboles de decisión permite capturar más información incorporada en los precios. Por eso, la rentabilidad ajustada por el riesgo (ratio de Sharpe) obtenida con este método es hasta tres veces superior a la obtenida mediante métodos estándar de formación de carteras. Los autores muestran que el alto rendimiento no es debido a una exposición relativamente mayor de las carteras a los factores de riesgo ni a la potencial desagregación de las carteras. Por tanto, esta metodología es capaz de formar carteras con características comunes que los métodos tradicionales no pueden recoger.

 


Referencias:

  • [i] Bryzgalova, Svetlana and Pelger, Markus and Zhu, Jason, Forest Through the Trees: Building Cross-Sections of Stock Returns (December 1, 2019). Available at SSRN: https://ssrn.com/abstract=3493458

Contacto:

  • Para cualquier tema relacionado con este artículo: insights@noaxglobal.com
  • Para consultas sobre el fondo de inversión NOAX GLOBAL: info@noaxglobal.com.

¿Te ha gustado el artículo? 

Suscríbete a nuestro newsletter pulsando AQUÍ!

Pin It on Pinterest

Share This