Unac Tesis
Unac Tesis
Unac Tesis
AUTOR:
HIDALGO BELLIDO ANGGIE BETSABE
ASESOR:
INCACARI SANCHO GERBER FEDERICO
CALLAO, 2021
PERÚ1
1
Resumen
tiempos donde nos encontramos en una pandemia impredecible, muchas de las empresas
han disminuido el costo de sus acciones por las grandes pérdidas económicas que el país
está atravesando en momentos muy difíciles, no solo empresas que se encuentran en BVL,
también PYMES, al igual que muchos inversionistas se encuentran vendiendo sus acciones
por miedo a la pérdida total de ellas, pero veamos el lado positivo de la situación, acciones
modelo predictivo donde me permita observar los precios a futuro y la volatilidad de las
acciones, nos muestra una gran oportunidad para empezar en el mundo de las finanzas, si
somos muy observadores, podemos encontrar una oportunidad ante una calamidad.
las variables y técnicas a utilizar, así como también del pre procesamiento que se realice a
la data antes de ser ingresada al modelo, es por esto que en el presente trabajo se realizó
una encuesta a expertos de inversión en la bolsa de valores sobre las variables influyentes
como el precio de los metales, precio de los índices y precio del dólar; las cuales, junto a las
cálculo del coeficiente de correlación de Pearson en cada una de ellas. Las variables
resultantes fueron ingresadas posteriormente al modelo híbrido propuesto, donde las salidas
de cada una de las técnicas de machine learning utilizadas (redes neuronales artificiales,
máquinas de soporte vectorial para regresión y red neuronal de base radial) formaban parte
2
de la entrada hacia una red neuronal artificial, considerada como técnica principal debido a
3
Abstract
Stock prediction has been a major topic in the investment world, due to its high short-
term earnings and investment strategy. In these times where we are in an unpredictable
pandemic, many of the companies have reduced the cost of their actions due to the great
economic losses that the country is going through in very difficult times, not only
companies that are in BVL, but also SMEs, by Like many investors, they find themselves
selling their shares for fear of their total loss, but let's see the positive side of the situation,
accessible shares and little demand from investors, with the necessary study of each
company and a predictive model where it allows me to observe the future prices and the
volatility of the shares, shows us a great opportunity to start in the world of finance, if we
The precision of machine learning models depend on the correct choice of variables
and techniques to be used, as well as on the pre-processing that is carried out on the data
before being entered into the model, which is why in the present work it was carried out a
survey of investment experts in the stock market on the variables influencing the behavior
of a mining share, as a result of which variables such as the price of metals, the price of
indices and the price of the dollar were identified; which, together with the fundamental
and technical variables, participated in the selection of variables by calculating the Pearson
correlation coefficient in each of them. The resulting variables were subsequently entered
into the proposed hybrid model, where the outputs of each of the machine learning
techniques used (artificial neural networks, vector support machines for regression, and
radial-based neural network) were part of the input to a network. artificial neuronal,
4
considered as the main technique because it achieved the best results in the experimental
phase.
5
INTRODUCCIÓN
Las tecnologías que se han desarrollado por las últimas décadas han influenciado
apertura del mundo de las inversiones a una mayor cantidad de personas. Mayor número de
han sido resultado del desarrollo de las comunicaciones. Hace 10 años, alrededor del 50%
comunes de diversas empresas (Gitman, Joehnk y Aguado, 2005, p. 3). Dentro de los
instrumentos como los bonos o acciones preferentes. Sin embargo, la característica negativa
respecto a su valor esperado (Welch, 2014, p. 123). Esto puede resultar en rentabilidades
menores a las esperadas o incluso negativas, perdiendo parte de las inversiones iniciales.
Por tanto, los precios de las acciones han sido los datos financieros más analizados por de
las últimas décadas, siendo muchas técnicas empleadas con diferentes grados de éxito
(Granger, 1992). Support Vector Machine ha sido una de ellas, mostrando progresos en
inversiones, puesto que la predicción precisa de los precios de los instrumentos financieros
es esencial para tomar mejores decisiones de inversiones con mínimo riesgo (Das y Padhy,
2012)
6
ANTECEDENTES
En esta parte se describen y analizan las investigaciones previas relacionadas con el tema
Antecedentes Nacionales
En la tesis titulada “Sistema inteligente para la predicción del precio diario de las
acciones mineras en la Bolsa de Valores de New York usando un modelo híbrido de redes
neuronales y máquina de soporte vectorial de regresión” realizado por los autores Jessica
bolsa de valores es la expectativa del valor futuro de los precios diarios de las acciones en
la Bolsa de valores de New York y se caracteriza por ser incierto, dinámico y no lineal.
Los autores realizaron una encuesta a expertos de inversión en la bolsa de valores sobre
identificaron variables como el precio de los metales, precio de los índices y precio del
dólar; las cuales, junto a las variables fundamentales y técnicas, participaron en la selección
propuesto, donde las salidas de cada una de las técnicas de machine learning utilizadas
(redes neuronales artificiales, máquinas de soporte vectorial para regresión y red neuronal
de base radial) formaban parte de la entrada hacia una red neuronal artificial, considerada
como técnica principal debido a que alcanzaba los mejores resultados en la fase
experimental.
7
Segunda tesis titulada “Desarrollo de un modelo para la predicción del precio del cobre
al aplicar diversos algoritmos. De esta forma, emplea los estudios previos presentados
como base para la ejecución y selección del modelo en esta tesis. Asimismo, de manera
más detallada se presentan los factores más importantes en el comportamiento del precio de
un commodity.
Antecedentes Internacionales
Politécnica de Madrid nos habla en este caso otro método para predecir, utiliza la minería
Estimará valores con una frontera de unos minutos, de forma que la conexión física
Para conseguir esto, analizarán los datos históricos intradía de diferentes valores con el
fin de encontrar:
confirmador de la tendencia.
8
En la tesis titulada “Pronóstico del precio de acciones de la empresa First Solar
mediante redes neuronales artificiales” sustentada por el autor Stefano Andrés Simi Salinas
de la Universidad Técnica Federico Santa María, Valparaíso – Chile. En esta tesis nos
y crisis financiera como vía de escape para esta situación, también analizar el
lado realizar una comparación entre el desempeño del precio de la acción y el NASDAQ,
acciones disminuya o incremente. El inversor asume este riesgo con la esperanza de obtener
un rendimiento apreciable.
volatilidad y, por tanto, habrá un mayor riesgo de caídas de precios y también la posibilidad
Una acción cuya cotización no tuviera oscilaciones en sus precios, o sea, cuyo precio
no sufriera cambios, tendría volatilidad igual a cero. El riesgo total de una acción se puede
descomponer en:
9
Riesgo sistémico o riesgo de mercado: deriva de las condiciones macroeconómicas
y del entorno.
mueven en consonancia:
Ahora, ¿por qué invertir en acciones? Pese a que la pandemia del coronavirus ha
muchas acciones podría resultar una buena oportunidad para aquellos inversionistas que
están dispuestos a generar una ganancia en el largo plazo. Cuando se vive una época de alta
volatilidad e incertidumbre como esta, cuando son más las noticias negativas (como el
alta oferta -personas dispuestas a vender sus acciones- y poca demanda -personas
dispuestas a comprar y/o pagar un alto precio por dichas acciones. Las acciones dependen
de la ley de la oferta y demanda. Es decir, si hay menos compradores (menor demanda) los
10
precios caen para atraer inversores (mayor oferta). De otro lado, si los compradores
En el periodo abril a agosto de este año, las inversiones han representado solo el 57 %
de las realizadas en el mismo periodo del 2019. Asimismo, aún sigue presente el pesimismo
de los inversionistas por los posibles rebrotes del COVID-19 a nivel mundial. Por tanto,
todavía es un buen momento para invertir en Bolsa. Es casi seguro que los precios de la
el Banco de Inglaterra decidió bajar la tasa de interés de referencia a 0,10 % (tasa de interés
esterlinas al mercado, decisión que fue muy bien recibida por los diferentes sectores
económicos. Por otro lado, el 22 de marzo se anunció en Estados Unidos que se inyectaría
al mercado la cantidad de dinero que fuera necesaria para ayudar al sector financiero, a las
empresas y a las familias; y que se haría todo lo necesario para la transmisión efectiva de la
política monetaria. Francia también habló de la posibilidad de ayudar a las familias y a las
empresas, en tanto que el Banco Central Europeo, el 18 de marzo, indicó que inyectaría 750
entonces, todos los índices bursátiles comenzaron a mejorar, a mostrar una tendencia
fuerte, felizmente ha habido cierta recuperación. Por supuesto, nos queda un largo camino
por recorrer y hay una expectativa muy grande por la posibilidad de encontrar una vacuna,
que finalmente aliviaría esta situación. Muchos laboratorios han recibido fondos
significativos por parte de los gobiernos, con el fin de acelerar una cura o vacuna para la
liquidez en los países, la búsqueda de una vacuna por parte de varios laboratorios e incluso
la reducción de las tasas de infectados en muchos países. Todo ello ha hecho que se vayan
Se espera una mejora en todas las economías recién para el próximo año, motivo por el
cual se puede tener ganancias significativas en el 2022. En el caso peruano, según el Banco
de América Merrill Lynch, nuestra economía medida por el PBI podría caer 9 % en el
2020; para Barclays, la caída podría llegar a -6,6 %; el estimado de JP Morgan es que
llegue a -8,5 %; el Fondo Monetario Internacional indica que podría estar en -4,5 % y otros
analistas ven una caída de entre 10 % y 15 %. De otro lado, la bolsa peruana también ha
sufrido una caída bastante significativa. Su valor más alto fue el 20 de enero, cuando llegó a
20.734,74 puntos en su índice. A partir de ahí, tuvo una tendencia descendente hasta el 3 de
abril, en que llegó a un valor de 13.538,79 en su índice bursátil, mostrando una caída de
14 %. Para el 2021, nuestro país podría tener una tasa de crecimiento del PBI de 3 % a
4,5 % en promedio, de acuerdo con las medidas económicas que se vienen dando. Esta
recuperación podría ser más rápida, en comparación con los demás países de
12
Latinoamérica, debido a la decisión y a la acción tomadas en su momento por el Gobierno
peruano.
a las preguntas de la investigación dada, se logró fijar la existencia de los problemas que se
Problema general
¿Será posible predecir los precios a futuro a un mediano plazo de las acciones de la
Problemas específicos
PE1: ¿Será posible disminuir las pérdidas de los inversionistas en la Bolsa de Valores
de Lima?
PE2: ¿Será posible que al emplear el algoritmo de Support Vector Machine pueda
predecir de manera más acertada posible a mediano plazo el precio a futuro de las acciones
Objetivos
13
Objetivos específicos
• Identificar los factores que influyen en la predicción de los precios de las acciones en
• Identificar la técnica más adecuada para seleccionar las variables más influyentes en
predicción.
Marco
La finalidad de este apartado es presentar los fundamentos sobre los cuales se basó el
articulación de las teorías con los conceptos y experiencias en el problema, marco social
Teórico
14
La teoría de inversión en la Bolsa de Valores de Lima donde podamos entender el
proceso que se realiza al hacer la compra de una acción y los estudios de cada empresa y
desempeño durante los últimos años para observar los cambios y con ello la mejor toma de
decisiones.
HIPOTESIS Y VARIABLES
En esta parte del informe final de investigación, se presentan las hipótesis que se han
Hipótesis
En este apartado se presentan las hipótesis de trabajo que se formularon para guiar el
Hipótesis general
corto plazo, transando con acciones volátiles de manera diaria y con un modelo de
predicción basado en Support Vector Regression. Este supuesto se basa en la idea de que el
modelo de redes es capaz de captar patrones conductuales que presenta las acciones de la
Bolsa de Valores de Lima mediante el ingreso del estudio realizado por los últimos 5 años.
15
MATERIAL Y MÉTODOS
Tipo de investigación
de causa-efecto.
16
Según el periodo temporal en que se realiza, la investigación es de tipo transversal
Diseño de la investigación
producto cumple con verificar o contrastar las hipótesis planteadas. Por consiguiente, el
metodologías complementarias, una para el desarrollo del producto y otra para probar las
los últimos 5 años, mediante encuestas empleando la herramienta del formulario de Google.
Seleccionar y definir las variables predictivas que se utilizaran para el desarrollo del
modelo, estas variables son la codificación concreta de las características que describen la
variable Bolsa de Valores de Lima. Crear la base de datos elaborada en SQL server con los
17
Mediante la carga de la data requerida para el análisis del comportamiento
Transformar la Base de datos del SQL server a formato .csv para adaptarlo al
software de RapidMiner. Importar y procesar la base de datos con sus variables predictivas
utilizará para este modelo de predicción que vienen incluido en el software de RapidMiner.
de contraste.
veces con el 80% de la base de datos para mejorar la exactitud de predicción con la ayuda
identificar el modelo más eficaz para predecir los precios de la Bolsa de Valores de Lima.
18
Entregable: Documento del análisis comparativo de las tablas de clasificación de los
algoritmos entrenados.
Ejecutar el modelo elegido con mayor eficacia donde se emplearán el 20% de la base
de datos desarrollada.
interpretar los resultados finales teniendo en cuenta que cumple con el 70 % de eficacia
mínima.
19
RESULTADOS
20
Confiabilidad de la Variable Independiente
21
DISCUSIÓN
Las mejores medidas lo tienen los modelos de análisis técnico y análisis fundamental
cuando se encuentran separados uno del otro, teniendo una performance disminuida cuando
los indicadores son combinados, sea en el modelo que incluye todos los indicadores o el
subgrupo de indicadores.
entre ambos tipos de análisis financiero, es decir que los precios parte del análisis técnico
análisis fundamental.
Otro motivo puede ser la correlación que existe entre los indicadores de ambas ramas
de análisis, si el precio sube y tiene buenos indicadores de tendencias de parte del análisis
técnico, puede que ser refleje también en los estados financieros de la empresa, origen del
análisis fundamental.
Sin embargo, si bien los dos primeros modelos de ramas de análisis independientes se
presentan como mejores alternativas, los cuatro modelos muestran resultados aceptables no
muy distintos entre ellos. Por lo que otro análisis de resultados desde un nuevo punto de
vista puede que establezca mejores diferencias entre los modelos. Por tanto, se analizarán
han implementado varios modelos utilizado indicadores del análisis técnico y análisis
Los resultados de los modelos de Support Vector Regression son evaluados mediante
indicadores estadísticos como DA, MAE, MAPE y MSE. Los cuatro modelos elegidos, uno
de análisis técnico, otro de análisis fundamental, uno combinado de las dos metodologías y
finalmente un subgrupo de indicadores de último grupo, tienen resultados similares entre sí.
Tienen como resultados promedio una dirección correcta de 60%, un error promedio de 5
Los resultados de los modelos de Support Vector Machine son evaluados por la
cantidad de veces que se precisó correctamente la dirección del precio futuro con respecto
al inicial. El modelo que mejor performance tuvo fue el del subgrupo de indicadores con
83% de dirección, pero tan solo clasificando 24 acciones de las 320 de forma segura. Los
23
Al no tener claras diferencias entre los modelos, se opta por realizar un análisis de otro
indicadores tanto para los modelos basados en Support Vector Regression y en Support
La diferencia entre los modelos es el contexto del mercado, al ser las acciones un
instrumento financiero de inversión, entonces las expectativas son que las rentabilidades
sean positivas. Por tanto, para obtener rendimientos superiores al mercado, no es suficiente
poder 68 predecir la dirección de las acciones, dado por los modelos de Support Vector
Machine, sino se requiere predecir qué tanto subirán los precios de estas acciones, dado por
Otra diferencia es poder predecir rendimientos negativos de acciones, que en este caso
no es posible por los modelos de Support Vector Machine evaluados, pero si por los
Por tanto, y por los resultados expuestos en la investigación, se determina que, para el
modelo de Support Vector Machine. Asimismo, los modelos Support Vector Regression
24
rendimiento superior al promedio del mercado, objetivo de los inversionistas de la bolsa de
valores.
AGRADECIMIENTOS
Gerber Federico por sus orientaciones para lograr realizar este trabajo.
25
REFERENCIAS BIBLLIOGRÁFICAS
I.H. Witten, E. Frank (2005) Data Mining: practical machine learning tools and
Kaufmann.
P. Flach (2012). Machine Learning: The art and science of algorithms that make
https://www.techemergence.com/machinelearning-in-pharmamedicine/ [Accessed
26
Ramon, R. Machine Learning es un área de la inteligencia artificial que busca desarrollar
técnicas para que las computadoras aprendan. (2014). [online] Available at:
http://www.lavanguardia.com/economia/20170119/413499547095/sociedadinteligenciaa
Orbyt, E., Vivienda, S., TV, G., inmobiliarias, I., Búho, E., Sergio, R., Plus, C., Médico,
D., Marca, A., eSports, M., Editorial, E., Editorial, U., Empleo, E. and Editorial, E.
(2018). Elon Musk: "Hay que regular la inteligencia artificial antes de que se convierta
http://www.elmundo.es/tecnologia/2017/07/18/596dc3acca4741ea3b8b45a0.html
https://searchdatacenter.techtarget.com/es/definicion/Inteligencia-artificial-o-AI
Synergic Partners (2018). Una Breve Historia del Machine Learning. [online] Available
8 May 2018].
27