DivulgaMAT
Inicio - DivulgaMAT Facebook - DivulgaMAT Twitter - DivulgaMAT

76. (Mayo 2016) Cadenas de Markov con restricciones aplicadas a modelos cognitivos en la improvisación del jazz
PDF Imprimir Correo electrónico
Escrito por Kristy Yun y Mariana Montiel (Georgia State University)   
Viernes 20 de Mayo de 2016

Este mes vamos a presentar un trabajo hecho por Kristy Yun y Mariana Montiel, de Georgia State University, en Atlanta (donde estoy pasando mi sabático). Kristy es una estudiante de licenciatura que está a punto de obtener su título. En las universidades americanas los estudiantes de licenciatura acuden a unas conferencias llamadas conferencias de investigación para alumnos de grado. En esas conferencias los alumnos de licenciatura presentan pequeños proyectos de investigación supervisados por un profesor. Ni en el campo de las matemáticas ni en el de la música existen en España estas conferencias. Y es una pena. Primero, habla del nivel de nuestras universidades. ¿Es que no pueden nuestros alumnos de los últimos años de grado adentrarse en el mundo de la investigación y presentar pequeños resultados en una conferencia de estas características? Constituyen una experiencia previa para ellos que es muy valiosa en tantos aspectos: se enfrentan a problemas de investigación; se prueban a sí mismos; conviven con su profesor; supone una gran emoción presentar su trabajo antes sus compañeros (normalmente, en forma de póster o de comunicación corta); ponen en práctica sus habilidades de escritura y orales, entre otras.

Me llamó la atención el trabajo de Kristy Yun y Mariana Montiel en la conferencia de este año y les propuse publicarlo en formato divulgativo en esta columna. Les agradezco profundamente que hayan aceptado la invitación. Espero que este ejemplo cunda y empecemos a celebrar este tipo de conferencias para alumnos de licenciatura en España también de modo generalizado. Los investigadores más productivos que he conocido siempre han tenido una amplia red de alumnos a su alrededor con quienes han desarrollado relaciones personales excelentes y en quienes han podido depositar sus ideas para llevarlas a cabo, todo ello en el contexto de una cálida simbiosis humana y científica.

Paco Gómez Martín (Universidad Politécnica de Madrid)

Resumen del estudio

Las improvisaciones en el jazz consisten en ciertos patrones rítmicos y melódicos que oímos en cierto orden. Por medio del estudio de la genésis de estos patrones podemos entender el proceso de la toma de decisiones en tiempo real en el contexto de una estructura dada en que consiste la improvisación. No hay teorías que describan a fondo y con precisión la improvisación, pero entre las existentes destacan dos escuelas de pensamiento: una es la teoría basada en patrones; la otra se basa en gramáticas o reglas. La primera teoría propone que los improvisadores se nutren de un corpus de patrones rítmicos y melódicos memorizados y que dichos patrones se insertan en el proceso de una improvisación en curso dentro de unas ciertas reglas de estilo. Otra teoría, encontrada con la primera, asevera que los improvisadores generan notas por medio de los algoritmos y las reglas del jazz tonal, sin la ayuda de patrones memorizados. Para comprobar la validez de estas teorías, en un estudio previo [7] llevado a cabo por Martin Norgaard y sus coloaboradores se analizó un corpus de 48 solos improvisados por el gran saxofonista de jazz Charlie Parker. Los resultados del estudio mostraron que la incidencia de patrones en el corpus de Charlie Parker coincide con el algoritmo basado en patrones implementado en ese estudio. En cambio, las improvisaciones generadas por Impro-Visor, un software desarrollado en base a gramáticas y reglas tomadas de los acordes musicales introducidos por el usuario, no generó una presencia de patrones similar a la del corpus real de Parker. En vista de los resultados positivos del algoritmo, el siguiente paso era la incorporación de acordes; sin embargo, se quería evitar que dichos acordes dictasen la melodía y el contorno de la salida musical de manera excesivamente estricta, ya que la coincidencia de patrones era muy apegada a las improvisaciones de Parker. Se vio que una posible solución era el empleo de modelos de Markov no homogéneos, en que los acordes se entendiesen como restricciones. Cabe mencionar que podría haber aplicaciones de ese algoritmo que transcendiesen el género de jazz y aún la música, ya que se basa en patrones. La creatividad en áreas tales como los video juegos se puede modelar, dado que los jugadores deben responder de forma creativa en tanto adquieren ciertos patrones de respuesta con restricciones inherentes al contexto.

Introducción

Normalmente, cuando los músicos profesionales de jazz tocan en pequeños grupos no leen partituras, sino que improvisan. Los ejecutantes escogen frases que al público podría parecerles prescritas, pero que realmente se crean en el acto. Estos músicos profesionales desarrollan una forma muy intrincada de tema y variación; cada uno es consciente de su tonada y su papel; esto explica la razón por la que la improvisación de jazz sirve como un paradigma excelente para el estudios de la creatividad en tiempo real. La improvisación en el jazz es también un prototipo de la actividad mental común al reconocimiento del habla y otras áreas de interés en la inteligencia artificial.

Actualmente hay dos teorías encontradas en el estudio de la improvisación en el jazz: (1) el enfoque basado en los patrones y (2) el enfoque basado en reglas; la figura 1 ilustra esta situación esquemáticamente (se ha dejado el texto en el inglés original).

Cadenas de Markov con restricciones aplicadas a modelos cognitivos en la improvisación del jazz

Figura 1. Teorías cognitivas encontradas

Hay varios softwares para la improvisación en el jazz que se basan en una de las teorías descritas más arriba, patrones o reglas. Un ejemplo de un software basado en reglas es Impro-Visor, un software para la notación musical diseñada para ayudar a los estudiantes de jazz componer y escuchar solos similares a los que podrían improvisarse sobre los acordes dados. Martin y sus colaboradores [7], en un artículo de 2013, analizaron las dos teorías cognitivas prevalecientes por medio del análsis de un corpus de solos de Charlie Parker. Los resultados del estudio (mostrados en la figura 2, primera parte) demostró que el porcentaje de notas que inician un patrón de 4 intervalos como una función del número de veces el patrón ocurre en las improvisaciones no es coherente con el corpus de Charlie Parker cuando se emplea el software Impro-Visor (mostrados en la figura 2, segunda parte).

Cadenas de Markov con restricciones aplicadas a modelos cognitivos en la improvisación del jazz

Figura 2 (primera parte). Comparación del porcentaje de notas que inician un patrón de 4 intervalos como una función del número de veces que el patrón ocurre en el corpus. [2]

Cadenas de Markov con restricciones aplicadas a modelos cognitivos en la improvisación del jazz

Figura 2 (segunda parte). Comparación de los porcentajes de notas que inician en un patrón de 4 intervalos como una función del número de veces que el patrón ocurre en 1) una melodía generada según la gramática de Parker en el software Impro-Visor y 2) utilizando nuestro algoritmo. [2]

No obstante, un algoritmo basado en patrones melódicos parece reflejar el corpus de Parker con mucha más fidelidad. Tras los buenos resultados conseguidos por este último algoritmo, los autores pensaron en incorporar los acordes a la generación de los solos. Los acordes son fundamentales en la improvisación en el jazz y existe una íntima relación entre melodía y acordes que no es posible deslindar en modo alguno en este estilo. Existía, empero, el peligro de que la incorporación de los acordes restringiese excesivamente las posibilidades de elección de los patrones si dicha incorporación no se hacía de modo cuidadoso. Entonces, para incorporar los acordes y, a la vez, modificar lo menos posible las improvisaciones que resultan de nuestro algoritmo, decidimos explorar las cadenas de Markov no homogéneos.

Modelos de Markov

Los procesos de Markov son una herramienta popular de modelaje que se emplean en la generación de contenido, tales como la generación de textos, la composición musical y la interacción. El principio básico de la suposición de Markov es que los estados futuros dependen sólo del pasado inmediato y de la sucesión de eventos que ocurrió anteriormente. Matemáticamente, para una sucesión {q1,q2,...,qn}:

p(qi|q1,...,qi-1) = p(qi|qi-1)(1)

Ejemplo de un proceso de Markov[4] El pronóstico del tiempo consiste en adivinar el estado del clima mañana basado en una historia de observaciones en torno al tiempo. En base a la tabla 1 de números escogidos aleatoriamente, mas el autómata generado de esta tabla en la figura 3, intentaremos pronosticar el tiempo.

Cadenas de Markov con restricciones aplicadas a modelos cognitivos en la improvisación del jazz

Tabla 1. Probabilidades escogidas aleatoriamente para el tiempo.

Cadenas de Markov con restricciones aplicadas a modelos cognitivos en la improvisación del jazz

Figura 3. Autómatas generadas de la Tabla 1.

Por ejemplo, en vista de que hoy es un día soleado, ¿cuál es la probabilidad que mañana sea soleado y que el día siguiente sea lluvioso? Esto se traduce en los siguientes cálculos:

P(q2 = soleado, q3 = lluvioso | q1 = soleado)

= P(q3 = lluvioso | q2 = soleado, q1 = soleado) x

P(q2 = soleado | q1 = soleado)

= P(q3 = lluvioso | q2 = soleado) x

P(q2 = soleado | q1 = soleado)

= (0.05)(0.8)

= 0.04

Esta probabilidad también se puede obtener a través del autómata de la figura 3, multiplicando las probabilidades correspondientes en el proceso.

Resultados

En el artículo de Pachet, Finite-length Markov processes with constraints [5], se muestra que las restricciones pueden compilarse en un nuevo modelo de Markov cuyas probabilidades sean equivalentes al modelo inicial. Según el propio Pachet, al hablar su método, “esto nos deja con la ventaja de retener la sencillez de los trayectos aleatorios, en tanto asegura que las restricciones de control se satisfagan"[5].

Estos resultados se pueden aplicar a nuestro algoritmo melódico y rítmico actual para mantener las probabilidades de la salida musical original (la “improvisación”), en tanto los acordes son incorporados como restricciones. Una vez más se enfatiza que la meta es no dejar que los acordes “dicten” el contenido melódico, cosa que sí sucede en el software Impro-Visor, donde la incidencia de patrones presentes en el corpus de solos de Parker se pierde en las improvisaciones generadas (aunque somos los primeros en reconocer lo ingenioso y la utilidad didáctica de Impro-Visor).

Nuestra meta es generar un modelo no homogéneo de Markov, representado por una serie de matrices de transición. Para mostrar cómo las restricciones se pueden compilar en un modelo no homogéneo de Markov, tomaremos un ejemplo de generación de melodía con una restricción simple. La restricción se reduce a que toda melodía de 4 notas tiene que terminar en C (do); de nuevo se usarán el ejemplo original en inglés. Considérese un modelo de Markov estimado a partir de las sucesiones de la figura 4. El vector a priori es:

C D E
Cadenas de Markov con restricciones aplicadas a modelos cognitivos en la improvisación del jazz

donde las entradas se originan en las melodías de la figura 4. Por ejemplo, para encontrar la probabilidad de C, primeramente se toman el número total de notas en cada melodía, que en este caso son 6 para cada una. Por lo tanto, de las doce notas C aparece 4 veces y esto arroja la probabilidad 4/12 = 1/3.

Cadenas de Markov con restricciones aplicadas a modelos cognitivos en la improvisación del jazz

Figura 4. Dos melodías sencillas de entrada usadas para estimar M.

Las probabilidades de transición de M también se pueden generar de las dos melodías de entrada.

Cadenas de Markov con restricciones aplicadas a modelos cognitivos en la improvisación del jazz

Por ejemplo, cuando C va a D (re), podemos ver de nuestras melodías que la totalidad de posibles transiciones que comienzan con C son:

  1. C va a D (primera melodía)
  2. C va a E (segunda melodía)
  3. C va a D (segunda melodía).

De las tres transiciones posibles, 2 de las 3 terminan de D. Por lo tanto, la probabilidad de ir de C a D es 2/3.

Por medio de un programa sencillo creado para generar todas las posibles combinaciones de melodías de 4 notas (véase la figura 5), obtenemos 12 posibilidades de probabilidades diferentes de cero, como se ve en la tabla 2.

Cadenas de Markov con restricciones aplicadas a modelos cognitivos en la improvisación del jazz

Figura 5. Todas las posibles combinaciones de melodías de 4 notas que satisfacen la restricción.

Cadenas de Markov con restricciones aplicadas a modelos cognitivos en la improvisación del jazz

Tabla 2. Las 12 melodías de 4 notas que satisfacen la restricción del control y sus probabilidades en M, donde la suma de las probabilidades para estas sucesiones es s.

Las probabilidades de obtener melodías de 4 notas que terminan en C pueden detectarse por medio de nuestro vector a priori M, junto con las probabilidades de transición. Por ejemplo:

Cadenas de Markov con restricciones aplicadas a modelos cognitivos en la improvisación del jazz

Después de la generación de estas matrices primarias, el primer paso en nuestro proceso es hacer que nuestro problema inducido de satisfación de restricciones (CSP) cumpla con la consistencia de arcos. La consistencia de arcos consiste en la propagación de las restricciones en todo el problema de la satisfacción de restricciones através de un algoritmo de punto fijo que considera la restricciones de manera individual [6]. Para nuestro ejemplo, la consistencia de arcos elimina C y E del dominio de V3 y arroja los siguientes dominios:

Cadenas de Markov con restricciones aplicadas a modelos cognitivos en la improvisación del jazz

donde Ki es el estado de transición entre Z(i-1) a Zi y Vi es el estado. Esto asegura que durante cualquier trayecto aleatorio no habrá una situación en la cual se escoja una alternativa que no tenga continuación. El siguiente paso es extraer las matrices de los dominios.

Por medio del algoritmo de Pachet[5]:

Cadenas de Markov con restricciones aplicadas a modelos cognitivos en la improvisación del jazz

mantenemos las siguientes matrices:

Cadenas de Markov con restricciones aplicadas a modelos cognitivos en la improvisación del jazz

Finalmente, construimos las matrices de transición definitivas (i) a através de un proceso sencillo de derecha-a-izquierda para poder propagar las perturbaciones en las matrices inducidas por la normalización individual al revés, comenzando con la que está más a la derecha.[5]

Para lograr lo anterior, primeramente normalizamos la última matriz Z(L-1)individualmente. En seguida se propaga la normalización de la derecha a la izquierda hasta llegar al vector a priori Z(0). Los elementos de las matrices (i) y el vector a priori (0) se definen através de las siguientes relaciones de recurrencia:

Cadenas de Markov con restricciones aplicadas a modelos cognitivos en la improvisación del jazz

Por medio de la relación arriba expuesta, logramos las siguientes matrices de transición para nuestro ejemplo.

Cadenas de Markov con restricciones aplicadas a modelos cognitivos en la improvisación del jazz
Cadenas de Markov con restricciones aplicadas a modelos cognitivos en la improvisación del jazz

Por medio de calculos similares para i = 1 y i = 0, como resultado contamos con las siguientes matrices de transición:

Cadenas de Markov con restricciones aplicadas a modelos cognitivos en la improvisación del jazz

Discusión

Este es un enfoque eficiente para controlar la generación de Markov con restricciones que pueden:

  1. garantizar que las sucesiones generadas satisfagan las restricciones.
  2. seguir la distribución de probabilidad del modelo de Markov inicial.

Podemos ver que la matriz final de transición mantuvo la misma distribución de probabilidad que el vector a priori M.

Cadenas de Markov con restricciones aplicadas a modelos cognitivos en la improvisación del jazz

La tabla 3 muestra las probabilidades de todas las posibles sucesiones de soluciones, donde estas probabilidades son iguales a las probabilidades iniciales hasta un factor constante de multiplicación α(0).

Cadenas de Markov con restricciones aplicadas a modelos cognitivos en la improvisación del jazz

Tabla 3. La probabilidad del conjunto de sucesiones de soluciones en . La razón de probabilidades es constante.

Este algoritmo no tienen que ser específico al género de jazz, ya que se basa en los patrones reales de un corpus. Ha habido implementaciones con música clásica, música blue grass y otras músicas. Se piensa que este algoritmo puede trascender la música y utilizarse para estudiar la creatividad en áreas tales como los video juegos, donde la improvisación juega un papel significativo dado que los participantes deben responder de manera creativa en tanto adquieren ciertos patrones de respuesta como resultado de las restricciones.

Actualmente estamos trabajando en la incorporación de los acordes en el algoritmo y este método parece prometedor. Mi contribución en este proyecto de investigación consistió en encontrar esta técnica y mostrar su relevancia para el siguiente paso importante en el desarrollo de este software para la improvisación.

Reconocimientos

Primeramente quiero agradecer a mi asesora de investigación, Dr. Mariana Montiel. Sin su ayuda e involucramiento dedicado en cada paso de este proceso, este trabajo jamás se habría realizado. Me gustaría darle las gracias por su apoyo, orientación, paciencia y, sobre todo, su tutoría. También me gustaría mostrar mi gratitud a mi grupo de investigación de la neurofísica, incluyendo al Dr. Mukesh Dhamala, el Dr. Martin Norgaard, y a Kiran Dhakal por compartir mi interés y emoción durante el transcurso de esta investigación. Sin la oportunidad que me aportó el Dr. Dhamala de trabajar junto con Kiran en el registro de los datos fMRI de los músicos de jazz, no habría podido trabajar tan cercanamente con la Dra. Montiel y con el Dr. Norgaard en este proyecto. Asimismo, gracias al Dr. Paco Gómez por su ayuda con las últimas partes de los cálculos.

 

Referencias

[1] "Jazz Improvisation." A Passion for Jazz! Music History & Education. http://www.apassion4jazz.net

[2] Pressing, J. (1988). Improvisation: Methods and model. In J. A. Sloboda (Ed.), Generative processes in music (pp.129-178). Oxford, UK: Oxford University Press.

[3] Johson-Laird,P.N.(2002).How jazz musicians improvise. Music Perception., 19, 415-442.

[4] Resch, Barbara, Hidden Markov Models: A Tutorial for the Course Computational Intelligence.
http://www.igi.tugraz.at/lehre/CI

[5] Pachet , Pierre Roy , Gabriele Barbieri, Finite-length Markov processes with constraints, Proceedings of the Twenty-Second International joint conference on Artificial Intelligence, July 16-22, 2011

[6] C. Bessiere, E. C. Freuder, and J.-C. Regin. Using inference to reduce arc consistency computation. In Proc. of the IJCAI95, pages 592-598. Morgan Kaufmann, 1995.

[7] Norgaard, Martin; Spencer, Jonathan; Montiel, Mariana. Testing Cognitive Theories by Creating a Pattern-Based Probabilistic Algorithm for Melody and Rhythm in Jazz Improvisation. Psychomusicology, vol. 23, No. 4. 2013

 

© Real Sociedad Matemática Española. Aviso legal. Desarrollo web