¿Usarías un chatbot de IA en tu DAW?

Jugadores virtuales

Otra tarea que me gustaría ver impulsada por el chat son los instrumentos virtuales. Hemos visto los impresionantes resultados que pueden dar los instrumentos de ‘reproductor virtual’. Los gustos de Toontrack y UJAM han trabajado duro en esta área. Cuando trabajamos con un músico real, les hacemos pedidos verbales, dirigiéndolos pero dejando los detalles en manos de ellos y su experiencia. Por ejemplo, un baterista virtual (odio programar la batería…) podría recibir instrucciones: ‘El bombo está demasiado ocupado. Siéntese durante el tercer verso y suavice los platillos en el coro. En lo que Machine Learning es bueno es en identificar patrones en grandes conjuntos de datos. Déle suficientes ejemplos de buena percusión y reproducirá algo que suena como una buena percusión tan convincentemente como puede reproducir el lenguaje escrito. Al igual que el lenguaje escrito, es posible que necesite más orientación y, si está buscando algo genuinamente original, probablemente sea mejor que consiga un músico de verdad, ¡y gracias a Dios por eso!

Originalidad Vs Familiaridad

Las tareas laboriosas y las tareas que quedan fuera de nuestra experiencia se adaptan bien a este tratamiento y, aunque la originalidad es importante, gran parte de lo que hacemos es intentar que las cosas suenen apropiadas para el género y «como un disco». Eso es efectivamente tratar de hacer que suene similar a las cosas que han pasado antes. Con un conjunto de datos lo suficientemente grande y un software lo suficientemente sofisticado que puede responder a la dirección de un ser humano. No veo por qué la IA no puede producir resultados que no cuestionaríamos como algo más que música normal.

En nuestro reciente podcast con Stian de Acon Digital, su hallazgo de la semana fue un artículo sobre música generada por IA. Los resultados fueron en todas partes, desde alarmantemente buenos hasta cómicamente terribles. Pero la conclusión para mí fue que se trataba de una IA que generaba música a partir de descripciones de texto, pero que no había pasado por las revisiones necesarias para aprovecharla al máximo. Al usar Chat GPT, la primera respuesta suele ser bastante poco inspiradora, sin embargo, con alguna dirección, puede acercarse mucho más a lo que podría desear. Esto es lo mismo que el trabajo humano a humano de muchas personas. Se envía un borrador, recibe comentarios, se vuelve a enviar, etc. El hecho de que el primer borrador necesite trabajo no significa que el concepto sea defectuoso.

El ‘GPT’ en el chat GPT

La parte GPT de Chat GPT se refiere al uso de la familia de modelos de lenguaje Generative Pre-trained Transformer y esto es lo que está detrás de sus asombrosas capacidades. Esta interfaz similar a la humana y el gran conjunto de datos del que Chat GPT puede extraer se combinan para producir sus impresionantes resultados. Otro aspecto importante de la tecnología detrás de Chat GPT es el aprendizaje de refuerzo a partir de comentarios humanos y, dado el gran éxito y aceptación de Chat GPT, esta podría ser un área que presenta un problema para un pequeño desarrollador que desee intentar hacer algo similar, cuanto más grande sea el usuario. base la mayor cantidad de comentarios a los que pueda acceder y tal vez esta es un área donde lo más grande se vuelve más grande porque tiene los mejores datos. Los complementos de Chat GPT existen, aunque estos son complementos de navegador, no del tipo que esperaría que se discutan aquí y estoy seguro de que alguien en algún lugar está considerando si Chat GPT desempeñará un papel en los complementos de audio pronto. El tiempo lo dirá, pero esta es un área que estoy seguro crecerá explosivamente y los usos específicos que se le darán aún están por definirse.

¿Qué pasa contigo? ¿Le darías la bienvenida a esta tecnología en tu estudio? Comparte tus pensamientos.

Categorías DAW