¿Cómo funcionan las aplicaciones de identificación de música como Shazam?


Las aplicaciones de identificación de música parecen mágicas al principio, pero bajo el capó hay un algoritmo sofisticado que puede encontrar canciones en un instante. Así es como funcionan.

La magia de la identificación musical

Probablemente nos pasó a todos. Estás cenando en un buen restaurante, pasando el rato en un café o paseando por una tienda, cuando de repente escuchas una buena canción en los altavoces. Puede ser una canción que hayas escuchado antes o una pista que nunca hayas escuchado. Entonces sacas tu teléfono, abres Shazam y sostienes tu dispositivo contra el techo. En un instante, la aplicación te dice cuál es la canción, quién es el artista y dónde transmitirla.

Son rápidos, notablemente precisos y pueden identificar incluso las canciones más oscuras. En pocas palabras, funcionan aislando la canción de una grabación y buscándola en una gran base de datos de pistas. Pero la tecnología detrás de cómo lo hacen es bastante compleja e impresionante.

Es posible que se sorprenda al saber que la aplicación Shazam que conocemos hoy se lanzó en 2002, y el sistema era tan preciso y rápido como lo era entonces. Todo ello gracias a un algoritmo único que revolucionaría el mundo de la música.

No es solo la letra

A primera vista, las aplicaciones de identificación de música como Shazam pueden parecer sencillas. Podrías pensar que solo están escuchando la letra, como cualquier asistente de voz, y buscándola en una base de datos de letras de canciones para decirte cuál es la canción.

Sin embargo, la mayoría de las aplicaciones de identificación de música pueden decir cuál es el título de un instrumental, o incluso el cantante de una canción. De hecho, en lugar de analizar la letra de la pista, buscan “huellas digitales” específicas de cada canción en sus vastas bases de datos.

Pronto: Cómo ver letras de canciones en iPhone, iPad, Mac o Apple TV

Tecnología de huellas dactilares

Probablemente tenga dispositivos que se pueden desbloquear con su huella digital, que es la disposición de las pequeñas líneas en su dedo que son exclusivas para usted. Del mismo modo, cuando sostienes el micrófono para grabar un breve fragmento de una canción, ese clip se convierte en modelos de datos que Shazam u otra aplicación pueden buscar en su base de datos.

A primera vista, este método parece propenso a varios problemas. La mayoría de las veces que escuchas música en público, hay ruido de fondo y distorsión causada por los altavoces, lo que puede hacer que las canciones no sean identificables o dar lugar a coincidencias inexactas. Además, hay muchos datos capturados incluso en un clip de audio corto, lo que puede ralentizar la búsqueda de dichos patrones en una base de datos de millones de canciones.

En relación :  Cómo ver Plex con amigos

En una entrevista con Científico estadounidense en 2003, Avery Li-Chun Wang, científico jefe de datos y cofundador de Shazam, explica cómo su algoritmo resuelve estos problemas. La información de un clip de audio se puede visualizar con un gráfico 3D conocido como espectrograma, que representa un cambio en las frecuencias durante un período de tiempo. También tiene en cuenta la amplitud, es decir, la fuerza de un sonido. Esto se representa en un espectrograma usando la intensidad del color.

Espectrograma musical de Shazam

De la misma manera que los humanos no pueden percibir el sonido a menos que esté en una frecuencia particular, en lugar de considerar una canción completa en una búsqueda, Shazam solo considera ” picos ”, que es el contenido de energía más alto en un clip de audio. . Las huellas digitales capturadas solo toman los puntos de frecuencia más alta en un período de tiempo determinado y luego los puntos de amplitud máxima en esas frecuencias.

En un trabajo de investigación para Universidad de ColombiaWang dijo que el método les permite eliminar la mayoría de las partes innecesarias de un clip de audio, como el ruido de fondo, y eliminar la distorsión. También hace que el tamaño de las impresiones sea lo suficientemente pequeño como para que solo se necesiten unos milisegundos para identificar una canción de su gran base de datos.

El impacto de Shazam

Además de ser útiles para los oyentes promedio que escuchan una canción que les encanta, las aplicaciones de identificación de música también ayudan a dar forma al mundo de la música.

Las estaciones de radio y los servicios de transmisión a menudo utilizan datos sobre lo que la gente está buscando para determinar qué pistas escucha la audiencia. Esto es útil porque indica el carácter pegadizo y la popularidad potencial de una canción, independientemente del artista. Cuando etiqueta una canción con la aplicación, inmediatamente ve cuántas personas han intentado etiquetarla también.

Identificación de música Soundhound

Desde el ascenso de Shazam al poder, también ha surgido un puñado de competidores. Soundhound afirma poder identificar una canción simplemente cantándola o tarareando, con resultados mixtos. También hay una identificación de canción integrada en aplicaciones de voz como Google Assistant que funcionan de manera muy similar al sistema de Shazam.

Pronto: Los mejores sitios para transmitir música gratis

Moyens Staff
El personal de Moyens I/O lo ha motivado, brindándole consejos sobre tecnología, desarrollo personal, estilo de vida y estrategias que lo ayudarán.