CBL - Campus del Baix Llobregat

Projecte llegit

Títol: Audio fingerprinting para la identificación automática de contenidos audiovisuales


Estudiants que han llegit aquest projecte:


Director/a: TARRÉS RUIZ, FRANCESC

Departament: TSC

Títol: Audio fingerprinting para la identificación automática de contenidos audiovisuales

Data inici oferta: 26-01-2017     Data finalització oferta: 26-09-2017



Estudis d'assignació del projecte:
    GR ENG SIS TELECOMUN
    GR ENG SIST AEROESP
    GR ENG TELEMÀTICA
Tipus: Individual
 
Lloc de realització: EETAC
 
Paraules clau:
Fourier Transform, Spectrogram, Audio Signal Processing, Fingerprinting, MFCC, Matlab
 
Descripció del contingut i pla d'activitats:
El projecte consisteix en identificar i estudiar diferents tecnologies de marcatge de
senyals d'audio per la seva identificació seleccionant l'estratègia que sembli més
adequada per tal d'identificar codis de temps en la reproducció de senyals audiovisuals a
partir del audio. L'algorisme seleccionat s'implementarà en Matlab i es testejara amb una
base de dades predefinida per tal d'avaluar les seves prestacions. Finalment, es
considerarà optimitzar el algorisme bàsic si els resultats son satisfactoris
 
Overview (resum en anglès):
Audiofingerprinting is a technology used to identify audio files based on the content of the file.
With them we can identify a pattern of an audio file, so that it can be recognized from an audio database, without having to have information about it. Its use is based on the detection of an audio sample and subsequent sending to a database (BD), once analyzed look for matches in this and return us information about the sample analyzed.

One of the methods to perform this identification is the method known as Hashing.

From this methodology we can choose a song fragment of a certain duration and make the spectrogram of the song. From here with a series of filters we will get a series of points called candidates. Later the hashing is done where we will obtain information encoded in bits.

In parallel there is a database of capacity and reasonable effectiveness to keep all the information of the different songs.

Finally, a comparison will be made between the result of the Hashing and the one stored in the database to see matches. In case you have them from that segment we can know what song it is.

In this work we will do an in-depth study of the audiofingerprining and we will make a practical case of simulation through the program to be able to see the whole operation.


© CBLTIC Campus del Baix Llobregat - UPC