CBL - Campus del Baix Llobregat

Projecte llegit

Títol: Popularity Prediction on Instagram using Machine Learning


Estudiants que han llegit aquest projecte:


Director/a: ZOLA, ENRICA VALERIA

Departament: ENTEL

Títol: Popularity Prediction on Instagram using Machine Learning

Data inici oferta: 22-06-2017     Data finalització oferta: 22-06-2017



Estudis d'assignació del projecte:
    GR ENG SIS TELECOMUN
Tipus: Individual
 
Lloc de realització: ERASMUS
 
Paraules clau:
AI, Machine Learning, Deep Learning, Popularity, Prediction, Instagram
 
Descripció del contingut i pla d'activitats:
Durant l’últim any, la recerca sobre noves maneres d’aprofitar Deep Learning pel profit de l’ésser humà ha crescut exponencialment. Al mateix temps, la nostra societat està evolucionant en direcció a noves formes de comunicació i interacció social. Instagram és una de les principals cares en aquest canvi en l’evolució humana.
Els sistemes de predicció i la Intel·ligència Artificial són temes que estan explotant ara mateix. Hi ha empreses que estan invertint en reptes i experts per predir aquell producte que l’usuari comprarà, o aquella música que li agradarà, o aquella pel·lícula que voldrà veure. Hi ha una nova branca per seguir que és Social Media. Predir la popularitat de les imatges, quina serà la més popular del dia, quin és el millor tall perquè el teu Selfie sigui més popular...
Aquest projecte tracta de posar aquestes dues realitats juntes. L'objectiu és predir quants likes rebrà un post abans de ser publicat a Instagram. Això ara només seria possible gràcies a Machine Learning. Machine Learning és aquest concepte que podem entrenar ordinadors per identificar patrons i dades, i aleshores utilitzar aquests patrons per predir noves dades. Nosaltres donarem mostres de posts a la nostra màquina perquè pugui trobar patrons i estimar i predir un resultat després d'haver estat donat algun altre input, en base als patrons que la màquina va aprendre.
El sistema constarà de tres seccions:
En primer lloc, la imatge d'entrada es classificarà en una categoria en funció del tema de la imatge utilitzant un model basat en Deep Learning. En aquest projecte tindrem en compte sis categories: Animals, Food, Friends, Landscape, Quote and Selfie.
En segon lloc, la imatge d'entrada es compara amb un conjunt de 200 imatges de la categoria seleccionada que ja tenen una puntuació entre 0 i 1 utilitzant un altre model de nou basat en Deep Learning. Un algoritme farà la comparació i es traduirà en un histograma. El punt màxim de l'histograma serà la puntuació computada de la imatge d'entrada.
En tercer lloc, utilitzarem aquesta puntuació calculada a partir de la segona secció com una variable en una regressió, per tal d'obtenir la predicció final de likes. Altres variables es tenen en compte en aquesta regressió també.
Com es pot veure a la descripció del sistema, sense Machine Learning seria impossible, fins i tot per a un ésser humà, d’identificar tots els patrons necessaris i predir amb precisió noves dades. Generalment, els humans poden crear un o dos bons models a la setmana; Machine Learning pot crear milers de models en una setmana.
 
Overview (resum en anglès):
In the last year, the research about new ways of using Machine Learning for the human profit has grown exponentially. At the same time, our society is evolving into new ways of communication and social interaction. Instagram is one of the faces of this change in the human evolution.
Prediction systems and Artificial Intelligence are topics that are exploding right now. Companies are investing in challenges and experts to predict that product that a user will want, or that music that he will like, or that film that he will want to watch. There is a new challenging branch to be followed and that is Social Media. Predict the popularity of pictures, which one will be the most popular of the day, which is the best cut for a selfie to be more popular...
This project tries to put these two realities together. The goal is to predict how many likes a post is gonna get before being posted on Instagram. This would only be possible right now thanks to Machine Learning. Machine Learning is this concept that we can train computers to identify patterns and data, and then use those patterns to predict off of new data. We will give samples of posts to our machine so it can find patterns and estimate and predict a result after being given some other input, based on the patterns that it learned.
The system will consist of three sections:
First, the input picture will be classified into one category depending on the theme of the picture using a retrained model based on Deep Learning. In this project we are going to take into account six categories: Animals, Food, Friends, Landscape, Quote and Selfie.
Second, the input picture will be compared with a set of 200 pictures from the selected category that already have a score between 0 and 1 using another retrained model based on Deep Learning. An algorithm will make the comparison and will result in a histogram. The maximum point of the histogram will be the computed score of the input picture.
Third, we will use that computed score from the second section as a variable in a regression, in order to get the final prediction of likes. Other variables are taken into account in this regression as well.
As you can see in the description of the system, without Machine Learning it would be impossible, even for a human being, to identify all the necessary patterns and predict off new data accurately. Humans can typically create one or two good models a week; machine learning can create thousands of models a week.


© CBLTIC Campus del Baix Llobregat - UPC