Quasi un anno fa Pro Web ha tenuto un intervento al Rocket Science SEO, l’evento organizzato da Enrico Altavilla. In quell’occasione abbiamo approfondito il funzionamento di due tra i più importanti update di Google degli ultimi anni, Hummingbird e Rankbrain. Il contenuto dell’intervento, prettamente tecnico, era tutt’altro che leggero e questo per molti mesi ci ha fatto sorgere profondi dubbi riguardo la possibilità di trasformarlo in un post. Poi però abbiamo pensato che, spacchettando il contenuto, avremmo potuto scrivere due o tre post interessanti e forse, con un po’ d’impegno, non troppo pesanti.
Oggi proviamo quindi a raccontarvi una parte dell’intervento, quella relativa a Rankbrain, spiegando cos’è e come funziona e illustrando il brevetto che probabilmente ne è alla base.
Cos’è Rankbrain e come funziona
RankBrain: tra intelligenza artificiale e parole che diventano entità matematiche, resta uno degli algoritmi più “misteriosi” di Google
Tutto ha inizio il 26 ottobre 2015, data in cui Bloomberg.com pubblica un articolo nel quale il giornalista Jack Clark riporta le parole di Greg Corrado, Principal Scientist di Google. Corrado sostiene che Google già da un po’ di mesi sta utilizzando l’intelligenza artificiale e il machine learning per affinare i risultati delle SERP e l’algoritmo che opera in questa direzione è stato denominato RankBrain. Secondo Clark, Corrado avrebbe detto che Rankbrain utilizza l’intelligenza artificiale per trasformare il linguaggio in entità matematiche in grado di essere comprese da un computer; quando RankBrain si trova difronte a parole o frasi con le quali non ha familiarità, prova a sostituirle con parole o frasi dal significato simile, modificando di conseguenza i risultati nelle SERP. Corrado parla anche del team di ingegneri coinvolti nello sviluppo di Rankbrain, citando Yonghui Wu e Thomas Strohmann. Probabilmente questi nomi non vi dicono nulla ma tenete a mente quest’ultimo perché ci tornerà utile tra pochissimo.
Negli stessi giorni si occupa dell’argomento anche TheSEMPost.com e lo fa nella persona della sua fondatrice Jennifer Slegg la quale riporta le dichiarazioni di un imprecisato portavoce di Google e aggiunge alcune informazioni a quelle fornite da Bloomberg:
- Rankbrain lavora con tutte le lingue;
- È utile specialmente ma non soltanto nelle ricerche di lunga coda e in quelle che non sono mai state effettuate prima;
- Agisce con tutti i tipi di query;
- Non impara in tempo reale ma viene aggiornato periodicamente.
L’articolo più interessante è però probabilmente quello che Bill Slawsky pubblica su Gofishdigital.com, articolo nel quale vengono ipotizzati ulteriori dettagli sul funzionamento di RankBrain. Secondo quanto riportato nell’articolo, RankBrain effettuerebbe una sostituzione della query basata su due fattori fondamentali: il concetto e il contesto. Slawsky prova anche ad avanzare un’ipotesi anche sul brevetto che probabilmente è alla base del tutto. Il titolo del brevetto in questione è “L’utilizzo dei concetti come contesti per le sostituzioni della query” ed è il frutto del lavoro di un team di ingegneri tra cui spicca un nome, quello di Thomas Strohmann. Proprio lui, lo stesso Strohmann, che Corrado aveva indicato come uno dei padri fondatori di RankBrain.
RankBrain funzionerebbe attraverso le sostituzioni, utilizzando sinonimi dei termini della query dell’utente, al fine di restituire risultati sempre più precisi in SERP
Questa coincidenza ci ha portato a supporre che l’intuizione di Slawsky fosse corretta e ci ha spinto ad approfondire lo studio del brevetto. Esso spiega nel dettaglio come avviene il processo di sostituzione della query, cioè il processo attraverso il quale Rankbrain sostituirebbe i termini di ricerca digitati dagli utenti con altri termini, al fine di ottenere risultati migliori nelle SERP. Utilizziamo il condizionale perché quella di Slawsky, seppur molto convincente, resta un’ipotesi, un’ipotesi che adesso proveremo ad avvalorare.
Rankbrain: il possibile brevetto
L’immagine riportata sotto mostra tutti i passaggi del processo di sostituzione, prendendo come esempio il caso della query “New York Times Puzzle”: si tratta di un utente che sta cercando su Google i giochi di enigmistica del New York Times. Le lettere e i numeri indicati nell’immagine sono funzionali alla spiegazione; noi ci concentreremo sulle lettere, che rappresentano i passaggi salienti del processo, mentre citeremo soltanto i numeri più utili alla comprensione.
Ecco una delle immagini del brevetto depositato che spiegherebbe il funzionamento di RankBrain tramite il metodo delle sostituzioni: la query riguarda i cruciverba del New York Times.
A: La query dell’utente (in figura n. 221) viene inoltrata, attraverso un network, al Search System.
B: La query viene inoltrata al Query Reviser Engine, che stabilisce se e come deve essere rivisitata.
C: Se il Query Reviser Engine decide che la query deve essere rivisitata, i termini che la compongono vengono inoltrati separatamente al Substitution Engine. In questo caso quindi verranno inoltrati separatamente i termini “New”, “York”, “Times” e “Puzzle” (in figura n.222).
D: il Substitution Engine analizza i singoli termini, li combina tra loro al fine di individuare uno o più concetti e interroga la Collection Of Concepts per verificare se esiste un match tra i concetti trovati e i concetti già noti.
E: la Collection Of Concepts restituisce il concetto trovato al Substitution Engine. In questo caso il concetto restituito è “New York Times”
F: il Substitution Engine inoltra il concetto “New York Times” al Query Log
G: il Query Log prova a combinare il concetto con i termini presenti nella query originale e prova a sostituire tali termini con altri, ottenendo una serie di regole di sostituzione alle quali assegna una valutazione. Ecco nel dettaglio le regole di sostituzione generate dal Query Log:
- Regola n. 231: “New York Times Puzzle” può essere sostituito con “New York Times Crossword”. Il Query Log assegna a questa regola di sostituzione una valutazione positiva (rappresentata in figura da una freccia verso l’alto)
- Regola n. 232: “Puzzle New York Times” può essere sostituito con “Crossword New York Times”. Il Query Log assegna a questa regola di sostituzione una valutazione negativa (rappresentata in figura da una freccia verso il basso)
- Regola n. 233: “New York Times Puzzle” può essere sostituito con “New York Times Subscription”. Il Query Log assegna a questa regola di sostituzione una valutazione negativa
- Regola n. 234: “Jigsaw Puzzle” può essere sostituito con “Jigsaw Crossword”. Il Query Log non assegna alcuna valutazione a questa regola
- “Puzzle” può essere sostituito con “Crossword”. Il Query Log non assegna alcuna valutazione a questa rergola
H: il Query Log invia al Substitution Engine le regole di sostituzione alle quali ha assegnato una valutazione.
I: il Substitution Engine determina che l’unica regola adatta è la prima (l’unica che ha ricevuto una valutazione positiva, la n.231) e la invia alla Collection Of Substitution Rules. D’ora in avanti questa regola di sostituzione verrà utilizzata per affinare risultati nelle SERP.
Le conseguenze nelle SERP
Quali sono le conseguenze del processo descritto nel brevetto? Google ha imparato che quando un utente digita la query “New York Times Puzzle” sta probabilmente cercando anche risultati relativi alla query “New York Times Crossword” e crea quindi delle SERP in grado di rispondere ad entrambe le query. Le SERP delle due query sono infatti molto simili tra loro:
Conclusioni
Cos’è Rank Brain?
RankBrain è un algoritmo di Google che utilizza l’intelligenza artificiale e il machine learning per aiutare l’algoritmo core ad interpretare meglio le query degli utenti.
Cosa fa in concreto?
Cerca di affinare i risultati di ricerca sostituendo i termini che compongono la query con termini più adatti.
In base a cosa viene effettuata la sostituzione?
In base ai concetti contenuti nella query, e in base ai contesti che essi possono rappresentare
In che modo influenza la SEO?
Ci si può arrivare ragionando, quindi vi lasciamo ragionare. O magari a breve scriviamo un post proprio su questo…