Nelle news di questo inizio del 2024 probabilmente hai sentito parlare di ChatGPT, il chatbot basato su GPT-3 (tecnicamente, 3.5) che è stranamente in grado di simulare risposte simili a quelle umane.
Per rispondere al titolo di questo articolo abbiamo chiesto direttamente a ChatGPT:
ChatGPT è un motore di ricerca?
No, ChatGPT non è un motore di ricerca. È un chatbot di intelligenza artificiale che utilizza l’elaborazione del linguaggio naturale per comprendere e rispondere all’input dell’utente.
Non è male, e suona come qualcosa che scriverebbe un vero essere umano.
GPT (Generative Pre-training Transformer) è un sistema di deep learning che genera testo basato sulla previsione di modelli linguistici dopo essere stato pre-addestrato con un ampio set di documenti. I modelli attuali sono davvero impressionanti, inclusa l’analisi di domande complesse:
Come spiegheresti ChatGPT a un bambino di 5 anni?
ChatGPT è come un amico robot che può parlarti e rispondere alle tue domande. È come avere un amico che sa molto su cose diverse e può aiutarti a imparare cose nuove.
Ormai avrai probabilmente visto dozzine di esempi, quindi cosa c’entra tutto questo con la Ricerca Google?
Agli albori della ricerca, i motori di ricerca erano costruiti per indicizzare parole e brevi frasi e non avevano la capacità di elaborare il linguaggio naturale. Se stavi cercando un nuovo laptop, avresti cercato qualcosa come “computer” o “acquistare computer”. Man mano che la ricerca diventava più sofisticata, abbiamo imparato che potevamo utilizzare query più complesse e, soprattutto con l’avvento della ricerca vocale, abbiamo sperimentato qualcosa di più vicino al linguaggio naturale. Quando Google si è adattato, è successo qualcosa di interessante: le nostre domande sono diventate domande, spingendo Google a rendersi conto che a volte non vogliamo un collegamento a una risorsa: vogliamo una risposta.
Google si è evoluto molto come “motore di risposta”, inclusa la creazione del Knowledge Graph e la visualizzazione dei risultati Web come risposte dirette note come Featured Snippet. Se, ad esempio, cerchi “Come funziona la ricerca su Google?”, potresti ricevere uno snippet in primo piano (essenzialmente una risposta attribuita) come questo:
Questo particolare esempio è un po’ goffo, ma illustra come funziona l’algoritmo. Google è alla ricerca di frammenti di documenti che potrebbero rispondere alla domanda. In questo caso, è ovvio che il passaggio estratto non è proprio una risposta completa.
Ora, considera la stessa domanda posta a GPT-3:
Come funziona la ricerca su Google?
Ricerca Google funziona eseguendo la scansione del Web e l’indicizzazione dei siti web. Quando un utente cerca qualcosa, Google esamina il suo indice e restituisce i risultati più pertinenti. Utilizza una combinazione di algoritmi e altre tecniche per determinare la pertinenza dei risultati. Questi algoritmi tengono conto di fattori quali le parole utilizzate nella query, la freschezza del contenuto, la popolarità del sito Web e la posizione dell’utente.
Posso scegliere questa risposta, ma tutto sommato è abbastanza buona ed è una risposta molto più completa di un estratto da un sito web. Il motore GPT-3 ha essenzialmente riassunto più fonti.
È facile vedere come questo potrebbe iniziare a innervosire Google.
GPT-3 (e in particolare ChatGPT) può restituire alcune risposte piuttosto umane. Mettendo da parte le questioni etiche (compresi il plagio e il pregiudizio, che tratterò brevemente più avanti), ci sono alcuni seri problemi pratici.
La “risposta” di Google ha un grande vantaggio: l’attribuzione. Possiamo facilmente andare alla pagina di origine. Questo non solo ci fornisce più informazioni, ma fornisce più contesto, inclusi dettagli sulla fonte stessa. Questi dettagli possono aiutarci a fidarci (o, in alcuni casi, a diffidare) della risposta.
Un altro problema è la velocità di Internet. ChatGPT viene addestrato su un corpus statico, un momento nel tempo. Google esegue la scansione e l’indicizzazione di Internet molto rapidamente e può restituire informazioni recenti, localizzate e persino personalizzate.
Vale la pena notare che Google ha investito ingenti somme di denaro nell’apprendimento automatico. LaMDA (Language Model for Dialogue Applications) e Google è in grado di generare testo complesso, simile a quello umano. Google è ben consapevole dei limiti e dei costi di questi modelli. Se si sono mossi lentamente nel distribuirli nella ricerca, probabilmente ci sono buone ragioni.
La più grande minaccia a breve termine per Google è che le persone e le aziende probabilmente utilizzeranno ChatGPT per sfornare montagne di contenuti di bassa qualità, costando tempo e denaro a Google e probabilmente comportando importanti aggiornamenti dell’algoritmo reattivo.
Quello che è certo per il 2024 è che la popolarità di ChatGPT e la sua accessibilità al grande pubblico causeranno un’esplosione di investimenti (nel bene e nel male) e accelereranno lo sviluppo. Sebbene Google non stia andando da nessuna parte, possiamo aspettarci che il panorama della ricerca cambierà in modi inaspettati (e occasionalmente indesiderati) nel prossimo anno.