NotebookLM: eccezionale assistente che dà voce ai tuoi documenti
NotebookLM evolve con un’interfaccia più intuitiva e nuove funzioni, tra cui gestione avanzata delle note e podcast interattivi. [Lettura 10 min]
NotebookLM (LM sta per Language Model) è uno strumento di Google basato sull’intelligenza artificiale (IA) per semplificare la gestione dei documenti e la creazione di contenuti.
Versatilità nei tipi di documenti utilizzabili: abbiamo già visto in un post precedente, che NotebookLM permette di lavorare su diverse tipologie di file.
È possibile caricare:
Documenti PDF
Pagine web
File audio
Documenti Google
Presentazioni Google
File di testo (o copiare testo direttamente)
Trascrizioni
Gestione dei contenuti: NotebookLM analizza il contenuto dei file, per facilitare il brainstorming, lo studio e la comprensione di documenti più o meno lunghi e complessi e la creazione di contenuti.
Riassumere testi complessi in modo conciso ed efficace
Generare domande pertinenti sui temi trattati per stimolare la riflessione e l’apprendimento
Rispondere a domande specifiche inserite nella chat basandosi solo sulle informazioni contenute nelle fonti caricate, minimizzando il rischio di allucinazioni
Creare diversi tipi di contenuti come FAQ, guide di studio e cronologie, per semplificare l’organizzazione e la presentazione delle informazioni.
Oltre ad analizzare le fonti caricate, NotebookLM consente di aggiungere fino a 1000 note personali all’interno di un notebook, create da noi o generate dall’IA integrata.
Privacy: un aspetto importante, soprattutto in ambito sanitario, è che i dati personali e i contenuti caricati, come garantisce Google, non verrebbero utilizzati per addestrare il modello di IA. Le informazioni dovrebbero restare private e accessibili solo all’utente e ai collaboratori con cui si sceglie di condividerle.
La versione base di NotebookLM è completamente gratuita. Una serie di aggiornamenti recenti hanno introdotto diverse novità che lo rendono ancora più potente e versatile.
L’integrazione con Gemini 2.0, l’IA più avanzata di Google, consente un’analisi più profonda e interazioni più ricche con diversi formati di file, inclusi testo, video, immagini e audio.
L’interfaccia utente è stata ridisegnata per essere più intuitiva e user-friendly.
È ora possibile caricare direttamente i link dei video di YouTube come fonti.
La nuova funzione di generazione di podcast interattivi consente di dialogare con l’IA in tempo reale sul contenuto dei propri documenti (per ora solo in inglese).
È previsto un piano Plus a pagamento con funzionalità avanzate.
Novità principali
Integrazione con Gemini 2.0
Gemini 2.0 è il modello di IA più sofisticato di Google, capace di elaborare informazioni da diverse fonti, tra cui testo, video, immagini e audio. Questa capacità multimodale in NotebookLM consente un’analisi più completa e approfondita dei documenti caricati dall’utente.
Invece di limitarsi al testo, Gemini 2.0 permette a NotebookLM di estrarre informazioni anche da video, immagini e audio. Caricando un video di YouTube, NotebookLM non solo ne produce e analizza la trascrizione, ma tiene conto anche di immagini e audio per fornire una comprensione più completa del messaggio testuale del video.
La comprensione multimodale di Gemini 2.0 rende le interazioni più naturali, permette di porre domande che fanno riferimento a specifici istanti di un video e migliora la capacità di cogliere il contesto generale di documenti anche se le informazioni sono presentate in formati diversi.
Nuova interfaccia
La nuova interfaccia utente di NotebookLM è più intuitiva e semplice da utilizzare.
La schermata principale è suddivisa in tre sezioni principali.
A sinistra, si trova l’area dedicata alle fonti, che NotebookLM chiama ancora Origini, ma che in altri punti vengono chiamate Fonti (traduzioni un po’ maldestre di “Sources”).
Le fonti caricate vengono visualizzate in un elenco, ed è possibile selezionare solo quelle su cui si desidera lavorare in quel momento.
Facendo click su “+ Aggiungi fonte” si possono caricare altri documenti che si desidera analizzare, scegliendo tra i numerosi formati accettati.
Nella versione gratuita si possono avere fino a 100 notebook.
Ogni notebook può contenere fino a 50 fonti. Ogni fonte può contenere fino a 500.000 parole.
Per i video caricati direttamente il limite di dimensione è 200 MB.
Una volta caricate le fonti che ci interessano, possiamo decidere quali devono essere utilizzate da NotebookLM spuntandole o meno sulla destra. Di default le fonti caricate sono spuntate e utilizzate dall’IA, ma durante l’analisi dei documenti potremmo trovare utile lavorare solo su una o alcune delle nostre fonti.
Con un ingrandimento della pagina al 100% le 3 aree del notebook si visualizzano una per una. Con ingrandimenti inferiori, si possono visualizzare come 3 colonne.
Al centro, si trova la Chat, dove è possibile interagire con l’IA di NotebookLM. Tutti gli utenti hanno a disposizione un massimo di 50 domande in chat e 3 generazioni di audio al giorno.
Automaticamente, sotto al titolo viene generato un riassunto delle fonti caricate.
I pulsanti Aggiungi nota, Riassunto audio, Documento di briefing mandano direttamente nella sezione Studio.
Nella casella di prompt a fondo pagina si possono porre domande, chiedere riassunti di fonti specifiche o generare idee. L’interazione avviene tramite prompt o istruzioni come in un qualsiasi chatbot di basato sull’IA.
Alla base della casella di digitazione si trovano pulsanti con prompt già preimpostati che si possono eseguire semplicemente facendo click.
Ogni risposta dell’IA, al fondo ha il pulsante “Salva nella nota” che serve per memorizzare quella risposta in una nota che troveremo nella sezione Studio.
A destra, si trova l’area dedicata alle note che ora è definita Studio.
Qui vengono visualizzate le note, sia quelle create da noi sia quelle prodotte dall’IA (riassunti, domande frequenti, cronologie, glossari e guide di studio). Le note create da noi possono essere integrate, modificate e formattate, mentre quelle create automaticamente sono di sola lettura.
Le note si possono aggiungere facendo click su “+ Aggiungi nota” o sui pulsanti predefiniti:
Guida allo studio crea una nota strutturata con concetti chiave, quiz, analisi delle risposte, domande di approfondimento e glossario per facilitare lo studio del materiale.
Domande frequenti genera una lista di domande e risposte basate sulle fonti caricate, utile per la revisione e l'autovalutazione.
Documento di briefing riassume i punti chiave, le criticità e le differenze tra le fonti, pensato per la condivisione di informazioni in ambito lavorativo.
Sequenza temporale estrae le date e gli eventi più importanti dalle fonti, creando una cronologia utile per comprendere lo sviluppo di un argomento che si svolge in un periodo di tempo definito.
Link ai video
Un’altra novità è la possibilità di caricare direttamente i link dei video di YouTube come fonti. Questa funzione permette di attingere a una vastissima libreria di informazioni video.
Quando si inserisce un link di YouTube, NotebookLM recupera automaticamente la trascrizione del video, che si può visualizzare o copiare facendo click sul nome del video nella sezione Origini.
La possibilità di avere video e trascrizione in un unico punto è importante, in quanto facilita diversi aspetti del lavoro:
Brainstorming: avere il video a portata di mano durante il brainstorming consente di cogliere sfumature e dettagli che potrebbero sfuggire dalla sola lettura della trascrizione.
Verifica delle informazioni: è possibile verificare facilmente l’accuratezza delle informazioni presenti nella trascrizione, riducendo il rischio di allucinazioni, malintesi o errori.
Ricerca mirata: si possono utilizzare le funzionalità di ricerca di NotebookLM per trovare informazioni specifiche all’interno del video, saltando direttamente ai punti che ci interessano.
Creazione di contenuti: la trascrizione del video può essere utilizzata come base per la creazione di nuovi contenuti, come post per i social media, articoli o presentazioni.
Creazione di podcast interattivi
NotebookLM aveva già introdotto una funzione che trasforma i documenti caricati in podcast. Nella versione precedente, era possibile ascoltare una sintesi audio delle informazioni chiave presenti nelle fonti sotto forma di podcast in inglese.
Si tratta di un effetto estremamente realistico: due persone, un uomo e una donna, discutono dell’argomento dei documenti caricati offrendo una panoramica dei temi molto utile e divertente da ascoltare.
La vecchia funzione podcast non era interattiva, si poteva solo ascoltare la narrazione generata dall’IA. L’introduzione della modalità interattiva rende il podcast uno strumento di apprendimento molto più dinamico e personalizzabile.
Anche questa funzione al momento è disponibile solo in inglese: è possibile inserirsi nel podcast e i due personaggi, anche in questo caso in modo sorprendentemente naturale, ci accolgono nella discussione, rispondono alle nostre domande o commentano i nostri interventi.
Piano Plus
Google sta per introdurre un piano a pagamento per NotebookLM, chiamato Plus, che offrirà una serie di funzionalità avanzate, quali:
Aumento delle fonti caricabili su ciascun notebook: con un massimo di 500 notebook e 300 fonti per notebook. Anche il limite di domande aumenta: puoi porre fino a 500 domande sulla chat e usufruire di 20 generazioni di audio al giorno.
Personalizzazione dello stile e della lunghezza delle risposte: gli utenti potranno definire lo stile di scrittura dell’IA, scegliendo tra diverse opzioni come formale, informale, tecnico, creativo, ecc.
Controllo del formato di output: il piano Plus offrirà maggiore flessibilità nella scelta del formato di output per le informazioni elaborate da NotebookLM: elenchi puntati, tabelle, mappe concettuali o altri formati specifici.
Istruzioni personalizzate: possibilità di fornire istruzioni personalizzate a NotebookLM all’interno di specifici notebook. Ad esempio, si potrà chiedere all’IA di assumere il ruolo di un esperto in un determinato campo o di adottare un tono di voce specifico durante l’interazione con l’utente.
Analisi del notebook: i notebook saranno condivisibili con altre persone, e si potrà visualizzare i dati su quanti utenti al giorno hanno effettuato l'accesso e quante domande al giorno hanno posto nell'ultima settimana.
Facciamo una prova
Immaginiamo di dover valutare rapidamente della documentazione sull’uso degli antidepressivi SSRI in gravidanza.
Disponiamo della seguente documentazione, che importiamo nelle fonti di un notebook (la sezione Origini):
Safety of Selective Serotonin Reuptake Inhibitors in Pregnancy: A Review of Current Evidence (file PDF)
Selective Serotonin Reuptake Inhibitors (SSRIs) in Pregnancy: An Updated Review on Risks to Mother, Fetus, and Child (link all’articolo online)
Specific SSRIs and birth defects: interpreting new data in the context of previous reports (link al video su YouTube)
Antenatal use of antidepressants and the potential risk of teratogenicity and adverse pregnancy outcomes: Selective serotonin reuptake inhibitors (testo copiato e incollato da UpToDate)
Et si elle était ou devenait enceinte ? Choisir un antidépresseur en tenant compte de l'éventualité d'une grossesse et des risques pour l'enfant à naître (La Revue Prescrire 2024:44(489):522-523) (file PDF)
Antidépresseurs IRS et grossesse : troubles neuropsychiques à long terme ? (La Revue Prescrire 2020:40(444):747-749 (file PDF)
Entrando nella Chat è possibile interrogare direttamente l’IA con domande specifiche sull’argomento, adattandole alle esigenze cliniche, educative o pratiche.
Alcune domande sono già preconfezionate in pulsanti sotto la casella del prompt.
Anche se le fonti sono in inglese e francese, l’interazione con l’IA può avvenire in italiano.
Portando il puntatore (senza fare click) sui numeri dei riferimenti, si apre una finestra che contiene la parte di testo da cui è stata tratta l’informazione, per verificarla direttamente.
Le richieste all’IA possono essere molto specifiche e puntuali, per esempio:
- Crea una tabella che confronti gli SSRI in termini di sicurezza per la madre e il nascituro. Le colonne della tabella devono essere: SSRI (principio attivo), Rischi per la madre, Rischi per il feto, Raccomandazioni.
- L'effetto sul nascituro dipende anche dalla dose del farmaco?
- Quale antidepressivo citato nelle fonti pare essere il più sicuro in gravidanza?
- Ci sono argomenti o domande sulla sicurezza degli SSRI in gravidanza non trattati nelle fonti caricate?
- Confronta le raccomandazioni degli articoli in francese con quelle in inglese.
- Scrivi una email per una paziente in gravidanza che descriva i rischi e benefici dell’uso di SSRI con un linguaggio comprensibile.
Nella sezione Studio il Documento di briefing, creato automaticamente facendo click sul relativo pulsante, è un riassunto delle informazioni delle diverse fonti.
Riassunto audio - È il podcast creato dall’IA utilizzando il materiale delle nostre fonti.
Facendo click sul pulsante Personalizza possiamo inserire delle istruzioni che definiscano il tipo di riassunto prodotto dall’IA. Per esempio:
Concentrati su una fonte specifica
Concentrati su un argomento specifico
Scegli un pubblico specifico
Ho personalizzato il nostro podcast con queste istruzioni:
Concentrati sugli articoli della rivista Prescrire e sui principi attivi che non bisognerebbe prescrivere in gravidanza. Rivolgiti a un pubblico di medici di medicina generale.
NotebookLM ha impiegato 6 minuti per creare un podcast di 15 minuti che si può ascoltare qui. Il risultato lascia francamente allibiti!
Un trucchetto che si può usare per superare il limite del podcast solo in inglese, è quello di specificare, nelle istruzioni personalizzate, “Crea il podcast in italiano”.
Il risultato è discreto, anche se non buono come quello in inglese. Lo potete ascoltare qui: il podcast creato ha molte voci, alcune con inflessione inglese e contiene imprecisioni dovute alla traduzione. Per esempio l’IA non capisce che la sigla francese IRS deve essere tradotta SSRI, usata anche in italiano. Nella versione inglese non si era fatta ingannare e aveva tradotto correttamente IRS con SSRI e IRSN con SNRI.
Se usiamo la funzione interattiva e ci inseriamo nel podcast, i partecipanti ci risponderanno di nuovo in inglese, anche se facciamo le nostre domande in italiano.
Domande frequenti - È un’altra funzione utile nella sezione Studio per generare rapidamente un documento che, per esempio, si può mandare a una paziente incinta che ha chiesto informazioni su questo argomento.
Per finire
NotebookLM, ancora in una versione non definitiva, è già uno strumento molto potente per chiunque lavori con documenti e contenuti informativi.
Come abbiamo visto può analizzare fonti in diverse lingue e formati, combinarle in modo intelligente e generare sintesi interattive; permette applicazioni molto interessanti in ambito professionale, accademico e di ricerca.
Alcune funzionalità avanzate, come i podcast interattivi in lingue diverse dall'inglese, sono ancora in fase di sviluppo, ma le sue potenzialità sono già evidenti nella versione gratuita.
L'integrazione con Gemini 2.0 e l'interfaccia intuitiva rendono NotebookLM uno strumento accessibile anche per chi si avvicina per la prima volta all'uso dell'intelligenza artificiale per l'analisi documentale.