News

Tutte le proteine conosciute sono da oggi disponibili in un database gratuito.

Nato dall’intelligenza artificiale.

Bosone di Higgs

Da oggi determinare la struttura tridimensionale della quasi totalità delle proteine conosciute sarà semplice quanto una ricerca con Google Search. AlphaFold – un rivoluzionario network predittivo basato sull’intelligenza artificiale (AI) – ha determinato la struttura di oltre 200 milioni di proteine appartenenti a circa un milione di specie viventi, praticamente quasi tutte le strutture proteiche conosciute del pianeta.

Sviluppato da DeepMind – una AI company con sede a Londra posseduta da Google – usando la tecnica definita “deep learning”, AlphaFold è stato lanciato un anno fa con oltre 350.000 strutture predittive comprendenti praticamente tutte le proteine umane, murine e di altri diciannove organismi già ampiamente conosciuti e studiati.

I dati sono oggi disponibili gratuitamente in un database di DeepMind e dello European Molecular Biology Laboratory’s European Bioinformatics Institute (EMBL–EBI), un’organizzazione intergovernativa con sede a Cambridge, Gran Bretagna.

La forma tridimensionale di una proteina, ovvero la sua struttura, è ciò che ne determina la funzione biologica. Molti farmaci sono “disegnati” usando informazioni strutturali e la creazione di mappe che riproducono accuratamente la disposizione degli amminoacidi è spesso il primo passo per scoprire come le proteine funzionino. Solitamente gli scienziati, per poter risolvere (cioè individuare la struttura) una proteina devono dedicarsi ad esperimenti lunghi e molto costosi, quali la cristallografia a raggi X e la microscopia caio-elettronica.

Il network produce strutture predittive altamente accurate e allo stesso tempo informazioni sull’accuratezza delle previsioni, così che i ricercatori possano conoscere il grado di affidabilità di una struttura proteica predetta da AlphaFold.
Secondo EMBL–EBI, circa il 35% degli oltre 214 milioni di strutture predittive del network è classificato come “altamente accurato”, il che significa che queste strutture sono valide quanto le strutture proteiche determinate sperimentalmente. Il 45% sono invece strutture predittive  considerate accurate sufficientemente per molte applicazioni. Strutture scarsamente predittive sono comunque possibili , ma sono causate da disordini interni alla proteina stessa, quando non ha una struttura definita.

AlphaFold avrà bisogno di aggiornamenti costanti nel tempo, mano a mano che nuovi organismi sono scoperti o studiati o che strutture già presenti nel database forniranno nuove informazioni. Demis Hassabis, fondatore e CEO di DeepMind, prevede che il database sarà aggiornato almeno con cadenza annuale.

Leggi l’articolo su Nature qui.

Nella fotografia: la struttura della vitellogenina (un precursore del sacco vitellino dell’uovo) predetta da AlphaFold. Credit: DeepMind.

Contattaci

info@qualunquemente.science

Dipartimento di Scienze della Salute – Università del Piemonte Orientale
Via Solaroli, 17 – 28100, Novara

Contattaci

info@qualunquemente.science

Dipartimento di Scienze della Salute – Università del Piemonte Orientale
Via Solaroli, 17 – 28100, Novara