Modeli#
Modele struktur si lahko z uporabo različnih orodij kot so AlphaFold, RoseTTAFold, MODELLER ipd. izračunamo sami, enostavneje in včasih popolnoma primerno pa je uporabiti avtomatsko zgenerirane modele, ki so deponirani v eno izmed zbirk. Če želimo pripraviti model skrajšane oblike proteina, uvesti mutacije ipd. je seveda edino smiselno da model izračunamo sami.
AlphaFold Protein Structure Database#
Ena izmed najpogosteje uporabljanih zbirk modelov proteinskih struktur je AlphaFold Protein Structure Database, za katero skrbi European Bioinformatics Institute (EBI) pod okriljem European Molecular Biology Laboratory (EMBL). Modeli za zaporedja v zbirki UniProt zgenerirani avtomatsko, po zbirki pa lahko iščemo z imenom proteina ali gena, kodo za dostop do zapisa v UniProt, imenom organizma, lahko pa tudi z aminokislinskim zaporedjem (v tem primeru dobimo kot zadetke iskanja modele struktur z identičnim ali podobnim aminokislinskim zaporedjem). Za nekatere t.i. referenčne proteome, torej nabore proteinov iz določenega organizma, so zgenerirani modeli za vse te proteine.
Modele si lahko ogledamo neposredno na spletni strani zbirke in sicer preko integriranega orodja MolStar, koordinate atomov v formatih PDB in mmCIF pa si lahko prenesemo za analizo v drugih lokalno nainstaliranih programih. Modeli so privzeto pobarvani glede na zanesljivost (vrednost pLDDT, predicted local distance difference test, razpon 0–100), komplementaren podatek pa je diagram z vrednostmi PAE (Predicted aligned error), ki nam pove oceno napake v razalji med dvema aminokislinskima ostankoma (razpon 0–35 Å; manjša je, bolje je). Del območja v diagramu PAE lahko označimo, avtomatsko se označi ekvivalenten del modela strukture. Več o tem bomo povedali pri predmetu Biokemijska informatika.
Spodaj je prikazan primer zapisa, kjer je polipeptidna veriga pobarvana glede na pLDDT (visoke vrednosti so povezane z višjo zanesljivostjo tistega dela modela strukture).
Pri EMBL-EBI so pripravili tudi videoposnetek spletnega seminarja na temo dostopa do AlphaFold modelov (od objave posnetka se je spletna stran ybirke sicer malce spremenila):
ModelArchive#
ModelArchive vzdržuje Swiss Institute of Bioinformatics (SIB). Primarni namen je bil omogočiti denponiranje in javni dostop do modelov struktur, ki niso bili določeni primarno z eksperimentalnimi pristopi (X-žarkovna kristalografija, NMR spektroskopija, krio-EM ipd.). Namreč, zaradi leta 2006 vspostavljenih smernic modeli struktur, primarno izračunani brez eksperimentalnih podatkov, niso smeli biti deponirani v PDB [Berman et al., 2006]. Tako je še sedaj, so pa sedaj v PDB povezave na te modele.
Modeli v zbirki PDB#
Pri opisu vsebine zbirke RCSB PDB je že bilo omenjeno, da ta zbirka vsebuje povezave na modele, izračunane/zgenerirane s pomočjo AlphaFold in drugih orodij. Pri RCSB so pripravili 30 min dolg posnetek, ki zelo nazorno prikaže možnosti, ki nam jih tak dostop ponuja: