Aminokislinska zaporedja#
Zbirke aminokislinskih zaporedij#
Glavna zbirka aminokislinskih zaporedij je UniProt. Aminokislinska zaporedja najdemu sicer tudi v zbirki NCBI Protein, ki vsebuje del UniProta ter zaporedja iz drugih virov (Protein Research Foundation (PRF), Protein Data Bank (PDB) in prevode kodirajočih regij zaporedij v zbirki Nucleotide (RefSeq, International Sequence Database Collaboration – DDBJ / EMBL / GenBank)).
UniProt#
Zbirka UniProt(KB) je sestavljena osnovnih delov:
UniProtKB/SwissProt, ki vsebuje ročno pregledane zapise (označeni so z rumeno zvezdico);
UniProtKB/TrEMBL, ki vsebuje avtomatsko prevedena nukleotidna zaporedja, ti zapisi pa niso ročno pregledani (označeni z modrim listom).
Zaporedja iz zgoraj navedenih delov so predestilirana v skupke zaporedij v delu, imenovanem UniRef (referenčna zaporedja). Zraven tega pa v UniProt najdemo še UniMES (metagenomska zaporedja, zaporedja iz okoljskih vzorcev), ki pa so prav tako predestilirana v skupke UniMES. Osnovni tok podatkov, je predstavljen na spodnji sliki (vir: spletna stran UniProt):
Do zbirke UniProt dostopamo neposredno z uporabo brskalnika ali programskega dostopa, lahko pa tudi posredno prek drugih orodij, npr. pri iskanju podobnih zaporedij. Vse te načine si bomo ogledali tudi na vajah.
Dodatni viri#
Za podroben opis zbirke UniProt in prikaz uporabe priporočam tečaj na uradni strani European Bioinformatics Institute - EBI: UniProt - Exploring protein sequence and functional information. Prav tako uporaben je webinar A guide to UniProt for students.
Dodatni zanimivi viri:
kanal Uniprot na YouTube:
uvod v UniProtKB - UniProtKB Intro
razlaga zapisa v UniProtKB - UniProt Entry View intro
uvod v UniRef - UniRef Intro
pregledovalnik značilnosti zapisa - UniProt Feature Viewer
avtomatske anotacije v UniProt (webinar na EBI)
informacije o funkciji proteinov v UniProtu (webinar EBI)
Še zanimivost: UniProt ima posebno stran, kjer so zbrani podatki, povezani s COVID-19. Stran je podrobneje predstavljena v webinarju EBI.