Aminokislinska zaporedja

Aminokislinska zaporedja#

Zbirke aminokislinskih zaporedij#

Glavna zbirka aminokislinskih zaporedij je UniProt. Aminokislinska zaporedja najdemu sicer tudi v zbirki NCBI Protein, ki vsebuje del UniProta ter zaporedja iz drugih virov (Protein Research Foundation (PRF), Protein Data Bank (PDB) in prevode kodirajočih regij zaporedij v zbirki Nucleotide (RefSeq, International Sequence Database Collaboration – DDBJ / EMBL / GenBank)).

UniProt#

Zbirka UniProt(KB) je sestavljena osnovnih delov:

  • UniProtKB/SwissProt, ki vsebuje ročno pregledane zapise (označeni so z rumeno zvezdico);

  • UniProtKB/TrEMBL, ki vsebuje avtomatsko prevedena nukleotidna zaporedja, ti zapisi pa niso ročno pregledani (označeni z modrim listom).

Zaporedja iz zgoraj navedenih delov so predestilirana v skupke zaporedij v delu, imenovanem UniRef (referenčna zaporedja). Zraven tega pa v UniProt najdemo še UniMES (metagenomska zaporedja, zaporedja iz okoljskih vzorcev), ki pa so prav tako predestilirana v skupke UniMES. Osnovni tok podatkov, je predstavljen na spodnji sliki (vir: spletna stran UniProt): UniProt tok podatkov

Do zbirke UniProt dostopamo neposredno z uporabo brskalnika ali programskega dostopa, lahko pa tudi posredno prek drugih orodij, npr. pri iskanju podobnih zaporedij. Vse te načine si bomo ogledali tudi na vajah.

Dodatni viri#

Za podroben opis zbirke UniProt in prikaz uporabe priporočam tečaj na uradni strani European Bioinformatics Institute - EBI: UniProt - Exploring protein sequence and functional information. Prav tako uporaben je webinar A guide to UniProt for students.

Dodatni zanimivi viri:

Še zanimivost: UniProt ima posebno stran, kjer so zbrani podatki, povezani s COVID-19. Stran je podrobneje predstavljena v webinarju EBI.