NetNGlyc - N-glikozilacija človeških proteinov#

Avtorja: Teja Spruk, Urša Štefan

Datum predstavitve: 2022-04-20


Namen vaje#

Ugotavljanje N-glikozilacije proteinov velja za enega izmed zahtevnejših in dolgotrajnejših eksperimentalnih postopkov, zato programi za napoved N-glikozilacijskih mest močno olajšajo delo biokemikov in molekularnih biologov. Naučili se bomo uporabljati program NetNGlyc, ki na podlagi anotiranih človeških proteinov iz UniProt-a z določeno stopnjo verjetnosti napove mesta N-glikozilacije podanih aminokislinskih zaporedij.


Program#

Program: NetNGlyc - 1.0

Avtorji programa: Gupta R, Brunak S. - DTU Health Tech

Reference:

  • Gupta R, Brunak S. (2002) Prediction of glycosylation across the human proteome and the correlation to protein function. Pacific Symposium on Biocomputing 2002:310-22. PMID: 11928486.

Opis programa#

Glikozilacija vpliva na fizikalne in kemijske lastnosti proteinov, in sicer na njihovo proteolitično odpornost, topnost, stabilnost, lokalno strukturo, življenjsko dobo in imunogenost. Poznamo dve vrsti glikozilacije: N- in O-glikozilacijo.

Program NetNGlyc napoveduje mesta N-glikozilacije. To je kotranslacijski proces, ki se začenja v endoplazmatskem retikulumu in ima vpliv na zvijanje proteinov. Pri tem se na asparaginski ostanek veže oligosaharid GlcNac2Man9Glc3.

Pogoj za N-glikozilacijo je, da je asparagin, na katerega se vežejo ogljikovi hidrati, del sekvona Asn-Xaa-Ser/Thr. Prisotnost takega zaporedja pa ni nujno dovolj, da je dotični asparagin modificiran.

Program preverja, če ima vnešeni protein ustrezno signalno zaporedje, ker N-glikozilacija poteka le na membranskih oziroma sekrecijskih proteinih. Prav tako upošteva dejstvo, da je N-glikozilacija najpogostejša bližje N-koncu proteina, in sicer 12-14 aminokislinskih ostankov stran. Bližje kot smo C-koncu, manjša je verjetnost glikozilacije - 60 aminokislinskih ostankov stran pa glikozilacija skorajda ne obstaja.

Program obdela vhodne podatke z uporabo devetih različnih nevronskih mrež. Nevronska mreža predstavlja skupek algoritmov, ki je bil osnovan na podobnosti s človeškimi možgani, in je namenjen predvsem prepoznavi vzorcev. Da nevronska mreža deluje, jo je sprva potrebno na zadostnem številu primerov naučiti, kakšni so pričakovani rezultati ob danih znanih vhodnih podatkih. Naučeno pa nato uporabi za analizo neznanih vhodnih podatkov.

Vhodni podatki in rezultati#

Kot vhodne podatke v program vnesemo accession code iz UniProt-a ali FASTA zaporedje proteina. Program je namenjen uporabi na človeških proteinih.