#S1-06

- **Datum izdelave**: 2026/05/07
- **Koda seminarja**: (S1-06)

## Ne dajajte aspirina vevericam in belim kitom

Pri raziskavi proteoma navadne veverice iz Tivolija smo uspešno sekvencirali naslednje aminokislinsko zaporedje, ki ustreza enemu pomembnemu motoričnemu proteinu:

```
MDHAEENEILAATQRYYVERPIFSHPVLQERLHTKDKVSDSIGDKLKQAFTCTPKKIRNI
IYMFLPITKWLPAYKFKEYVLGDLVSGISTGVLQLPQGLAFAMLAAVPPVFGLYSSFYPV
IMYCFLGTSRHISIGPFAVISLMIGGVAVRLVPDDIVIPGGVNATNGTEARDALRVKVAM
SVTLLSGIIQFCLGVCRFGFVAIYLTEPLVRGFTTAAAVHVFTSMLKYLFGVKTKRYSGI
FSVVYSTVAVLQNVKNLNVCSLGVGLMVFGLLLGGKEFNERFKEKLPAPIPLEFFAVVMG
TGISAGFNLKESYNVDVVGTLPLxxxxxANPDTSLFHLVYVDAIAIAIVGFSVTISMAKT
LANKHGYQVDGNQELIALGLCNSIGSLFQTFSISCSLSRSLVQEGTGGKTQLAGCLASLM
ILLVILATGFLFESLPQAVLSAIVIVNLKGMFMQFSDLPFFWRTSKIELTIWLTTFVSSL
FLGLDYGLITAVIIALLTVIYRTQSPSYKVLGQLPDTDVYIDIDAYEEVKEIPGIKIFQI
NAPIYYANSDLYSNALKRKTGVNPAVIMGARRKAMRKYAKEVGNANVANATVIKADAEVD
GEDGTKPEEENDEIKYPPIVTRNTFPEELQRFMPPGNNVHTIILDFTQVNFIDSVGVKTL
AGIVKEYGDVGIYVYLAGCSAQVVNDFTQNRFFENPALKELLFYSIHDAVLGSQVREALA
EQEASVPPPQEDLEPNATPTTPEA

```
S črko 'x' pa so označeni tisti aminokislinski ostanki ki niso bili natančno določeni, poznamo pa naslednje verjetnosti in emisijske signale:

**izmerjena emisijska koda: E1, E2, E3, E1, E2**

| ak ostanek             | verjetnost | 
| :---------------- | :------: |
| L       |   0,2   | 
| P      |   0,1   | 
| G    |  0,7   |

Tabela 1: Iniciacijska verjetnost

| ak ostanek          | E1| E2 | E3 | 
| :---------------- | :------: |:------: |:------: |
| L       |   0  |  0,3 |  0,7 | 
| P      |   0,2   |  0,7 |  0,1 | 
| G    |  0,8 | 0 |  0,2 | 

Tabela 2: Emisijska verjetnost


|         | L| P | G | 
| :---------------- | :------: |:------: |:------: |
| L       |   0 ,4 |  0,6 |  0 | 
| P      |   0  |  0,8 |  0,2 | 
| G    |  0,6 | 0,2 |  0,2 |  

Tabela 3: Verjetnost prehodov

> podatki v tabelah so izmišljeni le za namen te naloge.

* Z uporabo znanih podatkov s pomočjo Viterbijevega algoritma določi najverjetnejše skrito zaporedje.

Poišči homolog tega proteina pri belem kitu (*Delphinapterus leucas*). Naprej v nalogi uporabi tisti zapis, ki pri blastp ima največji total score. 

* Kateri je to protein?

* Katera STOP kodona sta prisotna v mRNA zaporedju za izoforma X1 in X2 tega proteina?

V ustezni neredundantni podatkovni zbirki poišči lastnosti tega proteina ter njegovega človeškega homologa in odgovori na naslednja vprašanja.

* Kakšna je funkcija tega proteina v celici? 

* Katera je kratica najbolj pogoste bolezni povezane s tem proteinom pri človeku?

* Zakaj je ta protein precej pomemben pri kitu? 

* Koliko transmembranskih vijačnic vsebuje?

* Kaj pomeni anotacija *Compositional bias* v oddelku *Family and Domains*?

Ta protein še ni dobro anotiran za belega kita. S pomočjo poravnav z dobro anotiranimi zaporedji ugotovi kateri aminokislinski ostanek ima vlogo vezavnega mesta. 

* Zapiši njegovo enočrkovno kodo in vrstno številko v zaporedju belega kita.

S pomočjo filogenetskega drevesa tega proteina s sedmimi Swiss-Prot recenziranimi homologi iz UniProta, ugotovi kateri je evolucijski najbolj podoben naši veverici. Poišči strukturo tega proteina določeno v kompleksu s salicilatom. 

* V kakšnem ekspresijskem sistemu in s kakšno metodo je bila določena?

* Poišči v izhodiščnem članku iz strukturne biologije kako aspirin vpliva na ta protein.