S12#

  • Datum izdelave: 2026-05-07

  • Koda seminarja: S12

PROJEKT HELIX-9: “Ko natančnost ni dovolj.”#

Sistemi CRISPR-Cas, ki bakterijam omogočajo obrambo pred tujim genetskim materialom, so danes postali eno najpomembnejših orodij za ciljno spreminjanje DNA z izjemno natančnostjo. V središču teh sistemov je protein Cas9 iz bakterije Staphylococcus aureus, ki se zaradi svoje učinkovitosti in relativno enostavnega načrtovanja vodilne RNA uporablja od temeljnih raziskav do razvoja terapevtskih pristopov. Prav zato je bil Cas9 izbran kot osrednji element projekta HELIX-9.

Pri nekaterih tarčah je sistem deloval učinkovito, pri drugih pa je aktivnost močno upadla. Sprva so raziskovalci sumili tehnične napake ali kontaminacijo, vendar ponovitve eksperimentov teh razlag niso potrdile. Postalo je jasno, da težava ne izhaja iz eksperimentalnega protokola, temveč iz nepopolnega razumevanja delovanja sistema na molekularni ravni.

V nadaljevanju boš z uporabo podatkov iz različnih baz izvedel podrobno analizo ter poskušal razložiti opažene eksperimentalne rezultate.

a) Le s pomočjo UniProt odgovori na naslednja vprašanja.#

  1. V UniProt poišči protein Cas9 iz te bakterije in zapiši njegov accession ID.

  2. Koliko aminokislinskih ostankov sestavlja ta protein? Izpiši prvih 10 kakor si sledijo v tem proteinu.

  3. Protein Cas9 ima še eno priporočljivo ime. Poišči ga in izpiši. Kaj pa alternativno ime?

  4. S katero metodo so določili njegovo sturkturo?

  5. Eden znanih ligandov Cas9 je magnezij. Poimenuj še eno kovino, katere kation je ligand tega proteina. Kako prisotnost kovinskih ionov vpliva na katalitično aktivnost Cas9 in njegovo sposobnost cepitve DNA?

  6. Ima Cas9 tudi nukleazno funkcijo? V katerem razdelku najdeš ta podatek?

  7. Ima Cas9 tudi paraloge? Če da, katere?

b) S pomočjo PubMed analize preveri razvoj raziskav CRISPR-Cas9 sistema skozi čas. Za vsako obdobje ( 2013–2015, 2016-2018, 2019-2021, 2022-2024) določi:#

  • število article review člankov, kjer je Cas9 omenjen v naslovu

  • število article review člankov, kjer je Cas9 omenjen kjerkoli v besedilu

Na podlagi dobljenih številk za vsako obdobje določi delež Cas9 v naslovu/Cas9 kjerkoli. Na podlagi rezultatov:

  • primerjaj spremembe v deležu skozi čas

  • določi, v katerem obdobju je največji relativni porast omembe Cas9

  • razloži, zakaj je do tega porasta verjetno prišlo

c) Zanima nas tudi, kako dobre so poravnave aminokislinskega zaporedja Cas9 z drugimi proteini. Eden od takih, ki je za nas zanimiv je Cas12a.#

Proteina za analizo:

  • Cas9 (Staphylococcus aureus)

  • Cas12a (Acidaminococcus sp.)

Izvedi globalno poravnavo obeh proteinov z EMBOSS Needle. Analiziraj odstotek identičnosti sekvenc in število vrzeli. Posebej komentiraj, kaj se dogaja pri Cas9 od približno 1054 aminokislinskega ostanka dalje in zakaj pride do tega vzorca.

Nato se loti še lokalne poravnave z EMBOSS Water in ponovno analiziraj. Na podlagi rezultatov presodi:

  • katera poravnava (globalna ali lokalna) je primernejša za ta par proteinov

  • zakaj druga metoda ni optimalna za primerjavo teh proteinov

  • kako bi lahko izboljšali primerjavo (npr. izbira domen ali fragmentov)

Pojasni pomen simbolov v poravnavi:

  • :

  • .

Katerega od teh simbolov si v idealni poravnavi želimo največ? Ali je to doseženo pri Cas9 , Cas12a? Zakaj pride do takšnega vzorca poravnave glede na evolucijsko razdaljo proteinov?

d) Izvedi še poravnavo proteinov iz točke c) , vendar naj bo ta ustvarjena v EMBOSS dotmatcher. Izvedi 3 poravnave:#

  • eno pri oknu 10

  • drugo pri oknu 20

  • tretjo pri oknu 50

Je njuna podobnost stabilna po celotnem proteinu (glede na rezultate poravnav)? Zakaj tako sklepaš?

Ugotavljali smo tudi tudi vpliv substitucijske matrike. Uporabljeni sta bili EBLOSUM62 in PAM250. Rezultati so bili naslednji:

  • pri Dotmatcher analizi med Cas9 in Cas12a z uporabo matrike EBLOSUM62 opazimo predvsem manjše število krajših in bolj jasno omejenih diagonalnih segmentov. Večina grafa ostane prazna, posamezne diagonale pa predstavljajo le najbolj ohranjene regije med proteinoma

  • pri uporabi PAM250 pa se po grafu pojavi več diagonalnih segmentov in tudi več razpršenih točk oziroma krajših “pikčastih” vzorcev. Diagonale so manj izrazite, vendar jih je več, kar kaže na zaznavanje dodatnih šibkejših podobnosti med proteinoma.

Na podlagi opaženega pojasni:

  • Zakaj PAM250 zazna več podobnosti kot EBLOSUM62?

  • Zakaj je pri PAM250 prisotnega tudi več šuma oziroma naključnih ujemanj?

  • Katera matrika je primernejša za primerjavo evolucijsko oddaljenih proteinov, kot sta Cas9 in Cas12a?

e) Kako se rezultati dot plot analize ujemajo z rezultati globalne (Needle) in lokalne (Water) poravnave? Lahko potrdiš oddaljenost oziroma podobnost med proteinoma?#

f) Katere funkcionalne domene v UniProt zapisu Cas9 pojasnijo lokalne podobnosti opažene v dot plot analizi?#

g) Koliko napovedanih struktur z AlphaFold DB je na voljo za Cas9 v UniProt?#

  • Kakšna je zanesljivost napovedane 3D strukture proteina Cas9? Iz česa to razberemo?

  • Katere dele proteina Cas9 predstavljajo regije z nizkim pLDDT in kakšna je njihova funkcionalna vloga?

  • Je bila struktura tudi eksperimentano določena (npr. z XRD)?

  • Kaj pa pomeni anotacija Position 1-1053 v razdelku Structure v AlphaFold zapisu?

h) S pomočjo informacij o genu Cas9, ki pridobimo iz baze GenBank:#

*Koliko baznih parov vsebuje GenBank zapis za Cas9 iz Staphylococcus aureus?