COBALT#

Avtorja: Petja Premrl, Pia Mencin

Datum predstavitve: 2022-04-28


Namen vaje#

Naučiti se uporabljati programom COBALT ter presoditi za katere vhodne podatke je uporaba programa primerna.


Program#

Program: Papadopoulos JS and Agarwala R (2007) COBALT

Avtorji programa: Jason S. Papadopoulos, Richa Agarwala; National Center for Biotechnology Information (NCBI), National Institutes of Health (NIH), Department of Health and Human Services

Reference: Papadopoulos JS, Agarwala R. (2007) COBALT: constraint-based alignment tool for multiple protein sequences. Bioinformatics 23, 1073–1079. 10.1093/bioinformatics/btm076

Opis programa#

COBALT omogoča poravnavo več aminokislinskih zaporedij. Temelji na iskanju ohranjenih proteinskih domen in lokalnih podobnostmi med vhodnimi zaporedji. V prvem koraku vsakemu izmed vhodnih zaporedij ustvari profil (PSSM), ki bo služil za nadaljnjo poravnavo. Začetni profil ustvari se na podlagi primerjave vsakega vhodnega zaporedja z: motivi v zbirki CDD, parnih lokalnih poravnav vhodnih zaporedij ter omejitev, ki jih vnese uporabnik. Kasneje v fazi izpopolnjevanja se izvede še iskanje motivov po zbirki PROSITE (izvedeno s PSI-BLAST). CDD je zbirka s profili, ki izhajajo iz poravnanih družin proteinoov. RPS-BLAST išče po CDD zbirki, in poda profil, ki se ujema s podanim zaporedjem. Nato se izvede parna lokalna poravnava vhodnih zaporedij s BLAST-P. Predhodno izračunane profile COBALT nato primerja v parih, čemur sledi izračun matrike razdalj na podlagi narejenih profilov iz prejšnjega koraka. Iz omenjene matrike se z metodo združevanja sosedov (neighbour-joining) naredi vodilno drevo. Sledi progresivna poravnava več zaporedij po navodilu vodilnega drevesa in nato še izpopolnjevanje.

Program nam ne vrne vedno najboljše poravnave. Primeren je za primerjavo podobnih zaporedij približno enake dolžine. Če se naša vhodna zaporedja zelo razlikujejo lahko spremenimo določene paramentre poravnave: zmanjšamo velikost primerjalnih k-terk, kazen za odpiranje vrzeli ali povišamo E vrednost (omejitev za delovanje BLAST-P pri parni lokalni poravnavi).

Vhodni podatki#

Kot vhodne podatke lahko v program vnesemo accession code iz UniProt-a ali FASTA zaporedja proteinov.