Zanimivosti#
Nekaj zanimivosti s področja bioinformatike, Za nekatere od njih bi lahko celo rekli “Saj ni res, pa je!”.
Napaka v matriki zamenjav BLOSUM62 izboljša iskanje#
Matrika zamenjav BLOSUM62 je bila opisana v letu 1992 (članek Amino acid substitution matrices from protein blocks v PNAS avtorjev Henikoff in Henikoff), leta 2008 pa so Styczynski in sodelavci opisali napako v programu (članek BLOSUM62 miscalculations improve search performance), uporabljenem za izračun matrike, zaradi katere so matrike, ki so bile v uporabi, vsebovale vrednosti, drugačne od tistih, ki bi sicer bile izračunane po algoritmu Henikoffa. Te sicer napačno izračunane matrike so bile v uporabi kar 15 let in so se presenetljivo izkazale kot boljše od pravilno izračunanih matrik. Na novo izračunana in napačno izračunana matrika se razlikujeta v približno 15 % vrednosti, napačno izračunana matrika pa je v poravnavah dveh zaporedij po algoritmu Smith-Waterman ter pri hevrističnem iskanju oddaljenih homologov z BLAST bila nekoliko boljša od pravilno izračunane, npr. pri BLAST je bila pri napačno izračunani matriki vrednost EPQ nižja (errors-per-query, ki predstavlja delež zaznanih nehomolognih proteinov glede na vse zaznane proteine med zadetki iskanja, merilo za homologijo pa je bilo določeno glede na strukturno klasifikacijo proteinov SCOP). Problem je bil kasneje še večkrat naslovljen, na primer v članku Addressing inaccuracies in BLOSUM computation improves homology search performance v BMC Bioinformatics avtorja Hess in sodelavcev leta 2016.