-
Bioloģiskās informācijas meklēšana datu bāzēs un analīzes pamatmetodes
Konspekts6 Anatomija, veselība, medicīna, higiēna, Bioloģija
TEORIJA
Viens no svarīgākajiem bioinformātikas uzdevumiem ir DNS un proteīnu sekvenču meklēšana un analīze publiski pieejamās datu bāzēs. Pētījumu rezultātā noteiktās DNS un proteīnu sekvences tiek ievietotas starptautiskās publiski pieejamās datu bāzēs. Pētniekiem visā pasaulē ir pieejamas datubāzes, kas dod iespēju salīdzināt savu pētījumu rezultātus ar datu bāzēs atrodamo. Bioloģiskās informācijas apjoms ir ļoti liels un, lai datubāzēs atrastu interesējošo informāciju, nepieciešamas efektīvas meklēšanas sistēmas. Ir divi galvenie informācijas meklēšanas veidi: 1) teksta meklēšana izmantojot atslēgas vārdus vai konkrētus datubāzes ierakstu numurus (Accession Number, Gene Identificator u.c.); 2) homoloģijas meklēšana salīdzinot jūs interesējošo DNS vai proteīna aminoskābju sekvenci ar visu datubāzi. Viens no populārākajiem homoloģijas meklēšanas rīkiem ir BLAST, kas ļauj meklēt līdzību starp DNS – DNS (BLASTN, TBLASTX), proteīnu – proteīnu (BLASTP), DNS – proteīnu (BLASTX) un proteīnu – DNS (TBLASTN) secībām. Homoloģijas meklēšanas pamatā ir pieņēmums, ka sekvencēm ir līdzīga izcelsme, t.i., ka novērotā līdzība starp sekvencēm norāda uz to izcelsmi no kopīga senča evolūcijas procesā. Filoģenētiskā analīze (phylogeny) ir sugas (vai citas taksonomiskas vienības) evolucionārā vēsture. Filoģenētiskās analīzes pamatā ir ideja, ka visi dzīvie organismi ir cēlušies no kopīga senča. Evolucionārās attiecības starp taksonomiskajām vienībām parasti tiek attēlotas filoģenētiskā koka (dendrogrammas) veidā. Filoģenētiskie koki var tikt konstruēti gan atsevišķiem gēniem, gan veseliem genomiem.
…
DARBA UZDEVUMI 1. Veikt NCBI PopSet datubāzē atrodamo DNS sekvenču, kas saistītas ar publikāciju Volodko et al. (2008) Mitochondrial genome diversity in arctic Siberians, with particular reference to the evolutionary history of Beringia and Pleistocenic peopling of the Americas. Am J Hum Genet, 82:1084-1100, daudzkārtējo salīdzinājumu un filoģenētisko analīzi. 2. Veikt E-studijās dotās citohroma C oksidāzes 1. subvienības gēna kodēto daļējo aminoskābju sekvenču filoģenētisko analīzi ar programmu MEGA.