Originea SARS-CoV-2 – cum să identifici de acasă

Originea SARS-CoV-2 – cum să identifici de acasă

De unde își are originea virusul SARS-CoV-2? Specialiștii afirmă că provine de la lilieci, dar cum au ajuns ei la această deducție? Bioinformaticienii utilizează instrumente precum BLAST, însă în acest articol vă vom demonstra cum puteți analiza și voi, din confortul casei, genomul noului coronavirus dintr-o perspectivă științifică. Vom aplica metode științifice pentru a determina originea virusului SARS-CoV-2 prin compararea genomului său cu cel al altor coronavirusuri identificate în diverse specii de animale, cum ar fi rațele, bovinele, găinile și liliecii.

Sursa datelor
Secvența genomului SARS-CoV-2 este disponibilă publicului pe site-ul Bibliotecii Naționale de Medicină din SUA: [https://www.ncbi.nlm.nih.gov/labs/virus](https://www.ncbi.nlm.nih.gov/labs/virus). Observați cele două linkuri care conduc către două categorii de secvențe de genom viral: nucleotide și proteine. Aici, ne vom concentra în mod special pe secvențele de nucleotide ale 4 specii de animale, anume găini, lilieci, bovine și rațe, și le vom compara cu secvențele de genom viral prelevate de la persoanele infectate cu SARS-CoV-2.

Obținerea datelor
Pentru a începe cu nucleotidele, accesați acest link: [https://www.ncbi.nlm.nih.gov/labs/virus/vssi/#/virus?SeqType_s=Nucleotide&VirusLineage_ss=Severe%20acute%20respiratory%20syndrome%20coronavirus%202,%20taxid:2697049](https://www.ncbi.nlm.nih.gov). Observați că „Severe acute respiratory syndrome” este deja selectat în filtrul din partea stângă, sub secțiunea „virusuri”. Apoi, veți observa două opțiuni de secvențe: „GenBank” și „RefSeq”. Vom opta pentru „GenBank”, iar din secțiunea „Nucleotide Completeness” vom selecta „complete” și vom apăsa pe butonul „Download”. Desigur, puteți filtra rezultatele pe baza diverselor criterii, cum ar fi regiunea geografică, gazda, data descoperirii, dar pentru acest experiment nu sunt necesare.

Odată ce apăsăm pe butonul „Download”, va apărea o fereastră unde putem alege tipul de date, formatul de export etc. Vom selecta „Nucleotide”, apoi „Download all records”, iar în pasul 3, „Use default”. După ce ați descărcat datele, puteți deschide fișierul în formatul „fasta” cu un editor de text precum Notepad, Notepad++ sau orice editor de text preferați. Fișierul va avea un aspect similar cu imaginea alăturată. Puteți observa că prima linie începe cu caracterul „>”, care indică descrierea virusului. La momentul redactării acestui articol, există 3117 genomuri complete de virusuri (fișierul are aproximativ 92 MB).

Dacă doriți să săriți peste restul articolului, puteți încărca fișierul [aici](https://blast.ncbi.nlm.nih.gov/Blast.cgi) și veți vedea secvențe similare, dar trebuie să reduceți dimensiunea (încărcând doar o parte din fișier), deoarece serverul are o limită de dimensiune. Totuși, făcând acest lucru, veți pierde o parte din distractie. Puteți analiza chiar voi genomurile virusurilor și să determinați sursa acestuia.

Acum, să descărcăm secvențele de nucleotide ale coronavirusurilor identificate în alte specii de animale (rațe, găini, bovine și lilieci). Pentru aceasta, va trebui să eliminăm opțiunea din filtru numită „Severe acute respiratory syndrome coronavirus 2” și să alegem „Coronaviridae”. Acesta este numele științific pentru toate coronavirusurile care circulă printre toate speciile. Apoi, din secțiunea „Host”, care înseamnă „gazdă”, alegem „Gallus gallus” (găina) și apăsăm butonul Download. Repetăm acești pași pentru celelalte 3 specii: bovine