Nowy program komputerowy może odczytać dowolną sekwencję genomu i ją zdekodować

Jekaterina „Kate” Shulgina była studentką pierwszego roku w Wyższej Szkole Sztuki i Nauki i szukała krótkiego projektu z biologii obliczeniowej, aby sprawdzić wymagania swojego programu z biologii systemów. Zastanawiała się, jak kod genetyczny, kiedyś uważany za uniwersalny, może ewoluować i zmieniać się.

To było w 2016 roku, a dziś Shulgina pojawiła się na drugim końcu tego krótkoterminowego projektu, aby rozszyfrować tę genetyczną zagadkę. Opisuje to w nowym artykule naukowym w czasopiśmie e-życie Z biologiem z Harvardu Seanem Eddym.

Raport szczegółowo opisuje nowy program komputerowy, który potrafi odczytać sekwencję genomu organizmu, a następnie określić jego kod genetyczny. Program o nazwie Codetta może pomóc naukowcom poszerzyć wiedzę na temat ewolucji kodu genetycznego i poprawnie zinterpretować kod genetyczny nowo zsekwencjonowanych organizmów.

„To samo w sobie jest fundamentalne pytanie w biologii”, powiedziała Shulgina, która prowadzi badania podyplomowe w laboratorium Eddiego.

Kod genetyczny to zestaw reguł, które mówią komórkom, jak interpretować trzyliterowe zestawy nukleotydów w białka, często określane jako cegiełki życia. Prawie każda żywa istota z bakterie coli W przypadku ludzi wykorzystuje ten sam kod genetyczny. Dlatego kiedyś wierzono, że kod został wyryty w kamieniu. Ale naukowcy odkryli garstkę odstających obserwacji:; Organizmy posługujące się alternatywnymi kodami genetycznymi znajdują się tam, gdzie zestaw instrukcji jest inny.

Tutaj Codetta może naprawdę zabłysnąć. Program może pomóc w identyfikacji większej liczby organizmów korzystających z tych alternatywnych kodów genetycznych, pomagając rzucić nowe światło na to, jak kody genetyczne mogą się zmieniać w pierwszej kolejności.

Zrozumienie, jak to się dzieje, pomoże nam zrozumieć, dlaczego początkowo myśleliśmy, że to niemożliwe… i jak naprawdę działają te podstawowe procesy. „

Jekateryna „Kate” Szulgina

Codetta przeanalizowała już sekwencje genomu ponad 250 000 bakterii i innych organizmów jednokomórkowych zwanych archeonami pod kątem alternatywnych kodów genetycznych i zidentyfikowała pięć, których wcześniej nie widziano. We wszystkich pięciu przypadkach kod aminokwasowy argininy został przestawiony na inny aminokwas. Uważa się, że po raz pierwszy naukowcy zaobserwowali tę wymianę w bakteriach i mogą wskazywać na siły ewolucyjne, które wpływają na zmianę kodu genetycznego.

READ  5N Plus finalizuje przejęcie AZUR SPACE

Naukowcy twierdzą, że badanie stanowi największe badanie alternatywnych kodów genetycznych. Codetta przeanalizowała praktycznie każdy dostępny genom bakterii i archeonów. Nazwa programu to skrzyżowanie kodonów, sekwencji trzech nukleotydów, która tworzy fragmenty kodu genetycznego, i Kamienia z Rosetty, płytki zapisanej w trzech językach.

Praca stanowi punkt kulminacyjny dla Shulginy, która przez ostatnie pięć lat rozwijała teorię statystyczną stojącą za Codettą, pisała program, testowała go, a następnie analizowała genom. Działa poprzez odczytywanie genomu organizmu, a następnie wykorzystanie bazy danych znanych białek do wytworzenia potencjalnego kodu genetycznego. Różni się od innych podobnych metod rozmiarem, z jakim może analizować genomy.

Shulgina dołączyła do laboratorium Eddiego, które specjalizuje się w porównywaniu genomów, w 2016 roku po tym, jak przyszła po poradę na temat algorytmu, który projektowała do interpretacji kodów genetycznych.

Jak dotąd nikt nie przeprowadził tak szerokiego przeglądu alternatywnych kodów genetycznych.

„Wspaniale było zobaczyć nowe kody, ponieważ pomimo wszystkiego, co wiedzieliśmy, Kate wykonałaby całą pracę i nie byłoby żadnych nowych kodów do znalezienia” — powiedział Eddy, który jest również badaczem medycznym w Howard Hughes. Zauważył również, że system można wykorzystać do zapewnienia dokładności licznych baz danych sekwencji białek.

„Wiele sekwencji białek w bazach danych w dzisiejszych czasach to tylko konceptualne translacje sekwencji genomowego DNA” – powiedział Eddy. „Ludzie zagłębiają się w te sekwencje białek, szukając wszelkiego rodzaju przydatnych rzeczy, takich jak nowe enzymy lub nowe modyfikatory genów itd. Chcesz, aby sekwencje białek były dokładne, ale jeśli organizm używa niestandardowego kodu, to zrobią. Źle przetłumacz” .

Naukowcy twierdzą, że kolejnym etapem prac jest wykorzystanie Codetty do poszukiwania alternatywnych kodów w wirusach, organizmach eukariotycznych i genomach metaloorganicznych, takich jak mitochondria i chloroplasty.

„W życiu jest tak wiele różnorodności, że nie przeprowadziliśmy jeszcze tego systematycznego badania” – powiedziała Shulgina.

Elise Haynes

„Analityk. Nieuleczalny nerd z bekonu. Przedsiębiorca. Oddany pisarz. Wielokrotnie nagradzany alkoholowy ninja. Subtelnie czarujący czytelnik.”

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Back to top