Projekty

Projektowanie klasyfikatorów zazwyczaj poprzedzane jest zastosowaniem grupowania danych, czyli tzw. 'klasyfikacją bez nauczyciela'. Pozwala to na poznanie struktury danych, co w szczególności dla klasyfikatorów o dużej interpretowalności dla eksperta ludzkiego jest etapem podatkowym.

Czytaj więcej: Metoda grupowania rozmytych c-sortowanych średnich

Dostępność tysięcy osobnicznych genomów, tak ludzkich, jak i rozmaitych gatunków zwierząt i roślin, oraz wzrost liczby placówek badawczych na świecie zajmujących się biologią obliczeniową pociągają za sobą drastycznie rosnące koszty transferu i składowania danych bioinformatycznych. By mieć wyobrażenie o trudnościach tego typu, wystarczy uświadomić sobie, że dane z sekwencjonowania genomu człowieka, przy standardowym pokryciu 30x, zajmują w postaci surowej (FASTQ) ponad 200 GB (nie licząc informacji o wynikach ich uliniowienia, np. w formacie SAM). Tradycyjne algorytmy kompresji nie są zbyt przydatne dla tego typu danych, osiągając stopień kompresji jedynie rzędu 3-4x (nawet przy dość kosztowej obliczeniowo i pamięciowo kompresji algorytmem LZMA).

Czytaj więcej: Zaprojektowanie i ewaluacja porównawcza efektywnego kompresora danych z odczytów sekwencjonowania...

Wykładniki charakterystyczne, np. Lapunowa, Perrona, Bohla, ogólne, Grobmana mogą służyć jako narzędzie do scharakteryzowania pewnych własności układów dynamicznych. Opisują one różne typy stabilności, tempo wzrostu lub malenia trajektorii, wrażliwość własności dynamicznych układu na niedokładności parametryczne.

Czytaj więcej: Metody syntezy praw sterowania w oparciu o wykładniki charakterystyczne dyskretnych układów...

Wyznaczanie liczby wystąpień każdego ciągu o długości k (gdzie wartość k jest np. rzędu 20-40), tzw. k-merów, jest ważnym elementem składowym wielu procedur bioinformatycznych. Ważnym zastosowaniem jest procedura asemblacji genomu de novo, gdzie kluczowym elementem jest detekcja odczytów (ang. reads) obarczonych błędami sekwencjonowania; przypadki takie zwykle odpowiadają jedynie pojedynczym wystąpieniom k-merów w zaburzonych odczytach (czy ich odpowiednich fragmentach). Inne znaczące zastosowania statystyk k-merów to uliniowianie wielu sekwencji (MSA), detekcja powtórzeń czy korekta błędów w odczytach.

Czytaj więcej: Zaprojektowanie i ewaluacja porównawcza efektywnego algorytmu zliczania k-merów z odczytów...

Czynnik HSF1 (Heat Shock Factor 1) jest podstawowym czynnikiem transkrypcyjnym aktywowanym w odpowiedzi na stres komórkowy, podczas gdy HSF2 jest aktywny w trakcie rozwoju i zróżnicowania komórek, również w czasie spermatogenezy. Mimo, że oba czynniki są niezbędne dla prawidłowego przebiegu spermatogenezy (podwójny knockout genowy u myszy skutkuje zablokowaniem procesu), aktywacja HSF1 przez szok termiczny inicjuje apoptozę komórek spermatogenicznych prowadząc do bezpłodności mężczyzn. Apoptoza wywołana stresem umożliwia usunięcie komórek potencjalnie uszkodzonych, zmniejsza więc ryzyko przekazania uszkodzeń następnym pokoleniom. Mechanizm indukcji takiej apoptozy nie jest jednak znany.

Czytaj więcej: Odziaływania pomiędzy HSF1 i HSF2 w czasie odpowiedzi na szok termiczny w jądrach myszy.

Strona 4 z 6

FaLang translation system by Faboba

Górnośląskie Centrum Obliczeń Naukowych i Inżynierskich

Metoda grupowania rozmytych c-sortowanych średnich

Zaprojektowanie i ewaluacja porównawcza efektywnego kompresora danych z odczytów sekwencjonowania DNA

Metody syntezy praw sterowania w oparciu o wykładniki charakterystyczne dyskretnych układów liniowych ze zmiennymi współczynnikami

Zaprojektowanie i ewaluacja porównawcza efektywnego algorytmu zliczania k-merów z odczytów sekwencjonowania DNA.

Odziaływania pomiędzy HSF1 i HSF2 w czasie odpowiedzi na szok termiczny w jądrach myszy.