Górnośląskie Centrum Obliczeń Naukowych i Inżynierskich

Projektowanie klasyfikatorów zazwyczaj poprzedzane jest zastosowaniem grupowania danych, czyli tzw. 'klasyfikacją bez nauczyciela'. Pozwala to na poznanie struktury danych, co w szczególności dla klasyfikatorów o dużej interpretowalności dla eksperta ludzkiego jest etapem podatkowym. 

Dostępność tysięcy osobnicznych genomów, tak ludzkich, jak i rozmaitych gatunków zwierząt i roślin, oraz wzrost liczby placówek badawczych na świecie zajmujących się biologią obliczeniową pociągają za sobą drastycznie rosnące koszty transferu i składowania danych bioinformatycznych. By mieć wyobrażenie o trudnościach tego typu, wystarczy uświadomić sobie, że dane z sekwencjonowania genomu człowieka, przy standardowym pokryciu 30x, zajmują w postaci surowej (FASTQ) ponad 200 GB (nie licząc informacji o wynikach ich uliniowienia, np. w formacie SAM). Tradycyjne algorytmy kompresji nie są zbyt przydatne dla tego typu danych, osiągając stopień kompresji jedynie rzędu 3-4x (nawet przy dość kosztowej obliczeniowo i pamięciowo kompresji algorytmem LZMA).

Wykładniki charakterystyczne, np. Lapunowa, Perrona, Bohla, ogólne, Grobmana mogą służyć jako narzędzie do scharakteryzowania pewnych własności układów dynamicznych. Opisują one różne typy stabilności, tempo wzrostu lub malenia trajektorii, wrażliwość własności dynamicznych układu na niedokładności parametryczne.

Wyznaczanie liczby wystąpień każdego ciągu o długości k (gdzie wartość k jest np. rzędu 20-40), tzw. k-merów, jest ważnym elementem składowym wielu procedur bioinformatycznych. Ważnym zastosowaniem jest procedura asemblacji genomu de novo, gdzie kluczowym elementem jest detekcja odczytów (ang. reads) obarczonych błędami sekwencjonowania; przypadki takie zwykle odpowiadają jedynie pojedynczym wystąpieniom k-merów w zaburzonych odczytach (czy ich odpowiednich fragmentach). Inne znaczące zastosowania statystyk k-merów to uliniowianie wielu sekwencji (MSA), detekcja powtórzeń czy korekta błędów w odczytach.

Czynnik HSF1 (Heat Shock Factor 1) jest podstawowym czynnikiem transkrypcyjnym aktywowanym w odpowiedzi na stres komórkowy, podczas gdy HSF2 jest aktywny w trakcie rozwoju i zróżnicowania komórek, również w czasie spermatogenezy. Mimo, że oba czynniki są niezbędne dla prawidłowego przebiegu spermatogenezy (podwójny knockout genowy u myszy skutkuje zablokowaniem procesu), aktywacja HSF1 przez szok termiczny inicjuje apoptozę komórek spermatogenicznych prowadząc do bezpłodności mężczyzn. Apoptoza wywołana stresem umożliwia usunięcie komórek potencjalnie uszkodzonych, zmniejsza więc ryzyko przekazania uszkodzeń następnym pokoleniom. Mechanizm indukcji takiej apoptozy nie jest jednak znany.

FaLang translation system by Faboba