Górnośląskie Centrum Obliczeń Naukowych i Inżynierskich

Jednym z kluczowych kwestii w badaniach nad rakiem wydają się różnice w profilach komórek neoplastycznych in vivo i ich odpowiednikach in vitro. Ogromna ilość informacji zdeponowanych w bioinformatycnych bazach danych pozwala na szersze spojrzenie na zagadnienie zmian genetycznych w nowotworach.

Analiza bazy danych mutacji somatycznych w nowotworach Sanger Institute Catalog Of Somatic Mutations In Cancer (COSMIC) w wersji v61 ujawniła niższy procent homozygotycznych mutacji w grupie genów supresorowych w próbkach pobranych od pacjentów (in vivo) w stosunku do linii komórkowych (in vitro). Podobnie w przypadku mutacji powodujących brak białka (mutacje nonsens oraz delecje całego genu), które zaobserwowano częściej in vitro niż in vivo. Potencjalnym wytłumaczeniem takich obserwacji może być fakt, że heterozygotyczne mutacje powodujące zmianę w białku (mutacje missense) mogą stopniowo, w miarę postępu procesu nowotworowego (po osiągnięciu określonego kontekstu molekularnego) zmieniać się w homozygotyczne powodujące całkowity brak białka. Możliwe również, że wśród wielu niezależnych możliwości przebiegu procesu nowotworowego, ścieżki prowadzące do homozygotycznych mutacji nonsense są charakterystyczne dla linii, które łatwiej ustabilizować in vitro. Wnioski mogą być interesujące dla badaczy wykorzystujących linie komórkowe in vitro dla wnioskowania do jakiego stopnia procesy przebiegające w liniach komórkowych odzwierciedlają sytuację w guzach in vivo.

Celem ekspertyzy będzie ekstrakcja danych dotyczących częstości mutacji oraz stabilności mikrosatelitów z bazy danych COSMIC v61. Dla każdego genu z bazy zostanie pobrana informacja o częstości występowania próbki normalnej i posiadającej mutację. Co więcej, zmutowane próbki będą podzielone na grupy odzwierciedlające zygotyczność i typ mutacji – mutacje modyfikujące lub częściowo wykluczające funkcje białka (misseense) oraz mutacje całkowicie eliminujące białko (nonsense i delecje całego genu). Analiza zostanie przeprowadzona dla każdego genu z wykorzystaniem dokładnego testu Fishera dla tabel 2x2. Obliczenia zostaną przeprowadzone w pakiecie R 2.15.1 oraz Matlab 2010b. Analiza będzie dotyczyła porównania mutacji homo i hetereozygotycznych oraz częściowo lub całkowicie eliminujących funkcje bałka (missense, nonsense) we wszystkich możliwych kombinacjach.

FaLang translation system by Faboba