Aby pobrać dane do projektu należy wpisać do poniższego pola swój numer indeksu.
Każdy student ma inne dane, oczekuję więc innych wyników.
Wyniki:
Po wpisaniu numeru indeksu można pobrać dane do testowania.
Skrypt którego ja używałem do uzyskania czerwonych wyników znaleźć można tutaj http://biecek.pl/MIMUW/uploads/skryptDS.r.
(W przypadku Państwa danych należy wybrać inne geny ale tą samą liczbę)
Instrukcja:
W leczeniu nefrologicznym, przydatnym czynnikiem opisującym stan nerki jest 'elastaza'. Ta substancja jest naturalnie produkowana przez organizm ludzki i przyjmuje się, że im większe stężenie elastazy tym lepszy stan nerki.
Pomiar ekspresji elastazy w nerce jest dosyć kosztowny i bolesny dla pacjenta (jak to biopsja). Będziemy więc chcieli ocenić ekspresje elastazy na podstawie innych cech pacjenta. Te inne cechy to ekspresja 100 wybranych genów, informacja o wieku, płci oraz ewentualnej cukrzycy.
Do dyspozycji mają Państwo zbiór 201 osób, dla których zmierzono poziom elastazy, jest informacja o zdiagnoyowanej lub nie cukrzycy, wieku, płci oraz logarytmu z ekspresji 100 genów (wartości ekspresji genów się standardowo logarytmuje).
Mamy też informacje o 299 nowych pacjentach, dla których nie ma podanej informacji o chorobie ani poziomie elastazy. Dla tych nowych pacjentów proszę oszacować elastazę oraz ocenić czy są oni zdrowi czy chorzy na cukrzycę (uwaga!!! cukrzyca wcale nie musi być związana z elastazą).
Zbiór uczący składa się z dwóch plików: xxx.zdrowi.txt i xxx.chorzy.txt (gdzie xxx to Państwa numer indeksu). W jednym pliku są pomiary dla osób bez cukrzycy w drugim dla chorych z cukrzycą. Po odczytaniu oba zbiory danych należy połączyć w jeden. Zbiór dla którego powinni wykonać Państwo prognozę znajduje się w pliku xxx.nowi.txt
Jako wynik należy przesłać pocztą elektroniczną plik tekstowy o następującym formacie: W pierwszych 299 liniach znajdować się powinny wyniki dla kolejnych pacjentów w kolejności zgodnej z plikiem xxx.nowi.txt W każdej linii znajdować powinny się dwie wartości rozdzielone spacją, pierwsza to państwa prognoza wartości elastazy dla tego pacjenta, a druga to diagnoza choroby.
Po tych 299 liniach z wynikami należy umieścić krótki słowny komentarz jaki model został użyty do prognozy.
Uwaga! W tytule maila powinno znaleźć się słowo projektStatystykaII
Powodzenia!!!