Celem ćwiczenia jest zapoznanie się z kilkoma wybranymi narzędziami chemicznymi dostępnymi on-line.
bazy chemiczne, sekwencje aminokwasowe, formaty plików
Na dysku Google utwórz katalog "Cwiczenie10", który później udostępnisz do oceny.
Do łatwej wizualizacji trójwymiarowych struktur chemicznych, zapisanych zgodnie ze standardami mogą służyć różne narzędzia. Można wykorzystywać wtyczki (plugin's) do przeglądarek, które wyświetlą cząsteczkę wprost w oknie przeglądarki (np. Jmol), lub zapisywać je lokalnie i obrazować z użyciem dodatkowych programów. To drugie rozwiązanie stwarza zazwyczaj więcej możliwości, ponieważ dzięki wtyczce możemy oglądać, mierzyć i zmieniać reprezentację cząsteczki czy struktury bez możliwości jej obejrzenia po zmodyfikowaniu jej topologii lub geometrii (np. po ręcznym usunięciu atomu/grupy lub zoptymalizowaniu jej geometrii w polu sił).
Do własnych zastosowań najlepszy może okazać się jeden z dwóch programów:
RasMol: http://www.openrasmol.org/
znany nam już i doskonale opanowany program o otwartym kodzie. Niektóre dostępne wersje są nawet bezinstalacyjne (dstępny binarny plik wykonywalny wystarczy uruchomić).
PyMOL: http://www.pymol.org/
wieloplatformowy, o dużych możliwościach. Umożliwia edycję topologii i koordynatów, mutacje i tworzenie "od zera". Wymaga trochę samozaparcia do opanowania jego obsługi, jednak dla twardzieli może być narzędziem doskonałym. Posiada implementowane pola siłowe i współpracuje z bazą RCSB online - czego nie potrafi RasMol. Starsze wersje oraz wersja edukacyjna dostępne są bezpłatnie.
Jeżeli masz zainstalowany któryś z tych programów - będziesz mógł je wykorzystać do wizualizacji - w dalszej części tego ćwiczenia.
W pracowni TI nie musisz instalować żadnego z tych programów - wszystkie już tam są i czekają na uruchomienie ;)
Struktury peptydów, białek i kwasów nukleinowych dostępne są swobodnie w bazie RCSB PDB: http://www.rcsb.org/
Wszystkie struktury opisane są w możliwie pełny sposób, a więc nawet bez pobierania i samodzielnej inspekcji danej struktury można odnaleźć informacje na temat bibliografii, sekwencji aminokwasowych, informacje o strukturze drugorzędowej, współrzędnych atomów, często właściwości fizykochemicznych, funkcji biologicznych, występowania lub sposobu otrzymania i innych.
Interfejs WWW działa w języku angielskim zaś wyszukiwanie wymaga podania jedynie fragmentu nazwy poszukiwanego związku, PDB ID danego związku, lub nazwiska/nazwisk autorów, którzy opublikowali daną strukturę.
Wykonaj:
Przejdź na stronę RCSB PDB i odszukaj informacje o enzymie: papaina (użyj angielskiej nazwy: papain).
Zapisz w katalogu "Cwiczenie10" na dysku Google dwa pliki: pobrany plik PDB (pkt. 2.h) i utworzony plik tekstowy (TXT) zawierający spis struktur (pkt. 2.c).
Przejdź na stronę UniProt: http://www.uniprot.org/
Dane udostępniane na tej stronie dotyczą nie tylko samych sekwencji aminokwasowych związków białkowych, ale można ich używać także do odnajdywania podobieństw sekwencyjnych i funkcjonalnych. My skupimy się na samych sekwencjach.
Może to być także przycisk "Download" dla pobrania pliku FASTA:
Prześlij uzyskany plik z sekwencją (uzyskany z narzędzia FASTA) na dysk Google, do katalogu "Cwiczenie10".
1) Przejdź pod podany adres, wydobądź i skonwertuj na sekwencję jednoliterową zawartość tego pliku PDB. Zachowaj stronę z wynikiem (z sekwencją) - np. w oddzielnej karcie przeglądarki, lub zapisz otrzymany plik sequence.pir (plik tekstowy) do późniejszego porównania.
UWAGA techniczna: jeżeli witryna nie chce współpracować i zamiast podać skonwertowaną sekwencję wypisze, że "nie ma takiego pliku", zwróć uwagę, czy w pasku adresu znajduje się hash - czyli fragment, który nie jest słowem (nazwą katalogu), a za nim nazwa pliku, który mieliśmy pobrać (sequence.pir).
2) Korzystając z tego samego interfejsu (adres powyżej) wpisz w polu kodów PDB oznaczenie: 1L9H - przejdź kolejno do wyników i porównaj je z tymi otrzymanymi w poprzednim kroku. Jeżeli obydwie sekwencje są identyczne, to w nagrodę możesz obejrzeć plik 1L9H w RasMolu lub PyMolu. Koniecznie sprawdź też zawartość tego pliku (tekstowo: np. w Notatniku), dla sprawdzenia, czy nie zawiera on po prostu jednoliterowej sekwencji rodopsyny.
Ilustracja do dwóch powyższych punktów:
Wykonaj: przejdź pod jeden z zaproponowanych wyżej adresów i skonwertuj znaną Ci już sekwencję jednoliterową receptora rodopsynowego 1L9H na jej trójliterowy odpowiednik. Jeżeli z przyczyn technicznych nie dysponujesz swoim plikiem "sequence.pir" - użyj tego pliku (zawiera wyłącznie sekwencję jednoliterową rodopsyny). Porównaj otrzymany wynik z sekwencją zapisaną w zapisanym lokalnie pliku rd_1l9h.pdb (zapis sekwencji aminokwasowej rozpoczyna się w 381 linii pliku).
Aby zapisać lokalnie skonwertowany plik, należy zaznaczyć CAŁY tekst w dolnej części formularza (wynik konwersji) i wkleić go do pliku teksotwego - koniecznie do NOTATNIKA lub innego etytora tekstowego (TXT; w pracowni TI użyj do tego "Edytora tekstowego" - gedit), a NIE DO WORD'a lub innego edytora z pakietu biurowego. Nowemu plikowi należy nadać rozszerzenie "mol2".
JEŻELI wskazany powyżej konwerter NIE DZIAŁA, to użyj tego: https://datascience.unm.edu/tomcat/biocomp/convert
W tym konwerterze format wejściowy jest wykrywany automatycznie, więc nie trzeba go podawać, zaś w formacie wyjściowym wybierz - jak poprzednio"mol2 - Tripos MOL2". Po uruchomieniu przycisku "Go Convert" pobierz skonwertowany plik "convert_out.mol2" (w sekcji "Results") i postępuj z nim tak, jak opisano to powyżej.
Uzyskaną strukturę zapisz lokalnie i obejrzyj zainstalowanym u siebie programem do wizualizacji (w pracowni może to być "Chimera" lub "PyMol"; w RasMol'u należy wyspecyfikować format ładowanego pliku:
rasmol -mol2 nazwa_pliku.mol2
- z linii poleceń lub "load mol2 nazwa_pliku.mol2" z commandline'a wewnątrz RasMol'a; w niektórych wersjach RasMola trzeba włączyć tę linię poleceń (F7)).
Porównaj ją z oryginalnym plikiem PDB oglądanym w tym samym programie. Czy po konwersji formatu zmieniła się geometria oglądanej cząsteczki? Czy powinna się zmienić?
Uwaga: niektóre wersje RasMol'a mają problem z interpretacją formatu MOL2 w ogóle. W takich przypadkach zamiast cząsteczki będzie widoczna "rozciągnięta galaktyka". Jeżeli nie jest widoczne nic - to problem jest innej natury: albo dokonano złej konwersji, albo nie podano formatu podczas wczytywania pliku. Tak, czy inaczej - nie ma się co przejmować takim, lub innym wyglądem tego pliku - należy go przesłać do oceny.
Prześlij na dysk Google, do katalogu "Cwiczenie10" skonwertowaną cząsteczkę (w formacie "mol2").
Wiele baz zawiera gotowe widma otrzymane eksperymentalnie. Jedną z nich jest baza dostępna pod adresem: https://webbook.nist.gov/chemistry/
Na stronie Webbok Chemistry (pod podanym wyżej adresem) odszukaj możliwość poszukiwania struktury (Structure) na podstawie wykonanego własnoręcznie rysunku (Use applet to draw a structure). W aplecie Javy narysuj benzen i wybierz Done... (nie zapomnij narysować odpowiedniej ilości wiązań podwójnych, które aplet zamieni na wiązanie zdelokalizowane). W ramce, która się pojawi zaznacz wyszukiwanie widma IR i zatwierdź wybór.
Uwaga: Jeżeli w używanej przez Ciebie przeglądarce nie ma możliwości uruchomienia Javy - wykorzystaj ponownie wyszukiwanie z użyciem wzoru sumarycznego (ang. formula, użyj wzoru: C6H6; wśród wyników wyszukiwania wybierz właściwy związek: "benzene"; nie używaj wyszukiwania wg nazwy).
Na kolejnej stronie poszukaj odnośnika do widma IR w roztworze (solution) i je obejrzyj. Upewnij się, ze porównujesz widmo absorbancji. Sprawdź, którego pasma charakterystycznego (lub których pasm) tym razem nie obserwujesz w wykresie absorbancji w stosunku do oglądanego poprzednio widma toluenu ("jakie są różnice w widmach"; wniosków/odpowiedzi na to pytanie nie musisz zapamiętywać ani nigdzie zapisywać...).
Powstały obraz (widmo IR wyrażone jako zmiana absorbancji benzenu) zapisz pod nazwą abs_benzen.png i prześlij do katalogu "Cwiczenie10" na swoim dysku Google.
Katalog "Cwiczenie10" na dysku Google udostępnij na zwykły (ten, co zawsze) adres (powinien zawierać 6 plików).