Ćwiczenie 11


Celem ćwiczenia jest zapoznanie się z wybranymi narzędziami chemicznymi dostępnymi on-line.
bazy chemiczne, sekwencje aminokwasowe, formaty plików
Na Dysku Google uwtórz katalog Ćwiczenie11, który później udostepnisz prowadzącemu.

 

  1. Narzędzia do wizualizacji.
    Do łatwej wizualizacji trójwymiarowych struktur chemicznych, zapisanych zgodnie ze standardami mogą służyć różne narzędzia. Można wykorzystywać wtyczki (plugin's) do przeglądarek, które wyświetlą cząsteczkę wprost w oknie przeglądarki (np. Jmol), lub zapisywać je lokalnie i obrazować z użyciem dodatkowych programów. To drugie rozwiązanie stwarza zazwyczaj więcej możliwości, ponieważ dzięki wtyczce możemy oglądać, mierzyć i zmieniać reprezentację cząsteczki czy struktury bez możliwości jej obejrzenia po zmodyfikowaniu jej topologii lub geometrii (np. po ręcznym usunięciu atomu/grupy lub zoptymalizowaniu jej geometrii w polu sił).

    Do własnych zastosowań najlepszy może okazać się jeden z dwóch programów:

    RasMol:http://www.openrasmol.org/
    wieloplatformowy program, lekki, nieuciążliwy. Nie pozwala na edycję cząsteczek (tylko wizualizacja i opracowywanie). Do samego "oglądania" wystarczy w zupełności. Wiele współczesnych dystrybucji zawiera ten program w standardowych repozytoriach, zaś pobrane pliki binarne można uruchamiać z dowolnej lokalizacji (bez instalacji = bez uprawnień administracyjnych).

    PyMOL:PyMOL: http://www.pymol.org/
    wieloplatformowy, o dużych możliwościach. Umożliwia edycję topologii i koordynatów, mutacje i tworzenie "od zera". Wymaga trochę samozaparcia do opanowania jego obsługi, jednak dla twardzieli może być narzędziem doskonałym. Posiada implementowane pola siłowe i współpracuje z bazą RCSB online - czego nie potrafi RasMol. Starsze wersje oraz wersja edukacyjna dostępne są bezpłatnie.

    Obydwa te programy są już nam znane - zostały zaprezentowane wcześniej

     

  2. Pozyskiwanie struktur.
    Struktury peptydów, białek i kwasów nukleinowych dostępne są swobodnie w bazie RCSB PDB: http://www.rcsb.org/pdb/home/home.do

    Wszystkie struktury opisane są w możliwie pełny sposób, a więc nawet bez pobierania i samodzielnej inspekcji danej struktury można odnaleźć informacje na temat bibliografii, sekwencji aminokwasowych, informacje o strukturze drugorzędowej, współrzędnych atomów, często właściwości fizykochemicznych, funkcji biologicznych, występowania lub sposobu otrzymania i innych.

    Interfejs WWW działa w języku angielskim zaś wyszukiwanie wymaga podania jedynie fragmentu nazwy poszukiwanego związku, PDB ID danego związku, lub nazwiska/nazwisk autorów, którzy opublikowali daną strukturę.

    Wykonaj:

    Przejdź na stronę RCSB PDB i odszukaj informacje o enzymie: papaina (ang. papain).

    • zwróć uwagę na to, czy w wynikach wyszukiwania znajdują się wyłącznie strony opisujące strukturę papainy
    • wśród wyników odszukaj stronę ze strukturą papainy (np. 9PAP)
    • odszukaj PDB ID tej struktury, sprawdź, jakie inne struktury ta struktura zastępuje (ang. "superseds", lub "previous versions")
      Utwórz lokalnie plik tekstowy (TXT) i umieść w nim spis struktur, które zostały zastąpione przez zidentyfikowaną strukturą papainy odnalezione w tym podpunkcie; plik ma zawierać tylko nazwy tych struktur, np:
      1AAB
      2BBC
      3CCD
      4DDE
    • odszukaj symbol UniProtKB (UniProt Knowledgebase) sprawdź, dokąd prowadzi ten odnośnik
    • odszukaj właściwe cytowanie dla odnalezionej struktury
    • odszukaj informacje eksperymentalne na temat tej struktury
    • obejrzyj cząsteczkę wykorzystując umieszczone na stronie narzędzia wizualizacji on-line ("3D View")
    • pobierz cząsteczkę papainy w postaci pliku tekstowego PDB, zapisz lokalnie i obejrzyj w dowolnym, zainstalowanym programie wizualizacyjnym

    img

    Zapisz na Dysku Google pobrany plik PDB i utworzony plik tekstowy (TXT) zawierający spis struktur

  3. Sekwencje.
    Przejdź na stronę UniProt: http://www.uniprot.org/

    Dane udostępniane na tej stronie dotyczą nie tylko samych sekwencji aminokwasowych związków białkowych, ale można ich używać także do odnajdywania podobieństw sekwencyjnych i funkcjonalnych. My skupimy się na samych sekwencjach.

    • odszukaj informacje dostępne dla enzymu papaina (ang. "papain"; musi pochodzic z melonowca właściwego (papaja), ang/łac: "Carica papaya (papaya)")
    • wybierz z listy wyników stronę opisującą ten enzym, jego strukturę (lub sekwencję). Zwróć uwagę na to, żeby pochodził z właściwego organizmy (patrz: podpunkt powyzej)
    • porównaj odnalezione informacje z tymi udostępnionymi w RCSB PDB, w szczególności zwróć uwagę na długość łańcucha i bibliografię
    • odszukaj sekcję opisującą strukturę: sekwencję ("sequence") i strukturę drugorzędową ("secondary structure")
    • odszukaj sekcję opatrzoną nagłówkiem 3D structure databases - zwróć uwagę na to, że wymienione są w niej odnośniki do konkretnych struktur trójwymiarowych m.in. w RCSB PDB - sprawdź jeden z odnośników (pierwszy na tej chronologicznej liście, na początku 2017 roku, jest 1BP4 - struktura oznaczona metodami rentgenografii strukturalnej z rozdzielczością 2,20 A; na tej samej liście znajduje się odnośnik do struktury oznaczonej ze znacznie lepszą rozdzielczością (niższą) - odszukaj go i obejrzyj strukturę papainy)

      img

    • powróć na stronę z opisem papainy, znowu do sekcji "3D structure databases"
    • jeden z odnośników (1EFF) w polu "Method" ma wpisaną wartość "model" - co to oznacza?
    • wszystkie odnośniki kierują do struktur, których sekwencje zgadzają się z papainą od reszty numer 134 - zastanów się, dlaczego tak moze być?
    • potwierdź, że dopiero później (niżej) w sekcji 3D structure databases pojawiają się podsekcje "ProteinModelPortal", "SMR" i "Modbase" (bazy struktur teoretycznych)
    • odszukaj w sekcji "Sequence" odnośnik zatytułowany "FASTA" - sprawdź, dokąd prowadzi; zapisz uzyskany plik tekstowy.
    • skorzystaj z narzędzia BLAST, aby odnaleźć struktury homologiczne (to znaczy o podobnej lub miejscami identycznej sekwencji aminokwasowej) i zapoznaj się z uzyskanymi wynikami (ich uzyskanie trwa kilka minut, nie zamykaj w tym czasie strony BLAST).

      img

    Na Dysk Google prześlij uzyskany plik z sekwencją (uzyskany z narzędzia FASTA).

  4. Konwersje formatów.
    1. Zapis sekwencji.

      Dysponując konkretnym plikiem ze strukturą możemy zamienić zapisaną w nim sekwencję aminokwasów np. z pliku PDB na sekwencję reprezentowaną skrótami jednoliterowymi korzystając np. z usługi dostępnej pod adresem: http://swift.cmbi.ru.nl/servers/html/soupir.html

      1) Przejdź pod podany adres, wydobądź i skonwertuj na sekwencję jednoliterową zawartość tego pliku PDB. Zachowaj stronę z wynikiem (z sekwencją) - np. w oddzielnej karcie przeglądarki, lub zapisz otrzymany plik sequence.pir (plik tekstowy) do późniejszego porównania.

      2) Korzystając z tego samego interfejsu (adres powyżej) wpisz w polu kodów PDB oznaczenie: 1L9H - przejdź kolejno do wyników i porównaj je z tymi otrzymanymi w poprzednim kroku. Jeżeli obydwie sekwencje są identyczne, to w nagrodę możesz obejrzeć plik 1L9H w RasMolu lub PyMolu. Koniecznie sprawdź też zawartość tego pliku (tekstowo), dla sprawdzenia, czy nie zawiera on po prostu jednoliterowej sekwencji rodopsyny.

      Ilustracja do dwóch powyższych punktów:

      img

    2. Kody reszt aminokwasowych.

      Do konwersji sekwencji zapisanych kodem jednoliterowym na trójliterowy i odwrotnie można użyć np. narzędzia umieszczonego pod adresem: http://molbiol.ru/eng/scripts/01_17.html

      Przejdź pod wskazany adres i skonwertuj znaną Ci już sekwencję jednoliterową receptora rodopsynowego 1L9H na jej trójliterowy odpowiednik. Porównaj otrzymany wynik z sekwencją zapisaną w zapisanym lokalnie pliku rd_1l9h.pdb (zapis sekwencji aminokwasowej rozpoczyna się w 381 linii pliku).

    3. Format pliku.

      Struktury chemiczne można zapisywać na wiele sposobów - w wielu formatach. Najpopularniejsze z nich, to PDB lub XYZ i MOL2. Korzystając z konwertera on-line dostępnego pod adresem: http://cdb.ics.uci.edu/cgibin/BabelWeb.py skonwertuj (zmień format) pliku pobranego w podpunkcie A z PDB (Input Format: Protein Databank) na MOL2 (output: Tripos Sybyl Mol2).
      Uzyskaną strukturę zapisz lokalnie i obejrzyj zainstalowanym u siebie programem do wizualizacji (w pracowni może to być "Chimera" lub "PyMol"; w RasMol'u należy wyspecyfikować format ładowanego pliku: rasmol -mol2 nazwa_pliku.mol2 - z linii poleceń lub load mol2 nazwa_pliku.mol2 z commandline'a wewnątrz RasMol'a; w niektórych wersjach RasMola trzeba włączyć tę linię poleceń (F7)).
      Porównaj ją z oryginalnym plikiem PDB oglądanym w tym samym programie. Czy po konwersji formatu zmieniła się geometria oglądanej cząsteczki? Czy powinna się zmienić?

    Na Dysk Google prześlij skonwertowaną cząsteczkę (w formacie "mol2").

  5. Odczytywanie widm.

    Wiele baz zawiera gotowe widma otrzymane eksperymentalnie. Jedną z nich jest baza dostępna pod adresem: http://webbook.nist.gov/chemistry/

    • przejdź pod wskazany adres
    • w opcjach wyszukiwania (Search Options) wybierz poszukiwanie wg nazwy (General Searches > Name)
    • w formularzu wpisz toluen (ang. toluene)
    • poniżej, w opcjach wyszukiwania zaznacz opcję poszukiwania widma w podczerwieni (Select the desired type(s) of data > IR Spectrum)
    • zatwierdź swój wybór (Search)
    • na kolejnej stronie, z charakterystyką, odszukaj odnośnik do widma w podczerwieni (IR Spectrum) roztworu toluenu (solution)
    • obejrzyj zdigitalizowane widmo w podczerwieni toluenu w roztworze
    • pod wykresem zmień opcję Transmittance na Absorbance
    • odszukaj pasma charakterystyczne absorpcji - spisz je do późniejszego porównania, lub pozostaw otwartą kartę z widmem

    Powstały obraz (widmo IR wyrażone jako zmiana absorbancji toluenu) zapisz pod nazwą abs_toluen.png i prześlij do katalogu Ćwiczenie11 na swoim Dysku Google.

    Na stronie Webbok Chemistry (pod podanym wyżej adresem) odszukaj możliwość poszukiwania struktury (Structure) na podstawie wykonanego własnoręcznie rysunku (Use applet to draw a structure). W aplecie Javy narysuj benzen i wybierz Done... (nie zapomnij narysować odpowiedniej ilości wiązań podwójnych, które aplet zamieni na wiązanie zdelokalizowane). W ramce, która się pojawi zaznacz wyszukiwanie widma IR i zatwierdź wybór.

    img

    Uwaga: Jeżeli w używanej przez Ciebie przeglądarce nie ma możliwości uruchomienia Javy - wykorzystaj ponownie wyszukiwanie z użyciem wzoru sumarycznego (ang. formula, użyj wzoru: C6H6; wśród wyników wyszukiwania wybierz właściwy związek: "benzene").

    Na kolejnej stronie poszukaj odnośnika do widma IR w roztworze (solution) i je obejrzyj. Sprawdź, którego pasma charakterystycznego (lub których pasm) tym razem nie obserwujesz w wykresie absorbancji w stosunku do oglądanego poprzednio widma toluenu ("jakie są różnice w widmach"; wniosków/odpowiedzi na to pytanie nie musisz zapamiętywać ani nigdzie zapisywać...).

    Powstały obraz (widmo IR wyrażone jako zmiana absorbancji benzenu) zapisz pod nazwą abs_benzen.png i prześlij do katalogu Ćwiczenie11 na swoim Dysku Google.

Katalog Ćwiczenie11 na Dysku Google udostępnij prowadzącemu (powinien zawierać 6 plików).