Ανάπτυξη υπολογιστικής μεθοδολογίας εξόρυξης, ανάλυσης και παρουσίασης δεδομένων πρωτεωμικής καρκινικών δειγμάτων

Τα πεπτίδια, είτε ως πρωτεϊνικά θραύσματα είτε ως φυσικές οντότητες, χαρακτηρίζονται από την ακολουθία τους και από τα λειτουργικά τους χαρακτηριστικά. Ο σκοπός αυτής της Διδακτορικής Διατριβής είναι η ανάπτυξη μιας μεθοδολογίας εξόρυξης δεδομένων για μοναδικά tags και πεπτιδικά/πρωτεϊνικά χαρακτηρι...

Full description

Bibliographic Details
Main Author: Αλεξανδρίδου, Αναστασία
Other Authors: Νικήτα, Κωνσταντίνα
Language:gr
Published: 2012
Subjects:
PHP
Online Access:http://hdl.handle.net/10889/5453
Description
Summary:Τα πεπτίδια, είτε ως πρωτεϊνικά θραύσματα είτε ως φυσικές οντότητες, χαρακτηρίζονται από την ακολουθία τους και από τα λειτουργικά τους χαρακτηριστικά. Ο σκοπός αυτής της Διδακτορικής Διατριβής είναι η ανάπτυξη μιας μεθοδολογίας εξόρυξης δεδομένων για μοναδικά tags και πεπτιδικά/πρωτεϊνικά χαρακτηριστικά του ανθρώπινου πρωτεώματος καθώς επίσης η ανάλυση και η εφαρμογή αυτών των βιολογικών δεδομένων σε πρωτεϊνες που σχετίζονται με τον καρκίνο. Δημιουργήθηκε μια αποθήκη αρχείων η οποία περιέχει μοριακά βάρη με ακρίβεια 0.01 Da που συνδέονται με τις αντίστοιχες πεπτιδικές ακολουθίες ανθρώπινων πρωτεϊνών της Swiss-Prot βάσης. Αυτές οι πρωτεϊνες διασπάστηκαν εξαντλητικά παρέχοντας ανεξαρτησία στις πεπτιδικές ακολουθίες από άλλες μεθόδους που βασίζονται στην ενζυματική διάσπαση. Από αυτήν την αποθήκη δεδομένων, διαχωρίστηκαν τα μοριακά βάρη που είναι μοναδικά και φτάνουν μέχρι τα 10 kDa καθώς και οι μοναδικές πεπτιδικές ακολουθίες (μέχρι 10 kDa). Στα πλαίσια της αξιοποίησης των δεδομένων εξόρυξης για την ταυτοποίηση των πρωτεϊνών, αναπτύχθηκε μια ευρέως διαθέσιμη διαδικτυακή εφαρμογή όπου γίνεται η αντιστοίχιση των μοριακών βαρών υψηλής ανάλυσης με πεπτίδια και πρωτεϊνες. Μια ακόμη διαδικτυακή εφαρμογή αναπτύχθηκε για να προσφέρει την πληροφορία της μοναδικότητας των μοριακών βαρών και των πεπτιδικών ακολουθιών στο ανθρώπινο πρωτέωμα. Η εφαρμογή μπορεί να αναζητήσει μοναδικά πρωτεϊνικά θραύσματα που προκύπτουν από την εζυματική διάσπαση πρωτεϊνών και να προσφέρει την πληροφορία για όλα τα μοναδικά μοριακά βάρη και τις μοναδικές πεπτιδικές ακολουθίες που περιέχονται σε μια πρωτεϊνη. Πολλές φορές χρειάζεται η μαζική διαχείριση των πεπτιδίων από λίστες. Για το σκοπό αυτό, αναπτύχθηκε ένας web server ο οποίος διαχειρίζεται τις πεπτιδικές λίστες, αναλύοντας τα χαρακτηριστικά των πεπτιδίων και ομαδοποιώντας τα πεπτίδια σύμφωνα μα αυτά τα χαρακτηριστικά, ενώ οπτικοποιείται η ομαδοποίηση με την χρήση ενός java applet. Το PepServe είναι ένα χρήσιμο εργαλείο για την κατανόηση της κατανομής των πεπτιδικών χαρακτηριστικών για ένα σύνολο πεπτιδίων. Τέλος, αναλύθηκαν σύνολα πρωτεϊνών που σχετίζονται με διάφορες περιπτώσεις καρκίνων, για πεπτιδικά χαρακτηριστικά. Αυτή η ανάλυση έχει σκοπό την εύρεση πιθανών προτιμήσεων σε χαρακτηριστικά και την εύρεση μοναδικών tags των πρωτεϊνών που σχετίζονται με καρκίνους. Τα μοναδικά tags μπορούν να χρησιμοποιηθούν στην ανακάλυψη βιοδεικτών και την ανάπτυξη νεων φαρμάκων για την πιο αποτελεσματική διάγνωση και θεραπεία. === Peptides, either as protein fragments or as naturally occurring entities are characterized by their sequence and function features. The purpose of the present Ph.D. thesis is to develop a datamining method for unique tags and peptide/protein characteristics in the human proteome and to analyze and apply the derived biological data in cancer-related proteins. A file repository has been created, containing indexed information that relates molecular masses with an accuracy of 0.01 Da to the corresponding peptides existing in human proteins. These proteins have been deposited in a completely digested protein database (Swiss-Prot) providing independence from any specific enzyme/digestion method. From this repository, the unique molecular masses, ranging from 1 to 10 kDa, and the unique peptide sequences from all the possible sequence fragments (up to 10 kDa) have been mined. A publicly available web application has been developed which facilitates a high resolution mapping of measured molecular masses to peptides and proteins, irrespectively of the enzyme/digestion method used. Μulti-filtering may be applied in terms of measured mass tolerance, molecular mass and isoelectric point range as well as pattern matching to refine the results In addition, another publicly available web application has been developed that offers information concerning the uniqueness of molecular masses and peptide sequences in the human proteome. The application is able to search for unique protein fragments derived computationally from enzymatic digestion driven by certain enzymes. Furthermore, the application can list all the unique masses and peptides of a given protein. Through this application, researchers are able to find unique tags, either on a molecular mass level or on a sequence level. A web server has beed developed that manages peptide lists in terms of feature analysis as well as interactive clustering and visualization of the given peptides. PepServe is a useful tool towards understanding peptide feature distribution among a group of peptides. Finally, cancer-related proteins have been analyzed producing peptide features and peptide feature’s sequence uniqueness resulting in some feature preferences and peptide unique tags. These unique tags can be used in biomarker discovery, and novel drug development for an efficient diagnosis and treatment.