ESSEX : identificação de um aminoácido de interesse em sequências biológicas de origens diferentes

Quaresma Junior, Wolmer Dias

Abstract:

 
O objetivo desta dissertação é propor uma ferramenta para tratar um problema importante da biologia computacional, que corresponde na localização de um determinado aminoácido em uma sequência biológica para que possa obter algum significado biológico. Obter essa informação muitas vezes é um processo complexo, pois a numeração deste aminoácido na sequência onde o experimento foi realizado não é obrigatoriamente a mesma numeração encontrada para sequências da mesma proteína obtida de diferentes organismos ou diferentes experimentos. A ferramenta desenvolvida apresenta na sua saída as sequências alinhadas e renumeradas, de modo correto e consequentemente apresente a exibição das informações de maneira objetiva, através da representação visual acrescentado com o esquema de cor e a numeração correta para cada aminoácido, fazendo com que o usuário localize com mais clareza o aminoácido de interesse em um processo de alinhamento de sequências biológicas. Essas sequências poderão vir de diferentes experimentos e de diversas espécies. A partir da ferramenta construída podemos destacar diversas vantagens da utilização da ferramenta comparada com as demais ferramentas existentes, dentre elas, é possível destacar a apresentação da régua horizontal enumerando cada aminoácido da sequência com a sequência que foi determinada como referência, após o processo de alinhamento. A régua horizontal é dinâmica e se adéqua de acordo com a sequência que é definida como referência, ajudando o usuário da ferramenta a encontrar de maneira rápida e eficaz o aminoácido de interesse. Nessa mesma perspectiva, a ferramenta utiliza informações representadas por meios de tooltip's, essas informações consistem em posição real que seria a posição original que o aminoácido se encontra na sequência e posição de alinhamento que se refere sobre a posição que o aminoácido se encontra logo após o processo de alinhamento. Por fim, é importante mencionar que a comparação de sequências proteicas é uma ferramenta essencial na procura da existência de relações de semelhança entre todo ou parte dessa sequência. Isso é muito comum quando temos uma sequência desconhecida e queremos identificar associando-a um grupo de proteínas de funções conhecidas, comparando essa sequência com outras de um banco de dados, também servem para a predizer as estruturas secundárias de proteínas ou para outras técnicas computacionais, como o docking e dinâmica molecular.
 
The purpose of this dissertation is to propose a tool to deal with an important problem of computational biology, which corresponds to the location of a certain amino acid in a biological sequence so that it can obtain some biological meaning. Obtaining this information is often a complex process because the numbering of this amino acid in the sequence where the experiment was performed is not necessarily the same numbering found for sequences of the same protein obtained from different organisms or different experiments. The developed tool presents in its output the correctly aligned and renumbered sequences and consequently displays the information in an objective way, through the visual representation added with the color scheme and the correct numbering for each amino acid, causing the user to locate with more clarity the amino acid of interest in a process of biological sequence alignment. These sequences may come from different experiments and from several species. From the built tool we can highlight several advantages of using the tool compared to the other existing tools, among them it is possible to highlight the presentation of the horizontal ruler by enumerating each amino acid of the sequence with the sequence that was determined as reference after the alignment process. The horizontal ruler is dynamic and conforms according to the sequence that is defined as reference, helping the tool user to quickly and effectively find the amino acid of interest. In this same perspective, the tool employs information represented by tooltip's means, this information consists of the actual position that would be the original position that the amino acid is in the sequence and position of alignment that refers to the position that the amino acid is just after the alignment process. Finally, it is important to mention that the comparison of protein sequences is an essential tool in the search for the existence of relations of similarity between all or part of that sequence. This is very common when we have an unknown sequence and we want to identify it by associating it with a group of proteins of known functions, comparing this sequence with others of a database, also serve to predict the secondary structures of proteins or to other computational techniques like the docking and molecular dynamics.
 

Show full item record

 

Files in this item

This item appears in the following Collection(s)

:

  • C3 - Mestrado em Engenharia da Computação