Projects

Bioinformtica Estrutural de Protenas: modelos, algoritmos e aplicaes biotecnolgicas

Este projeto propõe-se enfrentar dois desafios biotecnológicos de grande relevância nacional. O primeiro envolve a ricina, uma potente fitotoxina encontrada na mamoneira. Co-produtos da produção do óleo de mamona podem conter quantidades letais de ricina. Além do risco de intoxicação animal e humana do bagaço, isso tem dificultado sua reutilização e reciclagem, em especial no semiárido nordestino. A ricina preocupa também pelo seu potencial uso como arma química. Portanto, há forte apelo para se encontrar meios efetivos de neutralizar, inibir e/ou detectar a ricina. O segundo envolve a modelagem de celulases multifuncionais, capazes de degradar eficientemente a lignocelulose, composto base para a produção de biocombustíveis de segunda geração, os quais têm por princípio a utilização de subprodutos de plantas que não podem ser usados na alimentação humana. Ambos desafios exigem uma abordagem multidisciplinar sinérgica entre a modelarem teórica in silico e experimental in vitro. Objetivos: 1) Prever in silico e validar in vitro ligantes de ricina 2) Simular in silico e caracterizar in vitro efeitos causados por intervenções estratégicas em beta-glicosidases modificadas. 3) Projetar, implementar e validar modelos, algoritmos e ferramentas de Quimioinformática e Bioinformática Estrutural de Proteínas que permitam dar suporte aos objetivos biotecnológicos previamente descritos. Espera-se que este projeto possa revelar novas plataformas químicas para o desenvolvimento de inibidores, kits de detecção, biossensores, neutralizadores (substratos suicidas) e outros produtos de inovação biotecnológica baseados na ricina, com potencial para alavancar o agronegócio da mamona e a indústria nacional de fármacos. Espera-se também a modelagem de celulases multifuncionais, capazes especialmente de orientar a manipulação genética de algas produtoras de $\beta$-glicosidases, com características catalíticas eficientes e de tolerância à inibição por glicose e celobiose, permitindo seu uso industrial na produção de etanol de segunda geração. Espera-se, em fim, que esses desafios possam inspirar novas metodologias matemáticas, computacionais, químicas e bioquímicas integradas, de modo a gerar artefatos biotecnológicos inovadores, bem como contribuir para a formação de profissionais com perfil multidisciplinar altamente qualificados.

Projeto iniciado no ano 2014.

Responsávies na FURG: Karina S. Machado e Adriano Werhli

Financiador: CAPES Edital Biologia Computacional

Página Oficial do projeto

Simulao e Inferncia de Modelos Mecanicistas de vias biolgicas

Um grande desafio em Biologia Computacional é a modelagem das redes regulatórias através de modelos mecanicistas, ou seja por sistemas de equações diferenciais acopladas. Neste caso o número de parâmetros e a necessidade de conhecimento da estrutura da redes tornam o seu uso proibitivo para a maioria dos casos. Porém, com o avanço de métodos de medição de variáveis biológica e poder computacional alguns modelos mecanicistas de pequenas redes regulatórias são desenvolvidas atualmente com grande sucesso. Nesta proposta estamos especificamente interessados na investigação de métodos estatístico e computacionais para a inferência da estrutura e parâmetros de redes regulatórias modeladas por sistemas de equações diferenciais ordinárias (ODEs).
 
Projeto iniciado no ano 2013.
 
Responsável: Adriano V. Werhli
 
Financiador: CNPq - Edital Universal

Um Framework Para Triagem Virtual

Entre as muitas áreas de pesquisa de Bioinformática, uma das mais importantes é o Desenho Racional de Fármacos (Rational Drug Design - RDD). Os grandes desafios dessa área abrangem o entendimento sobre o comportamento das macromoléculas biológicas receptoras como proteínas e como as mesmas interagem com diferentes pequenas moléculas ou ligantes, uma estratégia bastante difundida chamada de Triagem Virtual (Virtual Screening, VS). VS emprega métodos de docagem molecular para a análise dessa interação receptor-ligante testando in-silico diferentes possíveis inibidores para uma proteína-alvo. Atualmente, cada vez mais, há a necessidade de aproximar os experimentos in-silico dos experimentos in-vitro, tornando as ferramentas computacionais empregadas cada vez mais próximas do que acontece na realidade. Nesse sentido, no processo de RDD é preciso considerar que em condições fisiológicas, as biomoléculas experimentam vários tipos de movimentos e de mudanças conformacionais muitas vezes cruciais para suas funções. Para a execução de um experimento de VS é necessário, além do receptor-alvo (rígido ou flexível), um conjunto de compostos que pode ser obtido de diferentes bases de dados públicas. Entretanto, também é necessária a seleção desses compostos, de forma que nem todos sejam utilizados na triagem virtual para determinado alvo. Além do problema de consideração da flexibilidade dos receptores e da seleção de compostos, em alguns estudos pode acontecer de não se conhecer exatamente o sítio de ligação do alvo, ou seja, não se sabe a melhor região de ligação para realizar o teste com os compostos candidatos a inibidores. Neste caso, é necessário também investigar todo o espaço conformacional do alvo, aumentando a complexidade desse tipo de experimento. Há atualmente diferentes ferramentas de VS, entretanto essas ferramentas executam localmente e os pesquisadores não conseguem facilmente modificar os parâmetros de execução de um experimento de VS nem selecionar um conjunto de conformações do receptor ou um conjunto de ligantes. Propõem-se neste projeto o desenvolvimento de um framework Web para a configuração de experimentos de triagem virtual que sejam apropriados para diferentes objetivos e que permitam que novas funcionalidades sejam adicionadas conforme a necessidade dos pesquisadores.

Projeto iniciado no ano 2013.

Responsável: Karina S. Machado

Financiador: CNPq - Edital Universal

Propostas de Algoritmos Para o Modelo AB e Modelo HP de Dobramento de Protenas

O problema de dobramento de proteínas continua presente como um desafio na área de Bioinformática. Com o objetivo de entender alguns aspectos desse problema, a comunidade científica tem proposto uma série de modelos altamente simplificados, porém não triviais. Exemplos desses modelos simplificados que incorporam características estruturais essenciais e consideram as interações entre os aminoácidos são o Modelo HP e o Modelo AB. Atualmente existem diferentes implementações para a solução do dobramento de proteínas com o uso dos Modelos HP e AB que despendem um longo tempo de execução em máquinas com alto desempenho. Este projeto tem por obtivo propor algoritmos para o dobramento de proteínas com modelos simplificados HP e AB. Esses algoritmos são soluções inspiradas nos algoritmos de estimação de distribuição e em estratégias de aprendizagem de máquina para a busca da solução ótima. Também são propostas alternativas com a utilização de processamento paralelo e métodos formais.

Projeto Iniciado no ano 2012.

Responsável: Karina S. Machado

Inferncia de Estrutura de Redes Biolgicas com a Combinao de Mtricas de Redes Bayesianas

Nos últimos tempos, temos testemunhado o aparecimento de novas técnicas de medição que permitem investigar os sistemas biológicos com uma riqueza de detalhes nunca obtida antes. Dentre estas técnicas, a possibilidade de medição da expressão de milhares de genes ao mesmo tempo fez surgir, dentre muitas outras, a idéia de que poderíamos inferir a estrutura regulatória destes genes, ou seja, como estes genes regulam uns aos outros. De modos a possibilitar esta inferência, levando em consideração os dados obtidos, várias métricas diferentes para atribuir uma pontuação (score) a estas redes foram criadas. Dentre estas métricas duas muito importantes e vastamente exploradas são destacadas: Bayesian Dirichlet e Bayesian Gaussian. Em resumo, estas duas métricas são a solução analítica da integração sobre todo o espaço de parâmetros da equação que fornece a métrica, a qual indica o quanto um modelo é adequado frente aos dados observados. Devido a características intrínsecas de cada uma destas métricas, sabe-se antecipadamente que ambas apresentam vantagens e desvantagens na sua utilização. Até os dias de hoje, quando se infere uma rede regulatória genética escolhe-se somente um destes scores para a classificação dos modelos. Neste projeto apresentamos uma proposta de um novo método para a inferência da estrutura de redes regulatórias utilizando os dois scores de uma maneira combinada. O método proposto é baseado em um modelo probabilista hierárquico Bayesiano e possibilita a integração dos dois scores além de conhecimento a priori sobre a estrutura da rede regulatória em estudo.

Projeto iniciado no ano 2009.

Responsável: Adriano Werhli

Agrupamento de Estruturas de Protenas

Uma forma de tratar os dados biológicos que estão sendo produzidos de forma a gerar informação útil é a aplicação de mineração de dados. Uma das técnicas de mineração de dados mais empregadas é a de Agrupamento, que consiste no processo de agrupar objetos físicos ou abstratos em classes de objetos similares. As trajetórias de simulação por dinâmica molecular (DM) geram uma grande quantidade de estrutura de proteínas, muitas vezes similares, que precisam ser tratadas de forma a reduzir esse espaço conformacional. Sendo assim, este projeto tem por objetivo o estudo e implementação de diferentes algoritmos de agrupamento aplicados aos dados resultantes de uma trajetória de simulação por DM.

Projeto iniciado no ano 2011.

Responsável: Karina S. Machado

Inferncia de Vias Biolgicas a Partir de Dados Ps-genmicos

Ultimamente temos testemunhado um rápido desenvolvimento de diferentes técnicas para a medição de grandes quantidades de dados biológicos. Também, é cada vez mais claro que não são os componentes biológicos isolados, mas sim sua combinação em intrincadas redes, os responsáveis por funções biológicas complexas como, por exemplo, o desenvolvimento e a manutenção da vida. Nesta projeto de pesquisa estamos especificamente interessados na investigação da performance de diferentes técnicas de reconstrução de redes regulatórias biológicas. Em particular, pretendemos propor novos métodos de inferência de Redes Booleanas e compará-los com alguns métodos já existentes: Redes Bayesianas, Redes de Relevância e Modelos Gráficos Gaussianos .
 
Projeto realizado nos anos de 2011 à 2013.
 
Responsável: Adriano V. Werhli

Aplicao de Minerao de Dados em Triagem Virtual Com Receptor Flexvel

Entre as muitas áreas de pesquisa de Bioinformática, uma das mais importantes é o Desenho Racional de Fármacos (Rational Drug Design - RDD), um processo onde os custos e o tempo envolvidos são altos. Os grandes desafios dessa área abrangem o entendimento sobre o comportamento das macromoléculas biológicas receptoras como proteínas e como as mesmas interagem com diferentes pequenas moléculas ou ligantes, uma estratégia bastante difundida chamada de Triagem Virtual (Virtual Screening, VS). VS emprega métodos de docagem molecular para a análise dessa interação receptor-ligante testando in-silico diferentes possíveis inibidores para uma proteína-alvo. Há atualmente inúmeros bancos de dados de possíveis candidatos a inibidores da proteína-alvo de estudo. Um dos Bancos de Dados mais populares é o ZINC, que disponibiliza atualmente mais de 20 milhões de moléculas em um formato apropriado para VS. Entretanto, o grande desafio desse tipo de abordagem é o tempo necessário para executá-lo, uma vez que analisar a interação in-silico de 20 milhões de compostos com cada proteína-alvo tem um alto custo computacional. Sendo assim, neste projeto são estudados métodos de seleção de compostos químicos mais promissores utilizando para isso diferentes técnicas de mineração de dados.

Projeto realizado nos anos de 2012 à 2013.

Responsável: Karina S. Machado

Inferncia de Redes Regulatrias Genticas

A pesquisa sobre a inferência de redes regulatórias sempre despertou muito interesse e esta está renovada principalmente devido as possibilidades de aplicação na área de sistemas biológicos. O surgimento de novas técnicas de medição biológicas produzem dados com diversidade, qualidade e quantidade nunca observados antes. Atualmente a maior necessidade são métodos matemáticos, estatísticos e computacionais que permitam a elucidação dos mecanismos biológicos envolvidos na produção destes dados. Dentre as muitas possibilidades de investigação, a descoberta da estrutura de redes regulatórias genéticas é uma das mais importantes. Vários modelos foram propostos para a inferência destas redes biológicas, por exemplo redes de relevância, modelos gráficos Gaussianos, redes Bayesianas, sistemas de equações diferenciais, entre outros. Cada um destes modelos é apenas uma caricatura da realidade. Alguns destes modelos são mais refinados e necessitam de uma grande quantidade de parâmetros tornando sua aplicação inviável. Outros possuem poucos parâmetros e, portanto, perdem a capacidade de reproduzir detalhes importantes das redes regulatórias. Neste projeto propomos a comparação entre os diverstos métodos e também a viabilidade da inferência de redes Booleanas probabilísticas com o método Approximate Bayesian Computation.

Responsável: Adriano Werhli

Workflow Cientfico para a Execuo de Dinmica Molecular

Descrição: O comportamento das macromoléculas biológicas pode ser modelado por programas de simulação por dinâmica molecular (DM) como o pacote GROMACS. Esse pacote de código e acesso livre, é utilizado para a execução de DM, gerando um conjunto de diferentes estruturas ao longo do tempo, chamada de trajetória dinâmica. Este projeto tem por objetivo a instalação e utilização do pacote GROMACS para a execução de simulações por DM em ambiente Linux e o desenvolvimento de um workflow científico para automatização desse processo, incluindo a etapa de aplicação de mineração de dados nessa grande quantidade de dados gerada. Esse estudo será realizado tendo como alvo uma importante proteína do Mycobacterium Tuberculosis.

Projeto realizado nos anos de 2011 à 2014.

Responsável: Karina S. Machado


2010 - 2017 -- Desenvolvido pelo Centro de Ciências Computacionais - C3