Minerva

Menu Principal

Disciplinas

Links

Search

Google



Web This Site 

Projetos de Pesquisa


Conhecimento contínuo de grandes bases de dados textuais
O NELL (Never Ending Learning Language) é um sistema de aprendizado de máquina semântico, programado para identificar um conjunto básico de relações semânticas fundamentais entre algumas centenas de categorias pré-definidas de dados, como cidades, empresas, emoções e equipes esportivas Essa capacidade de aprendizado contínuo é facilitado por ferramentas para identificação de conceitos relacionados a um conhecimento comum em textos de diferentes conteúdos. Neste projeto, estas ferramentas estão sendo usadas, particularmente, em textos na língua portuguesa, relacionados a assuntos, pessoas ou fatos.
Com isso, estão sendo desenvolvidos dois trabalhos, sendo um de fim de curso e um de iniciação científica, utilizando ferramentas de aprendizado de máquina aplicáveis a tarefas de detectar e decifrar padrões e correlações, conforme o raciocínio humano, em textos escritos em português.
Projeto orientado pelo prof. Estevam Rafael Hruschka Junior (UFSCar) em 01/08/2017.

Word2vec


Geração de dados sintéticos para testes de rotinas de record linkage no contexto brasileiro
As bases de dados populacionais brasileiras não trazem um identificador único, fazendo com que a vinculação de bases seja realizada empregando a comparação de identificadores pessoais como nomes, datas de nascimento e outros atributos. Esses identificadores servem como dados de entrada para que algoritmos de record linkage gerem um escore que indica se dois registros de bases diferentes pertencem à mesma entidade.
Visando garantir a privacidade dos indivíduos, o acesso a bases com identificadores pessoais é permitida somente em casos especiais, devendo a mesma ser realizada em ambientes seguros, o que restringe o uso de dados reais para a avaliação da qualidade dos algoritmos de linkage.
Este projeto tem como primeiro objetivo o desenvolvimento de algoritmos de geração de dados sintéticos, a partir da distribuição de frequência de nomes de bases de dados reais. A continuidade do projeto será dedicada a avaliação e testes de algoritmos de record linkage, utilizando técnicas de aprendizado de máquina, identificando níveis de similaridades entre os atributos gerados.
Projeto certificado no CNPq pela prof. Claudia Medina Coeli (IESC/UFRJ) em 08/10/2016.
Projeto de Iniciação Científica (em andamento) - Bacharelado em Ciência da Computação: Vitor Trentin Curiel Corral. Trabalho apresentado na JIC 2017 e artigo "Synthetic data generator for testing record linkage routines in Brazil.", apresentado em IPDLN Conference: Linking Data - Improving Lives, Banff, Alberta - Canadá - 2018.

RecLink2


PORLIBRAS: Fundamentos para a implementação de ferramentas computacionais voltadas para o desenvolvimento de um sistema bilíngue de tradução automática Português-LIBRAS
Este projeto tem como objetivo geral o desenvolvimento de processos, metodologias e instrumentos para a implementação de um ambiente computacional com vistas a dar suporte à implementação futura de um Tradutor Bilíngue Automático Português – Libras – Português, com base em princípios pedagógicos, linguísticos teóricos e de processamento da linguagem natural, para uso no processo de ensino e aprendizagem de estudantes surdos.
O trabalho a ser desenvolvido em parceria com o DCC tem como objetivo a classificação dos termos de corpora em português visando o reconhecimento de figuras sintáticas que poderão ser aplicadas posteriormente na construção de sentenças que atendam às categorias linguísticas adotadas para LIBRAS. O resultado obtido será a organização dos termos de acordo com sua classificação sintática, o que permite a definição da estrutura das sentenças existentes nos documentos em língua portuguesa, a qual irá facilitar a aplicação de métodos de organização linguística e a transcrição dos termos categorizados sintaticamente para a língua de sinais.
Algumas referências importantes podem ser encontradas aqui.
Projeto aprovado pelo CNPq e coordenado pelo prof. Jorge Bidarra (UNIOESTE) em 2016.

PorLibras


Abordagem Big Data no gerenciamento de ambientes aquáticos
Cada vez mais, os desafios apresentados pelas complexidades dos problemas levam à busca de novos métodos, ferramentas e técnicas para a prospecção de tecnologia e inovação e para a avaliação dos impactos gerados. Este projeto visa ao desenvolvimento de metodologias computacionais para a análise e visualização de grandes massas de dados heterogêneos, a fim de definir o estado trófico de ecossistemas aquáticos e seu nível de qualidade em tempo hábil para a tomada de decisão no âmbito do gerenciamento da zona costeira. 
Projeto certificado no CNPq pelo prof. Nelson Francisco Favilla Ebecken (COPPE/UFRJ) em 23/10/2013.
Trabalho de Conclusão de Curso - Bacharelado em Ciência da Computação: Daniele Peçanha, Jonathan Porto e Matheus Henrique Galvez. Classificação de Fitoplânctons em Ambientes Aquáticos da Costa do Estado do Rio de Janeiro. 2016.
Situação: Finalizado em 2017

Cytoboy


 Última Atualização: 24 de Outubro de 2018

© 2011-2018 Valeria M. Bastos Valid CSS & XHTML. Template design by Arcsin.