Mês de muitas defesas de doutorado de professores do Instituto Federal: agora foi a vez do Prof. Rafael Garcia Leonel Miani, que defendeu tese na UFSCar
Projeto utiliza a base de conhecimento do NELL
Dezembro foi marcado por várias defesas de doutorado no Instituto Federal – Câmpus Votuporanga. No último dia 20 de dezembro, foi a vez do Prof. Rafael Garcia Leonel Miani defender, na Universidade Federal de São Carlos, sua tese de doutorado “Regras de Associação e Correlação Temporal para Popular e Detectar Inconsistências em Grandes Bases de Conhecimento”, sob a orientação do Prof. Dr. Estevam Rafael Hruschka Junior. Ao lado do orientador, a banca foi composta pela Profa. Dra. Matilde Terezinha Prado dos Santos (UFSCar); pela Profa. Dra. Heloísa Arruda (UFSCar); pela Profa. Dra. Ana Carolina Lorena (UNIFESP); e pelo Prof. Dr. Alexandre Evsukoff(UFRJ).
O trabalho tem o foco de auxiliar a popular grandes bases de conhecimento e detectar possíveis inconsistências existentes nelas. Para isso, foi utilizada a técnica de mineração de regras de associação e correlação temporal. O projeto utiliza a base de conhecimento do NELL. Esse é um sistema desenvolvido pela CMU (Carnegie MellonUniversity - USA), que possui o intuito de criar um sistema de autoaprendizado, procurando e validando, automaticamente, os dados que foram aprendidos na web.
De acordo com o Prof. e agora Dr. Rafael Miani, “sistemas como o NELL, que possuem o intuito de fazer com que o computador aprenda sozinho, sendo capaz de diferenciar o correto e incorreto, são muito explorados atualmente. Fazer parte e poder contribuir com isso é motivo de orgulho e satisfação profissional”, afirmou.
Sobre ter feito parte do Programa de Capacitação e Qualificação do Instituto Federal de Educação, Ciência e Tecnologia de São Paulo, Prof. Miani explicou que “o afastamento proporcionado pelo IFSP para a capacitação do docente é muito importante para o desenvolvimento de uma pesquisa com maior qualidade”.
RESUMO COMPLETO
Grandes bases de conhecimento crescente têm sido um interessante campo em muitas pesquisas nos últimos anos. A maioria das técnicas foca na construção de algoritmos para auxiliar a Base de Conhecimento (BC) a expandir automaticamente (ou semiautomaticamente). Entretanto, muitas ferramentas utilizadas para expandir as BCs podem extrair dados incompletos ou incorretos, tornando a base inconsistente. Dessa forma, este trabalho possui o objetivo de expandir as grandes bases de conhecimento e detectar inconsistências nas mesmas. Para tal, são utilizadas a mineração de regras de associação e a correlação temporal. Ao aplicar um algoritmo de extração de regras de associação em grandes bases de conhecimento, é necessário considerar o problema de valores ausentes, uma vez que elas crescem diariamente, não possuindo todos os dados. Logo, foi criado um novo parâmetro para realizar o cálculo do suporte, denominado MSC, para trabalhar com valores ausentes. Além disso, um grande problema ao utilizar regras de associação é o esforço gasto ao avaliar cada regra extraída. Dessa forma, o presente trabalho desenvolveu o componente ER, o qual elimina regras de associação redundantes e irrelevantes. Cada regra válida é utilizada pelo componente TARE com o objetivo de detectar inconsistências. TARE introduz o conceito de STARs (regras de associação temporais específicas), as quais são utilizadas para detectar possíveis inconsistências. Cada STAR considerada relevante é utilizada como entrada para o componente TCI com o intuito de obter correlações temporais para (i) detectar possíveis inconsistências e (ii) auxiliar a popular a BC. Experimentos realizados demonstraram que as regras de associação e a correlação temporal são capazes de expandir a base de conhecimento, diminuindo a quantidade de valores ausentes. Além disso, ambos os componentes TARE e TCI foram eficientes no processo para detectar possíveis inconsistências na base de dados. Por fim, o componente ER reduziu em mais de 30\% o número de regras sem perda no processo de popular a BC.
registrado em:
Notícias
Redes Sociais