Extremamente úteis para resolver problemas de diversas áreas do conhecimento, como Engenharia, Medicina, Física e Humanidades, as técnicas de Inteligência Computacional (IC) se propagam por meio dos algoritmos evolutivos, base da Computação Evolutiva (CE) inspirada na Teoria da Evolução de Charles Darwin. Esse ramo de pesquisa trabalha com a melhoria genética de indivíduos artificiais, que seriam as representações para soluções de determinado problema no processamento de diversos tipos de dados.
Os indivíduos em questão – que compõem um grupo ou população – podem ser números, sistemas ou textos, que, quando combinados ou cruzados, assim como na Biologia, geram um terceiro indivíduo que será uma solução possivelmente melhor que os dois primeiros que lhe originaram. Dessa forma, os descendentes substituem aqueles que lhe originaram em um determinado processo. Na CE, essa combinação é feita de forma aleatória. Não se sabe exatamente como os dois indivíduos devem ser combinados para que o terceiro resultante seja melhor e a solução adequada seja encontrada.
Para Vinícius Veloso de Melo, docente do Instituto de Ciência e Tecnologia (ICT/Unifesp) – Campus São José dos Campos, a CE é eficaz, mas como funciona como um processo de apenas tentativa e erro, demanda tempo e, em áreas da Engenharia de Produção, por exemplo, um custo de gasto elevado. Após ter pesquisado técnicas de Estatística e de IC para aumento de eficiência de técnicas de CE em seu doutorado, Melo criou a Programação Kaizen (PK), um modelo alternativo à CE, que tem como finalidade fazer com que as soluções para os problemas sejam encontradas com mais assertividade e em um menor período de tempo. A principal tarefa da PK é a descoberta automática de conhecimento implícito nos dados para a aplicação em Aprendizado de Máquina (AM). Assim, as técnicas de AM para previsão numérica ou categórica podem utilizar o conhecimento descoberto pela PK e atingir melhor qualidade na previsão.
“A ideia da técnica proposta é que se consiga avaliar uma solução e extrair o máximo possível de informação para que, na próxima modificação, se tenha uma maior garantia de melhoria. Busca-se identificar, de maneira eficiente, quais partes das soluções estão incorretas ou precisam de melhorias e quais devem ser substituídas, em vez de ser um processo totalmente aleatório”, afirma o pesquisador.
Kaizen é uma palavra de origem japonesa que significa mudança para o melhor ou melhoria e refere-se a uma filosofia de aperfeiçoamento aplicado à gestão, processos de manufatura, engenharia, dentre outras áreas. Esse conceito, que se reflete na aplicação da PK no processamento dos dados, tem como objetivo reduzir a aleatoriedade do processo de busca por soluções de alta qualidade, viabilizando uma melhoria em sua eficiência. Nesse sentido, a PK utiliza técnicas de Estatística e de AM para identificar as partes relevantes da solução e guiar o processo.
“Enquanto na CE um indivíduo da população é a solução para um problema, na PK ele é parte da solução. Assim, na CE só é preciso um indivíduo para resolver o problema. A PK, por outro lado, usa um processo colaborativo em que as soluções parciais são combinadas de maneira determinística e eficiente, em vez de aleatória, para se obter uma solução completa para o problema. Justamente por serem parciais, pode-se identificar quais delas estão funcionando bem ou mal, influenciando de maneira positiva ou negativa. Aquilo que for negativo ao processo é retirado”, explica Melo. Depois de encontrar as soluções parciais mais adequadas para o problema em questão, a técnica as combina para obter uma resolução definitiva. Essas soluções parciais são então fornecidas à técnica de AM que é responsável por resolver o problema.
Áreas de aplicação
A PK pode ser aplicada em diversas áreas do conhecimento com a finalidade de construir um modelo matemático, um conjunto de regras ou outro tipo de estrutura que forneça respostas para problemas como a previsão do clima do próximo dia em um horário específico. A partir de um conjunto de valores históricos (grupos de dados), que neste caso seria a temperatura dos dias anteriores naquele mesmo horário, velocidade do vento e umidade do ar, dentre outros, é possível construir uma equação que combine as informações do passado para fazer a previsão. Esse tipo de modelo matemático também pode ser obtido pela CE tradicional, mas não com a mesma garantia e rapidez que a PK proporciona.
“Ela fornece um conjunto de expressões matemáticas que pode ser interpretado por especialistas. Com a PK, a modelagem de diversos tipos de processos ou comportamentos pode ser feita. Em Ciências Sociais, por exemplo, é possível fazer uma regressão para saber o crescimento da taxa de desemprego a partir de diversas variáveis, buscando relacionamentos entre elas em vez de olhá-las de maneira independente. Na área da Biologia, pode-se descobrir uma função de crescimento da população de um determinado organismo ou saber a extensão da transmissão de um vírus”, exemplifica o docente.
Um artigo apresentado no XXV Congresso Brasileiro de Engenharia Biomédica, em 2016, intitulado Construção Automática de Covariáveis para Modelos de Regressão Aplicados em Estimativa Antropométrica, de autoria de Melo, em conjunto com outros pesquisadores, mostrou a aplicação da PK em pesquisa da área forense. Nesse estudo, a partir das medidas das mãos se tornou possível obter a previsão da estatura de uma pessoa, processo que pode ser utilizado para ajudar na identificação de corpos de indivíduos. Felipe Granado, orientando, no Mestrado, de Maria Elizete Kunkel, também docente do ICT/Unifesp, criou um banco de dados com informações com medidas de cada um dos dedos e da palma das mãos de centenas de pessoas e, a partir destas características, a PK gerou uma fórmula que prevê a altura de uma pessoa com uma estimativa numérica.
O pesquisador Vinícius Veloso de Melo
Saúde
Além da previsão numérica, a PK pode ainda prever por categoria e descobrir índices que podem ser aplicados na Medicina. “Por exemplo, um paciente tem uma mancha na pele e é possível extrair informações como medidas, simetria, variação de cor e outras características que seriam determinadas por um especialista da área, o qual também deve rotular essas manchas. Pode-se gerar um banco de dados com essas informações e a partir da PK determinar uma fórmula matemática (um índice) que pode ser usado para classificar as manchas como um melanoma benigno ou maligno. É uma previsão categórica como verdadeiro ou falso”, desenvolve Melo.
O docente orientou o trabalho de conclusão de curso (TCC) do estudante Léo Françoso Dal Piccol Sotto, no ICT/Unifesp, no qual a PK foi usada para identificar, com sucesso, diferentes tipos de arritmias cardíacas a partir de um conjunto de dados de medidas obtidas de sinais de eletrocardiogramas, o que demonstrou a eficácia da PK. O que ainda precisa ser feito por um especialista é a análise e interpretação biológica dos índices descobertos pela PK.
Os índices podem ser criados, por exemplo, a partir de um conjunto de dados extraídos de um hemograma, como valores de colesterol, triglicérides ou glicemia, entre outros. A PK pode criar uma fórmula que define se uma pessoa tem determinada doença ou não. “Podem ser valores mínimos e máximos, por exemplo. Acima desse índice quer dizer que a pessoa está propensa a ter a doença, abaixo não. Esses índices costumam ser elaborados manualmente por um especialista ou pesquisador. Com uma ferramenta como a PK, esse processo é automatizado. Vamos supor: Quantos índices um especialista consegue propor e analisar por hora? Digamos que seja um a cada 10 minutos, 6 por hora. Com uma técnica desse tipo, podemos fazer milhares por hora. Se tivermos computadores suficientes, poderemos fazer milhões. É um ganho para a área da saúde”, ressalta o pesquisador.
Artigos relacionados:
MELO, Vinícius Veloso de. Breast cancer detection with logistic regression improved by features constructed by Kaizen programming in a hybrid approach. In: IEEE CONGRESS ON EVOLUTIONARY COMPUTATION, 2016, Vancouver. Proceedings... Vancouver: IEEE, 2016. p. 16–23. Disponível em: < http://ieeexplore.ieee.org/document/7743773/ >. Acesso em: 12 abr. 2017.
MELO, Vinícus Veloso de et al. Construção automática de covariáveis para modelos de regressão aplicados em estimativa antropométrica. In: CONGRESSO BRASILEIRO DE ENGENHARIA BIOMÉDICA, 25., 2016, Foz do Iguaçu. Anais eletrônicos… Foz do Iguaçu:CBEB, 2016. p. 2201–2204. Disponível em: < https://drive.google.com/drive/folders/0B543adcG1FClQ21ZaFhCUmdwMlk >. Acesso em: 12 abr. 2017.
SOTTO, Léo F. D. P.; COELHO, Regina C.; MELO, Vinícius Veloso de. Classification of cardiac arrhythmia by random forests with features constructed by Kaizen programming with linear genetic programming. In: GENETIC AND EVOLUTIONARY COMPUTATION CONFERENCE, 2016, Denver. Proceedings... Denver:GECCO, 2016. p. 813–820. Disponível em: < http://dl.acm.org/citation.cfm?id=2908882 >. Acesso em: 12 abr. 2017.
Dissertação:
GRANADO, Felipe. Criação de uma base de dados de mãos e estaturas para geração de modelos de regressão em antropometria forense. 2014. Dissertação (Mestrado em Engenharia Biomédica) - Universidade Federal do ABC, Santo André, 2014.