Otimizando a prevenção de fraudes através do algoritmo Naive Bayes

Hoje em dia, é comum usar o “machine learning” para detectar fraudes on-line. Na verdade, o aprendizado de máquinas está em toda parte. Devido à sua natureza independente e mecânica que busca mimetizar a inteligência humana, alguns algoritmos para o “machine learning”, podem parecer às vezes uma “caixa preta”. Mas a verdade é que a aprendizagem automática não precisa ser assim. Existem abordagens específicas que têm conquistado cada vez mais espaço devido à possibilidade de melhor controlar os parâmetros de aprendizado.

A que merece maior destaque, é o método estatístico conhecido como classificador “Naive Bayes” – uma ferramenta de classificação probabilística supervisionada. Este algoritmo, alavancado em tecnologias de autenticação baseadas na análise de risco – oferece uma construção e pontuação de modelos rápidos e altamente escalonáveis. Os classificadores bayesianos geralmente são mais rápidos para aprender novos padrões de fraude em conjuntos de dados menores. Sua principal vantagem está em permitir adições de novos preditores, o que é crucial em um mundo onde as estratégias de fraude estão em constante mudança.

Esta característica não está presente em sistemas baseados em Redes Neurais Artificiais (ANNs), e suas derivadas Redes Neurais Profundas (Deep Neural Nets). Por outro lado, elas são muito superiores a outros algoritmos em aplicações de reconhecimento de imagem ou fala. Mas não é esse o caso quando tratamos de prevenção de fraudes. Há muitos exemplos em que ANN pode produzir resultados inferiores em relação a outras técnicas de classificação, especialmente se quando o tamanho da amostra de dados de aprendizado é relativamente pequeno e específico. A ANN é às vezes referida como “a segunda melhor maneira de resolver qualquer problema”, enquanto a melhor maneira é realmente entender os diferentes parâmetros do problema que você está tentando resolver e, em seguida, implementar um modelo que se assemelhe bastante à realidade.

Com a abordagem bayesiana, a característica “genérica” da ANN/DNN dá lugar a um modelo onde os parâmetros que contribuem para o resultado final podem ser visíveis (não uma “caixa preta”), inclusive através de aplicativos de gerenciamento.

Basear-se em inteligência artificial não significa necessariamente a vida no escuro ou perder o controle sobre o que seu sistema está fazendo. Quando você tem um algoritmo de aprendizagem de máquina robusto que se adapta às mudanças e aos dados parciais, é flexível para adições constantes e possui uma qualidade única pela qual as previsões são fáceis de interpretar, então os principais resultados de detecção de fraude podem coexistir com a transparência e uma compreensão clara do sistema.

Para ser verdadeiramente bem-sucedido, o algoritmo precisa ter a sinergia do conhecimento dos gestores de administração e TI. No pragmatismo do combate à fraude, isso faz muita diferença.