Fraude em e-commerce – Algoritmos

As técnicas praticadas para fraude em sistemas de e-commerce(e em todos os outros) estão em constante evolução. Variam de injeção de código malicioso, passando por técnicas sociais e utilização de dados de cartões de crédito furtados.

As práticas acima se somam ao uso fraudulento de recursos legitimos como é o caso do charge back, que consiste em estornar a operação, retornando o montante movimentado para a conta do cliente devido a disputas relacionadas a autoria da compra, problemas com produtos e entrega. Uma fraude baseada em charge back é uma fraude baseada na falsa alegação de uma dessas ocorrências, como por exemplo, haver recebido o produto mas alegar que não o recebeu para que o valor pago seja estornado e a compra saia de graça.

Técnicas como essas fazem parte de uma lista crescente que aponta para a necessidade da sistematização da análise de crédito. O número de operações realizadas online inviabiliza a validação manual dessas operações.

Assim, chegamos aos sistemas de anti-fraude.

Agora que conhecemos o problema, estamos coletando informações sobre comportamento e operações de checkout e conhecemos algumas das técnicas utilizadas, podemos pensar sobre como desenvolver uma solução.

Em termos de algoritmos eu gostaria de abordar duas opções:

Algoritmos de aprendizado supervisionado
Pertencem a essa classe de algoritmos todos aqueles que se baseiam em cenários de treinamento. Esses cenários representam o comportamento esperado.
Um algoritmo dessa classe infere uma resposta a um input de acordo com sua “base de conhecimento”.

Árvores de decisão, classificadores Bayesianos, redes neutrais utilizando back propagation são algoritmos de aprendizado supervisionado.

Algoritmos de aprendizado não supervisionado.
Esse tipo de algoritmo não se baseia em cenários de treinamento. Eles não recebem feedback e por essa razão são chamados de não supervisionados. Não há alguma fonte externa que informe que estão errados ou certos.
Através da analise de características da fonte de dados eles expõem grupos que são utilizados para tomada de decisão sem qualquer tipo de conhecimento prévio.

Clusterização de dados e alguns tipos de redes neutrais são exemplos de algoritmos não supervisionados.

A decisão entre quais algoritmos utilizar é baseada no tipo de problema.

No caso da análise de risco de fraude, caso você decida por um algoritmos supervisionado você tera de conviver com a possibilidade de novos tipos de fraudes com características que não estão cobertas pelo conjunto de dados de treinamento e que talvez não consigam ser inferidas com a assertividade esperada.
A utilização de algoritmos de aprendizado não supervisionado para lidar com a evolução das técnicas de fraude é o melhor cenários e, de facto, esse é o tipo de algoritmos mais utilizado nessa industria milionária de sistema de anti-fraude.

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s