Amy Sariego

Aprendizado de Máquina ou Regras? Um dilema central na detecção de fraudes em tempo real

Publicado

Publicado

October 1, 2021

October 1, 2021

Tempo de leitura:

Tempo de leitura:

Tempo de leitura: 8 min

Tempo de leitura: 8 min

Amy Sariego
Conteúdos

Compartilhe este artigo

Inscreva-se para atualizações por e-mail

Mantenha-se informado e conheça as últimas tendências em fraudes, crédito e riscos de conformidade.

Inscreva-se para atualizações por e-mail

Mantenha-se informado e conheça as últimas tendências em fraudes, crédito e riscos de conformidade.

Inscreva-se para atualizações por e-mail

Mantenha-se informado e conheça as últimas tendências em fraudes, crédito e riscos de conformidade.

Inscreva-se para atualizações por e-mail

Mantenha-se informado e conheça as últimas tendências em fraudes, crédito e riscos de conformidade.

As perdas totais por fraude em 2020 totalizaram 56 bilhões de USD e as empresas dos EUA perderão em média 5% da receita bruta para fraudes, tornando a mitigação de fraudes uma área central de foco em negócios de todos os tipos. Ao mesmo tempo, detectar fraudes em tempo real é uma proposta difícil, causando perdas monetárias substancialmente altas devido à detecção tardia de comportamentos fraudulentos. Mais de 50% das organizações afirmaram em uma pesquisa que recuperam menos de 25% das perdas por fraudes. Além das perdas monetárias, a detecção tardia de fraudes causa danos irreparáveis à equidade da marca e à confiança do usuário. Usuários de serviços online estão em maior risco de privacidade na forma de exposição de dados pessoais, apropriação de contas para fraudes ou perdas monetárias, tornando a detecção de fraudes crucial para a confiança e segurança geral.

Bancos, varejo, companhias de seguros, produtos comunitários online e marketplaces precisam de ferramentas e técnicas tanto para detectar fraudes e abusos em tempo real quanto para tomar medidas de mitigação adequadas no momento, em vez de quando for tarde demais. Padrões adversários em rápida evolução tornam a detecção precoce de fraudes particularmente desafiadora. Isso é agravado pela falta de ferramentas para detectar esses padrões em tempo real através de regras ou modelos de Machine Learning (ML), mas Oscilar pode mudar isso!

Decisões instantâneas de fraude, alimentadas por uma combinação de Machine Learning e regras, são o futuro da mitigação de fraudes.

Detecção de fraudes em tempo real: Regras ou Machine Learning?

Até recentemente, a abordagem principal para prevenção de fraudes era centrada na detecção de fraudes baseada em regras definidas por humanos, acoplada a uma revisão manual de transações possivelmente fraudulentas. Embora a revisão humana de transações fraudulentas possa levar a menos falsos positivos, infelizmente deixa uma janela de oportunidade para técnicas adversárias avançadas e de rápida evolução, levando a danos financeiros e de reputação substanciais. Portanto, a mitigação eficaz de fraudes requer habilidade de decisão precisa e instantânea com baixos falsos positivos. A decisão instantânea de fraudes envolve a ingestão de centenas de sinais, alguns da transação em curso e alguns da análise histórica, para decidir o curso de ação apropriado para a transação, conforme ela acontece.

Por que uma abordagem puramente baseada em regras é insuficiente?

Historicamente, a mitigação de fraudes se concentrou principalmente em heurísticas definidas usando regras que, quando satisfeitas, acionam a ação correspondente. Em uma abordagem baseada em regras, você marca um ponto de dados como anômalo se ele exceder um limite pré-definido, definido por humanos. Esta abordagem requer um conhecimento significativo do domínio dos dados entrantes e pode se tornar menos eficaz com mudanças nos sinais de fraude subjacentes.

À medida que novos padrões adversários emergem, a decisão deve evoluir instantaneamente para enfrentá-los. Regras se adaptam facilmente a mudanças, tornando-as adequadas para mitigar novos padrões adversários. No entanto, conforme os padrões adversários se adaptam a limiares definidos por humanos, as regras e os limites correspondentes devem se adaptar rapidamente. Isso exige ajuste de regras com base em análises contínuas de regras, bem como o uso de Machine Learning.

Ajustar regras baseadas em heurísticas pode funcionar bem para abordar certos sinais de alta confiança, mas pode falhar em discernir novos padrões multidimensionais.

Por exemplo, o endereço de cobrança usado em uma transação de cartão de crédito ser diferente do endereço de cobrança do cartão é um sinal de alta confiança para risco aumentado da transação. Mas uma combinação de discernir tendências através de vários sinais de transações financeiras com base em padrões históricos, como valor da transação, tendências de transações anteriores, localização GPS da transação, tempo da transação, histórico da conta do comerciante, etc., limita rapidamente a eficácia das regras impulsionadas por insights humanos.

Por que uma abordagem puramente de Machine Learning é insuficiente?

Machine Learning é eficaz em derivar previsões de uma ampla variedade de sinais históricos, mas não é fundamentalmente ágil para responder a padrões adversários em rápida evolução no momento. Além disso, uma abordagem puramente de Machine Learning para detecção de fraudes e abusos requer uma experiência substancial que pode não se escalar bem se aplicada em todos os lugares. Por exemplo, modelos de ML podem operar com alta recall e taxas de falsos positivos relativamente mais altas, mas podem ser ajustados para ter uma taxa de falsos positivos mais baixa e um recall mais baixo.

Encontrar o ponto de operação certo na curva ROC é necessário para encontrar o equilíbrio apropriado entre taxa de falsos positivos e recall.

Modelos de Machine Learning também são substancialmente menos explicáveis comparados a regras, limitando o conjunto de pessoas que podem efetivamente ajustar o modelo.

É sobre a complexidade da lógica de decisão e a taxa de mudança

Código de aplicação é o ponto de partida para regras leves, que são simples e não mudam frequentemente, mas também é menos acessível para a maioria das equipes de risco devido à exigência de escrever código. À medida que o grau de complexidade e a taxa de mudança aumentam, o código de aplicação não é mais adequado para lógica de negócios. Um motor de regras é adequado para lógica que muda frequentemente, mas é menos eficaz na tomada de decisões à medida que a lógica aumenta em complexidade. Machine Learning é melhor para sintetizar relações complexas entre centenas de pontos de dados em uma pontuação de probabilidade quando a taxa de mudança em padrões de fraude é relativamente baixa. Enquanto a complexidade da decisão, bem como a taxa de mudança das decisões aumentam, um motor de decisão que integra tanto Machine Learning quanto regras oferece o melhor ajuste para decisões holísticas e instantâneas.

Machine Learning vs Regras: O ajuste

Machine Learning vs Regras: O Ajuste

Além da complexidade e da taxa de mudança, outros vetores para avaliar o ajuste de regras versus aprendizado de máquina giram em torno da explicabilidade, precisão da saída, origem da lógica.

Regras vs Machine Learning: O Ajuste

Mitigação eficaz de fraudes requer tanto ML quanto regras

A decisão de risco em tempo real precisa e usando uma combinação apropriada de Machine Learning e regras é uma jornada. Esta evolução começa substituindo um subconjunto de regras existentes por modelos de ML, seguido pelo suporte às pontuações de risco dos modelos de ML com regras e, finalmente, aplicando vários modelos de ML—alguns internos e outros externos—na decisão final.

Esta evolução é caracterizada pelos seguintes 3 passos na jornada.

Passo 1: Substituir um subconjunto de regras por novos modelos de Machine Learning

O primeiro passo na aplicação de Machine Learning à decisão de risco é substituir um subconjunto de regras por um modelo de ML para facilitar a manutenção e aumentar o recall.

Passo 1Substituir um subconjunto de regras bem ajustadas usando Machine Learning


Com o tempo, organizações de risco acumulam um grande número de regras com limites ajustados manualmente. Isso não só é menos sustentável, mas também complicado para o processo de ajuste acompanhar a evolução dos padrões de fraude. Para fazer isso, os recursos usados em regras servem como dados de treinamento para o modelo de Machine Learning. Por exemplo, uma regra pode negar uma solicitação de usuário se o usuário não conseguir fazer login três vezes nos últimos 30 minutos e a idade da conta for menor que 2 dias. Outra regra pode intensificar a autenticação se o CEP da transação do usuário não coincidir com um do perfil do cliente. Os recursos usados nessas regras—como valor da transação e número de tentativas de login falhas—servem como dados de treinamento para o modelo de Machine Learning fornecer uma probabilidade de risco para a transação em particular do usuário. Um humano normalmente define a decisão e a ação recomendada com base no limiar da pontuação de probabilidade.

Passo 2: Apoiar novos modelos de Machine Learning usando regras bem ajustadas

O próximo passo nesta evolução é apoiar esses novos modelos de ML criados usando regras bem ajustadas.

Passo 2: Apoiar novos modelos de ML com regras bem ajustadas


Apoiar modelos de ML com regras é especialmente eficaz ao lançar um novo modelo de Machine Learning ou quando o sinal que está sendo usado nas regras não está disponível durante o treinamento do modelo. Compensar a precisão do modelo de ML relativamente menos ajustado com algumas regras baseadas em heurísticas bem ajustadas serve como um ponto de partida razoável. Modelos de ML treinados em outras fraudes relevantes também ajudam a proteger o lançamento de um novo. Por exemplo, se a saída do modelo de ML de fraude de conta for > 0,65 e o modelo de ML de reputação de IP < 0,76 e o número de solicitações de usuário nos últimos 30 minutos > 3, bloqueie a transação.

Machine Learning funciona bem quando a pontuação de probabilidade de um modelo bem ajustado é suficientemente alta. No entanto, uma pontuação de probabilidade na área cinza pode levar a uma alta taxa de falsos positivos que é difícil de explicar ou justificar. É também onde apoiar a pontuação do modelo de ML usando regras bem definidas efetivamente ajuda a aumentar a precisão geral da decisão. Por exemplo, vamos supor que seu modelo de detecção de fraudes de ML tenha uma pontuação de risco de 0,75 para fraudes de conta de usuário. Ao mesmo tempo, se o valor da transação de pagamento for incomumente mais alto do que as transações anteriores pelo mesmo usuário, então você pode aumentar a pontuação de risco.

Outra razão para aplicar esse padrão é quando a eficácia do modelo de ML pode estar se deteriorando devido a mudanças nos dados ou padrões de comportamento do usuário. Da mesma forma, o modelo pode ser treinado em rótulos que são diferentes, mas correlacionados ao rótulo que está sendo previsto. Quando isso acontece, adicionar regras baseadas em heurísticas bem ajustadas pode aumentar a precisão geral da decisão. Por exemplo, bloqueie a transação se a pontuação do modelo de ML de transação de cartão de crédito > 0,81 e a idade da conta do usuário > 10 dias, ou a pontuação do modelo de ML de transação de cartão de crédito estiver entre 0,55 e 0,81 e a idade da conta do usuário ≤ 10 dias. Nesse caso, o modelo de ML pode já estar treinado com a idade da conta do usuário, mas o comportamento dos padrões de fraude influenciado pela idade da conta do usuário pode mudar de uma forma que o modelo desconhece. Posteriormente, treine um novo modelo de ML incorporando fraudes de conta, novo comportamento da idade da conta do usuário, junto com outros recursos, e eventualmente substitua essa regra.

Passo 3: Integrar múltiplos modelos de ML em um modelo de ML mais avançado

O passo final na evolução move o pêndulo do lado de regras para o lado de Machine Learning. Este passo integra pontuações de probabilidade de vários modelos de ML bem ajustados—alguns internos e alguns de terceiros—em regras e outros modelos de ML.

Com o tempo, à medida que a competência de ML da organização aumenta, várias pontuações de risco provenientes de ferramentas especializadas de terceiros e modelos de ML internos, igualmente, precisam ser integradas para uma capacidade holística de decisão de fraudes. Por exemplo, você pode ter uma ferramenta de terceiros oferecendo uma pontuação de risco de fraude de conta e um modelo de ML interno que oferece uma pontuação de risco de fraude de transação. Ambas as pontuações de risco devem ser integradas na avaliação da pontuação de risco geral para a transação. Tal integração começa com a escrita de regras que combinam efetivamente várias pontuações de risco e limites correspondentes para então recomendar o curso de ação apropriado. E evolui para o treinamento de novos modelos de ML usando saídas de modelos de ML bem ajustados existentes.

Passo 3: Integrar várias pontuações de risco de modelos de ML em regras inicialmente, seguido por um modelo de ML mais avançado

Oscilar para prevenção de fraude em tempo real, impulsionada por ML

A prevenção de fraudes em tempo real é um problema de processamento de dados cada vez mais complexo, envolvendo capacidade de integração de dados multifacetada para apoiar pontuações de risco de machine learning com regras quando necessário e ter capacidade de treinamento online para aprender continuamente novos padrões adversários em evolução para proteger o negócio e o usuário. Oscilar resolve a detecção de fraude em tempo real usando um motor de decisão sem codificação que integra machine learning e regras para permitir a prevenção de fraudes em tempo real e precisa.


Continue lendo