Мошенничество — это не просто неприятность; это индустрия объемом 12,5 миллиардов долларов. Согласно данным FTC за 2024 год, зарегистрированные потери от мошенничества резко возросли. Традиционные системы, основанные на правилахМошенничество — это не просто неприятность; это индустрия объемом 12,5 миллиардов долларов. Согласно данным FTC за 2024 год, зарегистрированные потери от мошенничества резко возросли. Традиционные системы, основанные на правилах

Создайте систему защиты от мошенничества с искусственным интеллектом в реальном времени с помощью Python, XGBoost и BERT

2025/12/15 04:04

Мошенничество — это не просто неприятность; это индустрия объемом 12,5 миллиардов долларов. Согласно данным FTC за 2024 год, зарегистрированные потери от мошенничества резко возросли, причем только инвестиционное мошенничество составляет почти половину этой суммы.

Для разработчиков и системных архитекторов задача двояка:

  1. Мошенничество с транзакциями: Обнаружение аномалий в структурированных финансовых данных (Кто отправил деньги? Куда? Сколько?).
  2. Коммуникационное мошенничество (Спам/Фишинг): Обнаружение злонамеренных намерений в неструктурированном тексте (SMS-ссылки, фишинговые электронные письма).

Традиционные системы, основанные на правилах ("Если сумма > 10 000 долларов, отметить"), слишком хрупки. Они генерируют ложные срабатывания и пропускают развивающиеся векторы атак.

В этом инженерном руководстве мы создадим Двухуровневую систему защиты. Мы реализуем высокоскоростную модель XGBoost для мониторинга транзакций и BERT-based NLP-движок для обнаружения спама, обернув все это в облачную микросервисную архитектуру.

Давайте приступим к созданию.

Архитектура: Реальное время и облачные технологии

Мы не создаем пакетное задание, которое выполняется за ночь. Мошенничество происходит за миллисекунды. Нам нужен движок вывода в реальном времени.

Наша система состоит из двух отдельных конвейеров, подающих данные в центральный механизм принятия решений.

Технический стек

  • Язык: Python 3.9+
  • Структурированное обучение: XGBoost (Extreme Gradient Boosting) и Random Forest.
  • NLP: Hugging Face Transformers (BERT) и Scikit-learn (Naïve Bayes).
  • Развертывание: Docker, Kubernetes, FastAPI.

Часть 1: Защитник транзакций (XGBoost)

При работе с табличными финансовыми данными (Сумма, Время, Местоположение, ID устройства), XGBoost в настоящее время является королем горы. В наших тестах он достиг 98,2% точности и 97,6% прецизионности, превзойдя Random Forest как по скорости, так и по надежности.

Проблема: Несбалансированные данные

Мошенничество редко. Если у вас 100 000 транзакций, возможно, только 30 из них являются мошенническими. Если вы обучите модель на этом, она будет просто угадывать "Легитимно" каждый раз и достигнет 99,9% точности, пропуская при этом каждый случай мошенничества.

Решение: Мы используем SMOTE (Synthetic Minority Over-sampling Technique) или взвешивание классов во время обучения.

План реализации

Вот как настроить классификатор XGBoost для оценки транзакций.

import xgboost as xgb from sklearn.model_selection import train_test_split from sklearn.metrics import precision_score, recall_score, f1_score import pandas as pd # 1. Load Data (Anonymized Transaction Logs) # Features: Amount, OldBalance, NewBalance, Location_ID, Device_ID, TimeDelta df = pd.read_csv('transactions.csv') X = df.drop(['isFraud'], axis=1) y = df['isFraud'] # 2. Split Data X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 3. Initialize XGBoost # scale_pos_weight is crucial for imbalanced fraud data model = xgb.XGBClassifier( objective='binary:logistic', n_estimators=100, learning_rate=0.1, max_depth=5, scale_pos_weight=10, # Handling class imbalance use_label_encoder=False ) # 4. Train print("Training Fraud Detection Model...") model.fit(X_train, y_train) # 5. Evaluate preds = model.predict(X_test) print(f"Precision: {precision_score(y_test, preds):.4f}") print(f"Recall: {recall_score(y_test, preds):.4f}") print(f"F1 Score: {f1_score(y_test, preds):.4f}")

Почему XGBoost выигрывает:

  • Скорость: Он обрабатывает табличные данные значительно быстрее, чем глубокие нейронные сети.
  • Разреженность: Он изящно обрабатывает отсутствующие значения (что часто встречается при снятии отпечатков устройств).
  • Интерпретируемость: В отличие от "Черного ящика" нейронной сети, мы можем вывести важность признаков, чтобы объяснить, почему транзакция была заблокирована.

Часть 2: Охотник за спамом (NLP)

Мошенничество часто начинается со ссылки. "Нажмите здесь, чтобы обновить свой KYC." \n Для обнаружения этого нам нужна обработка естественного языка (NLP).

Мы сравнили Naïve Bayes (легкий, быстрый) с BERT (глубокое обучение).

  • Naïve Bayes: 94,1% точности. Хорош для простого спама с ключевыми словами.
  • BERT: 98,9% точности. Необходим для "контекстного" фишинга (например, социально спроектированных писем, которые не выглядят как спам).

План реализации (BERT)

Для производственной среды мы дообучаем предварительно обученную модель Transformer.

from transformers import BertTokenizer, BertForSequenceClassification import torch # 1. Load Pre-trained BERT model_name = "bert-base-uncased" tokenizer = BertTokenizer.from_pretrained(model_name) model = BertForSequenceClassification.from_pretrained(model_name, num_labels=2) def classify_message(text): # 2. Tokenize Input inputs = tokenizer( text, return_tensors="pt", truncation=True, padding=True, max_length=512 ) # 3. Inference with torch.no_grad(): outputs = model(**inputs) # 4. Convert Logits to Probability probabilities = torch.nn.functional.softmax(outputs.logits, dim=-1) spam_score = probabilities[0][1].item() # Score for 'Label 1' (Spam) return spam_score # Usage msg = "Urgent! Your account is locked. Click http://bad-link.com" score = classify_message(msg) if score > 0.9: print(f"BLOCKED: Phishing Detected (Confidence: {score:.2%})")

Часть 3: Рабочий процесс "Жесткой остановки"

Обнаружение бесполезно без действия. Самая инновационная часть этой архитектуры — Логика вмешательства.

Мы не просто регистрируем мошенничество; мы перехватываем путь пользователя.

Рабочий процесс:

  1. Пользователь получает SMS: "Обновите способ оплаты."
  2. Пользователь нажимает: Клик направляется через наш микросервис.
  3. Сканирование в реальном времени: URL и тело сообщения оцениваются моделью BERT.
  4. Точка принятия решения:
  • Безопасно: Пользователь перенаправляется на фактический платежный шлюз.
  • Мошенничество: Появляется предупреждение "Жесткая остановка".

Примечание: В отличие от стандартных фильтров электронной почты, которые перемещают элементы в папку "Спам", эта система находится между кликом и пунктом назначения, предотвращая загрузку пользователем вредоносной нагрузки.

Ключевые метрики

При развертывании в производство "Точность" — это показатель тщеславия. Вам нужно следить за Прецизионностью и Полнотой.

  • Ложные срабатывания (падение прецизионности): Вы блокируете законного пользователя от покупки кофе. Они злятся и перестают использовать ваше приложение.
  • Ложные пропуски (падение полноты): Вы позволяете хакеру опустошить счет. Вы теряете деньги и репутацию.

В нашем исследовании XGBoost обеспечил наилучший баланс:

  • Точность: 98,2%
  • Полнота: 95,3% (Он поймал 95% всех случаев мошенничества).
  • Задержка: Быстрый вывод, подходящий для блокировки в реальном времени.

Заключение

Эра ручного обзора мошенничества закончилась. С взрывным ростом объемов транзакций единственная масштабируемая защита — это ИИ.

Объединяя XGBoost для структурированных данных транзакций и BERT для неструктурированных коммуникационных данных, мы создаем надежный щит, который защищает пользователей не только от финансовых потерь, но и от социальной инженерии, которая им предшествует.

Следующие шаги для разработчиков:

  1. Контейнеризация: Оберните приведенные выше скрипты Python в Docker.
  2. Предоставление API: Используйте FastAPI для создания конечной точки /predict.
  3. Развертывание: Отправьте в Kubernetes (EKS/GKE) для возможностей автоматического масштабирования.

\ \

Возможности рынка
Логотип RealLink
RealLink Курс (REAL)
$0.07239
$0.07239$0.07239
-1.57%
USD
График цены RealLink (REAL) в реальном времени
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу [email protected] для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно

CME Group расширяет криптодеривативы с фьючерсами на XRP и SOL с котировками по спотовым ценам

CME Group расширяет криптодеривативы с фьючерсами на XRP и SOL с котировками по спотовым ценам

CME Group запускает фьючерсы на XRP и SOL с котировками спот, расширяя доступ к криптовалютам для розничных клиентов с более длительными сроками истечения и сниженными затратами на ролловер. CME Group запустила спот
Поделиться
LiveBitcoinNews2025/12/16 11:30
Недавний рост Solana (SOL) может впечатлять, но инвесторы, нацеленные на ROI, способный изменить жизнь, смотрят в другом направлении

Недавний рост Solana (SOL) может впечатлять, но инвесторы, нацеленные на ROI, способный изменить жизнь, смотрят в другом направлении

Пост «Недавний рост Solana (SOL) может впечатлять, но инвесторы, нацеленные на изменяющий жизнь ROI, смотрят в другом направлении» появился на BitcoinEthereumNews.com. Последний рост Solana (SOL) привлек инвесторов со всего мира, но более важная история для дальновидных инвесторов заключается в том, куда направляются следующие волны доходности, способной изменить жизнь. Поскольку Экосистема Solana продолжает демонстрировать высокий уровень использования и загрузки сети, постепенно создаются условия для Mutuum Finance (MUTM). MUTM оценивается в 0,035 $ в своей быстрорастущей предпродаже. Рост цены на 14,3% — это то, что инвесторы ожидают на следующем этапе. Более 15,85 миллионов $ уже собрано, и предпродажа продолжает набирать обороты. В отличие от большинства токенов, которые используют краткосрочные волны хайпа, Mutuum Finance становится выбором, ориентированным на полезность, с большим потенциалом стоимости и, следовательно, все более привлекательным вариантом для инвесторов, ищущих больше, чем просто движение цены. Solana сохраняет прибыль около 234 $ на фоне продолжающихся спекуляций Solana (SOL) в настоящее время торгуется по цене 234,08 $, удерживая свой 24-часовой диапазон около 234,42 $ - 248,19 $, что иллюстрирует недавний тренд. Токен зафиксировал сильный семидневный рост почти на 13%, значительно превосходя большинство своих конкурентов, поскольку его поддерживают растущий объем и институциональные покупки. Сопротивление находится на уровне 250-260 $, а поддержка, по-видимому, на уровне 220-230 $, и, таким образом, это значимые уровни для потенциального прорыва или отката. Однако новая DeFi криптовалюта Mutuum Finance, по мнению рыночных наблюдателей, имеет больший потенциал роста, находясь еще на стадии предпродажи. Предпродажа Mutuum Finance Фаза 6 Mutuum Finance в настоящее время находится на 6 этапе предпродажи и предлагает токены по цене 0,035 $. Предпродажа идет очень быстро, и инвесторы уже собрали более 15,85 миллионов $. Проект также планирует создать стейблкоин, привязанный к доллару США, на блокчейн Ethereum для удобных платежей и в качестве хранителя долгосрочной стоимости. Mutuum Finance — это двусторонняя кредитная, многоцелевая DeFi платформа, которая приносит пользу как заемщикам, так и кредиторам. Она предоставляет сеть для розничных, а также...
Поделиться
BitcoinEthereumNews2025/09/18 06:23
Bank of America: Банковская индустрия США движется к многолетней фазе он-чейн развития.

Bank of America: Банковская индустрия США движется к многолетней фазе он-чейн развития.

PANews сообщил 16 декабря, ссылаясь на CoinDesk, что Bank of America заявил в понедельник в отчете, что политика в отношении криптовалюты переходит от обсуждения к реализации
Поделиться
PANews2025/12/16 10:43