Назад к кейсам

Познакомьтесь с MachinaLabs — превращение рыночного шума в четкие сигналы

В этом тематическом исследовании мы рассмотрим, как MachinaLabs масштабировала глобальное извлечение данных за счет интеграции этичных резидентных прокси-серверов Massive, повысив уровень успеха до 99,7%, сократив задержки и обеспечив полное соответствие требованиям на всех рынках.

Вызов:
Масштабирование глобального сбора данных замедляет инновации

Чтобы получать финансовую информацию в реальном времени, MachinaLabs пришлось собирать структурированные и измененные данные за рубежом. Но географические ограничения, капчи, тайм-ауты и накладные расходы на соответствие нормативным требованиям привели к снижению производительности и оттолкнули инженеров от разработки искусственного интеллекта.

Решение:
Этическая инфраструктура, высвобождающая основные ресурсы

Интегрировав резидентные прокси-серверы Massive, полученные из этичных источников, MachinaLabs устранила блокировки IP-адресов, сократила время выборки и обеспечила соответствие международным стандартам. Результат: более быстрые конвейеры данных, более высокие показатели успеха и расширение полосы пропускания для инноваций.

Познакомьтесь с лабораторией машин

Лаборатории машинного оборудования это финтех-компания, базирующаяся в Базеле, которая преобразует фрагментированные новости, документы и альтернативные данные в понятную информацию для трейдеров, портфельных команд и сотрудников по соблюдению нормативных требований. Модульный аналитический стек компании позволяет использовать такие продукты, как Механический исследовательский движок (настроения в реальном времени) и флагман Торговец машинами платформа, каждая из которых регулируется строгой политикой соответствия требованиям.

Задача: масштабирование глобального сбора данных

Чтобы работать в режиме реального времени, MachinaLabs приходится собирать как структурированные данные (заявки, цены), так и «альт-данные» (твиты, публикации на Reddit, сетевые события) с рынков по всему миру. Четыре проблемы продолжали замедлять развитие событий:

  1. Геоограничения и блокировка IP-адресов. На сайтах, заблокированных по регионам, коэффициент успеха остался на уровне около 70 процентов.
  2. JavaScript-проверки ботов и капчи. Среднее время выборки увеличилось.
  3. Пиковые нагрузки. Тайм-ауты при выполнении заданий с большим количеством параллельных заданий с географической ориентацией.
  4. Эволюция законов о конфиденциальности (GDPR, CCPA, DPA в Кении). Дополнительная работа по регистрации согласия и хранению данных в нужном регионе.

Использование и ротация тысяч жилых IP-адресов собственными силами заставило бы инженеров отвлечься от основной работы в сфере искусственного интеллекта.

Решение: массив в цикле MachinaCore

MachinaLabs интегрировала пул жилых IP-адресов Massive, полученный из этичных источников и одобренный пользователями, прямо в свой движок MachinaCore на базе .NET:

Глобальный охват.
IP-адреса из более чем 195 стран открывают доступ к сайтам с региональными ограничениями.

Меньше блоков.
Чистые резидентные IP-адреса вызывают гораздо меньше CAPTCHA или запретов IP-адресов.

Масштабирование по запросу.
Тысячи параллельных запросов выполняются без превышения ограничений по скорости.

Готово к соответствию.
На каждый IP-адрес можно подписаться, а Massive ведет журналы согласий для аудитов GDPR/CCPA.

Поскольку ротация прокси-серверов была передана в Massive, инженеры MachinaLabs сосредоточены на совершенствовании моделей искусственного интеллекта, а не на борьбе с блоками.

«Компания Massive Proxies является надежным инфраструктурным партнером, поддерживающим ключевые элементы нашего конвейера сбора данных. Мы интегрировали их услуги, чтобы обеспечить стабильное время безотказной работы и широкий доступ, необходимый для наших автоматизированных систем поиска веб-данных. Их стабильная производительность лежит в основе крупномасштабного сбора информации, которая поступает в аналитические системы MachinaLabs. Это позволяет нашим платформам обрабатывать разнообразные и своевременные данные с большей эффективностью».
Виктор Окороафор — ведущий специалист по обработке данных, MachinaLabs

Эффект: результаты, которые можно измерить

KPI (внутренний мониторинг)
Процент успешных скребков
До
70%
После
99,7%
Δ (абсолютное значение)
+29,7 чел.
KPI (внутренний мониторинг)
Среднее время выборки
До
65 с
После
42 с
Δ (абсолютное значение)
—23
KPI (внутренний мониторинг)
30-дневная безотказная работа
До
99,1%
После
99,7%
Δ (абсолютное значение)
+0,6 п.л.

Это позволяет вдвое сократить задержку сигнала в Торговец машинами, обогатите глубину чувств в Механическая исследовательская машина, и позвольте инженерам сосредоточиться на новой аналитике, а не на обслуживании прокси-серверов.

Почему это партнерство важно

  1. Соблюдение требований прежде всего. Подписные IP-адреса соответствуют GDPR, CCPA и правилам суверенитета данных.
  2. Проверенная производительность. Высокие показатели успеха и низкая задержка при параллельных нагрузках.
  3. Эластичная емкость. Пул масштабируется по требованию, поскольку MachinaLabs открывает новые рынки и типы данных.
  4. Экспертная поддержка. Имеются специалисты по прокси-серверу, поэтому MachinaLabs может продолжать внедрять инновации.

Конечный эффект: более легкий, быстрый и учитывающий риски конвейер данных, лежащий в основе MachinaLabs Вселенная высокоточных данных, Аналитика рисков, и Точное прогнозирование инструменты — и предоставляет клиентам более ранние оповещения и более глубокое понимание.

Готовы собирать данные этичным способом?

Поговорите с нашей командой чтобы узнать, как этичная прокси-сеть Massive может повысить ваш успех и сократить задержки.