Что такое «агентная сеть»? WebMCP, MCP Fetch и доступ на уровне агента
Все публикации

Что такое «агентная сеть»? WebMCP, MCP Fetch и доступ на уровне агента

Ryan Turner
Ryan Turner · Head of Growth

Сеть агентов заключается в переходе к рассмотрению ИИ-агентов в качестве полноценных веб-клиентов. Вместо того чтобы агент пытался самостоятельно определить, как действовать, на основе необработанного HTML-кода, сайт предоставляет структурированные инструменты, к которым агент может обращаться напрямую. Сайт сам указывает агенту, как взаимодействовать, а не агент вынужден самостоятельно анализировать DOM и надеяться, что макет не изменился за ночь.

Вот и вся суть в одном предложении. Интернет, которым мы с вами пользуемся, был создан для человеческого зрения и щелчков мышью. «Агентный Интернет» добавляет второй интерфейс — интерфейс, разработанный для машин, которые читают, принимают решения и действуют от вашего имени. На сегодняшний день этот интерфейс опирается на два стандарта: WebMCP и Model Context Protocol с его сервером-референсом Fetch.

Основные выводы
  • В «агентной сети» агенты рассматриваются как встроенные клиенты, при этом сайты предоставляют доступ к инструментам, которые можно вызывать, вместо того чтобы агенты извлекали данные из DOM.
  • WebMCP, представленный на конференции Google I/O 2026, позволяет веб-сайту публиковать функции JavaScript и HTML-формы в качестве инструментов, которые вызывает агент.
  • MCP Fetch — это стандартный сервер, который загружает URL-адрес и преобразует HTML в формат Markdown, что позволяет существенно сократить расходы на токены агента.
  • Внедрение происходит на раннем этапе и проходит неравномерно. Большинство сайтов в ближайшее время не будут предоставлять доступ к инструментам, разработанным с использованием технологий Agent.
  • Пока это не произойдет, агентам по-прежнему потребуются браузеры, API для рендеринга и поиска, а также сеть реальных устройств для обслуживания «длинного хвоста».

Что на самом деле означает термин «доступ на уровне агента»?

Доступ, встроенный в агент представляет собой модель, при которой сайт информирует агентов о своих возможностях, благодаря чему агент вызывает указанную функцию вместо того, чтобы анализировать страницу. Это кардинально меняет подход к доступу к веб-ресурсам. Старая модель основана на обнаружении и обходе: агент загружает страницу, сайт пытается выявить бота, а агент старается не выглядеть как бот. Доступ на уровне агента, напротив, превращает эту задачу в проблему адресации и протоколов, более близкую к вызову API, чем к скрапингу экрана.

Это различие имеет значение, поскольку трафик, генерируемый ботами, уже не является единичным явлением. В 2024 году на долю автоматизированных ботов приходилось 51 % всего веб-трафика — впервые за последнее десятилетие машины обогнали людей по этому показателю, согласно Imperva, Отчет о вредоносных ботах за 2025 год. Когда большую часть ваших посетителей составляют программы, создание интерфейса для программ перестаёт быть просто дополнительной опцией и становится частью дизайна.

Существует и менее заметная причина. Когда сайт может предоставить агенту четкий, разрешенный маршрут, он контролирует то, что агент видит и делает. В результате для владельца сайта такая ситуация становится более предсказуемой, чем если бы тысячи сканеров действовали по собственному усмотрению в условиях структуры сайта, которая изначально не была для них предназначена. Сайт устанавливает правила, агент их соблюдает, и обе стороны сталкиваются с меньшим количеством неожиданностей.

Кроме того, это меняет характер сбоев. При скрапинге DOM сбои происходят незаметно, когда меняется имя класса или перемещается кнопка; инструмент, встроенный в агент, либо существует, либо его нет, и версионированный контракт может явно сигнализировать об этом. Судя по нашим наблюдениям за рабочими нагрузками агентов, инженеры, отвечающие за уровень доступа, как правило, предпочитают второй тип сбоев, поскольку он явно проявляется и поддаётся тестированию, а не проходит незаметно и периодически. Для получения дополнительной информации о том, почему это важно на всех уровнях стека, см. предоставить ИИ-агентам доступ к веб-ресурсам в режиме реального времени.

Как работает WebMCP?

WebMCP — это предлагаемый стандарт, представленный на конференции Google I/O 2026, который позволяет веб-сайту предоставлять свои собственные функции JavaScript и HTML-формы в качестве инструментов, которые может вызывать агент, работающий в браузере. Согласно Chrome, Chrome на конференции I/O 2026, сайт описывает, что может делать агент; агент считывает эти описания и вызывает их, как вызовы API. Одним словом, страница описывает свои собственные действия, вместо того чтобы заставлять агента выводить их самостоятельно.

Представьте себе процесс оформления заказа. Без WebMCP оператору приходится самостоятельно находить нужные поля ввода, заполнять их, искать кнопку отправки и подтверждать результат — и всё это путём считывания пикселей и узлов DOM, расположение которых может меняться от версии к версии. С WebMCP, напротив, сайт публикует submitOrder инструмент с типизированными параметрами. Агент вызывает его. Никаких догадок при выборе селектора, никаких неустойчивых ожиданий элементов, которые отображаются с задержкой.

Две особенности делают этот подход полезным. Во-первых, договор носит явный характер: сайт указывает, какими инструментами он располагает, поэтому агенту не приходится реконструировать намерения. Во-вторых, агент работает в сеансе браузера самого пользователя, а это означает, что он действует с теми правами доступа и под той учетной записью, которые уже имеются у пользователя. Это позволяет избежать целого ряда проблем с доступом, хотя и только на тех сайтах, которые поддерживают WebMCP — а таких на сегодняшний день пока немного.

Что такое MCP Fetch и почему это важно?

MCP Fetch является эталонным сервером Fetch в экосистеме Model Context Protocol. Он отлично справляется с одной задачей: принимает URL-адрес, загружает страницу и преобразует HTML-код в формат Markdown, понятный агенту. Согласно Репозиторий серверов протокола Model Context Protocol, это стандартный многоразовый инструмент, к которому любой агент, совместимый с MCP, может подключиться для базового извлечения страниц.

Суть заключается в преобразовании в формат Markdown. Исходный HTML перегружен элементами навигации, скриптами, стилями и кодом отслеживания, которые агенту не нужны, но за которые он расходует токены. Очистка страницы до чистого Markdown существенно сокращает количество токенов — зачастую более чем наполовину, — что снижает затраты и оставляет больше места в контекстном окне модели для фактического вывода. Например, агент, загружающий страницу продукта в виде исходного HTML-кода, может потратить большую часть своего бюджета на меню и теги скриптов, прежде чем доберётся до единственного абзаца, который ему нужен. Статья практикующего специалиста на сайте dev.to, Инструменты браузера для ИИ-агентов. Часть 4 подробно рассматривает этот компромисс.

MCP Fetch и WebMCP решают задачи на разных уровнях. Fetch отвечает за чтение: извлекает страницу и возвращает очищенный текст. WebMCP, напротив, отвечает за выполнение действий: вызывает объявленные на сайте функции для выполнения определённых действий. Большинство реальных рабочих процессов агентов требуют использования обоих компонентов, и мы наблюдаем, как команды создают собственный уровень извлечения данных на основе этих базовых элементов, а не рассматривают какой-либо из стандартов в качестве полного конвейера.

Чётко понимайте, где заканчивается работа Fetch. Он загружает и преобразует данные, но не выполняет рендеринг JavaScript, не решает задачи на страницах-заданиях и не переключает исходящий трафик, если сайт блокирует запрос. В случае со статической статьёй он работает без проблем. Однако в одностраничных приложениях или на защищённых целевых ресурсах он возвращает пустую оболочку или страницу с ошибкой, поэтому команды сочетают его с более ресурсоёмким рендерингом для всех случаев, когда возникают препятствия. Если вы самостоятельно создаёте такой конвейер, создать MCP Server для извлечения данных из веб-ресурсов покрывает рисунок от начала до конца.

В каком же положении оказываются сегодняшние агенты?

Современным агентам по-прежнему требуются браузеры, API рендеринга и поиска, а также сеть реальных устройств, поскольку стандарты, встроенные в агенты, находятся на ранней стадии развития и внедряются неравномерно. WebMCP представляет собой предложение. Между тем, MCP Fetch обрабатывает лишь простые страницы, доступные для извлечения. Подавляющая часть веб-ресурсов не предоставляет инструментов, встроенных в агенты, а значительная часть активно блокирует автоматизированный доступ. В данном случае стандарты являются дополнением, а не заменой.

Блокировка является реальностью и приобретает всё большие масштабы. В 2025 году компания Cloudflare с 1 июля начала по умолчанию блокировать ИИ-краулеры примерно на 20 % веб-ресурсов, согласно Cloudflare, Cloudflare только что изменила подход к тому, как ИИ-краулеры сканируют Интернет в целом. Издатели новостей пошли ещё дальше: по данным, в 2025 году примерно 79 % крупных новостных сайтов заблокировали ботов, используемых для обучения ИИ, согласно «Press Gazette», В настоящее время восемь из десяти крупнейших новостных сайтов мира блокируют ботов, используемых для обучения искусственного интеллекта. Таким образом, «чистый» инструмент WebMCP не приносит никакой пользы миллионам сайтов, которые никогда не будут его использовать.

Таким образом, эти два мира сосуществуют. Если сайт использует WebMCP или корректно обслуживает запросы MCP Fetch, доступ упрощается, и модель адресации оказывается более эффективной. В случае «длинного хвоста», напротив, агентам требуется реальная визуализация и источники, соответствующие устройствам реальных пользователей, чтобы получить доступ к контенту так же, как это сделал бы обычный посетитель. На защищённых ресурсах исходящий трафик имеет большее значение, чем люди ожидают. По результатам наших сравнительных тестов поставщиков, запросы с частных IP-адресов, как правило, проходят на защищённых сайтах с гораздо большей успешностью, чем запросы с IP-адресов центров обработки данных — часто в диапазоне от 85 до 99 % против примерно 20–40 % для центров обработки данных, — именно поэтому команды направляют сложные случаи через источники с реальных устройств. Именно этот уровень охватывают сеть доступа к устройствам Massive и Web Render API: чистый HTML или Markdown из любого общедоступного источника, в любом месте, включая сайты, которые никогда не раскрывают информацию о своих инструментах. Стандарты упрощают простые случаи; они не устраняют сложные. Что касается логической стороны этого конвейера, обучение больших языковых моделей (LLM) с использованием актуальных веб-данных связывает процесс извлечения данных с результатами модели.

Источники

Часто задаваемые вопросы

Является ли «агентная сеть» настоящим стандартом или это всего лишь рекламный трюк?+

Это направление, подкреплённое конкретными предложениями. WebMCP был представлен на конференции Google I/O 2026, а MCP Fetch уже включён в репозиторий серверов Model Context Protocol. Все необходимые компоненты уже существуют. Однако широкое внедрение пока не наступило, поэтому рассматривайте эту технологию как развивающуюся инфраструктуру, а не как готовую платформу, на которую можно полагаться во всём открытом Интернете.

Заменяет ли WebMCP веб-парсинг?+

Нет, это произойдёт не скоро. WebMCP работает только на тех сайтах, где он реализован, а таких на сегодняшний день пока немного. Во всех остальных случаях агенты по-прежнему анализируют страницы, выполняют JavaScript и проходят через сети реальных устройств для доступа к контенту. В производственной среде следует предусмотреть оба варианта, а не рассчитывать на повсеместную встроенную поддержку агентами.

В чём заключается разница между WebMCP и MCP Fetch?+

MCP Fetch выполняет чтение: он загружает URL-адрес и преобразует HTML в формат Markdown для обработки агентом. WebMCP выполняет действия: он позволяет сайту предоставлять вызываемые функции и формы, чтобы агент мог выполнять задачи. Чтение и действие. В большинстве рабочих процессов оба подхода используются совместно.

Почему агентам следует конвертировать HTML в Markdown?+

Исходный HTML-код содержит элементы навигации, скрипты и стилевые настройки, которые приводят к ненужному расходу токенов и перегружают окно контекста. Markdown сводит его к удобочитаемому содержанию, существенно сокращая количество токенов — зачастую более чем наполовину. Меньшие затраты, более чистый ввод данных — и больше пространства для модели, чтобы сосредоточиться на том, что действительно важно.