OpAgent: Operator Agent for Web Navigation

Yuyu Guo , Wenjie Yang , Siyuan Yang , Ziyang Liu , Cheng Chen , Yuan Wei , Yun Hu , Yang Huang , Guoliang Hao , Dongsheng Yuan , Jianming Wang , Xin Chen , Hang Yu , Lei Lei , Peng Di

🏛 Institutions: Ant Group
📅 Date: February 14, 2026
📑 Publisher: arXiv
💻 Env: Web
🔑 Keywords: reinforcement learning planner-grounder-reflector-summarizer hierarchical multitask fine-tuning WebArena OpAgent

TLDR

OpAgent combines a modular planner-grounder-reflector-summarizer design with online reinforcement learning on unconstrained web environments. The paper reports strong WebArena performance and studies how modular coordination and RL improve web navigation.

Open paper arXiv Report issue

Related papers (24)

WebArena-Infinity: Generating Browser Environments with Verifiable Tasks at Scale

March 2026 · Blog Post
The Tool Illusion: Rethinking Tool Use in Web Agents

April 3, 2026 · arXiv
When Users Change Their Mind: Evaluating Interruptible Agents in Long-Horizon Web Navigation

April 1, 2026 · arXiv
AI Planning Framework for LLM-Based Web Agents

March 13, 2026 · arXiv
HATS: Hardness-Aware Trajectory Synthesis for GUI Agents

March 12, 2026 · CVPR 2026
WebFactory: Automated Compression of Foundational Language Intelligence into Grounded Web Agents

March 5, 2026 · arXiv
WebWorld: A Large-Scale World Model for Web Agent Training

February 16, 2026 · arXiv
DynaWeb: Model-Based Reinforcement Learning of Web Agents

January 29, 2026 · arXiv
ColorBrowserAgent: Complex Long-Horizon Browser Agent with Adaptive Knowledge Evolution

January 12, 2026 · arXiv
WebGym: Scaling Training Environments for Visual Web Agents with Realistic Tasks

January 5, 2026 · arXiv
WebOperator: Action-Aware Tree Search for Autonomous Agents in Web Environment

December 14, 2025 · arXiv
WebServ: A Browser-Server Environment for Efficient Training of Reinforcement Learning-based Web Agents at Scale

October 17, 2025 · arXiv
WALT: Web Agents that Learn Tools

October 1, 2025 · ICLR 2026 (Poster)
Thinking vs. Doing: Agents that Reason by Scaling Test-Time Interaction

June 9, 2025 · SEA @ NeurIPS 2025 (Oral)
Go-Browse: Training Web Agents with Structured Exploration

June 4, 2025 · ICLR 2026 (Poster)
WebDancer: Towards Autonomous Information Seeking Agency

May 28, 2025 · NeurIPS 2025 (Poster)
WebAgent-R1: Training Web Agents via End-to-End Multi-Turn Reinforcement Learning

May 22, 2025 · EMNLP 2025 (Poster)
GUI-R1: A Generalist R1-Style Vision-Language Action Model for GUI Agents

April 14, 2025 · arXiv
Inducing Programmatic Skills for Agentic Tasks

April 9, 2025 · COLM 2025
Advancing Autonomous VLM Agents via Variational Subgoal-Conditioned Reinforcement Learning

February 11, 2025 · arXiv
Proposer-Agent-Evaluator (PAE): Autonomous Skill Discovery For Foundation Model Internet Agents

December 17, 2024 · ICML 2025 (Poster)
WebRL: Training LLM Web Agents via Self-Evolving Online Curriculum Reinforcement Learning

November 4, 2024 · ICLR 2025 (Poster)
Beyond Browsing: API-Based Web Agents

October 24, 2024 · Findings of ACL 2025
Agent Q: Advanced Reasoning and Learning for Autonomous AI Agents

August 13, 2024 · arXiv