Added anchorbrowser computer implementation

guybensimhon1 · guybensimhon1 · commit f1f7e7c0bc87 · 2025-03-12T17:33:32.000+02:00
diff --git a/.env.example b/.env.example
@@ -6,4 +6,5 @@ OPENAI_ORG = "org-123"
 BROWSERBASE_API_KEY="00000000-0000-0000-0000-000000000000"
 BROWSERBASE_PROJECT_ID="bb_live_00000000-00000"
 
-SCRAPYBARA_API_KEY="scrapy-123"
+SCRAPYBARA_API_KEY="scrapy-123"
+ANCHOR_API_KEY="anchor-123"
diff --git a/README.md b/README.md
@@ -26,6 +26,7 @@ Other included sample [computer environments](#computer-environments):
 - [Docker](https://docker.com/) (containerized desktop)
 - [Browserbase](https://www.browserbase.com/) (remote browser, requires account)
 - [Scrapybara](https://scrapybara.com) (remote browser or computer, requires account)
+- [Anchor](https://anchorbrowser.io) (remote browser, requires account)
 - ...or implement your own `Computer`!
 
 ## Overview
@@ -93,7 +94,7 @@ This sample app provides a set of implemented `Computer` examples, but feel free
 | `Browserbase`       | browserbase        | `browser` | Remote browser environment        | [Browserbase](https://www.browserbase.com/) API key in `.env`    |
 | `ScrapybaraBrowser` | scrapybara-browser | `browser` | Remote browser environment        | [Scrapybara](https://scrapybara.com/dashboard) API key in `.env` |
 | `ScrapybaraUbuntu`  | scrapybara-ubuntu  | `linux`   | Remote Ubuntu desktop environment | [Scrapybara](https://scrapybara.com/dashboard) API key in `.env` |
-
+| `Anchor`            | anchor             | `browser` | Remote browser environment        | [Anchor](https://anchorbrowser.io) API key in `.env`                |
 Using the CLI, you can run the sample app with different computer environments using the options listed above:
 
 ```shell
diff --git a/cli.py b/cli.py
@@ -6,6 +6,7 @@
     ScrapybaraUbuntu,
     LocalPlaywrightComputer,
     DockerComputer,
+    AnchorBrowser,
 )
 
 
@@ -26,6 +27,7 @@ def main():
             "local-playwright",
             "docker",
             "browserbase",
+            "anchorbrowser",
             "scrapybara-browser",
             "scrapybara-ubuntu",
         ],
@@ -60,6 +62,7 @@ def main():
         "local-playwright": LocalPlaywrightComputer,
         "docker": DockerComputer,
         "browserbase": BrowserbaseBrowser,
+        "anchorbrowser": AnchorBrowser,
         "scrapybara-browser": ScrapybaraBrowser,
         "scrapybara-ubuntu": ScrapybaraUbuntu,
     }
diff --git a/computers/__init__.py b/computers/__init__.py
@@ -3,3 +3,4 @@
 from .local_playwright import LocalPlaywrightComputer
 from .docker import DockerComputer
 from .scrapybara import ScrapybaraBrowser, ScrapybaraUbuntu
+from .anchor import AnchorBrowser
diff --git a/computers/anchor.py b/computers/anchor.py
@@ -0,0 +1,147 @@
+import os
+from typing import Tuple
+
+from dotenv import load_dotenv
+from playwright.sync_api import Browser
+from playwright.sync_api import Error as PlaywrightError
+from playwright.sync_api import Page
+import requests
+
+from .base_playwright import BasePlaywrightComputer
+
+
+load_dotenv()
+
+
+class AnchorBrowser(BasePlaywrightComputer):
+    """
+    Computer implementation for Anchor browser (https://anchorbrowser.io)
+    Requires an API key in the .env file as ANCHOR_API_KEY
+
+    IMPORTANT: The `goto` and navigation tools are already implemented and recommended
+    when using the Anchor computer to help the agent navigate more effectively.
+    """
+
+    def __init__(
+        self,
+        width: int = 1024,
+        height: int = 900,
+        proxy_active: bool = True,
+        adblock_active: bool = True,
+        popup_blocking_active: bool = True,
+        captcha_active: bool = True,
+        timeout: int = 15,
+        idle_timeout: int = 2,
+        debug: bool = False,
+    ):
+        """Initialize the Anchor browser session"""
+        super().__init__()
+        self.api_key = os.getenv("ANCHOR_API_KEY")
+        if not self.api_key:
+            raise ValueError("ANCHOR_API_KEY not found in .env file")
+
+        self.debug = debug
+        self.base_url = "https://api.anchorbrowser.io/api"
+        self.base_ws_url = "wss://connect.anchorbrowser.io"
+        self.session_id = None
+        self.dimensions = (width, height)
+        self.proxy_config = {"active": proxy_active}
+        self.adblock_config = {
+            "active": adblock_active,
+            "popup_blocking_active": popup_blocking_active,
+        }
+        self.captcha_config = {"active": captcha_active}
+        self.timeout = timeout
+        self.idle_timeout = idle_timeout
+        self._browser = None
+        self._page = None
+        self._start_session()
+
+        if self.debug:
+            print(f"Anchor browser initialized with viewport {width}x{height}")
+
+    def _get_browser_and_page(self) -> Tuple[Browser, Page]:
+        """
+        Get browser and page objects.
+        For Anchor, we don't have direct browser/page objects, but we simulate them
+        for compatibility with the BasePlaywrightComputer interface.
+        """
+        # Create a session with Anchor API
+        width, height = self.dimensions
+        response = requests.post(
+            f"{self.base_url}/sessions",
+            headers={"anchor-api-key": f"{self.api_key}"},
+            json={
+                "width": width,
+                "height": height,
+                "useProxy": self.proxy_config["active"],
+                "solveCaptcha": self.captcha_config["active"],
+                "sessionTimeout": self.timeout,
+                "sessionIdleTimeout": self.idle_timeout,
+                "adBlocker": self.adblock_config["active"],
+                "popupBlockingActive": self.adblock_config["popup_blocking_active"],
+                "headless": False,
+            },
+        )
+        response.raise_for_status()
+        self.session_id = response.json().get("id")
+        if not self.session_id:
+            raise ValueError("Failed to create Anchor browser session")
+
+        browser = self._playwright.chromium.connect_over_cdp(
+            f"{self.base_ws_url}/?sessionId={self.session_id}"
+        )
+        context = browser.contexts[0]
+        context.on("page", self._handle_new_page)
+        page = context.pages[0]
+        return browser, page
+
+    def _handle_new_page(self, page: Page):
+        """Handle the creation of a new page."""
+        print("New page created")
+        self._page = page
+        page.on("close", self._handle_page_close)
+
+    def _handle_page_close(self, page: Page):
+        """Handle the closure of a page."""
+        print("Page closed")
+        if self._page == page:
+            if self._browser.contexts[0].pages:
+                self._page = self._browser.contexts[0].pages[-1]
+            else:
+                print("Warning: All pages have been closed.")
+                self._page = None
+
+    def __exit__(self, exc_type, exc_val, exc_tb):
+        """Clean up resources when exiting"""
+        if self.session_id:
+            requests.delete(
+                f"{self.base_url}/sessions/{self.session_id}",
+                headers={"anchor-api-key": f"{self.api_key}"},
+            )
+            if self.debug:
+                print(f"Ended Anchor session: {self.session_id}")
+            self.session_id = None
+
+    def screenshot(self) -> str:
+        """
+        Capture a screenshot of the current viewport using CDP.
+
+        Returns:
+            str: A base64 encoded string of the screenshot.
+        """
+        try:
+            # Get CDP session from the page
+            cdp_session = self._page.context.new_cdp_session(self._page)
+
+            # Capture screenshot using CDP
+            result = cdp_session.send(
+                "Page.captureScreenshot", {"format": "png", "fromSurface": True}
+            )
+
+            return result["data"]
+        except PlaywrightError as error:
+            print(
+                f"CDP screenshot failed, falling back to standard screenshot: {error}"
+            )
+            return super().screenshot()