工具概览
探索 30+ MCP 浏览器自动化工具
🛠️ 30+ MCP 工具
AIPex 通过 30+ 专业的 MCP(模型上下文协议)工具提供全面的自动化功能。每个工具都旨在通过 AI 驱动的智能处理特定的浏览器自动化任务。
工具分类
🗂️ 标签页管理(8 个工具)
跨所有浏览器窗口的完整标签页控制和导航。
📄 页面内容与交互(14 个工具)
内容提取、分析和页面交互功能。
⬇️ 下载与文件(4 个工具)
下载控制和文件管理自动化。
📸 截图(3+ 个工具)
视觉捕获和截图管理工具。
快速参考
🗂️ 标签页管理工具
工具 | 描述 | 使用场景 |
---|---|---|
get_all_tabs | 获取所有窗口中的所有打开标签页 | 标签页清单、批量操作 |
get_current_tab | 获取当前活动标签页的信息 | 当前上下文感知 |
switch_to_tab | 通过 ID 切换到特定标签页 | 导航自动化 |
create_new_tab | 创建带有指定 URL 的新标签页 | 多页面工作流 |
get_tab_info | 获取标签页的详细信息 | 标签页元数据提取 |
duplicate_tab | 复制现有标签页 | 快速页面复制 |
close_tab | 关闭特定标签页 | 清理自动化 |
get_current_tab_content | 获取可见文本内容 | 内容分析 |
📄 页面内容与交互工具
工具 | 描述 | 使用场景 |
---|---|---|
get_page_metadata | 获取页面元数据(标题、描述、关键词) | SEO 分析、页面信息 |
extract_page_text | 提取带字数统计的文本内容 | 内容提取 |
get_page_links | 获取当前页面的所有链接 | 链接分析、抓取 |
search_page_text | 在当前页面搜索文本 | 查找特定内容 |
get_interactive_elements | 获取所有交互元素(优化) | 元素发现 |
click_element | 使用 CSS 选择器点击元素 | 交互自动化 |
summarize_page | 总结页面内容和关键点 | 内容分析 |
fill_input | 用文本填充输入字段 | 表单自动化 |
clear_input | 清除输入字段的内容 | 表单重置 |
get_input_value | 获取输入字段的当前值 | 表单验证 |
submit_form | 使用 CSS 选择器提交表单 | 表单提交 |
get_form_elements | 获取所有表单元素和输入字段 | 表单分析 |
scroll_to_element | 滚动到 DOM 元素并居中 | 导航 |
highlight_element | 永久高亮 DOM 元素 | 视觉标记 |
⬇️ 下载与文件工具
工具 | 描述 | 使用场景 |
---|---|---|
download_text_as_markdown | 将文本内容下载为 markdown 文件 | 内容导出 |
download_image | 从 base64 数据下载图像 | 图像保存 |
download_chat_images | 从聊天中下载多个图像 | 批量下载 |
download_current_chat_images | 从当前 AI 聊天下载所有图像 | 聊天导出 |
📸 截图工具
工具 | 描述 | 使用场景 |
---|---|---|
capture_screenshot | 捕获当前可见标签页的截图 | 视觉文档 |
capture_tab_screenshot | 通过 ID 捕获特定标签页的截图 | 多标签页捕获 |
capture_screenshot_to_clipboard | 捕获截图并保存到剪贴板 | 快速分享 |
工具使用示例
标签页管理示例
// 获取所有打开的标签页
const tabs = await get_all_tabs();
// 切换到特定标签页
await switch_to_tab(tabId);
// 创建新标签页
await create_new_tab("https://example.com");
页面交互示例
// 提取页面文本
const text = await extract_page_text();
// 点击元素
await click_element("button.submit");
// 填写表单
await fill_input("input[name='email']", "user@example.com");
await submit_form("form#contact");
下载示例
// 将页面内容下载为 markdown
await download_text_as_markdown(content, "page-content.md");
// 下载图像
await download_image(base64Data, "screenshot.png");
截图示例
// 捕获当前标签页
await capture_screenshot();
// 捕获特定标签页
await capture_tab_screenshot(tabId);
// 复制到剪贴板
await capture_screenshot_to_clipboard();
自然语言命令
无需直接使用工具,您可以使用自然语言命令:
# 标签页管理
"关闭除当前标签页外的所有标签页"
"切换到标题中包含 'GitHub' 的标签页"
"打开一个新标签页访问 google.com"
# 页面交互
"点击提交按钮"
"用 user@example.com 填充电子邮件字段"
"滚动到页脚"
# 数据提取
"获取此页面的所有链接"
"提取主要内容"
"总结这篇文章"
# 截图
"截取整个页面的屏幕截图"
"捕获此元素"
工具性能
所有工具都针对性能进行了优化:
- ⚡ 快速执行:大多数工具在 < 100ms 内完成
- 🎯 准确:AI 驱动的元素检测
- 🔄 可靠:自动重试和错误处理
- 📊 可扩展:处理大型页面和多个标签页
高级功能
批量操作
按顺序执行多个工具:
// 研究工作流
await create_new_tab("https://example.com");
const text = await extract_page_text();
const summary = await summarize_page();
await download_text_as_markdown(summary, "research.md");
错误处理
所有工具都包含内置错误处理:
try {
await click_element("button.submit");
} catch (error) {
console.error("元素未找到:", error);
}
下一步
专业提示:结合多个工具创建强大的自动化工作流。AI 将根据您的自然语言命令自动链接工具。