Nxtscapeは、プライバシー保護とローカライズされたAI機能に重点を置いたオープンソースのスマートブラウザです。Nxtscapeのコアデザインはユーザーデータのセキュリティに基づいており、ユーザーは独自のAPIキーまたはOllamaを介してローカルのAIモデルを実行することができ、閲覧データがクラウドにアップロードされないことを保証します。
Sunaは、Kortix AIによって開発されたオープンソースの汎用AIエージェントで、Apache 2.0ライセンスに基づいてGitHubでホストされており、ユーザーは無料でダウンロード、変更、セルフホストすることができます。自然言語対話を通じて、ウェブ閲覧、ファイル管理、データ・クロール、ウェブサイト......といった複雑なタスクでユーザーを支援する。
StrawberryはAIアシスタントを内蔵したスマートブラウザで、ユーザーの日常業務を自動化し、効率化を支援するために設計されている。従来のブラウザとは異なり、ウェブコンテンツをリアルタイムで理解し、迅速なリサーチ、コンテンツ作成、データ照合などの複雑なタスクを実行するAI技術を統合している。ユーザーは単に...
Fellouは、Fellou AIが提供する世界初のAI対応アクションブラウザです。Fellouは世界初のAI対応アクション・ブラウザで、従来のブラウザのウェブ閲覧機能を提供するだけでなく、AIによってタスクの自動化や深い情報の検索を行う...
AiPyはKnownsecチームによって開発されたオープンソースのPythonコマンドラインツールです。大規模言語モデル(LLM)とPython実行環境を組み合わせ、自然言語でタスクを記述することでPythonコードを自動生成し、実行することができる。
DroidRunは、AIに人間のようにAndroid携帯を操作させるオープンソースツールである。画面上のボタンや入力ボックスなどのインタラクティブな要素を抽出することで、アプリを開いたり、メッセージを送信したり、ウェブを閲覧したりといった作業をAIが自動化できるようにする。
Agent Sは、Simular AIが開発したオープンソースのフレームワークで、グラフィカル・ユーザー・インターフェース(GUI)を通じて、人間のようにコンピュータを操作することができる。マルチモーダル・マクロ言語モデルと経験的学習技術を使用して、ウェブの閲覧、文書の編集、ソフトウェアの使用などのタスクを実行する。プロジェクトはGitHubでオープンソース化されており、開発...
LibraはGreenbit.aiが提供する革新的なツールで、その中核機能は自然言語対話を通じてローカルで実行可能なAIインテリジェンスを生成することである。バイブ・エージェント」と名付けられたこのツールを使えば、ユーザーは自分のニーズを簡単な言葉で説明し、ウェブ検索、データ分析、視覚化...を実行することで、独自のインテリジェンスを素早く作成することができる。
OptexityはGitHub上のオープンソースプロジェクトで、Optexityチームによって開発されている。このプロジェクトの中核は、人間のデモデータを使用して、コンピュータタスク、特にウェブページ操作を完了するAIを訓練することである。このプロジェクトは、ComputerGYM、AgentAI、Playwrightの3つのコードライブラリで構成されている。
RunRabbitはAIベースのツールで、ユーザーは簡単な音声やテキストコマンドでブラウザを操作し、様々なタスクを実行することができる。最大の特徴は、ユーザーのニーズを理解し、情報の検索、フォームへの入力、反復的なタスクの実行など、ウェブページを自動的に操作することだ。このウェブサイトは、ある企業によって開発された。
LangGraph CUAはLangChainチームによって開発されたオープンソースプロジェクトである。LangGraphフレームワークをベースにしており、開発者はPythonを使ってコンピュータを直接操作できるAIインテリジェンスを構築できる。このツールのコアは "Computer Use Agent" (CU...
エージェントTARSは、ByteDance社によってオープンソース化されたマルチモーダルAIインテリジェンスであり、ウェブコンテンツを視覚的に理解し、コマンドラインとファイルシステム操作を組み合わせることで、ユーザーが複雑なコンピュータタスクを完了するのを支援するコア機能を備えている。従来のツールのように手動操作を必要とせず、ブラウザのタスクや編集...
Playwright MCPはMicrosoftによって開発され、GitHubでホストされているオープンソースツールである。モデルコンテキストプロトコル(MCP)プロトコルを介して、人工知能モデルがブラウザを直接制御し、ウェブページを開いたり、要素をクリックしたり、テキストを入力したりといったアクションを実行できる。このツールはPl...
AirtopはAIベースのブラウザ自動化ツールである。クラウド・ブラウザを制御し、ウェブサイトへのログイン、データのクロール、自動化タスクの実行など、複雑なウェブ操作を簡単な自然言語コマンドで実行できる。従来の複雑でエラーを起こしやすいスクリプトの問題を解決します。
BrowserAgentは、ブラウザ上で直接AIワークフローを作成・実行するツールです。使い方は簡単で、コードを記述する必要はありません。ユーザーは希望のワークフローを記述するだけで、AIが自動的に生成されます。このツールの主な特徴は、完全にプライベートであることです。すべてのデータはブラウザで処理されるので、プライバシーを心配する必要はありません...
Highlight AIは、WindowsとmacOS向けのデスクトップAIアシスタントで(モバイル版は開発中)、音声コマンドと画面コンテンツの分析を通じて、ユーザーがあらゆるアプリでタスクを素早く完了できるよう支援します。画面の内容をキャプチャし、コードを生成し、質問に答え、GitHub、Notion、...と連携します。
autoMateは、yuruotong1氏によってGitHub上でオープンソース化され開発されたローカル自動化ツールで、AI+RPA(Artificial Intelligence + Robotic Process Automation)を中核機能としています。大規模言語モデルのインテリジェントな理解とRPAのプロセス実行機能を組み合わせており、ユーザーは自然言語でタスクを記述するだけでよい。
Nanobrowserは、AIを搭載したマルチエージェントシステムによってウェブタスクを自動化するために設計されたオープンソースのChrome拡張機能です。LLM(大規模言語モデル)のAPIキーを提供するだけで、OpenAI Operatorの代替機能を無料で利用できます。
Proxy Liteは、Convergence AIによって開発されたオープンソースの軽量ウェブ自動化ツールで、Proxyのミニバージョンとしてオープンウェイトデザインで開発されています。3BパラメータのVLM(Visual Language Model)をベースにしており、ウェブナビゲーションや、情報検索やブラウジングなどのタスクを自律的に実行することができます。