DeepResearchAgentは、SkyworkAIによって開発されたオープンソースのAIツールで、ディープリサーチの自動化に焦点を当てています。検索エンジン、ウェブクローリング、大規模言語モデリング(LLM)を組み合わせることで、ユーザーが詳細な調査レポートを素早く作成できるよう支援する。ユーザーは研究トピックや質問を入力するだけで、ツールは自動的に検索し、情報を抽出し、構造化されたレポートに照合する。このプロジェクトは、開発者、研究者、コンテンツ作成者向けにGitHubでホストされており、柔軟なカスタマイズとローカルランタイムのサポートが可能です。プライバシー保護とローカル展開のサポートに重点を置いたDeepResearchAgentは、複雑なトピックを効率的に分析する必要があるユーザーに適しています。
機能一覧
- 自動リサーチ:ユーザーが入力したトピックや質問に基づき、関連するウェブコンテンツを自動的に検索・抽出。
- インテリジェントなコンテンツ抽出:ウェブクローリング技術を使用して、ウェブページから重要な情報を正確に抽出します。
- レポート作成:検索結果を、引用と書式付きコンテンツを含む構造化された調査レポートにまとめます。
- ローカル操作のサポート:データプライバシーを保護するために、ユーザーのローカル環境で実行することができます。
- 複数のLLMをサポート:OpenAI、Anthropic、Deepseek、その他の多言語モデルに対応。
- 柔軟なインタラクション:ファンクション・コール・モードと非ファンクション・コール・モードでのLLMインタラクションをサポート。
- オープンソースのカスタマイズ:完全なソースコードを提供するため、ユーザーは必要に応じて機能を変更、拡張することができます。
ヘルプの使用
設置プロセス
DeepResearchAgentは、ローカル環境にインストールして構成する必要があります。以下は、PythonとDockerに精通しているユーザ向けの詳細なインストール手順です。
- 環境を整える
システムにPython 3.10とDockerがインストールされていることを確認してください。Pythonはコアプログラムを実行するために使用され、Dockerは一貫性を確保するために環境をコンテナ化するために使用されます。- Pythonのバージョンをチェックする。
python --version
バージョンが3.10以上であることを確認してください。 - Dockerのインストール:Dockerの公式ウェブサイトにアクセスしてダウンロードし、インストールする。
- Pythonのバージョンをチェックする。
- クローン倉庫
Git を使用して DeepResearchAgent のコードベースをローカルにクローンします:git clone https://github.com/SkyworkAI/DeepResearchAgent.git cd DeepResearchAgent
- Python環境の作成
プロジェクトの依存関係を分離するために、Condaを使って仮想環境を作成し、有効化する:conda create -n deep_research python=3.10 conda activate deep_research
- 依存関係のインストール
プロジェクトのルート・ディレクトリに、必要なPythonの依存関係をインストールする:pip install -e .
これにより、ウェブ・クローラー・ツールやLLMインターフェース・サポートなど、プロジェクトに必要なコア・ライブラリーがインストールされる。
- Docker環境の設定
DeepResearchAgentは、Dockerコンテナ化された対話型環境を使用しており、プログラムがデバイス・アーキテクチャに基づいて適切なイメージを自動的に選択するため、手動でイメージを引き出す必要がない。ユーザは.env
ファイルはLLMのAPIキーを設定します:- のコピーを取る。
.env.template
というのも.env
::cp .env.template .env
- コンパイラ
.env
ファイルに、目的のLLM(OpenAI、Deepseekなど)のAPIキーを記入します。すべてのAPIキーを入力する必要はなく、使用する予定のモデルを設定するだけでよい。
- のコピーを取る。
- トリガ手順
以下のコマンドを実行して、DeepResearchAgent を起動します:auto deep-research
これによりツールがインタラクティブ・モードになり、ユーザー入力を受け付ける準備が整う。
機能 操作の流れ
1.オートメーション研究
ツールを起動した後、ユーザーは研究トピックや特定の質問を入力することができる。例えば、「ヘルスケアにおける人工知能」と入力すると、ツールは自動的に検索エンジンを通して関連情報を検索し、DeepResearchAgent は内蔵のウェブ・クローラ・モジュールを呼び出して、ウェブ・ページからテキスト、テーブル、またはその他の構造化データにアクセスして抽出する。ユーザーは検索語を手動で指定する必要はなく、ツールがLLMを通じてクエリを最適化し、高品質のソースを見つける。
2.コンテンツの抽出と照合
抽出された情報はLLMによって処理され、トピックの最も関連性の高い部分がフィルタリングされます。このツールは、出力が正確であることを保証するために、広告、ナビゲーションバー、およびその他の無関係なコンテンツを自動的に削除します。ユーザーは、元のウェブページのリンクを引用として残すかどうかを選択できます。抽出が完了すると、情報が段落、リスト、または表に照合され、予備レポートが作成されます。
3.レポート作成
DeepResearchAgentは、導入部、メインコンテンツ、および参考文献を含む構造化レポートの生成をサポートしています。ユーザは、起動時にコマンドラインパラメータを介してMarkdownやPDFなどのレポート形式を指定することができ、レポート生成後、編集や共有が簡単に行えるように、指定したディレクトリに自動的に保存されます。レポートの内容は論理的で明確であり、引用形式は標準化されているため、学術的または専門的なシナリオに適しています。
4.ローカルオペレーションとプライバシー保護
すべてのデータ処理は、クラウドにアップロードすることなくローカルで行われます。ユーザーはコードを修正することで、データ処理ロジックをカスタマイズすることができます。例えば、検索範囲を調整したり、レポート構造を最適化したりすることができます。オープンソースのコードにより、開発者は、より多くのLLMのサポートや他のデータソースとの統合などの新機能を追加することができます。
5.さまざまなLLMに対応
DeepResearchAgentは、主流のLLMを幅広くサポートしており、ユーザーは以下のことが可能です。.env
ファイルでAPIキーを設定する。ツールは、設定に基づいてタスクを処理するモデルを自動的に選択する。推奨モデルは、安定した性能と低コストのDeepseekとGrokである。ユーザーはコードを修正することでカスタムモデルをサポートすることもできる。
6.コマンドライン操作
一度起動すれば、ユーザーはコマンドラインから操作できる。例えばauto deep-research --topic "区块链技术"
ブロックチェーン技術に関するレポートが生成される。レポート言語や検索深度の設定など、より多くのパラメータが公式ドキュメントに掲載されています。
ほら
- 検索エンジンとウェブページにアクセスするために、ツールの安定したインターネット接続を確保する。
- APIキーを設定する際、追加支払いが必要なモデルかどうかを確認してください(例:OpenAIのGPT-4)。
- ローカルでの操作には、複雑なタスクをスムーズに処理するために、少なくとも8GBのRAMと4コアのCPUが必要だ。
- GitHubのリポジトリを定期的にチェックし、最新の機能や修正へのアップデートを確認する。
アプリケーションシナリオ
- 学術研究
研究者はDeepResearchAgentを使って、特定の分野の最新文献や情報を素早く収集することができる。例えば、「量子コンピューティングの最新の進歩」と入力すると、このツールは自動的に学術ウェブサイト、ニュース、ブログをクロールし、主要な調査結果や引用文献を含むレポートを生成する。 - コンテンツ制作
ブロガーやジャーナリストは、このツールを使って背景情報を素早く作成することができる。例えば、「再生可能エネルギーの動向」に関する記事を書く場合、トピックを入力すると、構造化された市場分析とデータを得ることができる。 - ビジネス分析
ビジネスユーザーは、市場力学や競合他社の情報を調査することができます。例えば、「電気自動車市場2025」と入力すると、業界レポート、販売データ、トレンド予測を照合します。 - 開発者のカスタマイズ
開発者は、オープンソースコードに基づいてカスタマイズされた調査ツールを開発することができます。例えば、特定のデータベース・インターフェースを追加して、業界特有の詳細なレポートを作成することができる。
品質保証
- DeepResearchAgentはインターネットに接続する必要がありますか?
はい、このツールは、検索エンジンとウェブコンテンツにアクセスするためにインターネット接続を必要とします。しかし、データ処理とレポート作成は、ユーザーのプライバシーを保護するためにローカルで行われます。 - レポーティングでサポートされている言語は?
現在、使用するLLMに応じて、中国語、英語、その他の言語によるレポートをサポートしており、ユーザーは設定で出力言語を指定することができる。 - 検索結果の質を最適化するには?
例えば、「AIチップ」よりも「AIチップ市場2025」の方がより正確です。ユーザーは、コードによって検索パラメータを調整することもできます。 - プログラミングの経験は必要ですか?
基本的な使い方であればプログラミングは不要で、コマンドラインでの操作で十分だ。ただし、カスタム関数にはPythonとGitの基礎が必要です。