NotebookLlamaは、LlamaCloudテクノロジーに基づいた完全なオープンソースのツールで、ユーザーがドキュメントを管理し、ポッドキャストのようなオーディオコンテンツを生成できるように設計されています。研究者、学生、ビジネスユーザー向けのGoogle NotebookLMの代替ツールです。NotebookLlamaは、ドキュメントのアップロード、ナレッジベースの作成、インテリジェントな分析による重要な情報の抽出が可能で、ドキュメントのコンテンツを自然な音声に変換する機能も備えている。このプロジェクトはGitHubでホストされており、透明性の高いコード、強力なコミュニティサポート、明確なインストールプロセスにより、技術愛好家や専門家に適している。
機能一覧
- ドキュメントのアップロードと管理個人またはチームのナレッジベースを構築するために、複数のフォーマット(PDFなど)のドキュメントのアップロードをサポートします。
- 知識の抽出と要約LlamaCloud技術により、ドキュメントを自動的に分析し、コアコンテンツを抽出し、要約を生成します。
- オーディオ・ジェネレーション自然な音声出力をサポートし、文書コンテンツをポッドキャストのような音声に変換します。
- オープンソースでカスタマイズ可能コードは完全にオープンソースであり、ユーザーは要求に応じて機能を変更したり拡張したりすることができます。
- マルチプラットフォーム対応DockerとStreamlitで動作し、ローカルまたはクラウドでのデプロイをサポートします。
- インテリジェント・サーチ文書の内容に基づいてインテリジェントな検索を行い、情報をすばやく探し出します。
ヘルプの使用
設置プロセス
NotebookLlamaを使用するには、まずインストールと設定を完了する必要があります。以下が詳しいインストール手順です:
- コードベースのクローン
ターミナルで以下のコマンドを実行し、NotebookLlamaプロジェクトをローカルにクローンします:git clone https://github.com/run-llama/notebookllama
プロジェクト・カタログにアクセスする:
cd notebookllama/
- 依存関係のインストール
利用するuv
ツールは必要な依存パッケージをインストールする:uv sync
Pythonと
uv
.持っていない場合は、まずPython 3.8以上をインストールしてpip install uv
取り付けuv
. - APIキーの設定
このプロジェクトには3つのAPIキーが必要だ:OpenAI、ElevenLabs、LlamaCloud:- プロジェクト・ディレクトリを
.env.example
ドキュメンテーション - APIキーを取得する:
OPENAI_API_KEY
OpenAIのプラットフォームにログインし、Account Settingsからキーを生成します。ELEVENLABS_API_KEY
イレブンラボのウェブサイトの設定ページから入手できます。LLAMACLOUD_API_KEY
LlamaCloudのダッシュボードにアクセスしてキーを入手してください。
- キーを
.env.example
ファイルを作成し、ファイル名を変更する:mv .env.example .env
- プロジェクト・ディレクトリを
- 初期化スクリプトの実行
以下のコマンドを実行して、LlamaCloudインデックス作成・抽出エージェントを作成します:uv run tools/create_llama_extract_agent.py uv run tools/create_llama_cloud_index.py
- サービス開始
DockerでPostgresとJaegerのサービスを開始する:docker compose up -d
MCPサーバーを起動する:
uv run src/notebookllama/server.py
- Streamlitアプリケーションの実行
Streamlitフロントエンドインターフェースを起動します:streamlit run src/notebookllama/Home.py
取り付け
ffmpeg
(まだインストールされていない場合):- Ubuntuで:
sudo apt-get install ffmpeg
- macOS上で:
brew install ffmpeg
- Ubuntuで:
- アプリケーションへのアクセス
ブラウザを開き、次のサイトにアクセスする。http://localhost:8751/
今すぐNotebookLlamaを使い始めることができます。
主な機能
ドキュメントのアップロードとナレッジベースの作成
- 手続き::
- Streamlitインターフェイスにログインし、"Upload Document "ボタンをクリックする。
- システムにアップロードするPDFまたはその他のサポートされているドキュメント形式を選択します。
- システムは自動的に文書の内容を解析し、知識ベースに組み込む。
- 機能的特徴::
- バッチアップロードに対応しており、大量の研究資料を処理するのに適しています。
- 文書コンテンツは、その後の検索や分析のために自動的にインデックス化されます。
知識の抽出と要約
- 手続き::
- インターフェイスでアップロードされたドキュメントを選択します。
- 情報の抽出」または「サマリーの作成」ボタンをクリックします。
- このシステムは文書を分析し、重要なポイントや要約、Q&Aの内容を出力する。
- 機能的特徴::
- 正確で簡潔な抽出のためのLlamaCloudに基づくインテリジェントな分析。
- 特定の章のみを抽出するなど、ユーザー定義の抽出範囲をサポート。
オーディオ・ジェネレーション
- 手続き::
- 音声を生成する必要のある文書または要約コンテンツを選択します。
- ポッドキャスト生成」ボタンをクリックすると、システムがElevenLabs APIを呼び出してテキストを音声に変換します。
- 生成されたオーディオファイルをダウンロードするか、オンラインで直接再生してください。
- 機能的特徴::
- 音声は自然で滑らかで、人間のポッドキャスト効果に近い。
- 多言語音声出力をサポートし、国際化のニーズに対応。
インテリジェント・サーチ
- 手続き::
- インターフェイスにキーワードまたは質問を入力します。
- システムは関連する文書の断片や回答を返す。
- 機能的特徴::
- 検索結果は文書の内容に基づいており、非常に正確です。
- 文書のトピックを要約する」などの複雑なクエリをサポート。
ほら
- ネットワークが安定しており、APIコールにインターネット接続が必要であることを確認する。
- 音声生成に失敗した場合は
ffmpeg
正しく取り付けられているか。 - 定期的にコードベースを更新し、最新の機能を追加する:
git pull origin main
.
アプリケーションシナリオ
- 学術研究
研究者は学術論文をアップロードすることで、重要な情報を素早く抽出したり、要約を作成したりすることができる。音声機能は、通勤中に論文の内容を聴いて効率化を図るのに適している。 - ビジネス分析
ビジネスユーザーは、市場レポートや社内文書をアップロードしてナレッジベースを構築します。インテリジェントな検索機能と要約機能により、意思決定を支援する重要なデータを素早く見つけることができます。 - 教育的学習
学生は教科書やプリントをアップロードし、要約や音声を生成して簡単に復習することができます。音声機能は特に聴覚学習者に適しています。 - コンテンツ制作
ポッドキャスト作成者は、記事やメモを音声に変換してポッドキャスト・コンテンツを素早く作成し、録音時間を節約できます。
品質保証
- NotebookLlamaはどのような文書形式に対応していますか?
現在、PDF、TXTと他の一般的な形式をサポートしていますが、将来的にはより多くの形式を拡張する可能性があります。 - APIを使用するためにお金を払う必要がありますか?
はい、OpenAI、ElevenLabs、LlamaCloudのAPIには、それぞれの有料アカウントが必要です。ユーザーは自分で登録し、キーを取得する必要があります。 - ローカル展開には高性能ハードウェアが必要ですか?
一般的な家庭用コンピューター(8GB RAM、4コアCPU)で実行可能で、Dockerのデプロイには約10GBのディスク容量が必要だ。 - 音声はどの程度スピーチを生成しますか?
イレブンラボが提供する音声は、人間のアナウンサーレベルに近く、複数の言語とトーンに対応している。