代替URL：www.kdjingpai.com

Ctrl + D このサイトをブックマークする

削りかす

 ウェブサイトを投稿する

Muyan-TTS：パーソナライズされたポッドキャストの音声トレーニングと合成
Synthesis Muyan-TTSは、ポッドキャスティングシナリオ用に設計されたオープンソースのテキスト音声合成（TTS）モデルです。100,000時間以上のポッドキャスト音声データで事前にトレーニングされており、ゼロサンプル音声合成をサポートして、高品質の自然な音声を生成します。このモデルはLlama-3.2-3Bをベースに構築されており、SoVITSデコーディングと組み合わされています。
05-06 1790表彰される
CAD-MCP: CADソフトウェアを自然言語コマンドで制御するMCPサービス
概論 CAD-MCP は、ユーザが自然言語コマンドによって CAD ソフトウェアを制御し、図面を描画することを可能にするオープンソースプロジェクトです。自然言語処理とCAD自動化技術を組み合わせ、CADインターフェースを手動で操作することなく、簡単なテキストコマンドを入力するだけで、図面を作成・修正することができます。プロジェクト ...
05-06 1730表彰される
Cotrans: ワンストップのマンガ画像翻訳機（オープンソース、無料）
包括的な導入漫画画像翻訳者（Cotrans Translatorオープンソース版）テキスト内の漫画や絵を翻訳する。バッチ変換モード、Webサーバーモードや他の多様なオプションを使用して、コマンドラインの対話とオンラインデモを提供します。複数の言語でターゲット翻訳と設定することができます。
05-06 1.6 K0表彰される
GraphGen: 知識グラフを使って言語モデルを微調整し、合成データを生成する
包括的な紹介 GraphGenは、上海のAIラボであるOpenScienceLabによって開発されたオープンソースのフレームワークで、GitHubでホストされています。知識グラフを通して合成データ生成を導くことで、大規模言語モデル（LLM）の教師ありファインチューニングを最適化することに焦点を当てています。LLMは、ソーステキストから、事前定義された知識グラフを使用して、きめ細かな知識グラフを構築する。
05-05 940表彰される
ACI.DEV：MCPサーバーを介したAIインテリジェンスのための600以上のツールの統合
概要 ACI.devは、AIインテリジェンスに600以上のツールへの迅速な統合を提供するために設計されたオープンソースのインフラストラクチャプラットフォームです。マルチテナント認証ときめ細かな権限管理により、インテリジェンスがGoogleカレンダー、Slack、Brave Searchなどのツールに安全にアクセスできるようにします。
05-05 850表彰される
llm.pdf：大規模言語モデルをPDFファイルで実行する実験的プロジェクト
概要 llm.pdfは、PDFファイル内で大規模言語モデル(LLM)を直接実行できるオープンソースプロジェクトです。EvanZhouDevによって開発され、GitHubでホストされているこのプロジェクトは、革新的なアプローチを示しています: llama.cpp via Emscripten...
05-05 1130表彰される
Abogen：複数のテキスト形式をオーディオブックに変換するツール
一般的なAbogenは、ePub、PDFまたはプレーンテキストファイルを高品質のオーディオに迅速に変換するために設計されたオープンソースのツールです。Kokoro-82Mモデルを使用して自然で滑らかな音声を生成し、同時字幕生成をサポートしているため、オーディオブックやビデオの吹き替え、学習教材に適しています。使用...
05-05 770表彰される
ローカル・ディープ・リサーチ：詳細な調査レポートを作成するためのローカルで実行可能なツール
一般的な紹介 Local Deep Research は、ユーザが深い研究を行い、複雑な問題に対する詳細なレポートを作成するために設計されたオープンソースの AI 研究アシスタントです。ローカルでの実行をサポートしており、ユーザーはクラウドサービスに依存することなく研究タスクを完了することができます。このツールは、ローカルの大規模言語モデリング...
05-05 1060表彰される
DeepWiki：GitHubリポジトリのドキュメントの自動生成とAI対話の活用
概要 DeepWikiは、Cognition AIが提供する無料のツールで、GitHubリポジトリの構造化されたウィキペディアのようなドキュメントの生成に特化しています。コード、READMEファイル、設定ファイルを分析し、詳細なドキュメントとインタラクティブなダイアグラムを自動的に作成します。
05-05 1580表彰される
Trackers: ビデオオブジェクト追跡のためのオープンソースツールライブラリ
一般的な紹介 Trackersは、映像中の複数オブジェクト追跡に特化したオープンソースのPythonツールライブラリです。SORTやDeepSORTのようないくつかの主要なトラッキングアルゴリズムを統合しており、ユーザーは柔軟なビデオ解析のために異なるオブジェクト検出モデル（例えばYOLOやRT-DETR）を組み合わせることができます。ユーザー ...
05-05 1170表彰される
Kimi-Audio：オープンソースの音声処理と対話ベースモデル
一般的な紹介 Kimi-Audioは、Moonshot AIによって開発されたオープンソースの音声ベースモデルで、音声の理解、生成、対話に焦点を当てています。音声認識、音声Q&A、音声感情認識など、様々な音声処理タスクをサポートしています。このモデルは、1,300万時間以上の音声データを用いて事前にトレーニングされています。
05-05 910表彰される
Describe Anything: 画像やビデオ領域の詳細な説明を生成するオープンソースツール
概論 Describe Anything は、Describe Anything Model (DAM) を中核として、NVIDIA といくつかの大学により開発されたオープンソースプロジェクトです。このツールは、ユーザーが画像やビデオにマークした領域（ドット、ボックス、落書き、マスクなど）に基づいて、詳細な画像やビデオを生成する...
05-05 680表彰される
Cooragent: マルチインテリジェンス・タスク・コラボレーション・ツールの構築
Cooragentは、清華大学のLeapLabによって開発され、GitHubでホストされているオープンソースのAIエージェントコラボレーションフレームワークである。このフレームワークには2つのモードがあります。
05-05 1080表彰される
InstantCharacter：単一の画像から一貫性のある文字を生成するオープンソースツール
概要 InstantCharacterは、Tencent HunyuanとInstantXチームによって開発されたオープンソースプロジェクトで、GitHubでホストされています。参照画像とテキストの説明を使用して、様々なシーンやスタイルに対応する一貫性のあるキャラクター画像を生成します。このプロジェクトは、Diffusion var...
05-05 1020表彰される
詳細な調査レポートを作成するクロードのMCPサービス
総合紹介 MCP Server Deep Researchは、人工知能とウェブ検索によって複雑な問題の構造化された研究レポートを自動的に生成するオープンソースツールです。ユーザーがリサーチクエスチョンを入力すると、ツールはそのクエスチョンを分解し、権威のある情報を検索し、ソースの信頼性を評価し、引用を含む Markdo を生成します。
05-05 1290表彰される
Deep Recall：大規模モデルのためのエンタープライズクラスのメモリフレームワークを提供するオープンソースツール
包括的な紹介 Deep Recallは、大規模言語モデル（LLM）のために設計されたオープンソースのエンタープライズクラスのメモリフレームワークです。効率的な文脈検索と統合により、超パーソナライズされた応答性を提供します。このフレームワークは、メモリサービス、推論サービス、コーディネータを含む3層アーキテクチャを採用しており、GPUに最適化された推論をサポートしています。
05-05 900表彰される
CleverBee：オープンソースのAIリサーチアシスタントが引用研究を生成
一般的な紹介 CleverBeeはGitHubでホストされているオープンソースのAI研究アシスタントであり、SureScaleAIによって開発された。ウェブブラウジング技術と大規模な言語モデル（GeminiやClaudeなど）を組み合わせることで、ユーザが素早く情報を収集、分析、要約し、引用文献を含む研究を生成することを支援します。
05-05 740表彰される
FantasyTalking: リアルな似顔絵を生成するオープンソースツール
一般的な紹介 FantasyTalkingは、Fantasy-AMAPチームによって開発されたオープンソースプロジェクトで、音声駆動型の生成によってリアルなトーキングポートレート動画を生成することに焦点を当てています。このプロジェクトは、先進的なビデオ拡散モデルWan2.1をベースに、音声エンコーダーWav2Vecと独自のモデルの重みを組み合わせ、人工知能を使用しています。
05-05 770表彰される
Paper2Code: 機械学習論文を実行可能なコードに自動変換する
一般的な紹介 Paper2Codeは、機械学習論文のコード実装が不足しているという問題を解決することを目的としたオープンソースプロジェクトである。マルチエージェントの大規模言語モデル（LLM）システムPaperCoderによって、科学論文を実行可能なコード・リポジトリに自動的に変換する。このシステムは、計画、分析、コード生成の3段階のフローを使用する。
05-05 1060表彰される

クリックして詳細を読み込む

日本語