ReCallは、教師ありデータに頼らずに、強化学習によってツールの呼び出しと推論のための大規模言語モデル(LLM)を学習するために設計されたオープンソースのフレームワークです。ReCallは、複雑なタスクを解決するために、検索や計算機などの外部ツールを自律的に使用し、組み合わせることを可能にします。
GraphGenは、上海のAIラボであるOpenScienceLabによって開発されたオープンソースのフレームワークで、GitHubでホストされている。知識グラフを通して合成データ生成をガイドすることで、大規模言語モデル(LLM)の教師ありファインチューニングを最適化することに焦点を当てている。予想されるキャリブレーション誤差を利用して、ソーステキストからきめ細かな知識グラフを構築する。
MiniMind-VはGitHubでホスティングされているオープンソースプロジェクトで、わずか2600万個のパラメータを持つ軽量な視覚言語モデル(VLM)を1時間以内に学習できるように設計されています。MiniMind言語モデル、新しい視覚コーダーと特徴投影モジュール、画像とテキストの共同処理のサポートに基づいています。
DeepCoder-14B-Previewは、Agenticaチームによって開発され、Hugging Faceプラットフォームでリリースされたオープンソースのコード生成モデルです。DeepSeek-R1-Distilled-Qwen-14Bをベースに、分散強化学習(RL)技術によって最適化されています。
WeCloneはオープンソースのプロジェクトで、WeChatのチャットログと音声メッセージを大規模な言語モデルと音声合成技術と組み合わせることで、パーソナライズされたデジタル・ドッペルゲンガーを作成することができる。このプロジェクトは、モデルを訓練するためにユーザーのチャット習慣を分析することができ、また、少数の音声サンプルでリアルな声クローンを生成することができます。最終的には、デジタル...
Search-R1はPeterGriffinJinによってGitHub上で開発されたオープンソースプロジェクトで、veRLフレームワーク上に構築されている。強化学習(RL)技術を使って大規模言語モデル(LLM)を学習することで、モデルが自律的に推論を学習し、問題を解決するために検索エンジンを呼び出します。プロジェクト・サポート Qwen2....
OptexityはGitHub上のオープンソースプロジェクトで、Optexityチームによって開発されている。このプロジェクトの中核は、人間のデモデータを使用して、コンピュータタスク、特にウェブページ操作を完了するAIを訓練することである。このプロジェクトは、ComputerGYM、AgentAI、Playwrightの3つのコードライブラリで構成されている。
Bonsaiはdeepgrove-aiによって開発されたオープンソースの言語モデルで、パラメータサイズは5億、3項重みを使用する。LlamaアーキテクチャとMistral分類器設計をベースにしており、3項重みをサポートするように線形レイヤーが調整されています。このモデルでは、主に...
Second MeはMindverseチームによって開発されたオープンソースプロジェクトで、あなたのコンピューター上に「デジタル・ドッペルゲンガー」のような働きをするAIを作ることができ、あなたの言葉や記憶を通してあなたの話し方や習慣を学習し、あなたを理解するインテリジェントなアシスタントになる。その最大の特徴は、すべてのデータが...
Easy Datasetは、大規模モデル(LLM)の微調整のために特別に設計されたオープンソースツールで、GitHubでホストされています。ユーザーがファイルをアップロードし、コンテンツを自動的にセグメント化し、質問と回答を生成し、最終的にファインチューニングに適した構造化データセットを出力できる、使いやすいインターフェースを提供する。開発者のCona...
MM-EUREKAは、上海交通大学上海人工知能研究所とその他の関係者によって開発されたオープンソースプロジェクトです。ルールベースの強化学習技術により、テキスト推論機能をマルチモーダルシナリオに拡張し、モデルが画像とテキスト情報を処理できるようにする。このツールの主な目的は、画像やテキスト情報を処理するモデルを強化することである。
AI Toolkit by Ostrisは、Stable DiffusionとFLUX.1モデルの学習と画像生成タスクのサポートに焦点を当てたオープンソースのAIツールキットです。開発者のOstrisによって作成・保守され、GitHubでホストされているこのツールキットは、研究者や開発者に柔軟なモデリングを提供することを目的としています。
X-R1は、dhcode-cppチームによってGitHubでオープンソース化された強化学習フレームワークであり、エンドツーエンドの強化学習に基づくモデルをトレーニングするための低コストで効率的なツールを開発者に提供することを目的としている。DeepSeek-R1とopen-r1にインスパイアされたこのプロジェクトは、簡単な...
OpenManus-RLは、UIUC-UlabとMetaGPTコミュニティのOpenManusチームによって共同開発されたオープンソースプロジェクトで、GitHubでホストされている。このプロジェクトは、Deepseek-R1に基づく強化学習(RL)技術によって、大規模言語モデル(LLM)インテリジェンスの推論および意思決定能力を強化する。
TPO-LLM-WebUIは、AirmomoがGitHubでオープンソース化している革新的なプロジェクトで、直感的なWebインターフェースを通じて大規模言語モデル(LLM)のリアルタイム最適化を可能にします。TPO (Test-Time Prompt Optimisation)フレームワークを使用し、LLMのリアルタイム最適化を実現します。
Open-Reasoner-Zeroは、強化学習(RL)研究に焦点を当てたオープンソースプロジェクトで、GitHub上のOpen-Reasoner-Zeroチームによって開発されています。効率的でスケーラブルかつ使いやすい学習フレームワークを提供することで、人工知能分野の研究プロセスを加速させることを目的としており、特に汎用的な人間...
中国語のDeepSeek-R1蒸留データセットは、機械学習と自然言語処理の研究をサポートするために設計された110Kのデータを含むオープンソースの中国語データセットです。このデータセットはLiu Cong NLPチームによって公開されたもので、数学的なデータだけでなく、論理的推論や小洪水などの一般的な種類のデータも多数含まれています。
ColossalAIは、HPC-AI Technologies社によって開発されたオープンソースプラットフォームで、大規模なAIモデルの学習と推論に効率的で費用対効果の高いソリューションを提供します。複数の並列戦略、ヘテロジニアスメモリ管理、混合精度学習をサポートすることで、ColossalAIはモデルの学習と推論にかかる時間を大幅に短縮し、...
One Shot LoRAは、動画から高品質の動画LoRAモデルを生成することに特化したプラットフォームです。ユーザーは、ログインや個人データの保存をすることなく、動画から高品質なLoRAモデルを迅速かつ簡単にトレーニングすることができます。このプラットフォームは、Hunyuan Video、FLUX、SDXLをサポートしています。