包括的な紹介 GraphGenは、上海のAIラボであるOpenScienceLabによって開発されたオープンソースのフレームワークで、GitHubでホストされています。知識グラフを通して合成データ生成を導くことで、大規模言語モデル(LLM)の教師ありファインチューニングを最適化することに焦点を当てています。LLMは、ソーステキストから、事前定義された知識グラフを使用して、きめ細かな知識グラフを構築する。
综合介绍 MiniMind-V 是一个开源项目,托管于 GitHub,旨在帮助用户在 1 小时内训练一个仅 2600 万参数的轻量级视觉语言模型(VLM)。它基于 MiniMind 语言模型,新增视觉编码器和特征投影模块,支持图像和文本联....
综合介绍 DeepCoder-14B-Preview 是由 Agentica 团队开发并在 Hugging Face 平台发布的开源代码生成模型。它基于 DeepSeek-R1-Distilled-Qwen-14B,通过分布式强化学习(RL...
総合的な紹介 WeCloneは、WeChatのチャットログと音声メッセージを大規模な言語モデルと音声合成技術と組み合わせて使用するオープンソースプロジェクトであり、ユーザーはパーソナライズされたデジタル・ドッペルゲンガーを作成することができます。このプロジェクトは、ユーザーのチャットの習慣を分析してモデルを訓練するだけでなく、少数の音声サンプルを使用して、リアルな声クローンを生成することができます...
综合介绍 Search-R1 是一个开源项目,由 PeterGriffinJin 在 GitHub 上开发,基于 veRL 框架构建。它通过强化学习(RL)技术训练大语言模型(LLM),让模型自主学会推理和调用搜索引擎解决问题。项目支持 Q...
综合介绍 Optexity 是一个在 GitHub 上开源的项目,由 Optexity 团队开发。它的核心是用人类演示数据训练 AI 完成计算机任务,尤其是网页操作。项目包含三个代码库:ComputerGYM、AgentAI 和 Playw...
综合介绍 Bonsai 是 deepgrove-ai 开发的一个开源语言模型,参数规模为 5 亿,采用三值权重(ternary weights)技术。它基于 Llama 架构和 Mistral 分词器设计,线性层经过调整以支持三值权重。模型...
Second MeはMindverseチームによって開発されたオープンソースプロジェクトで、あなたのコンピューター上に「デジタル・ドッペルゲンガー」のような働きをするAIを作り、あなたの言葉や記憶を通してあなたの話し方や習慣を学習し、あなたを理解するスマート・アシスタントに変えることができる。その最大の特徴は、すべての数字...
包括的な紹介 Easy Datasetは、大規模モデル(LLM)のファインチューニングのために特別に設計されたオープンソースツールで、GitHubでホストされています。ユーザーがファイルをアップロードし、コンテンツを自動的に分割し、質問と回答を生成し、最終的にファインチューニングに適した構造化データセットを出力できる、使いやすいインターフェースを提供します。オープン ...
MM-EUREKAは、上海交通大学の上海人工知能研究所とその他の関係者によって開発されたオープンソースプロジェクトです。ルールベースの強化学習技術により、テキスト推論機能をマルチモーダルシナリオに拡張し、モデルによる画像とテキスト情報の処理を支援する。このツールの主な目的は、画像やテキスト情報を処理するモデルを改善することである。
综合介绍 AI Toolkit by Ostris 是一个开源的AI工具集,专注于支持Stable Diffusion及FLUX.1模型的训练与图像生成任务。该工具集由开发者Ostris创建并维护,托管于GitHub,旨在为研究者和开发者提...
综合介绍 X-R1 是一个由 dhcode-cpp 团队在 GitHub 上开源的强化学习框架,旨在为开发者提供一个低成本、高效的工具,用于训练基于端到端强化学习的模型。该项目受到 DeepSeek-R1 和 open-r1 的启发,专注于...
综合介绍 OpenManus-RL是由UIUC-Ulab与 MetaGPT 社区的OpenManus团队联合开发的开源项目,托管于GitHub。该项目通过强化学习(RL)技术提升大型语言模型(LLM)智能体的推理与决策能力,基于Deepse...
综合介绍 TPO-LLM-WebUI 是由 Airmomo 在 GitHub 上开源的一个创新项目,通过直观的 Web 界面实现大语言模型(LLM)的实时优化。它采用 TPO(Test-Time Prompt Optimization)框架...
综合介绍 Open-Reasoner-Zero 是一个专注于强化学习(RL)研究的开源项目,由 GitHub 上的 Open-Reasoner-Zero 团队开发。它旨在通过提供高效、可扩展且易用的训练框架,加速人工智能领域的研究进程,特别...
包括的な紹介 中国語のDeepSeek-R1蒸留データセットは、機械学習と自然言語処理の研究を支援するために設計された、110Kのデータ項目を含むオープンソースの中国語データセットである。このデータセットはCong LiuのNLPチームによって公開されている。 このデータセットには数学的データだけでなく、論理的推論などの一般的なデータも多数含まれている。
包括的な紹介 ColossalAIは、HPC-AI Technologies社によって開発されたオープンソースプラットフォームで、大規模なAIモデルの学習と推論に効率的でコスト効率の高いソリューションを提供します。複数の並列戦略、ヘテロジニアスメモリ管理、混合精度学習をサポートすることで、ColossalAIはモデルの学習と推論を大幅に削減することができます...
综合介绍 One Shot LoRA 是一个专注于从视频生成高质量 视频 LoRA 模型的平台。用户可以快速、简便地从视频中训练出精品 LoRA 模型,无需登录或存储私人数据。该平台支持 Hunyuan Video 、 FLUX 和 SDX...
包括的な紹介 Kilnは、大規模言語モデル(LLM)の微調整、合成データの生成、およびデータセットのコラボレーションに焦点を当てたオープンソースツールです。Windows、MacOS、Linuxに対応した直感的なデスクトップアプリケーションを提供し、Llama、GPT4o、Mixtralなどのモデルをゼロコードで実装することができます。