ビデオ顔交換
Video Face Swapは完全無料のAI顔入れ替えツールで、どんな動画でも簡単に顔を入れ替えることができます。このツールは、ビデオ、写真、GIFアニメーションのリアルタイムまたは後処理による顔の入れ替えをサポートします。そのインテリジェントなアルゴリズムは、ビデオ内の顔を認識し、正確に置き換えて、リアルな顔を生成します。
Codeium (Windsurf Editor): 無料のAIコード補完&チャットツール。
Codeiumは、開発者のプログラミング効率を向上させるために設計された無料のAIコード補完およびチャットツールです。70以上のプログラミング言語をサポートし、40以上の統合開発環境(IDE)と互換性があります。Codeiumはコードの自動補完を提供するだけでなく、コード生成、コード解釈、チャット機能を備えており、...
ポケパルAI
PocketPal AIは、iOSとAndroidの両ユーザー向けに、Small Language Models (SLM)を携帯電話に直接導入するために設計されたオープンソースのモバイルアプリです。ウェブに依存しないAIチャット体験を提供し、ユーザーの隠れた...
Cursor試用期間リセットツール:Cursor試用期間制限の問題を解決し、簡単に試用期間をリセットし、プロフェッショナル版へのアップグレードを回避する。
Cursor 無料トライアルリセットツールは、Cursor の無料サブスクリプション中のマルチアカウント制限の問題を解決するために設計されたオープンソースツールです。ユーザが同じマシンで複数の無料トライアルアカウントを使用すると、Cursorは "Too many free trial acc... "というプロンプトを表示します。
Roo Code (Roo Cline): Clineをベースに強化された自律型プログラミングアシスタント、インテリジェントIDEプログラミングアシスタント
Roo Code (旧Roo Cline)Roo Code (Roo Cline)は、VS Codeの強力な拡張プラグインであるClineをベースに強化された自律プログラミングアシスタントです。このツールは、統合開発環境(IDE)での自律的なコーディングを可能にし、...
MagicQuill:インテリジェントなインタラクティブ画像落書き編集システム、正確なローカル落書き編集
MagicQuillは、HKUST、Ant Group、浙江大学、香港大学によって立ち上げられたオープンソースのAI対話型画像編集ツールである。このツールは、インテリジェントかつインタラクティブな方法で画像の正確なローカル編集を可能にすることを目的としている。MagicQuillは、ユーザーフレンドリーなインターフェースとAI駆動の...
すなわち夢のAI
Instant Dream AIは、多彩で強力なクリエーションツールをユーザーに提供するために設計された、ワンストップのAIクリエーションプラットフォームです。画像生成、スマートキャンバス、ビデオ生成、音楽生成など、Instant Dream AIはユーザーの創造性を簡単に実現することができます。このプラットフォームは、AIドローイング、AIビデオ、AIサウンド...を含む複数の作成モードをサポートしています。
リメイカー:無料のオンライン顔変更ツール
Remaker AIは、最新のAI技術を駆使して開発された革新的なツールセットで、テキスト、画像、音声など、さまざまなタイプのコンテンツの作成と生成をサポートします。このプラットフォームにより、ユーザーは写真やビデオのフェイススワップ、AIポートレートの生成、画像のズームイン、トーキングフォトの作成などを行うことができます。
LTXスタジオ
LTX Studioは、クリエイター、マーケティング担当者、映像制作者、スタジオ向けに設計された、AIを活用した革新的な映像制作プラットフォームです。ストーリーのアイデア出しから、分割画面の生成、モーションエフェクトの追加、ポスト編集までのフルフローを提供し、ユーザーがクリエイティブなコンセプトを詳細なストーリーボードや高品質な...
聞き取る
Tongyi Listening and Understandingは、AliCloudの強力なAIモデルによって、音声や動画コンテンツをリアルタイムでテキスト化し、翻訳や要約、位置情報などの機能を提供する。AliCloudの強力なAIモデルに依存し、音声や動画コンテンツをリアルタイムでテキストに書き起こし、翻訳、要約、位置決めなどの機能を提供する。Tongyi Listening Wooは複数の言語とシナリオをサポートし、ユーザ...
Conch Speech (MiniMax Audio): 自然な音声を生成するAIツール
MiniMax Audioは、MiniMax社のAI音声生成ツールで、テキストを類似性の高い自然な音声に素早く変換することを主な特徴としています。Speech-02モデルをベースにしており、最大99%の音声合成類似度、スタジオ級の音質、30以上の言語と幅広い口語をサポートしています。
kun-lab: Ollamaベースのネイティブ軽量AI対話クライアント
kun-labはOllamaをベースとしたオープンソースのAI対話アプリで、軽量、高速、ローカライズされたインテリジェントな対話体験を提供することに重点を置いています。Windows、macOS、Linuxをサポートし(現在はWindowsがメイン)、使用するのに複雑な設定は必要ありません。ユーザーはスムーズな...
1月:オープンソースのオフラインAIアシスタント、ChatGPTの代替、ローカルAIモデルの実行またはクラウドAIへの接続
JanはオープンソースのChatGPT代替ツールで、ユーザーのデバイス上でオフラインで100%を実行することができます。Cortexエンジンによって駆動され、NVIDIA GPUやAppleのMシリーズチップを含む幅広いハードウェアプラットフォームをサポートしています。Janは、ユーザーがダウンロードして実行できる、以下のようなモデルの豊富なライブラリを提供しています。
AI顔交換:無料AI顔交換、ビデオ顔交換、マルチプレイヤー顔交換ツール
AI Face Swapは、人工知能技術を使って写真、ビデオ、GIFの顔を簡単に入れ替えることができる無料のオンライン・プラットフォームである。ソフトウェアのダウンロードやアカウント登録は不要で、ユーザーはファイルをアップロードするだけですぐに行うことができる。このウェブサイトは、JPG、PNG、MP4、GIFなどの複数のフォーマットをサポートしており、出力...
AdpexAI: ジェネレーティブAI画像・動画コンテンツ作成プラットフォーム
AdpexAIは、画像編集、ビデオ編集、AIチャット、コード生成を提供するジェネレーティブAIツールのオールインワン・オンライン・プラットフォームです。ユーザーは、ソフトウェアをインストールすることなく、ブラウザを通して、高品質のビジュアルコンテンツを素早く作成したり、コードを書いたり、インテリジェントなAIモデルと対話したりすることができます。このプラットフォームは、最先端のAIを幅広くサポートしています。
エケト
EkotuはEコマース、マーケティング、個人ユーザー向けのオンライン写真編集・ポスターデザインプラットフォームです。ユーザーはソフトウェアをインストールする必要がなく、ブラウザを通して写真加工、ポスター制作、ビデオ編集を行うことができます。このプラットフォームは、豊富な無料テンプレート、純正素材、AIツールを提供しており、Eコマースの商品画像を素早く生成するのに適しています。
Vidnoz AI:たった1枚の写真でデジタル人語動画を生成、複数の無料動画生成ツール
Vidnozは、1分以内に素早くAIビデオを作成できる無料のAIビデオ生成プラットフォームです。費用、ダウンロード、経験は必要ありません。このプラットフォームは、500以上のAIアバター、470以上のリアルなAIナレーション、500以上のテンプレートを提供しています。Vidnoz AI Video Generatorを使えば、ユーザーはより速くビデオを作成し、ピッチを向上させることができます。
AIイメージエディター
AI Image Editorは、AIベースのオンライン写真編集ツールで、ユーザーはソフトウェアをダウンロードすることなく、幅広い画像処理タスクを実行することができます。ぼやけた写真の鮮明度を上げたり、不要な透かしを削除したり、様々なクリエイティブスタイルを試したり、このプラットフォームなら簡単にできます。簡単に使える...
ウィスク:複数の画像をアップロードし、テーマ、シーン、スタイルをミックスしてユニークなアートワークを作成します!
WhiskはGoogle Labsが開発した革新的なAI画像生成ツールで、複数の画像をアップロードすることで、さまざまなテーマやシーン、スタイルをミックスできるように設計されている。テキストプロンプトに依存する従来の画像生成ツールとは異なり、Whiskは主に画像を入力として使用するため、ユーザーはより直感的に作品を作成することができます...
聞き取る
Tongyi Listening and Understandingは、AliCloudの強力なAIモデルによって、音声や動画コンテンツをリアルタイムでテキスト化し、翻訳や要約、位置情報などの機能を提供する。AliCloudの強力なAIモデルに依存し、音声や動画コンテンツをリアルタイムでテキストに書き起こし、翻訳、要約、位置決めなどの機能を提供する。Tongyi Listening Wooは複数の言語とシナリオをサポートし、ユーザ...
SkyReels:自然な動きのあるパノラマポートレートの生成に特化したAI動画スキット作成プラットフォーム
SkyReelsは、AI動画作成に特化したオンラインプラットフォームで、ユーザーがテキストスクリプトやクリエイティブなアイデアを高品質なショートビデオに素早く変換できるように設計されています。コンテンツ制作者、マーケティング担当者、一般ユーザーのいずれであっても、テキストを入力するだけで、リアルな音声、正確な字幕、...
Google AI Studio:マルチモーダル生成モデルを構築するための最新のGoogle Geminiモデルの体験と統合
Google AI Studioは、開発者が最新のマルチモーダルジェネレーティブAIモデルを迅速に統合して利用できるように設計された、Googleが提供するプラットフォームである。Gemini APIキーを取得することで、ユーザーは5分以内に強力なAI機能をアプリケーションに統合することができる。Gemini ...
レポ・プロンプト:ローカル・フォルダー・コンテキストに依存した記述、対話、最適化されたコード
Repo PromptはmacOSプラットフォーム向けに開発されたネイティブアプリケーションで、高度なAI言語モデルを使用してネイティブコードを扱う開発者のプロセスを簡素化することに特化しています。このツールは、開発者がコードファイルをインテリジェントな方法で管理・修正し、開発効率を大幅に向上させるのに役立ちます。このツールの強みは、開発者に...
Internet.io:複数のAIモデルからの回答を集約する知的作業プラットフォーム
Internet.ioは、複数のトップAIモデルからの回答を集約するインテリジェント・プラットフォームである。1つのAIの回答が不正確であったり、一貫性がなかったりするという問題を解決することを目的としている。ユーザーは質問をすると、同時に複数の一流AIモデルから回答を得ることができ、簡単に比較して最も信頼できる回答を選ぶことができる。また、このプラットフォームは...
粘着Internet.io:複数のAIモデルからの回答を集約する知的作業プラットフォーム
Internet.ioは、複数のトップAIモデルからの回答を集約するインテリジェント・プラットフォームである。1つのAIの回答が不正確であったり、一貫性がなかったりするという問題を解決することを目的としている。ユーザーは質問をすると、同時に複数の一流AIモデルから回答を得ることができ、簡単に比較して最も信頼できる回答を選ぶことができる。また、このプラットフォームは...
粘着シグマAIブラウザー:主流のビッグモデルを使用するための無料のAIブラウザー
Sigma AI BrowserはSigmaBrowser OÜによって開発された先進的なブラウザーで、人工知能技術を活用し、より高速でスマートなブラウジング体験をユーザーに提供します。このブラウザはスピードと効率性だけでなく、強化されたセキュリティとパーソナライズされたレコメンデーションを提供し、ユーザーの利便性を確保します。
粘着Page Assist: ネイティブAIモデルの対話とドキュメントの検索のためのウェブアシスタントプラグイン
Page Assistは、ローカルのAIモデルと対話する簡単な方法をユーザーに提供するために設計されたオープンソースのブラウザ拡張機能です。この拡張機能を使用すると、ユーザーは任意のWebページでサイドバーを開き、ローカルで実行されているAIモデルと対話することができます。Page Assistは、Chrome、B...を含む複数のブラウザをサポートしています。
粘着Grok: Grokアプリ、高度な推論、コーディング、視覚処理を提供するAIアシスタント
Grokは、xAIによって開発されたAIチャットボットで、ユーザーに信憑性があり、興味深く、有益な回答を提供するように設計されている。テキストの質問だけでなく、画像を生成し、リアルタイムのデータ更新、特にX(旧Twitter)プラットフォーム経由の情報を提供します。Grokのマルチモーダル機能により、ビジュアル...
Quick Prompt: プロンプトを素早く管理・使用するためのブラウザ拡張機能
クイックプロンプトはプロンプト管理とクイック入力に特化したオープンソースのブラウザ拡張機能です。ユーザーはプロンプトのライブラリを作成、整理、保存し、定義済みのプロンプトコンテンツを任意のウェブページの入力ボックスに素早く挿入することができます。このツールは、特に頻繁に使用する必要があるAIモデル(例: ...
ChatOn: 汎用AIチャット&クリエイティビティツール
ChatOnはGPT-4oとClaude 3.5をベースにした多機能なAIプラットフォームで、インテリジェントなチャット、文章作成支援、画像生成、文書処理を提供する。ユーザーは、テキストや音声入力を通じて、ソーシャルメディア投稿の生成、PDF文書の要約、コードの記述などのタスクを迅速に完了することができます。ネット...
AI-Pro:複数のAIツールと学習リソースを統合したプラットフォーム
AI-Pro.orgはAIに特化したウェブサイトで、幅広いAIツールや学習リソースをユーザーに提供している。サイトの目的は、初心者や専門家がAI技術を習得するのを助けることであり、テキスト生成、画像作成、チャットボットなどの機能をカバーしている。ユーザーは購読することで、より高度な機能を利用することができる。
MaxAI:ウェブの読み書きを効率化するブラウザ拡張機能
MaxAIは、ユーザーがウェブ上でより効率的に情報を読み、書き、処理できるように設計されたAIベースのブラウザ拡張機能です。DeepSeek、GPT-4o、Claude-3.5、Gemini-2.0などの様々な高度なAIモデルを統合することで、要約、翻訳、ライティングの最適化などを提供します。使用方法 ...
kun-lab: Ollamaベースのネイティブ軽量AI対話クライアント
kun-labはOllamaをベースとしたオープンソースのAI対話アプリで、軽量、高速、ローカライズされたインテリジェントな対話体験を提供することに重点を置いています。Windows、macOS、Linuxをサポートし(現在はWindowsがメイン)、使用するのに複雑な設定は必要ありません。ユーザーはスムーズな...
UIプロンプト:美しいウェブページのUIプロンプトを生成するアシスト
UI Promptは、デザイナーがUIデザインのインスピレーションを素早く得るためのオンラインツールです。多様なデザインプロンプトと美しいUI例を提供することで、ユーザーがニーズに合ったインターフェイスデザインを生み出せるようサポートします。ウェブ、モバイル、その他のデジタル製品のいずれにおいても、UI Promptはデザイナーに直感的な...
リコール:ウェブ閲覧時に個人的な知識ベースに関する情報を表示する
Recallは、ウェブページ、ビデオ、PDFなどを素早く要約し、個人的な知識ベースに預けることで、ブラウジング体験を向上させる人工知能ツールです。中心的な機能は、ブラウジング中にリアルタイムで関連情報を表示し、断片化されたコンテンツを順序付けられた知識ネットワークに整理するのを助けることです。Paulとそのチームによって開発されたこのツールは...
Glama:1000以上のMCPサービスを統合する多機能AIチャットツール
Glamaはパワフルで使いやすいAIチャットツールです。さまざまなAIモデルとの会話をサポートするだけでなく、ファイルのアップロード、ウェブでの情報検索、さらにはプロフェッショナルなグラフの生成も可能だ。このウェブサイトは、企業チームや開発者、個人ユーザーなど、情報やタスクを効率的に処理する必要のあるユーザーを対象としている。Glamaの中核となる強みは...
粘着Artbreeder: 教材のための優れたイメージコントロールとイメージスタイルブレンドツール!
Artbreederは、人工知能(AI)ベースの共同アート制作サイトです。StyleGANとBigGANモデルを使用し、ユーザーが顔、風景、絵画などの画像を生成したり、修正したりするのを支援する。遺伝子」スライダーを操作することで、ユーザーは新しい変種を作ったり、新しい影響を生み出すために画像を交配させたりすることができる。
粘着OpenCreator:複数のAIモデルを統合してクリエイティブな動画を生成
OpenCreatorは、20以上のジェネレーティブAIモデルを集めたクリエイター向けのオンラインツールです。ユーザーは、プラットフォームを切り替えたり、複数のサブスクリプションを支払うことなく、簡単にクリエイティブな動画を生成するために使用することができます。シンプルなインターフェースを持ち、ワンクリックで異なるモデルの効果を比較することができます。
粘着すなわち夢のAI
Instant Dream AIは、多彩で強力なクリエーションツールをユーザーに提供するために設計された、ワンストップのAIクリエーションプラットフォームです。画像生成、スマートキャンバス、ビデオ生成、音楽生成など、Instant Dream AIはユーザーの創造性を簡単に実現することができます。このプラットフォームは、AIドローイング、AIビデオ、AIサウンド...を含む複数の作成モードをサポートしています。
粘着流星群
Xingliuは、LiblibAIチームによって開発された新世代のAI画像生成ツールで、自社開発のStar-3 Alpha画像生成モデルをベースとしており、高精度で多様な画像生成サービスを提供することができます。デザイナー、写真家、画像クリエイターの生産性を強力にサポートすることを目指しています。その...
PMAI:AIによるプロダクトマネージャー向け文書作成・データ分析ツール
PMAIは、https://www.pm-ai.cn/、プロダクトマネージャー向けに設計されたAI支援ツールです。製品要件文書(PRD)の迅速な生成、ソリューション提案の提供、SQLクエリコードの生成などを支援し、プロダクトマネージャーの日常業務を簡素化します。PMAIはAI技術を使用しています...
AIイメージエディター
AI Image Editorは、AIベースのオンライン写真編集ツールで、ユーザーはソフトウェアをダウンロードすることなく、幅広い画像処理タスクを実行することができます。ぼやけた写真の鮮明度を上げたり、不要な透かしを削除したり、様々なクリエイティブスタイルを試したり、このプラットフォームなら簡単にできます。簡単に使える...
AdpexAI: ジェネレーティブAI画像・動画コンテンツ作成プラットフォーム
AdpexAIは、画像編集、ビデオ編集、AIチャット、コード生成を提供するジェネレーティブAIツールのオールインワン・オンライン・プラットフォームです。ユーザーは、ソフトウェアをインストールすることなく、ブラウザを通して、高品質のビジュアルコンテンツを素早く作成したり、コードを書いたり、インテリジェントなAIモデルと対話したりすることができます。このプラットフォームは、最先端のAIを幅広くサポートしています。
Poify:AIを活用したeコマース画像生成・編集ツール
PoifyはEコマースユーザーのために設計されたAIツールで、商人が高品質な商品ディスプレイ画像を素早く生成するのに役立ちます。Poifyは "テキストから画像へ "と "画像から画像へ "機能をサポートしており、ユーザーはテキストの説明や既存の画像から画像を生成することができます。
DiffPortrait360: 1枚のポートレートから360度のヘッドビューを生成
DiffPortrait360は、CVPR 2025の論文DiffPortrait360: Consistent Portrait Diffusion for 360 View Synthesisに関連するオープンソースプロジェクトです。DiffPortrait360は、360ビュー合成のための一貫したポートレート拡散です。
Headshotly:プロのヘッドショットを素早く作成するAIツール
Headshotlyは、AI技術を使ってプロのヘッドショットを素早く生成するオンラインツールだ。ユーザーが普通の自撮り写真を数枚アップロードするだけで、AIがそれを処理し、高品質のプロフェッショナルなヘッドショットを生成する。このウェブサイトは、シンプルな操作と効率的な体験に重点を置いており、ソーシャルメディアのイメージを素早く更新する必要がある人に適している。
new.email:テキストを入力し、Eメールテンプレートを素早く生成する
new.emailは、ユーザーがEメールテンプレートを素早く作成できるよう支援する、使いやすいウェブサイトです。メールデザインをより効率的にすることを目標に、Resendによって開発されました。このツールを使って様々な目的のメールテンプレートを作成するのに、複雑な技術的背景は必要ありません。このウェブサイトでは、わかりやすい...
Reve.art:美学とカメラレディを融合した画像生成プラットフォーム
Reve.artはAIを活用した画像生成プラットフォームで、主な製品はReve Image 1.0(通称Halfmoon)である。米国カリフォルニア州アルトにあるReve AI, Inc.の研究者、エンジニア、デザイナー、ストーリーテラーのチームによって開発されました。
粘着OpenCreator:複数のAIモデルを統合してクリエイティブな動画を生成
OpenCreatorは、20以上のジェネレーティブAIモデルを集めたクリエイター向けのオンラインツールです。ユーザーは、プラットフォームを切り替えたり、複数のサブスクリプションを支払うことなく、簡単にクリエイティブな動画を生成するために使用することができます。シンプルなインターフェースを持ち、ワンクリックで異なるモデルの効果を比較することができます。
粘着SkyReels:自然な動きのあるパノラマポートレートの生成に特化したAI動画スキット作成プラットフォーム
SkyReelsは、AI動画作成に特化したオンラインプラットフォームで、ユーザーがテキストスクリプトやクリエイティブなアイデアを高品質なショートビデオに素早く変換できるように設計されています。コンテンツ制作者、マーケティング担当者、一般ユーザーのいずれであっても、テキストを入力するだけで、リアルな音声、正確な字幕、...
リトル・ミラー・ストーリーボード
Little Mirror Storyboard (xjstoryboard.com)は、分割スクリーンのスクリプトをオンラインで作成することに特化したツールである。映画やテレビの制作、広告の企画、アニメーションのデザインに適したストーリーボードを素早く作成できる。ユーザーは専門的な描画スキルを必要とせず、テンプレートや要素をドラッグ&ドロップすることで脚本デザインを完成させることができる。このサイトでは、複数の...
SuperMaker AI:ビデオ、音楽、画像を生成する無料のオーサリングツール
SuperMaker AIは、高品質な動画、音楽、画像、音声コンテンツを素早く作成できる無料のオンラインオーサリングプラットフォームです。ユーザーはログインすることなくコア機能を試すことができ、使い方もシンプルなので、個人のクリエイターや小規模なチームに適しています。このプラットフォームでは、人工知能技術を利用して、テキスト、画像、クリエイティブ...
AdpexAI: ジェネレーティブAI画像・動画コンテンツ作成プラットフォーム
AdpexAIは、画像編集、ビデオ編集、AIチャット、コード生成を提供するジェネレーティブAIツールのオールインワン・オンライン・プラットフォームです。ユーザーは、ソフトウェアをインストールすることなく、ブラウザを通して、高品質のビジュアルコンテンツを素早く作成したり、コードを書いたり、インテリジェントなAIモデルと対話したりすることができます。このプラットフォームは、最先端のAIを幅広くサポートしています。
Pollo AI:複数のモデルを統合して動画や画像を生成するAIツール
Pollo AIは、Kling AI、Stable Diffusion、Fluxなど様々な主要AIモデルを統合したワンストップAIプラットフォームで、ユーザーはテキスト、写真、動画から高品質の動画や画像を素早く生成することができます。リアルなスタイルでも、アニメ効果でも、芸術的な創造でも、ユーザーは単に...
CoCoClip.AI
CoCoClip.AIは、ソーシャルメディアの動画コンテンツ作成に特化したオンラインAIツールで、YouTube Shorts、TikTok、Instagram Reelsに適した短い動画を素早く生成できるように設計されています。CoCoClip.AIは、テキストから動画への変換、AIスクリプト生成、自動編集...
Vizard:長い動画は、ソーシャルメディアプロモーションに適した短く爆発的な動画に自動的に編集されます。
Blue Pulse社のVizardは、人工知能技術を利用して、長い動画をソーシャルメディア用の短いクリップに素早く変換するオンラインツールである。コンテンツ制作者、マーケティング担当者、教育者向けに設計されており、動画の最高の瞬間を自動的に識別し、Tik...
クラップ
Klapは、長い動画をTikTok、Instagram Reels、YouTube Shortsなどのソーシャルメディア・プラットフォームに適した短い動画に変換する、コンテンツ・クリエイター向けのAIベースの動画編集ツールです。ユーザーは、YouTubeのリンクを貼り付けるか、動画をアップロードするだけで、...
ClipZap AI フェイススワップツール
ClipZap AI顔置換ツールは、写真やビデオの顔置換ニーズに合わせて設計された、AI顔置換ツールのリーディングカンパニーです。高度なAI技術を使用して、ビデオや画像内の人物を自動的に認識し、高品質の顔置換を実行します。面白いエモーティコンやアニメーションステッカーを作成することも、顔写真をAIに置き換えることもできます。
クリングルAI
クリングAI(Kling AI)は、シャッターストックが発表した新世代のAIクリエイティブ生産性プラットフォームで、高度なジェネレーティブAI技術により、ユーザーが高品質な画像や動画コンテンツを簡単に作成できることを目的としている。このプラットフォームは、Shutterstockが自社開発したKetu Big ModelとKling Big Model(Kolors)に基づいており、強力な画像と...
ヘドラ
Hedraは、人工知能技術によって表情豊かなおしゃべりや歌のキャラクター動画を生成することに特化した革新的なデジタルオーサリングプラットフォームです。Hedraは、誰もが簡単に魅力的な動画を作成できることを目指しています。
粘着Conch Speech (MiniMax Audio): 自然な音声を生成するAIツール
MiniMax Audioは、MiniMax社のAI音声生成ツールで、テキストを類似性の高い自然な音声に素早く変換することを主な特徴としています。Speech-02モデルをベースにしており、最大99%の音声合成類似度、スタジオ級の音質、30以上の言語と幅広い口語をサポートしています。
粘着聞き取る
Tongyi Listening and Understandingは、AliCloudの強力なAIモデルによって、音声や動画コンテンツをリアルタイムでテキスト化し、翻訳や要約、位置情報などの機能を提供する。AliCloudの強力なAIモデルに依存し、音声や動画コンテンツをリアルタイムでテキストに書き起こし、翻訳、要約、位置決めなどの機能を提供する。Tongyi Listening Wooは複数の言語とシナリオをサポートし、ユーザ...
リアルタイムボイスチャット
RealtimeVoiceChatは、音声を介した人工知能とのリアルタイムで自然な会話に特化したオープンソースプロジェクトである。ユーザーはマイクを使って音声を入力し、システムはブラウザを通して音声をキャプチャし、素早くテキストに変換し、大規模言語モデル(LLM)から返答を生成し、テキストを音声出力に変換する。
トランスクリプト
TranskriptorはAIを活用したテープ起こしツールで、音声や動画を素早くテキストに変換します。最大99%の精度で100以上の言語に対応しており、会議やインタビュー、授業ノートなど、さまざまなシーンに適しています。ファイルをアップロードしたり、直接録音したり、Zoom、Go...などへのリンク経由で書き起こしたりできます。
ツインマインド
TwinMindはThirdEar AI, Inc.が開発した「あなたのためにすべてを記憶する」スマートツールです。会話や会議、講義をリアルタイムで録音・テキスト化し、100以上の言語に対応。ユーザーは自分でメモを取る必要はなく、TwinMindが...
OpenAIリアルタイムエージェント
OpenAI Realtime Agentsは、OpenAIのリアルタイムAPIを使用して、マルチインテリジェントボディスピーチアプリケーションを構築する方法を示すことを目的としたオープンソースプロジェクトです。OpenAI Swarmから借用した)ハイレベルなインテリジェントボディモデルを提供することで、開発者は複雑なマルチインテリジェントボディスピーチシステムを短時間で構築することができます。このプロジェクトは ...
保釈
バイリン(Bailing)は、音声を通じてユーザーと自然な対話を行うように設計されたオープンソースの音声対話アシスタントである。このプロジェクトでは、音声認識(ASR)、音声活動検出(VAD)、大規模言語モデル(LLM)、音声合成(TTS)の技術を組み合わせて、GPT-4oに似た音声対話ロボットを実装しています。
「常時稼働のDeepseek AIアシスタント:Deepseek-V3に基づくインテリジェントな音声対話システムの構築
Always-On AI Assistantは、Deepseek-V3、RealtimeSTT、Typerなどの先進技術を統合し、強力で永続的なオンラインAIアシスタントシステムを構築する革新的なAIアシスタントプロジェクトです。このプロジェクトは、特にエンジニアリング開発シナリオに最適化されており、完全な...
シャオジーAIチャットボット
Xiaozhi AI Chatbotは、ESP32開発ボードをベースにしたオープンソースプロジェクトで、ユーザーが独自のAIチャットコンパニオンを構築できるように設計されています。このプロジェクトはShrimpによって開発され、より多くの人々がAIハードウェア開発を始め、大きな言語モデルを実際のハードウェア・デバイスに適用する方法を理解するための教育目的で主に使用されています。プロジェクト ...
フィッシュエージェント
フィッシュ・スピーチ派生プロジェクト フィッシュ・エージェントは、V0.1 3Bモデル・アーキテクチャに基づいて開発された、革命的なエンド・ツー・エンドのAI音声クローニング・システムです。完全なエンドツーエンドの音声クローニング処理システムとして、その最大の特徴は、革新的なセマンティックタグレスアーキテクチャ設計を採用していることです。
ボイスプロ
Voice-Proは、Gradio WebUIをベースとした多機能ツールで、音声合成、テキスト読み上げ、リアルタイム翻訳、YouTubeビデオダウンロード、人声分離をサポートします。Whisper、Faster-Whisper、Whisper-Timestampを統合しています。
いちご(llama3-s)
Ichigoはオープンソースのリアルタイム音声AIプロジェクトで、テキストベースの言語モデルをネイティブの「聞き取り」機能で拡張することを目的としている。このプロジェクトは、MetaのChameleon論文にインスパイアされた初期のフュージョン技術を使用している。Ichigoの目標は、オープンソースデータ、オープンソース重み付けネイティブデバイススピーチ...
粘着Cotrans: ワンストップのマンガ画像翻訳機(オープンソース、無料)
漫画や絵のテキストを翻訳するために使用される漫画-画像-トランスレータ(Cotrans Translatorオープンソース版) 。バッチ変換モード、Webサーバーモードと使用のための他の多様なオプションで、コマンドラインの対話とオンラインデモを提供します。複数の言語ターゲット翻訳と認識パラメータに設定することができ、詳細な...
粘着ZeroGPT:AIが生成したコンテンツを検出する無料ツール
ZeroGPTは、テキストがChatGPT、GPT-4、その他の言語モデルなどのAIによって生成されたかどうかを検出するために設計された無料のオンラインツールです。言語パターン、文章構造、その他の特徴についてテキストを分析することで、コンテンツが人間が作成したものか、機械が作成したものかを判定する。ウェブサイトの操作は簡単で、ユーザーが必要なのは...
粘着バベルドック
BabelDOCは、PDF文書をバイリンガル形式に翻訳するために設計されたオープンソースツールです。funstory-aiチームによって開発され、GitHubでホストされています。 主に、研究者や学生、技術者など、外国語の文書を扱う必要があるユーザーのために開発されています。 BabelDOCは、英語のP...
粘着ビデオマインド
VideoMindはオープンソースのマルチモーダルAIツールで、長尺動画の推論、Q&A、要約生成に特化している。香港理工大学のイェ・リューとシンガポール国立大学のショー・ラボのチームによって開発された。このツールは、タスクを計画、位置決め、確認...に分割することで、人間がビデオを理解する方法を模倣している。
WebThinker:自律的なウェブ検索とレポート作成を支援する知的推論ツール
WebThinkerは、大規模推論モデル(LRM)の自律的な研究能力を強化するために設計されたオープンソースプロジェクトです。WebThinkerは、推論モデルが推論プロセス中に独立してウェブ検索、ナビゲーション、情報抽出を行い、最終的に詳細なレポートを生成することを可能にします。このプロジェクトは、中国人民大学情報検索自然言語処理研究室によって開発されました。
DeerFlow: ディープリサーチのためのオープンソース自動化フレームワーク
DeerFlowはByteDanceによってオープンソース化されたディープリサーチフレームワークであり、マルチインテリジェンス連携によるリサーチタスクの自動化を目的として設計されています。言語モデルと、ウェブ検索、ウェブクローリング、Pythonコード実行などの専門ツールを組み合わせて、ユーザーが複雑なリサーチタスクを効率的に完了できるようにします。
イマージョン・ランゲージ・ラーニング・アシスタント
illa-helperは、ユーザーが没入体験を通して外国語を学ぶのを助けるために設計されたオープンソースのブラウザプラグインです。ユーザーがウェブをブラウズしている間、それはリアルタイムの翻訳、発音ガイドと語彙分析を提供することができます。プラグインは、ChromeとFirefoxブラウザをサポートしています, Vueに基づいて 3 フレームワークの開発, 明確な構造とに簡単...
DeepResearchAgent
DeepResearchAgentは、SkyworkAIによって開発されたオープンソースのAIツールで、ディープリサーチの自動化に焦点を当てています。検索エンジン、ウェブクローリング、大規模言語モデリング(LLM)を組み合わせることで、ユーザーが詳細な調査レポートを素早く作成できるように支援する。ユーザーは研究トピックや質問を入力するだけで、ツールが自動的に検索...
マッド・プロフェッサー
Mad Professor (暴躁的教授读论文)は、研究者や学生のために設計されたオープンソースのAI学術ツールで、学術論文の読解と分析を簡素化します。PDF処理、AI翻訳、RAG検索、AI Q&A、音声対話を統合している。ユーザーはPDF論文をインポートすることができます...
ペーパー2コード
Paper2Codeは、機械学習論文のコード実装の欠如に対処することを目的としたオープンソースプロジェクトである。マルチエージェントの大規模言語モデリング(LLM)システムPaperCoderによって、科学論文を実行可能なコードリポジトリに自動的に変換する。PaperCoderは、計画、分析、コード生成の3段階のプロセスを用いて、専門的な...
小さな語学レッスン
Google LabsのLittle Language Lessons (LLL)は、Gemini AIをベースにしたインタラクティブな英語学習プラットフォームです。LLLのシンプルなデザインは、初心者、学生、社会人に適しています。
Suna: ブラウザ操作とデータ分析を統合するインテリジェント・エージェント
Sunaは、Kortix AIによって開発されたオープンソースの汎用AIエージェントで、Apache 2.0ライセンスに基づいてGitHubでホストされており、ユーザーは無料でダウンロード、変更、セルフホストすることができます。自然言語対話を通じて、ウェブ閲覧、ファイル管理、データ・クロール、ウェブサイト......といった複雑なタスクでユーザーを支援する。
粘着グラノーラ:会議の議論を書き起こし、AIで会議メモを強化するAI会議アシスタント
グラノーラは、人工知能技術により会議の効率化と記録の正確性を向上させるツールです。リアルタイムで会議を書き起こし、スマートノートを自動生成し、会議の詳細な分析を提供する。Granolaは、ユーザーが会議の記録をよりよく管理し、作業効率を向上させるために設計されている。現在、このツールは主に...
粘着ブラックボックス
Blackboxは、コード生成、コード交換、コード検索サービスの提供に特化した革新的なAIプラットフォームです。高度なAI技術により、ユーザーは複数のプログラミング言語や開発ドメインの専門知識を持つ専用のAIアシスタントを作成し、カスタマイズすることができます。
粘着ナプキン:テキストを優れた概念図に変換し、イラストを素早く作成する記事
Napkin AIは、ユーザーのテキストコンテンツを図やシーン、画像などのビジュアルに変換するために設計された革新的なプラットフォームです。このプラットフォームは、関連性のあるビジュアルコンテンツを自動的に生成することで、ユーザーのアイデアの共有やプレゼンをより効率的に支援します。Napkin AIは、ユーザーが利用できる豊富な編集機能を提供します。
粘着カーソル:AIとの共同プログラミングのためのコードエディター
Cursorの概要 CursorはOpenAI GPTモデルに基づいたAI駆動のコードエディタで、コードの記述、編集、デバッグ、修正を高速に行うことができます。プロジェクトとチャットしたり、ファイルやドキュメントを参照したり、コードを生成したり、バグを見つけて修正したりすることができます。
Gemini CLI:グーグルのオープンソースコマンドラインAIプログラミングツール
Gemini CLIは、Googleによって開発されたオープンソースのコマンドラインツールであり、Gemini 2.5 Proモデルをベースにしている。大規模なコードベースでの作業、アプリケーションの生成、ワークフローの自動化、ファイルの管理などのタスクをサポートする。ユーザーは、個人のGoogle...
パワードリル
Powerdrillは、企業や個人が大量のデータから価値ある知見を効率的に抽出できるように設計された先進的なAIデータ分析プラットフォームです。複数のデータ処理ツールを統合することで、Powerdrill はデータクレンジング、分析、レポート生成を自動化し、複雑なデータ分析タスクを...
PRDからテストケースへ
Quashはテストケース生成に特化したAI搭載のプラットフォームで、開発者やQAチームが製品要件ドキュメント(PRD)を詳細なテストケースに素早く変換できるように設計されている。ユーザーは、登録や複雑な統合を行うことなく、PDF形式のPRD(最大10MB)をドラッグ&ドロップするだけで、AIがリアルタイムでドキュメントを分析し、パッケージを生成する。
Acedit:AIを活用したリアルタイム面接コーチングツール
Aceditは、求職者のために設計されたAIベースの面接コーチングツールです。Aceditには無料版と有料版があり、無料版には基本的な機能が、有料版には...
アウタースパン
Outerspanは、AIインテリジェンス用のスタンドアロン・メールボックスを提供する迅速なデプロイメント・プラットフォームである。シンプルなAPIやダッシュボードを使用することで、ユーザーはメールボックス付きのインテリジェンスを数秒で作成し、メールでのコミュニケーション、カスタマーサポート、データ照合などのタスクを処理することができる。このプラットフォームは、ユーザーが自分で複雑なサーバーを構築する必要がなく、自動的に管理される...
カワウソ
Otter.aiは、音声をリアルタイムでテキストに変換し、会議のメモ、サマリー、アクションアイテムを自動生成するコア機能を備えたAI搭載の会議管理・音声書き起こしツールです。Zoom、Google Meetなどの会議に自動的に参加し、音声をキャプチャするAIミーティングエージェントによってインテリジェントに機能します。
リコール:ウェブ閲覧時に個人的な知識ベースに関する情報を表示する
Recallは、ウェブページ、ビデオ、PDFなどを素早く要約し、個人的な知識ベースに預けることで、ブラウジング体験を向上させる人工知能ツールです。中心的な機能は、ブラウジング中にリアルタイムで関連情報を表示し、断片化されたコンテンツを順序付けられた知識ネットワークに整理するのを助けることです。Paulとそのチームによって開発されたこのツールは...
Fast.io:AIが大規模な企業データを素早く分析し、意思決定を下す
Fast.ioは、大規模データを実用的な洞察に変えることに集中するチームのためのAIワークベンチです。文書、画像、動画など何千ものファイルを素早く分析し、要約を生成して質問に答える。このウェブサイトは、中小企業(SMB)の問題解決を支援することを目的に、MediaFireの創設者によって構築された。
BeanBook:AIを活用したコーヒー追跡・記録ツール
BeanBookは、コーヒー愛好家のためにデザインされたモバイルアプリで、人工知能技術を取り入れ、ユーザーがコーヒー豆に関する情報を記録、追跡、探索することを支援する。豆のパッケージの写真を撮ったり、ウェブアドレスを入力したりといった簡単な操作で、コーヒーの産地、処理、風味に関するメモを自動的に保存します。ユーザーは...
AdpexAI: ジェネレーティブAI画像・動画コンテンツ作成プラットフォーム
AdpexAIは、画像編集、ビデオ編集、AIチャット、コード生成を提供するジェネレーティブAIツールのオールインワン・オンライン・プラットフォームです。ユーザーは、ソフトウェアをインストールすることなく、ブラウザを通して、高品質のビジュアルコンテンツを素早く作成したり、コードを書いたり、インテリジェントなAIモデルと対話したりすることができます。このプラットフォームは、最先端のAIを幅広くサポートしています。
ラブリードビー
LoveyDoveyはAIを搭載したチャットアプリで、バーチャルキャラクターとのリアルタイムの対話体験をユーザーに提供することに重点を置いている。ユーザーは自分のキャラクターを作成したり、既存のキャラクターを選択して、恋愛、友情、その他のタイプの会話を始めることができます。このアプリは、高度にカスタマイズ可能なキャラクター設定と様々なチャットモードによってモデル化されています...
roop-unleashed:ループ最適化に基づくオールインワンの顔交換ツール
Roop-UnleashedはPythonベースのオープンソースAI顔変更ツールで、s0md3vのRoopプロジェクトから継承され、開発者のC0untFloydによって保守され続け、Roop-Unleashedと改名された。ディープラーニング技術を使用して、写真やビデオの顔を実現する。
エリッサ
Wisdom In Meのウェブサイトは、Elissaアプリの公式ウェブサイトです。Elissaは、医学生Hyuntakによって開発された、ユーザーが不安やパニックに対処するのを助けるモバイルアプリです。AI技術と認知行動療法(CBT)を組み合わせ、いつでもどこでもサポートが受けられる。ユーザーはAIチャット、パニック...
AI顔交換:無料AI顔交換、ビデオ顔交換、マルチプレイヤー顔交換ツール
AI Face Swapは、人工知能技術を使って写真、ビデオ、GIFの顔を簡単に入れ替えることができる無料のオンライン・プラットフォームである。ソフトウェアのダウンロードやアカウント登録は不要で、ユーザーはファイルをアップロードするだけですぐに行うことができる。このウェブサイトは、JPG、PNG、MP4、GIFなどの複数のフォーマットをサポートしており、出力...
島風
Shamazeは、親が子供のためにパーソナライズされた就寝前の物語を作る手助けをするウェブサイトである。人工知能技術を使って、子どもの興味に基づいたユニークなストーリーを生成し、さらに親の声を真似てストーリーを読み上げる。親はテーマと登場人物を設定するだけで、Shamazeはストーリーの内容を素早く生成し、...
CloneMyTrips:ソーシャルメディアから旅行プランをクローンするAIツール
CloneMyTripsは革新的な旅行計画サイトで、その中核機能は、ユーザーがAI技術を通じてソーシャルメディア上の旅行コンテンツからインスピレーションと旅程を抽出するのを支援することである。ユーザーがお気に入りの旅行に関する短い動画や投稿を簡単に共有でき、パーソナライズされた旅行チェックリストやプランを自動的に生成する。このサイトはドラ ...
Avcado AI:食品ラベルをスキャンして成分を分析する健康アシスタント
Avcado AIは、ユーザーが食品の内容を理解するのに役立つスマートなツールである。その中核機能は、食品ラベルを撮影してスキャンすることで、原材料、栄養情報、添加物を素早く特定することである。ユーザーは携帯電話でパッケージのラベルを撮影するだけで、ウェブサイトがその食品のカロリーや添加物などの詳細情報を分析・表示する。
二人
Twosは、メモ、タスク、リマインダー、カレンダー、リストを1つのアプリにまとめた、使いやすい無料の生産性向上ツールです。メモ、タスク、リマインダー、カレンダー、リストを1つのアプリに統合し、ユーザーが生活のすべてを簡単に記録・管理できるようサポートします。Twosのコアコンセプトは「シンプルな記憶」で、ユーザーはいつでもどこでも重要な情報を書き留めることができ、忘れる心配はありません...
BeeDone:毎日のタスク計画をポイント獲得ゲームに変換
BeeDoneは、ユーザーの生産性向上を支援するウェブサイトとアプリである。退屈なタスク管理を楽しく遊び心のある体験に変え、ユーザーの目標達成意欲を高めます。Atomic Habits』、『Get It Done』、『The Power of Habit』などの書籍にインスパイアされたこのウェブサイトは、人工知能技術を組み合わせてタスク管理を提供...
AI Renamer: AIバッチがファイルの内容を識別し、ファイル名を変更します。
AI Renamerは、人工知能技術によってユーザーが自動的にファイル名を変更できるようにすることに重点を置いた、シンプルで便利なツールサイトです。写真や文書など、ファイルの内容に基づいて意味のある名前を生成し、ファイル管理を簡単にします。ごちゃごちゃした写真の整理でも、山積みのアイテムの処理でも...。
粘着クリリンAI
KrillinAIはオープンソースの動画処理ツールで、人工知能を使ってユーザーが動画を翻訳し、自動的にダビングすることを支援することに重点を置いている。動画のダウンロードから始まり、様々なプラットフォームに適応した完成品を生成するまで、全てのプロセスは数クリックで完了する。開発者はGitHubで無償のコードを提供しており、ユーザーはそれをダウンロードして...
粘着LLPlayer
LLPlayerはGitHubでホストされている、開発者umlx5hによって作成された、言語学習者のために設計されたオープンソースのメディアプレーヤーです。二ヶ国語字幕表示、AI自動生成字幕、リアルタイム翻訳、単語検索など、様々な便利な機能を統合しており、ユーザーが動画を視聴することで語学を上達させることを目的としています。
粘着字幕
Blue PulseのZeemoは、AIベースのビデオ字幕ジェネレーターで、ビデオクリエイターに効率的な多言語字幕ソリューションを提供することに重点を置いています。Zeemoは、95言語の音声を自動認識して字幕を生成し、字幕を124...
粘着すなわち夢のAI
Instant Dream AIは、多彩で強力なクリエーションツールをユーザーに提供するために設計された、ワンストップのAIクリエーションプラットフォームです。画像生成、スマートキャンバス、ビデオ生成、音楽生成など、Instant Dream AIはユーザーの創造性を簡単に実現することができます。このプラットフォームは、AIドローイング、AIビデオ、AIサウンド...を含む複数の作成モードをサポートしています。
Poify:AIを活用したeコマース画像生成・編集ツール
PoifyはEコマースユーザーのために設計されたAIツールで、商人が高品質な商品ディスプレイ画像を素早く生成するのに役立ちます。Poifyは "テキストから画像へ "と "画像から画像へ "機能をサポートしており、ユーザーはテキストの説明や既存の画像から画像を生成することができます。
エケト
EkotuはEコマース、マーケティング、個人ユーザー向けのオンライン写真編集・ポスターデザインプラットフォームです。ユーザーはソフトウェアをインストールする必要がなく、ブラウザを通して写真加工、ポスター制作、ビデオ編集を行うことができます。このプラットフォームは、豊富な無料テンプレート、純正素材、AIツールを提供しており、Eコマースの商品画像を素早く生成するのに適しています。
作る
HomeworkはアリババのTmallが発表したAIデザインツールで、ホームデコレーション、ホームファニシング、ホームアプライアンス業界のEコマース加盟店向けに設計されている。加盟店は商品画像をアップロードするだけで、AI技術によって宿題を生成することができ、様々なスタイルのシーン写真やリアルなモデル表示マップ、効果はプロのスタジオ写真に匹敵する。結果はプロのスタジオ写真に匹敵する...。
Spring.new
Spring.newは、マーケティング・マネージャーやプロダクト・マネージャーが、カスタマイズされたワークフローや小規模なアプリを素早く構築できるよう支援することに特化した、AIベースのオンライン・プラットフォームである。ユーザーが自然言語入力で要件を記述すると、Notion、Airtable、Slackなどのツールに接続するワークフローやアプリが自動的に生成される。
ピピットAI
Pippit AIは、マーケティング・コンテンツの制作プロセスを効率化することに焦点を当てた、CapCut社のスマート・オーサリング・ツールです。ユーザーは商品リンクの入力や素材のアップロードを行うだけで、ソーシャルメディアやEコマースプラットフォーム向けの動画や画像、AIアバターを素早く生成することができます。
ロージェントAI
Logent AIは、人工知能を使ってブランドロゴを素早く生成するオンラインツールです。ユーザーが入力した商品名、キャッチフレーズ、参考画像を分析し、幅広いプロフェッショナルなロゴデザインを瞬時に生成します。このプラットフォームは、様々なブランドスタイルのグラフィックロゴとモノグラムロゴをサポートしています。デザインの経験は必要ありません。
WiseBIM AI
WiseBIM AIは、AIベースのRevitプラグインで、2Dの建築図面を3DのBIMモデルに素早く変換することに重点を置いています。フランスのWiseBIM SAS社によって開発されたこのプラグインは、図面内の壁、ドア、窓、床スラブなどの要素を自動的に認識し、正確なAutodesk Revitモデルを生成します。ユーザーが必要とするのは...
クラリサイン
クラリサインは、契約書のドラフト、交渉、署名を迅速に行えるよう設計された、世界初のAI主導型契約ツールです。契約書テンプレートの自動生成、反復情報の入力、条項リスクの分析、複数人によるコラボレーションと電子署名に対応しています。このプラットフォームは、創業者のニキータが率いるチームによって開発されました。
粘着レンダーネット
RenderNetは、人工知能技術に基づき、キャラクターの一貫性を保った画像や映像の作成に特化したジェネレーターツールです。ユーザーは、簡単なテキストプロンプトで、キャラクター主導の画像や動画を生成することができます。このツールは、ユーザーが必要に応じてカスタマイズできる幅広い画像・動画生成オプションをサポートしており、...
メールゴー
Mailgoは、AIを活用したコールドメールマーケティングプラットフォームで、企業や個人が効率的なメールマーケティングによって売上や顧客転換率を高めることに注力しています。AI技術により、Eメールコンテンツの生成、見込み客の抽出、Eメール配信の最適化を自動化することで、マーケティングコストを削減します。このプラットフォームは、事前に加熱されたメール...
ピピットAI
Pippit AIは、マーケティング・コンテンツの制作プロセスを効率化することに焦点を当てた、CapCut社のスマート・オーサリング・ツールです。ユーザーは商品リンクの入力や素材のアップロードを行うだけで、ソーシャルメディアやEコマースプラットフォーム向けの動画や画像、AIアバターを素早く生成することができます。
フレッシュワークス
2010年に設立され、カリフォルニア州サンマテオに本社を置くFreshworksは、クラウドベースのソフトウェアを提供する企業です。同社の製品は、顧客サービス、ITサポート、販売プロセスの管理を支援し、ディズニー、S&Pグローバル、7-11などの有名ブランドを含む、世界中の72,000以上の顧客にサービスを提供しています。
Qualtrics:AI分析フィードバックで顧客と従業員の体験を最適化するツール
QualtricsはAIベースのプラットフォームで、フィードバックの収集と分析を通じて、組織が顧客と従業員のエクスペリエンスを向上させることを中核的な役割としている。Qualtricsは、自然言語処理と機械学習技術を用いて、アンケート、ビデオ、会話から重要な情報を抽出し、洞察と推奨アクションを生成します。ユーザーは素早く設定することができます...
製品ランク
ProductRankは、AIが製品やブランドをどのように評価するかを分析するオンラインツールである。様々な製品やブランドに対するAIモデルの見解を収集・照合することで、市場動向や消費者の嗜好を素早く理解することができる。このサイトは使いやすく、製品のランキングやブランドの影響力を把握したい人に適している。
スウォーム:チームのネットワーク関係を活用するための非常に効果的なツール
Swarmは、チームのネットワーク・コネクションを活用するためのプラットフォームです。チームメンバーのLinkedInコンタクト、Eメールコンタクト、職歴、学歴を統合し、強力な共有ネットワークを構築します。ターゲットとなる顧客、候補者、投資家の連絡先を素早く見つけることができます。
KOAH: AIアプリケーション向けネイティブ広告ソリューション
KOAHは、AIアプリケーションの広告ソリューションを提供することに焦点を当てたウェブサイトです。Koah Labs, Inc.によって開発され、カリフォルニア州サンフランシスコに拠点を置いている。このサイトの中心的な目標は、AIアプリの開発者がネイティブ広告を埋め込むことで収益を上げられるようにする一方で、ユーザーエクスペリエンスが損なわれないようにすることだ。
ビバ・ラボ
Viva Labsは、AI技術を利用して、コンバージョンの高い動画広告を素早く作成できるオンライン・ツールである。ユーザーは製品URLを提供するだけで、AIがターゲット層を調査し、リアルなAIアバターと多言語ナレーションを備えたプロフェッショナルな広告スクリプトを生成し、動画編集を自動化することができる。このウェブサイトは、米国...
Waxwing: マーケティング・コンテンツ制作においてAIが本物のエキスパートと協業するためのサービス・プラットフォーム
Waxwing 2.0は、AIと人間の専門家を組み合わせたタスク・サービス・プラットフォームである。米国デラウェア州ウィルミントンに本社を置くWaxwing AI Ltd.によって開発され、「人間+AI」モデルに焦点を当てている。このプラットフォームは、500以上の専門家が設計したAIワークフローを提供し、ユーザーはそれを使って自分自身でタスクを完了したり、...
Purposewrite:AIで高品質なオリジナルコンテンツを素早く生成するライティングツール
Purposewriteは、人工知能を利用したオンライン・ライティング・ツールで、ユーザーが高品質なオリジナル・コンテンツを素早く作成できるよう支援します。ユーザーは簡単な操作で、ブログ、Eメール、広告コピーなどのコンテンツを数秒で作成することができる。このウェブサイトの主な特徴は、AI技術を取り入れ、パーソナライズされたライティングアドバイスとリアルタイムの文法...
バナーベア
Bannerbear は、画像や動画の自動生成を支援するオンラインツールです。シンプルなAPIインターフェースを通じて、ソーシャルメディア用画像、Eコマース用バナー、ダイナミックなEメール用画像を素早く作成することができます。このサイトの主な機能は、デザインテンプレートを自動調整可能な映像に変えることです。
粘着マヌス
Manusは、モニカのチームによって構築された汎用AIインテリジェンス・プラットフォームであり、ユーザーのアイデアを具体的な結果に変換することに特化している。質問に答えるだけでなく、タスクの要件を自律的に分析し、仮想環境内のツール(ブラウザ、コードエディタ、ファイルプロセッサなど)を呼び出すことで、カウントから...
粘着パーティーロック
PartyRockは、Amazon Web Services(AWS)が提供する、プログラミングスキルなしでAIアプリケーションを作成するためのプラットフォームである。Amazon Bedrockをベースにしており、直感的で使いやすいインターフェースをユーザーに提供し、簡単なテキストプロンプトで多様なAIアプリケーションを生成できる。AIが初めての方でも...
粘着Page Assist: ネイティブAIモデルの対話とドキュメントの検索のためのウェブアシスタントプラグイン
Page Assistは、ローカルのAIモデルと対話する簡単な方法をユーザーに提供するために設計されたオープンソースのブラウザ拡張機能です。この拡張機能を使用すると、ユーザーは任意のWebページでサイドバーを開き、ローカルで実行されているAIモデルと対話することができます。Page Assistは、Chrome、B...を含む複数のブラウザをサポートしています。
粘着スカイワークスAI
天宮AIは中国初の全方位型AIアシスタントで、検索、対話、文章作成、文書分析、描画、PPT作成など様々な機能を統合している。先進的なAI技術により、ユーザーの意図を理解し、インターネット上のあらゆる情報を検索し、要約、一般化、統合し、高品質で広告のない検索結果を出力することができる。
Praxos:AI知能のための信頼できる構造化知識ベースの構築
Praxos.aiはAIエージェントのために設計されたカーネルです。Praxos.iは、コンテキスト管理の混乱、複雑なキューエンジニアリング、システムランタイムの障害など、AIインテリジェントを構築する際の一般的な課題に対処するために設計された開発環境を提供する。 Praxosのコアは、様々な入...
Nxtscape: オープンソースのプライバシーファーストAIスマートブラウザ
Nxtscapeは、プライバシー保護とローカライズされたAI機能に重点を置いたオープンソースのスマートブラウザです。Nxtscapeのコアデザインはユーザーデータのセキュリティに基づいており、ユーザーは独自のAPIキーまたはOllamaを介してローカルのAIモデルを実行することができ、閲覧データがクラウドにアップロードされないことを保証します。
アリタ:動的ツール生成のためのインテリジェントなAIアシスタント
AlitaはGitHubでホストされているオープンソースのAI Intelligent Bodyプロジェクトであり、複雑なタスクを完了するためのツールを動的に生成・管理することに焦点を当てている。革新的なMCP(Modularized Toolkit)メカニズムによってタスク処理能力を大幅に向上させ、GAIAベンチマーク、验证集pass@1达75.15%、...
ドルフィン
DolphinはByteDanceによって開発されたオープンソースの文書画像解析ツールで、スキャンファイルやPDFファイルに含まれるテキスト、表、数式、画像などの複雑な文書画像の処理に焦点を当てています。効率的な構文解析を実現するために、2段階のプロセスを通して「解析後の最初の解析」アプローチを採用しています。
DeepResearchAgent
DeepResearchAgentは、SkyworkAIによって開発されたオープンソースのAIツールで、ディープリサーチの自動化に焦点を当てています。検索エンジン、ウェブクローリング、大規模言語モデリング(LLM)を組み合わせることで、ユーザーが詳細な調査レポートを素早く作成できるように支援する。ユーザーは研究トピックや質問を入力するだけで、ツールが自動的に検索...
マッスル・メム
Muscle-MemはGitHubでホストされているオープンソースのPythonツールで、pig-dot-devによって開発された。AIエージェントに振る舞いキャッシュ機能を提供し、繰り返しタスクにおける大規模言語モデル(LLM)の呼び出しを削減することで、高速な実行、ばらつきの低減、コスト削減を実現するように設計されている。
オープン・エージェント・プラットフォーム
LangChainオープンエージェントプラットフォーム(OAP)は、AIインテリジェンスを構築するためのオープンソース、コードフリーのプラットフォームです。技術者でないユーザでも簡単にAIインテリジェンスを設計、テスト、デプロイすることができます。このプラットフォームはLangChainのLangGraphフレームワークに基づいており、外部ツールやデータソースとの接続をサポートしています。
Stepsailor:既存のSaaS製品にAIコマンドバーを統合
Stepsailorは、AIコマンドバーを核とした開発者向けのツールである。開発者はこれを使うことで、ソフトウェア製品にユーザーの発言を理解させることができる。例えば、ユーザーが「新しいタスクを追加する」と言えば、ソフトウェアは自動的に実行する。シンプルなSDKを通じてSaaS製品に統合されるため、開発者はAIを知らなくてもよい。
粘着ビデオマインド
VideoMindはオープンソースのマルチモーダルAIツールで、長尺動画の推論、Q&A、要約生成に特化している。香港理工大学のイェ・リューとシンガポール国立大学のショー・ラボのチームによって開発された。このツールは、タスクを計画、位置決め、確認...に分割することで、人間がビデオを理解する方法を模倣している。
GLM-4.1V-Thinking:マルチモーダルな複雑作業を支援するオープンソースの視覚推論モデル
GLM-4.1V-Thinkingは、清華大学(THUDM)のKEG研究室によって開発されたオープンソースの視覚言語モデルで、マルチモーダル推論機能に焦点を当てています。GLM-4-9B-0414の基本モデルをベースに、GLM-4.1V-Thinkingは強化学習と「心の連鎖」推論メカニズムを使って...
ERNIE 4.5
ERNIE4.5は、PaddlePaddleフレームワークに基づいてBaiduによって開発されたオープンソースの大規模モデルファミリーであり、0.3Bから424Bパラメータまでの幅広いモデルをカバーし、テキスト処理、画像生成、マルチモーダルタスクをサポートする。このプロジェクトはGitHubでホストされており、Hugging Faceと組み合わせることで、...
Hunyuan-A13B: 超長文文脈と知的推論のための効率的なオープンソース大規模言語モデル
Hunyuan-A13Bは、Tencentのハイブリッドチームによって開発されたオープンソースの大規模言語モデルであり、Mixed Expert(MoE)アーキテクチャ設計に基づいている。Hunyuan-A13Bは256Kの超長文脈処理をサポートし、...
FLUX.1 KontextとBFL Playgroundを発表
本日、FLUX.1 Kontextをリリースしました。FLUX.1 Kontextは、画像の生成と編集をサポートする生成フロー・マッチング・モデルのセットです。既存のテキストベースの画像生成モデルとは異なり、FLUX.1 Kontextファミリーは、文脈依存の画像生成をサポートします。
PartCrafter:1枚の画像から編集可能な3D部品モデルを生成
PartCrafterは、1枚のRGB画像から編集可能な3Dパーツモデルを生成することに特化した革新的なオープンソースプロジェクトです。先進的な構造化3D生成技術を使用し、1つの画像から意味的に意味のある複数の3Dパーツを同時に生成します。このプロジェクトは、事前学習...
シーダンス 1.0
Seedance 1.0は、ByteDanceのSeedチームによって開発されたAIビデオ生成ツールで、テキストや画像を高品質のビデオコンテンツに変換することに重点を置いています。ユーザーはテキストの説明文を入力するか、画像をアップロードするだけで、Seedanceは最大解像度1080pの動画を生成することができ、クリエイティブなコンテンツ制作に適しています。
ジェマ3n
グーグルは、Gemma 3とGemma 3 QATをリリースし、包括的なAIのための足跡を拡大しようとしている。Gemma 3が開発者に強力なクラウドとデスクトップ機能をもたらしたとすれば、この2025年5月20日のリリースは...
ムービージェン 1.1
MoviiGen 1.1は、ZuluVisionによって開発されたオープンソースのAIツールで、テキストから高品質のビデオを生成することに重点を置いています。720Pと1080Pの解像度をサポートしており、特に映画のような視覚効果を必要とするプロのビデオ制作に適しています。簡単なテキスト説明から、自然でダイナミックな動画を生成することができます。
ハイドリーム-I1
HiDream-I1は、170億ものパラメータを持つオープンソースの画像生成ベースモデルで、高品質な画像を素早く生成することができます。ユーザーはテキストによる説明を入力するだけで、リアル、カートゥーン、アーティスティックなど様々なスタイルの画像を生成できる。HiDream.aiチームによって開発され、GitHubでホストされているこのプロジェクトは、...
イメージ4
グーグル・ディープマインド(Google DeepMind)が最近発表したImagen 4モデルは、同社の画像生成技術の最新版であり、急速に業界の注目の的となっている。このモデルは、画像生成の豊かさ、ディテールの正確さ、スピードを大幅に向上させ、これまでにない方法でユーザーのイマジネーションに命を吹き込むことに取り組んでいる。
ベーグル
BAGELは、ByteDance Seedチームによって開発され、GitHubでホストされているオープンソースのマルチモーダルベースモデルです。テキスト理解、画像生成、編集機能を統合し、クロスモーダルなタスクをサポートします。このモデルは7Bのアクティブパラメータ(合計14Bのパラメータ)を持ち、Mixture-of-Tra...
Jubileeの大規模なモデルのAIコンテンツ検出を突破しようとして以来、技術記事は、 "洗濯 "プロンプトワードをリリースしました。JubileeのAI検出で "人工 "と識別された上記の2つの割合は高くない。 理由は非常に簡単で、前提の元の構造と情報内容を破壊することなく記事を書き換えることで、AI検出をやり過ごすことは基本的に難しい。そのため...
本稿では、Kapa.aiがRAG(Retrieval-Augmented Generation)システムにおいてOpenAIのo3-miniのような推論モデルを最近探索した概要報告を行う。 Kapa.aiは大規模言語モデル(...
最近、Claude Codeのようなツールが生み出した注目を受け、Googleは、強力なジェネレーティブAI機能をコマンドライン端末に直接統合し、自動タスク処理とローカルファイル管理の新たな可能性を開くように設計されたツール、Gemini CLIを無料で提供開始した。 コマンドラインAI....
マルチモーダル大規模モデルの開発は、単純な画像認識(「見る」)から複雑な論理的推論や深い理解(「見て考える」)へと、新たな段階を迎えている。最近、Smart Spectrum AIは、GLM-4.1V-ThinkingシリーズのGLM-4.1V-9B-Thinkinをリリースし、オープンソース化した。
大規模言語モデリング(LLM)技術は急速に変化しており、オープンソースコミュニティは貴重な学習リソースを豊富に生み出している。これらのプロジェクトは、LLMを体系的にマスターしたい開発者にとってプラクティスの宝庫だ。この記事では、GitHubで広く評価されている9つのトップ・オープンソース・プロジェクトを詳しく見ていこう。
大規模言語モデル(LLM)のAPIコールから、自律的で目標駆動型のエージェント型ワークフローまで、AIアプリケーションのパラダイムに根本的な変化が起きている。オープンソースコミュニティはこの波において重要な役割を果たしており、特定の研究課題に焦点を当てたAIを数多く生み出している。
大規模言語モデル(LLM)の性能が高まるにつれ、業界は個々のモデルの性能向上から、複数のAIが協調して動作する「エージェント・システム」の構築へと移行しつつある。オープンソースのフレームワークであるDeerFlowは、微妙な手がかりとなる単語の扱い方を明らかにする優れたモデルを提供している。
バイドゥは6月30日、大規模マルチモーダルモデルの最新版ERNIE 4.5ファミリーを正式にオープンソース化したと発表した。同ファミリーは、異なるスケールの10種類のバリエーションで構成され、MoE(Mixed Expertise)アーキテクチャを全面的に採用し、モデルから開発キット、デプロイツールまでフルスタックのソリューションを提供する。
最近、オープンAIがマイクロソフト・オフィスとグーグル・ワークスペースの市場ポジションに挑戦することを目標に、完全なAIオフィス・スイートを開発していることが発表された。これは空虚な主張ではなく、戦略的意図の明確なシグナルである。 チャットツールからオペレーティングシステムまで、Ope...
多くのコンテンツ制作者にとって、生々しく退屈なRSSニュースフィードを、きちんと構造化され、洞察に富み、一貫したスタイルの論説に仕上げるのは時間のかかる作業だ。情報の洪水は毎日やってくるが、それを本当に魅力的なコンテンツに磨き上げるには、しばしば「機械的な処理」と「創造」の組み合わせが必要になる...。
現在のAIの波の中で、AIプログラミングは最も混雑しているトラックのひとつとなっている。Cursor、WindsurfからVercelのv0まで、多くのプログラミング・エージェントが誕生した。その台頭の背景には、Anthropic Claude、OpenAI GP...
FLUX.1 Kontext Devについて FLUX.1 Kontextは、Black Forest Labsが開発した画期的なマルチモーダル画像編集モデルで、テキストと画像の同時入力をサポートし、画像のコンテキストをインテリジェントに理解して的確な編集を行います。その開発バージョンは...