SuperMaker AIは、高品質な動画、音楽、画像、音声コンテンツを素早く作成できる無料のオンラインオーサリングプラットフォームです。ユーザーはログインすることなくコア機能を試すことができ、使い方もシンプルなので、個人のクリエイターや小規模なチームに適しています。このプラットフォームでは、人工知能技術を利用して、テキスト、画像、クリエイティブ...
SkyReels-V2は、SkyworkAIによって開発されたオープンソースの動画生成モデルです。高度な拡散強制技術により、テキストから動画(T2V)、画像から動画(I2V)タスク用の長さ無制限の動画生成をサポートします。ユーザーは、テキスト記述や入力...
FramePackは、動画拡散技術をより実用的にすることに焦点を当てたオープンソースの動画生成ツールである。独自の次フレーム予測ニューラルネットワークによって入力フレームを固定長に圧縮することで、生成作業負荷をビデオの長さから切り離します。このため、長い動画を生成する場合でも、必要な動画メモリが大幅に増加することはありません。
Open-Soraは、誰でも効率的に高品質のビデオを生成できるように設計されたオープンソースプロジェクトです。hpcaitechチームによって開発され、テキストや画像からビデオを生成するツールを提供し、複数の解像度と持続時間をサポートしている。このプロジェクトは完全にオープンソースであり、モデルの重み、コード、学習プロセスを公開し、コミュニティに貢献することを奨励している。
Pollo AIは、Kling AI、Stable Diffusion、Fluxなど様々な主要AIモデルを統合したワンストップAIプラットフォームで、ユーザーはテキスト、写真、動画から高品質の動画や画像を素早く生成することができます。リアルなスタイルでも、アニメ効果でも、芸術的な創造でも、ユーザーは単に...
OpenCreatorは、20以上のジェネレーティブAIモデルを集めたクリエイター向けのオンラインツールです。ユーザーは、プラットフォームを切り替えたり、複数のサブスクリプションを支払うことなく、簡単にクリエイティブな動画を生成するために使用することができます。シンプルなインターフェースを持ち、ワンクリックで異なるモデルの効果を比較することができます。
Twin AIは、ユーザーが写真やビデオをパーソナライズされたAIビデオに素早く変換できるシンプルで便利なツールです。Alias Technologiesによって開発されたこのツールは、コンテンツ・クリエイターやビジネス・ユーザー、あるいはAIビデオ制作に挑戦したいすべての人に適している。ユーザーは写真をアップロードしてクリエイティブな動画を作成したり、...
StoryDiffusionは、書かれたストーリーを視覚的な画像や動画に変換することに特化したオンラインAIツールです。高度な拡散モデリング技術を使用し、ユーザーが入力したテキストに基づいて、一貫性のある画像シーケンスやアニメーションビデオを生成します。このサイトの主な特徴は...
ComfyUI-WanVideoWrapperは、開発者kijaiによって作成されたオープンソースプラグインで、ComfyUIプラットフォーム用に設計されています。WanVideoのWan2.1モデルに基づいており、強力なビデオ生成と処理機能を提供します。ユーザーはこのプラグインを使って、画像からビデオ(I2...
SkyReels-V1は、SkyworkAIチームによって開発されたオープンソースプロジェクトで、人間中心の高品質なビデオコンテンツの生成に焦点を当てています。このプロジェクトは、HunyuanVideoモデルに基づいています。HunyuanVideoモデルは、何千万もの高品質な映画やテレビクリップを微調整して作成された、世界初の人間のアクションビデオの基本モデルです。このモデルは...
DragAnythingは、エンティティ表現によって任意のオブジェクトのモーションコントロールを実現することを目的としたオープンソースプロジェクトです。このプロジェクトはShowlabチームによって開発され、ECCV 2024に採択された。DragAnythingは、ユーザーが軌跡線を描くだけで一対のオブジェクトを制御できる、ユーザーフレンドリーなインタラクションを提供する。
一般的な紹介 HunyuanVideoGPは、DeepBeepMeepによって開発され、ローエンドGPUユーザー向けに設計された大規模ビデオ生成モデルです。このモデルは、オリジナルのHunyuan Videoモデルを改良したもので、メモリとビデオメモリの要件を大幅に削減し、12GBから24GBまでのGPUで使用できるようにしました。
Luma Labsは、人工知能技術を用いて高品質な画像や動画を生成することに特化した企業です。主な製品として、Luma PhotonとLuma Ray2があり、テキストからフォトリアリスティックな画像や動画を生成するツールで、様々なクリエイティブや商業用途に使用されています。
Gokuは、ストリーム変換技術に基づく連携画像・動画生成モデルであり、業界レベルのパフォーマンスを達成するように設計されています。Gokuは、きめ細かなデータ照合、モデル設計、ストリーム変換の定式化など、高度な高画質映像生成技術を統合しています。Gokuの主な貢献には、高画質できめ細かな画像と映像のカウント...
X-Dynaは、ByteDanceによって開発されたオープンソースプロジェクトで、ゼロサンプル拡散技術によってダイナミックなポートレートアニメーションを生成します。このプロジェクトでは、走行映像の顔の表情や体の動きを使って個々のポートレート画像をアニメーションさせ、リアルでコンテキストを意識したダイナミックなエフェクトを生成します。X-Dynaは、ダイナミックなエフェクトを導入することで、...
MOFA-Videoは、生成的な動き場適応技術を用いて静止画像を動的な動画に変換する最先端の画像アニメーション生成ツールである。このプロジェクトは東京大学とTencent AI Labと共同で開発され、European Conference on Computer Vision (ECCV) 2024で発表される予定です。MOFA-Videoがサポートする...
HiDream.aiは、世界をリードするビジュアル・マルチモーダルベースモデルとアプリケーションの構築に注力するジェネレーティブ人工知能スタートアップである。同社が独自に開発した「HiDream.ai」は、画像・動画生成のための世界初の拡散トランスフォーマー(DiT)アーキテクチャ・モデルであり、オンライン・ ... 続きを読む
LTX-Videoは、Lightricksが開発した初のDiT(Diffusion Transformer)ベースのリアルタイムビデオ生成モデルです。LTX-Videoは、768×512の解像度で24フレーム/秒の高品質ビデオを生成することができます。
DisPoseは、制御されたキャラクター画像アニメーション生成に焦点を当てた革新的なオープンソースの人工知能プロジェクトです。研究者チームによって開発され、GitHubでオープンソース化されたこのプロジェクトは、高度なディープラーニング技術を使い、骨格のポーズ情報を分解することで正確なキャラクターアニメーションの制御を実現している。