小镜故事板
小镜故事板(xjstoryboard.com)是一个专注于在线创建分镜头脚本的工具。它帮助用户快速制作故事板,适合影视制作、广告策划和动画设计。用户无需专业绘图技能,通过拖拽模板和元素即可完成脚本设计。网站提供多...
MagicArena
MagicArena 是一个专注于视觉生成模型对战的在线平台。用户可以选择不同 AI 模型,输入相同的文字描述,让模型生成内容进行对比和评测。平台适合开发者、研究人员和对 AI 技术感兴趣的人。MagicArena 提供简单操...
SuperMaker
SuperMaker AI 是一个免费的在线创作平台,帮助用户快速生成高质量视频、音乐、图像和语音内容。用户无需登录即可试用核心功能,操作简单,适合个人创作者和小型团队。平台通过人工智能技术,将文字、图片或创意...
Quarkdown:基于Markdown的动态排版工具
Quarkdown 是一个基于 Markdown 的现代化排版工具,扩展了 CommonMark 和 GitHub Flavored Markdown(GFM)的功能。它通过引入函数、变量和标准库,让用户能创建动态内容,轻松生成交互式演示文...
Simple Subtitling: ein Open-Source-Tool zur automatischen Erstellung von Videountertiteln und zur Identifizierung der Sprecher
Simple Subtitling ist ein Open-Source-Tool zur Erzeugung von Audio-Untertiteln, das sich auf die automatische Erzeugung von Untertiteln und die Kennzeichnung von Sprechern für Video- oder Audiodateien konzentriert. Das von Jaesung Huh entwickelte Projekt, das auf GitHub gehostet wird, zielt darauf ab, eine einfache und effiziente Lösung zur Erzeugung von Untertiteln zu bieten. Werkzeuge durch die Audioverarbeitungstechnologie .....
ArXiv Paper Summarizer: ein Werkzeug zur automatischen Zusammenfassung von arXiv-Papers
arXiv Summarizer ist ein quelloffenes Python-Skripttool, das auf GitHub gehostet wird. Es wurde entwickelt, um Nutzern den schnellen Zugriff auf und die Erstellung von Zusammenfassungen von akademischen Artikeln der arXiv-Plattform zu ermöglichen. Es nutzt die kostenlose Gemini API für eine effiziente Textzusammenfassung und eignet sich für Forscher, Studenten und akademische...
Sim Studio: Open-Source-Workflow-Builder für KI-Agenten
Sim Studio ist eine Open-Source-Plattform für die Erstellung von KI-Agenten-Workflows, die den Nutzern hilft, über eine leichtgewichtige, intuitive visuelle Schnittstelle schnell umfangreiche Sprachmodell-Workflows (LLM) zu entwerfen, zu testen und einzusetzen. Benutzer können komplexe Multi-Agenten-Anwendungen mit Drag-and-Drop ohne tiefgreifende Programmierung erstellen. Es unterstützt diese ...
Hula: Verwandle Selfies mit einem Klick in kurze virale Videos und personalisierte Sticker
Hula ist ein KI-gesteuertes Kreativ-Tool, das Selfies von Nutzern mit einem einfachen Klick in virale Videos, Multi-Style-Bilder und personalisierte Sticker-Pakete verwandelt. Der Entwickler Prequel Inc. hat die App für iOS- und Android-Plattformen entwickelt, um...
AIstudioProxyAPI: Unbeschränkte Nutzung der Gemini 2.5 Pro Modell-APIs
AIstudioProxyAPI ist ein Open-Source-Projekt, das Node.js und Playwright-Technologie verwendet, um die Gemini-Modell-Dialogfunktionalität der Google AI Studio-Webversion in eine Standard-API-Verbindung zu konvertieren, indem es die OpenAI-API emuliert ...
Step1X-Edit: Ein Open-Source-Tool für die Bearbeitung von Bildern mit Anweisungen in natürlicher Sprache
Step1X-Edit ist ein Open-Source-Framework zur Bildbearbeitung, das vom Stepfun AI-Team entwickelt wurde und auf GitHub gehostet wird. Es kombiniert ein multimodales großes Sprachmodell (Qwen-VL) und einen Diffusionstransformator (DiT), um es Benutzern zu ermöglichen, ein Bild mit einfachen Befehlen in natürlicher Sprache zu bearbeiten, z. B. den Hintergrund zu ändern, ein Objekt zu entfernen oder den Wind zu transformieren ....
Klavis AI: Model Context Protocol (MCP) Integrationswerkzeug für KI-Anwendungen
Klavis AI ist eine Open-Source-Plattform, die sich auf die Vereinfachung der Nutzung und Integration des Model Context Protocol (MCP) konzentriert, einem offenen Standard, der es KI-Anwendungen ermöglicht, sich dynamisch mit externen Tools und Datenquellen zu verbinden...
MiMo: ein kleines Open-Source-Modell für effiziente mathematische Schlussfolgerungen und Codegenerierung
MiMo ist ein von Xiaomi entwickeltes Open-Source-Projekt zur Modellierung großer Sprachen mit Schwerpunkt auf mathematischer Argumentation und Codegenerierung. Das Kernprodukt ist die MiMo-7B-Modellfamilie, die aus einem Basismodell (Base), einem überwachten Feinabstimmungsmodell (SFT), einem aus dem Basismodell trainierten Verstärkungslernmodell (RL-Zero) und einem aus dem Basismodell trainierten SFT-Modell besteht...
Muyan-TTS: Personalisiertes Podcast-Sprachtraining und -synthese
Muyan-TTS ist ein Open-Source-Text-to-Speech-Modell (TTS), das für Podcasting-Szenarien entwickelt wurde. Es wurde mit über 100.000 Stunden Podcast-Audiodaten trainiert und unterstützt die Null-Sample-Sprachsynthese, um qualitativ hochwertige natürliche Sprache zu erzeugen. Das Modell basiert auf Llama-3.2-3B, und in Kombination mit dem SoVITS-Decoder bietet es eine hohe...
CAD-MCP: MCP-Dienste zur Steuerung von CAD-Software durch natürlichsprachliche Befehle
CAD-MCP ist ein Open-Source-Projekt, das es Benutzern ermöglicht, CAD-Software-Zeichenoperationen durch natürlichsprachliche Befehle zu steuern. Es kombiniert die Verarbeitung natürlicher Sprache mit der CAD-Automatisierungstechnologie, so dass die Benutzer die CAD-Schnittstelle nicht manuell bedienen müssen, sondern nur einfache Textbefehle eingeben müssen, um die Zeichnung zu erstellen und zu ändern. Das Projekt unterstützt eine Vielzahl von ...
Cotrans
manga-image-translator(Cotrans翻译器开源版),用于翻译漫画或图片中的文字。提供命令行交互方式和在线演示,拥有批量转换模式、web服务器模式等多样化的使用选项。可设置多种语言目标翻译和识别参数,配有详...
GraphGen: Feinabstimmung von Sprachmodellen mithilfe von Wissensgraphen zur Erzeugung synthetischer Daten
GraphGen ist ein Open-Source-Framework, das von OpenScienceLab, einem KI-Labor in Shanghai, entwickelt wurde und auf GitHub gehostet wird. Es konzentriert sich auf die Optimierung der überwachten Feinabstimmung von Large Language Models (LLMs), indem es die Erzeugung synthetischer Daten durch Wissensgraphen anleitet. Es konstruiert feinkörnige Wissensgraphen aus dem Ausgangstext, wobei der erwartete Kalibrierungsfehler...
ACI.DEV: Integration von mehr als 600 Tools für KI-Intelligenzen über MCP-Server
ACI.dev ist eine Open-Source-Infrastrukturplattform, die KI-Intelligenzen eine schnelle Integration in über 600 Tools ermöglicht. Sie stellt sicher, dass Intelligenzen durch mandantenfähige Authentifizierung und fein abgestufte Rechteverwaltung sicheren Zugriff auf Tools wie Google Calendar, Slack und Brave Search haben....
llm.pdf: Experimentelles Projekt zur Ausführung eines umfangreichen Sprachmodells in einer PDF-Datei
llm.pdf ist ein Open-Source-Projekt, mit dem Benutzer Large Language Models (LLMs) direkt in PDF-Dateien ausführen können. Entwickelt von EvanZhouDev und gehostet auf GitHub, zeigt dieses Projekt einen innovativen Ansatz: Kompilieren von llama.cpp über Emscripten als ...
Abogen: ein Tool zur Konvertierung verschiedener Textformate in Hörbücher
Abogen ist ein Open-Source-Tool zur schnellen Konvertierung von ePub-, PDF- oder reinen Textdateien in hochwertiges Audio. Es verwendet das Kokoro-82M-Modell, um natürliche und flüssige Sprache zu erzeugen, und unterstützt die gleichzeitige Erzeugung von Untertiteln, wodurch es sich für Hörbücher, Videosynchronisationen oder Lernhilfen eignet. Benutzer können wählen...