RealtimeVoiceChat
RealtimeVoiceChat ist ein Open-Source-Projekt, das sich auf natürliche Echtzeitgespräche mit künstlicher Intelligenz über Sprache konzentriert. Benutzer verwenden das Mikrofon zur Spracheingabe, das System nimmt das Audio über den Browser auf, wandelt es schnell in Text um, generiert eine Antwort aus einem großen Sprachmodell (LLM) und wandelt dann den Text in Sprachausgabe um, das Ganze...
OpenAI-Echtzeit-Agenten
OpenAI Realtime Agents ist ein Open-Source-Projekt, das zeigen soll, wie die Echtzeit-APIs von OpenAI genutzt werden können, um multi-intelligente Körpersprachanwendungen zu entwickeln. Es bietet ein intelligentes High-Level-Körpermodell (entlehnt aus OpenAI Swarm), das es Entwicklern ermöglicht, komplexe multi-intelligente Körpersprachsysteme in kurzer Zeit zu erstellen. Das Projekt ...
Bürgschaft
Bailing (Bailing) ist ein Open-Source-Sprachdialog-Assistent, der entwickelt wurde, um einen natürlichen Dialog mit dem Benutzer durch Sprache zu führen. Das Projekt kombiniert Spracherkennung (ASR), Voice Activity Detection (VAD), Large Language Model (LLM) und Sprachsynthese (TTS) Technologien, um einen Sprachdialogroboter ähnlich dem GPT-4o zu implementieren...
"Always-On" Deepseek AI Assistant: Aufbau eines intelligenten Sprachinteraktionssystems auf Basis von Deepseek-V3
Always-On AI Assistant ist ein innovatives KI-Assistentenprojekt, das durch die Integration von fortschrittlichen Technologien wie Deepseek-V3, RealtimeSTT und Typer ein leistungsfähiges und permanent online verfügbares KI-Assistenzsystem schafft. Das Projekt ist speziell für technische Entwicklungsszenarien optimiert und bietet eine komplette...
Xiaozhi AI Chatbot
Xiaozhi AI Chatbot ist ein Open-Source-Projekt, das auf dem ESP32-Entwicklungsboard basiert und Benutzern helfen soll, ihren eigenen KI-Chat-Begleiter zu bauen. Das Projekt wird von Shrimp entwickelt und dient hauptsächlich zu Lehrzwecken, um mehr Menschen den Einstieg in die Entwicklung von KI-Hardware zu erleichtern und zu verstehen, wie man das große Sprachmodell auf reale Hardwaregeräte anwendet. Projekt ...
Fisch-Agent
Fish Speech Derivative Project Fish Agent ist ein revolutionäres End-to-End-KI-System zum Klonen von Sprache, das auf der Grundlage der 3B-Modellarchitektur V0.1 entwickelt wurde. Sein wichtigstes Merkmal ist die innovative, semantische taglose Architektur, die nicht auf traditionelle Sprachen wie Whisper ..... angewiesen ist.
Ichigo (lama3-s)
Ichigo ist ein Open-Source-Echtzeit-Sprach-KI-Projekt, das darauf abzielt, textbasierte Sprachmodelle mit nativen "Hör"-Fähigkeiten zu erweitern. Das Projekt verwendet frühe Fusion Techniken inspiriert von Meta Chameleon paper.Ichigo Ziel ist es, eine Open-Source-Daten, Open-Source-gewichtet native Gerät Sprache zu werden...