Very Fast Dictationは、Macユーザーのために設計されたオープンソースの音声テキスト変換ツールです。テキスト入力が必要なあらゆる場面で、高速音声認識技術を使ってユーザーの発言をリアルタイムでテキストに変換する。GitHubでホストされ、開発者のAvi Aryanによって開発されたこのプロジェクトは、効率的な音声処理を保証するためにParakeet MLX技術を使用しています。ユーザーはControlキーを2回押すだけで、録音を開始または停止することができる。このツールはシステムレベルの統合をサポートしており、テキストは自動的にクリップボードにコピーされ、現在のウィンドウに貼り付けられるため、作業効率が向上します。プロジェクト全体が軽量でインストールも簡単なので、効率性を追求するMacユーザーに適している。
機能一覧
- リアルタイム音声テキスト変換:Parakeet MLXテクノロジーを使用して、音声をすばやくテキストに変換します。
- ショートカットキー操作:Controlキーを2回押すと録画の開始・停止ができ、直感的な操作が可能。
- クリップボードとの統合:転写されたテキストは自動的にクリップボードにコピーされ、アクティブなウィンドウに貼り付けられます。
- システムレベルの互換性:Macアプリケーションのテキストボックスで動作します。
- 視覚的な合図:録音中は画面中央に「Recording...」のラベルが表示され、ステータスを明確にフィードバックします。
- オープンソースで無料:コードは公開されており、ユーザーは自由に修正や最適化を行うことができる。
ヘルプの使用
設置プロセス
Very Fast Dictationを使用するには、まずMacにインストールし、環境を設定する必要があります。以下はその詳細な手順です:
- コードベースのクローン
ターミナルを開き、以下のコマンドを実行してプロジェクトをローカルにクローンする:git clone https://github.com/aviaryan/Very-Fast-Dictation.git cd Very-Fast-Dictation
- 依存関係のインストール
プロジェクト利用uv
をパッケージ管理ツールとして使用する。まずuv
(経由で入手可能pip install uv
(インストール)。次に以下のコマンドを実行して、依存関係をインストールする:uv sync
これにより、以下を含むセットアップが自動的にインストールされる。
parakeet-mlx
そしてpynput
歌で応えるpyside6
必要な依存パッケージは含まれています。インストールには通常数分しかかかりません。 - アプリケーションの実行
依存関係をインストールした後、以下のコマンドを実行してプログラムを開始する:uv run main.py
プログラムは起動後バックグラウンドで実行され、ユーザーは追加でインターフェースを開く必要はない。
使用方法
インストールが完了したら、Very Fast DictationをMacで使用することができます。使い方は以下の通りです:
- 録音開始
アプリケーション(テキストエディタ、ブラウザ、チャットツールなど)のテキスト入力ボックスで、すばやく コントロールキー画面中央に "Recording... "プロンプトが表示されます。画面中央に "Recording... "プロンプトが表示され、録音が開始されたことを示します。この時点で、ユーザーは直接話すことができ、音声はリアルタイムでテキストに書き起こされます。 - 録音停止
もう一度同じ速さで2回押す コントロールキー録音が停止します。書き起こされたテキストは自動的にクリップボードにコピーされ、現在アクティブなテキストボックスに貼り付けられます。手動でコピー&ペーストすることなく、全プロセスがスムーズに行えます。 - ステータス確認
録画中は、画面中央の "Recording... "タブが連続的に表示され、番組が動作していることをユーザーに知らせます。ラベルが表示されない場合は、ショートカット・キーが正しくトリガーされていない可能性があり、番組がバックグラウンドで実行されているかどうかを確認することをお勧めします。 - 互換性
Very Fast Dictationは、Pages、Word、Notion、ブラウザの入力ボックスなど、あらゆるMacアプリケーションのテキスト入力シナリオをサポートします。ユーザーはアプリケーションを切り替える必要がなく、ツールは現在フォーカスされているウィンドウに自動的に適応します。
注目の機能操作
- ショートカット操作コントロール・キーは、操作を簡単にするために2回押すように設計されており、ユーザーは追加のインターフェースを開くことなく、録画状態を素早く切り替えることができる。
- クリップボードの統合テープ起こしが完了すると、テキストは自動的にクリップボードにコピーされ、貼り付けられます。会議のメモや即興のアイデアなど、簡単なメモが必要な場面に適しています。
- リアルタイム転写パラキートMLXテクノロジーにより、音声合成はほとんど遅延がなく、長い文章を素早く入力するのに適しています。
- 軽量設計他のアプリケーションのパフォーマンスに影響を与えることなく、バックグラウンドで動作します。
ほら
- マイク権限初回起動時、Macのシステムからマイクへのアクセス許可を求められるので、正しく録音できるようにしてください。
- ネットワーク要件依存関係のインストールにはインターネット接続が必要だが、実行にはネットワークが不要なので、オフライン環境に適している。
- デバッグの問題ショートカットが機能しない場合は
pynput
正しくインストールされているか、またはプログラムを再起動してみてください。 - カスタム改造オープンソースプロジェクトであるため、GitHubリポジトリのドキュメントに記載されているように、ユーザーはショートカットの調整や新機能の追加など、必要に応じてコードを変更することができます。
アプリケーションシナリオ
- 会議録
会議や授業では、Very Fast Dictationを使ってディスカッションを素早く録音することができます。録音を開始すると、音声や対話がリアルタイムでテキストに変換され、自動的にメモアプリにペーストされるため、手入力の時間を節約できます。 - ライティングエイド
インスピレーションを素早く記録する必要があるライターやクリエイターのために、Very Fast Dictationは便利な音声入力方法を提供します。ユーザーは内容を口述するだけで、テキストを直接ライティングソフトウェアに入力できるため、ブレインストーミングや初稿の作成に最適です。 - アクセシブル入力
手入力が苦手なユーザー(手の怪我や視覚障害のあるユーザーなど)には、音声入力による効率的なテキスト入力を可能にすることで、アクセシビリティ体験を向上させる。 - マルチタスク
複数のタスクを同時に処理する必要がある場合、ユーザーは音声入力を使って、今やっていることを中断してキーボードに切り替えることなく、ToDoリストや電子メールの内容を素早く記録することができる。
品質保証
- Very Fast Dictationはどのオペレーティングシステムをサポートしていますか?
現在のところmacOS専用で、Macユーザー向けに設計されており、WindowsやLinuxでは利用できない。 - 使用するにはインターネット接続が必要ですか?
依存関係をインストールするにはインターネット接続が必要だが、実行にネットワークは必要なく、オフラインでの使用もサポートされている。 - デフォルトのショートカットキーを変更するには?
ユーザーはpynput
ショートカットの設定。これはGitHubリポジトリのmain.py
ファイルから該当するコードを見つけて調整する。 - 録音の質が悪いと、テープ起こしに影響がありますか?
はい、テープ起こしの正確性を確保するため、明瞭なマイクを使用し、静かな環境で録音することをお勧めします。 - 他の言語の音声書き起こしにも使えますか?
他の言語のサポートは、Parakeet MLXモデルの機能によって異なりますので、公式ドキュメントで確認することをお勧めします。