近年の音声合成技術の進化により、人工知能を利用した高品質な音声出力が可能になりました。
Pythonを使って、手軽に合成音声を生成する方法をご紹介します。
特に、人気の高いライブラリであるgTTS(Google Text-to-Speech)とpyttsx3を取り上げます。
必要なライブラリのインストール
まず、音声合成を行うために必要なライブラリをインストールします。
gTTSとpyttsx3の2つが特に人気です。それぞれのインストール方法を以下に示します。
pip install gtts
pip install pyttsx3
gTTSを使用した音声生成
gTTSはGoogleのテキスト読み上げサービスを利用しています。
非常に簡単に音声ファイルを生成できます。
以下に基本的な使い方を示します。
from gtts import gTTS
import os
text = "こんにちは、Pythonで合成音声を生成しています。"
tts = gTTS(text=text, lang='ja')
tts.save("output.mp3")
os.system("start output.mp3")
上記のコードを実行すると、「output.mp3」というファイルが生成され、そのファイルが再生されます。
gTTSの利点は、インターネット経由でGoogleの高品質な音声合成を利用できる点です。
ただし、インターネット接続が必要です。
pyttsx3を使用した音声生成
一方で、pyttsx3はオフラインでも動作する音声合成ライブラリです。
ローカルで完結するため、インターネット接続が不要です。
以下に基本的な使い方を示します。
import pyttsx3
engine = pyttsx3.init()
text = "こんにちは、Pythonで合成音声を生成しています。"
engine.say(text)
engine.runAndWait()
このコードを実行すると、PCのスピーカーから直接音声が出力されます。
設定オプションも豊富で、声の速度や音量、話者の変更などが可能です。
まとめ
Pythonを使用すると、簡単に高品質な合成音声を生成できます。
gTTSとpyttsx3という2つのライブラリはいずれも便利で、用途に応じて使い分けることができます。
gTTSはGoogleのサービスを利用するため高品質ですが、インターネット接続が必要です。
一方、pyttsx3はオフラインで動作し、ローカル環境での利用に最適です。
これらのツールを活用して、音声合成技術を応用したさまざまなプロジェクトに挑戦してみてください。
以上、Pythonで合成音声を生成する方法についてでした。
最後までお読みいただき、ありがとうございました。