Pythonは、音声認識の分野で広く利用されています。特に、GoogleのSpeech Recognitionライブラリは、その使いやすさと強力な機能で人気があります。
Google Speech Recognitionとは?
Google Speech Recognitionは、125以上の言語と方言をテキストに変換することができる強力なツールです。このライブラリは、リアルタイムで音声をテキストに変換することが可能で、リモート会議や授業での音声をリアルタイムで文字起こしするなど、多くの用途があります。
ライブラリのインストール
Google Speech Recognitionのライブラリは、pipコマンドを使用して簡単にインストールすることができます。
pip install SpeechRecognition
音声認識のコード例
以下に、Google Speech Recognitionを使用した音声認識の基本的なコード例を示します。
import speech_recognition as sr
def run_recognition(filename):
r = sr.Recognizer()
with sr.AudioFile(filename) as source:
audio = r.record(source)
text = r.recognize_google(audio, language='ja')
return text
if __name__ == '__main__':
filename = 'sample-speech.wav'
text = run_recognition(filename)
print(text)
このコードは、指定した音声ファイルを読み込み、その内容をテキストに変換します。
PythonとGoogle Speech Recognitionを使用することで、音声認識の機能を簡単に実装することができます。これにより、アプリケーションに音声入力の機能を追加することが可能となり、ユーザー体験を向上させることができます。