マーケとAI.com / 編集部

Submarine LLC

Editor Team

最近、デジタルメディア界隈ではポッドキャストが注目の話題になっていますね。リッチなコンテンツとその臨場感が、一般人だけでなくビジネスの世界にも新しい動きを生んでいます。ポッドキャストは、情報を得る新しい手段として、また新しい知識や見解を広める強いプラットフォームになっています。

しかし、この新しいメディアの形態がさらに広がりを見せるためには、音声だけでなく、文字でもコンテンツを使えるようにする必要があります。この点は、SEO、アクセシビリティ、リーチ拡充の視点からも重要です。

文字への変換、つまり文字起こしは、以前は時間と努力が必要なタスクでした。でも、AI技術が進化したおかげで、このプロセスは大いに進化しました。その先頭に立っているのがOpenAIのWhisper AIです。

そして最近、ポッドキャスト向けに音声を自動文字起こしする「LISTEN(リッスン)」がスタートしました。コミュニティ機能付きで、株式会社ONDとLISTEN PROJECTが展開するサービスです。とても使いやすく、改善もはやいサービスです。

LISTEN https://listen.style/

しかし、テキストデータを自社メディアで活用したり、Podcastではない音声メディアも取り扱いたい場合は、自分で文字起こしできるほうがよいです。

そこで、本記事ではWhisperAIで自分でPodcastを文字起こしする方法を紹介します。

Whisper AIとは?

Whisper AIは、OpenAIの最新の技術革新であり、自然言語処理(NLP)と音声認識の領域で新たな基準を設けています。

Whisper AIの基本的な機能

Whisper AIは、高度に精度の高い音声認識エンジンとして機能します。このAIは、入力として提供される音声データをテキスト形式に変換する能力を持っています。そして、その変換は驚くほど高速で、人間が行うよりも遥かに効率的です。

さらに、Whisper AIはさまざまなアクセントや方言に対応しており、広範なユーザーに適応する能力を持っています。これにより、世界中どこからでもユーザーが利用できます。

Whisper AIの利点

Whisper AIの最大の利点はその効率性と精度です。従来の手法に頼っていた場合、人間が音声をテキストに変換するためには大量の時間と労力が必要でした。しかし、Whisper AIを使用すれば、そのプロセスを大幅に短縮し、さらに高い精度で結果を得ることができます。

さらに、Whisper AIの出力は編集可能なテキストファイルとして利用できます。これにより、Podcastの内容をブログ記事、ソーシャルメディアの投稿、ニュースレターなどに簡単に再利用することが可能です。

Whisper AIを使ってPodcastを文字起こしする手順

実行環境 Google Colaboratory

Google ColaboratoryはGoogleが提供する環境で、ブラウザから直接pythonを記述し、実行できるサービスとなっています。

まずGoogle Colaboratoryにアクセスします。Googleアカウントがあれば誰でもGoogle Colaboratoryにアクセス可能です。

how-to-use-whisperai

開いたら、右下の[ノートブックを新規作成]を選択。

画面右上の「接続」を選択してください。

「接続」の箇所が「RAM ディスク」の表示に変わったらクリックし、右下の「ランタイムのタイプを変更」を選択しましょう。

「ハードウェアアクセラレータ」を「GPU」に変更します。

「GPU」を選択すると注意喚起が出ますがこちらも「OK」で大丈夫です。

「ハードウェアアクセラレータ」を「GPU」になっていること確認して「保存」です。

①WhisperをGoogle Colaboratoryにインストールするため、下記のコマンドを入力していきます。

!pip install git+https://github.com/openai/whisper.git

②実行します

③実行されました

次は「+コード」で追加してインポートします。

import whisper

ここでファイルをアップロードします。

「sample_data」にカーソルを合わせると右側に縦三個の•が出てきますのでそちらからアップロードできます。

最後に下記コマンドを入力します

model = whisper.load_model("large")
result = model.transcribe("ファイル名", verbose=True, language="ja")
print(result["text"])

モデルは”large”を使用しています。

※モデルについてはこちら

「ファイル名」は先程アップロードしたファイル名です。(拡張子も忘れずに)

約1分ほどでできました。

まとめ

ポッドキャストの成功は、その価値あるコンテンツをどれだけ広く伝えることができるかに大きく依存しています。それは、言い換えれば、あなたのメッセージを最大限に広める手段として、文字起こしの役割が重要であることを意味します。

このように、Whisper AIを活用することで、ポッドキャストの可能性は大きく広がります。その内容を広く届ける能力は、その成功に対する影響が大きいため、Whisper AIのような強力なツールを最大限に利用することが、今後のデジタルマーケティング戦略で重要となるでしょう。

この記事を書いた人

マーケとAI.com / 編集部

Submarine LLC

Editor Team