目次
【 Google Colab 】で無料で文字起こし
Googleアカウントがあれば使える!!
録音した音声から、無料&少ない手順で文字起こしをする。
GoogleColabを使った土地家屋調査士のLifehack
役員のお務め、お疲れ様でございます。
慣れない支部役員の仕事の中に、議事録作成をしないといけない場合もありますよね。
そんなとき、きっと会議は録音していると思います。
その録音した音声を自動で文字に起こし、たたき台をサクッと作って、議事録を作成してみましょう。
事前準備(以下の記事のとおり、自動文字起こしが出来る人)
・googleアカウントでログイン出来る。
・会議の音声(wavファイル、mp3ファイル)がある。
以上
GoogleColabにアクセス、ログイン
https://colab.research.google.com/?hl=ja
ノートブックを新規作成
接続をクリック
RAM
ディスクをクリック
googleが用意しているGPUを利用するので、作業しているPCにグラフィックボードがなくても大丈夫です。
!pip install git+https://github.com/openai/whisper.git
上の呪文をコピペする。
Pythonという種類のプログラム言語が利用出来ます。
あまり気にせず、呪文を唱えてみましょう。
以下の呪文をもう一度入力して再生マークをクリック
import whisper
あなたのPCに保存してある、会議の音声ファイルを、エクスプローラで選択します。
(文字起こしをする音声データを選択)
model = whisper.load_model(“base”)
result = model.transcribe(“ファイル名”)
print(result[“text”])
上の呪文をコピペ
(より、正確な文字起こしをしたい場合は?)
時間はかかるけど、学習言語が多いパラメータを利用したい場合はmodelのパラメータを「large」をする。
model = whisper.load_model(“large“)
result = model.transcribe(“ファイル名”)
print(result[“text”])
再生マークを押すと処理が実行される。
完了までには10分以上かかる事もあるので、とにかく待ちます。
コーヒーでも飲んで下さい。
画像をよくみると、薄々感づくとはおもいますが、完璧な言葉で文字起こしはされません。
改行など、読みやすくはありませんので、必要に応じてChatGPTなどで「読みやすくして」とお願いすれば幾分か読み易くなります。
もっと簡単にやりたい場合は、webサービスで課金プレイして下さい。
課金サイコー!!
Views: 170
この記事へのコメントはありません。