目次
【 Google Colab 】で無料で文字起こし
Googleアカウントがあれば使える!!
録音した音声から、無料&少ない手順で文字起こしをする。
GoogleColabを使った土地家屋調査士のLifehack
役員のお務め、お疲れ様でございます。
慣れない支部役員の仕事の中に、議事録作成をしないといけない場合もありますよね。
そんなとき、きっと会議は録音していると思います。
その録音した音声を自動で文字に起こし、たたき台をサクッと作って、議事録を作成してみましょう。
事前準備(以下の記事のとおり、自動文字起こしが出来る人)
・googleアカウントでログイン出来る。
・会議の音声(wavファイル、mp3ファイル)がある。
以上
GoogleColabにアクセス、ログイン
![](https://sakura.3ku.jp/wp-content/uploads/2023/06/2023-06-01_13h19_35.jpg)
https://colab.research.google.com/?hl=ja
ノートブックを新規作成
![](https://sakura.3ku.jp/wp-content/uploads/2023/05/2023-05-31_17h21_13.jpg)
![](https://sakura.3ku.jp/wp-content/uploads/2023/05/2023-05-31_17h22_36.jpg)
接続をクリック
![](https://sakura.3ku.jp/wp-content/uploads/2023/05/2023-05-31_17h23_33.jpg)
![](https://sakura.3ku.jp/wp-content/uploads/2023/05/2023-05-31_17h24_58.jpg)
RAM
ディスクをクリック
![](https://sakura.3ku.jp/wp-content/uploads/2023/05/2023-05-31_17h24_58-1.jpg)
![](https://sakura.3ku.jp/wp-content/uploads/2023/05/2023-05-31_17h28_31.jpg)
![](https://sakura.3ku.jp/wp-content/uploads/2023/05/2023-05-31_17h31_12.jpg)
googleが用意しているGPUを利用するので、作業しているPCにグラフィックボードがなくても大丈夫です。
![](https://sakura.3ku.jp/wp-content/uploads/2023/05/2023-05-31_17h32_16.jpg)
!pip install git+https://github.com/openai/whisper.git
上の呪文をコピペする。
Pythonという種類のプログラム言語が利用出来ます。
あまり気にせず、呪文を唱えてみましょう。
![](https://sakura.3ku.jp/wp-content/uploads/2023/05/2023-05-31_17h34_28.jpg)
![](https://sakura.3ku.jp/wp-content/uploads/2023/05/2023-05-31_17h35_23.jpg)
![](https://sakura.3ku.jp/wp-content/uploads/2023/05/2023-05-31_17h37_30.jpg)
以下の呪文をもう一度入力して再生マークをクリック
import whisper
![](https://sakura.3ku.jp/wp-content/uploads/2023/05/2023-05-31_17h39_54.jpg)
![](https://sakura.3ku.jp/wp-content/uploads/2023/05/2023-05-31_17h41_35.jpg)
![](https://sakura.3ku.jp/wp-content/uploads/2023/05/2023-05-31_17h44_48.jpg)
![](https://sakura.3ku.jp/wp-content/uploads/2023/05/2023-05-31_17h46_25.jpg)
あなたのPCに保存してある、会議の音声ファイルを、エクスプローラで選択します。
(文字起こしをする音声データを選択)
![](https://sakura.3ku.jp/wp-content/uploads/2023/05/2023-05-31_17h48_20.jpg)
![](https://sakura.3ku.jp/wp-content/uploads/2023/05/2023-05-31_17h50_15.jpg)
model = whisper.load_model(“base”)
result = model.transcribe(“ファイル名”)
print(result[“text”])
上の呪文をコピペ
(より、正確な文字起こしをしたい場合は?)
時間はかかるけど、学習言語が多いパラメータを利用したい場合はmodelのパラメータを「large」をする。
model = whisper.load_model(“large“)
result = model.transcribe(“ファイル名”)
print(result[“text”])
![](https://sakura.3ku.jp/wp-content/uploads/2023/05/2023-05-31_17h53_15.jpg)
再生マークを押すと処理が実行される。
完了までには10分以上かかる事もあるので、とにかく待ちます。
コーヒーでも飲んで下さい。
![](https://sakura.3ku.jp/wp-content/uploads/2023/05/2023-05-31_17h56_41.jpg)
![](https://sakura.3ku.jp/wp-content/uploads/2023/05/2023-05-31_18h01_31.jpg)
画像をよくみると、薄々感づくとはおもいますが、完璧な言葉で文字起こしはされません。
![](https://sakura.3ku.jp/wp-content/uploads/2023/05/2023-05-31_18h03_48.jpg)
改行など、読みやすくはありませんので、必要に応じてChatGPTなどで「読みやすくして」とお願いすれば幾分か読み易くなります。
もっと簡単にやりたい場合は、webサービスで課金プレイして下さい。
課金サイコー!!
この記事へのコメントはありません。