エンジニアの副業は週1からでも可能?副業の例や探し方も解説
- ITエンジニア
- 副業
上記のように、ChatGPTを使ったハック術で仕事を効率化させている人は多いのではないでしょうか。そして実は、ChatGPTを使うと文字起こしもかんたんにできてしまいます。
本記事では、普段はエンジニア、ときにはライターとしても活動する筆者が、ChatGPTを使った文字起こし方法をご紹介します。
ITライター兼Web開発者。 システムエンジニアとしての経験とSEOの知見を活かした記事を執筆。AIを組み込みライター業務を効率化するWebサービス『MOJI-KA』を開発・運用中。
目次
一昔前は、文字起こしは完全な人力でした。録音した音声を再生しながらキーボードを叩く、聞き漏らしたら戻る。また聞く、叩くを繰り返します。かなりの集中力と体力を使う作業です。文字起こしには「素起こし」「ケバ取り」「整文」の3工程がありますが、ChatGPTを使えば「ケバ取り」「整文」の2工程をあっという間にこなしてくれます。
最初の工程「素起こし」は文字起こしツールに任せます。文字起こしツールとは、録音した音声データをテキストデータに変換してくれるもの。
しかし、録音環境や話し手のクセなど、さまざまな要因で精度はバラつきます。また、ある程度は文字に起こせますが、「あー」「あのー」「えーと」といった口語特有の表現を削除する「ケバ取り」が必要です。さらに、不適切な漢字に変換されてしまうものもあり、1つずつチェックして直さなくてはいけません。これはこれで大変。
そこで出てくるのがChatGPTです。ChatGPTを使えば、ケバ取り作業や不自然な文脈の発言も文意をくみ取って整えてくれます。つまり、音声データからの文字起こし、体裁を整えるところまでは半自動でできてしまうのです。
ChatGPTで文字起こしするメリットはいろいろありますが、以下の部分はありがたく感じる人は多いと思います。
文字起こしで大変なのは「情報として整った状態にすること」です。必要なのは「誰が」「なにを」言ったかであり、それ以外の情報はノイズとして文字に起こさないことも重要になります。
文字起こしには相当な集中力が必要なため、1時間の音声データを文字起こしするだけでもかなり疲れます。経験上、専用のツールで文字起こししてても元データの2~3倍の時間が必要でした。
インタビュー記事制作であれば、コンテンツを作る前処理段階で疲れてしまいます。ChatGPTを活用すれば半自動で文章ができあがります。さらに、手と頭が疲れません。
どのようなアウトプットを出すにしろ、文字起こしは必須の工程です。文字起こしを半自動化することで作業スピードは劇的に早くなります。時間のかかる作業工程が1つ無くなるのは大きなメリットになるでしょう。さらに、集中力を温存してアウトプットの作成に入れるので、よりクオリティの高いものを生み出せます。
作業スピードとクオリティを同時に引き上げられるのであれば、ChatGPTを利用しない手はないのではないでしょうか。
それでは、具体的にChatGPTを使った文字起こしをしてみましょう。手順は3つです。
まずは音声ファイルを用意します。インタビューであれば録音アプリ、動画から文字起こしをしたいなら動画ファイルが必要です。
録音アプリはiOSなら「ボイスメモ」、Androidなら「レコーダー」がデフォルトでインストールされています。会議やインタビューを録音するだけなら標準アプリで困ることはないでしょう。
Microsoft TeamsやZoomなどのビデオツールから文字起こしする場合は、音声ファイルは必要ありません。標準機能で文字起こしデータをダウンロードできます。
次に音声ファイルから音声データをテキストに変換します。
音声ファイルのテキスト変換にはさまざまなアプリがありますが、無料で利用できるアプリを2つほど紹介します。
Nottaは104言語に対応する議事録サービス。リアルタイム文字起こしをしてくれるのがウリで、音声ファイルからの変換にも対応しています。無料でも120分まで利用できるので、ちょっとした音声ファイルなら使えますね。ファイルのインポートはOneDriveやGoogleDriveにも対応しているので便利です。
CLOVA Noteは、最近リリースされたサービスでこちらも議事録作成ツールです。現在ベータ版が公開されていて、音声ファイルをアップロードすれば手軽に文字起こししてくれます。無料で300分まで使えるので、仕事用に使っている人も増えている印象です。
最後にChatGPTを使って整形します。ChatGPTに以下のプロンプトと、文字起こし済みのテキストを入力してください。
【プロンプト】
以下の文章は、インタビューの音声データを文字起こししたものです。このデータを清書してください。
これだけで音声を整形してくれます! あとは、整形されたテキストを使って作業に入るだけです。音声ファイル、テキストデータ、文字起こしの整形データの作成まで、うまいことやれば無料でできてしまうのは驚異的といえます。利用頻度が高いなら、有料の文字起こしサービスに登録するのもいいですね。
文字起こし歴9年の編集者がオススメする文字起こしアプリ7選
Workship MAGAZINE
とても便利なChatGPTですが、いくつか注意点があります。
ChatGPTは一度に大きなテキストを処理することができますが、収録時間が長いとデータ量が膨大になってしまって処理しきれなくなってしまいます。
2023年11月現在、ChatGPTのGPT 3.5では、4,096トークン(おおよそ2,000字)が1回のセッションでの上限です。トークンは「ユーザーの質問」+「ChatGPTの回答」で計算されます。つまり、会話の合計が2,000字を超えるような質問を投げると回答が途中で切れてしまう可能性があるでしょう。
その場合はデータを分割してChatGPTに処理してもらいましょう。
なんでも答えてくれそうなChatGPTは、じつは最新時事ネタに弱いのをご存じでしょうか。ChatGPTは、2022年1月までのデータしか学習していません。そのため、最新の法律やサービスなど、最新情報を絡めた文字起こしをさせると単語を認識しない可能性があります(2023年11月現在)。
時事ネタを絡める場合は、誤変換や嘘の情報が混ざっていないかをしっかり確認しましょう。
企業など会議の会話データをChatGPTに読み込ませてしまうと、学習データとして利用されてしまうおそれがあります。企業の機密情報についての会話をChatGPTが学習して、ほかの利用者に回答として使われてしまえば、あっという間に情報漏えいにつながるでしょう。
そのため、機密性の高い情報はなるべくChatGPTに読み込ませないのが鉄則です。
もし、どうしても機密情報を含めた内容を文字起こししたいのであれば、Azure OpenAIが提供するChatGPTを組み込んでシステムや製品を利用、または構築する必要があります。
ChatGPTにやってもらえる仕事は文字起こし以外にもあります。たとえば、以下のようなものがあります。
それぞれの活用法を、そのままコピペして使えるプロンプト付きで解説します。
文章の要約は、ChatGPTの代表的な活用方法です。音声データをそのまま文字起こしした場合、何の話をしているのか大ざっぱに知りたい人には無駄が多くなってしまいます。そこで、文字起こしデータ全体を要約してもらえば、どういう会話がされたのかを短時間で把握できるでしょう。
【プロンプト】
以下の文章は、インタビューの音声データを文字起こししたものです。このデータを清書して外部に公開できるように、要約文を生成してください。
複数人で議論している議事録などは、文字起こしデータを読んでも結局どういう話だったのか掴みにくいことがあります。そこで、ChatGPTに会議で決定したキーポイントを抽出してもらいます。なお、私が試したときはなぜか英語で回答されたので、状況に応じて「日本語で回答してください。」と入れたほうが期待通りに動くと思います。
【プロンプト】
以下の文章は、議事録の音声データを文字起こししたものです。このデータからキーポイントを抽出してください。
座談会やセミナーなどのイベントを、あとからメディアで公開したいケースでは、参加者からの質問などがたくさん集まってきます。こういった質問は、当然メディアを見たユーザーも気になっている可能性がある内容です。
ChatGPTを使えば、内容からFAQを作成しておくことができます。ChatGPTが出力したFAQを元に、どれを掲載するべきかをピックアップするだけです。とても効率的ですね!
【プロンプト】
以下の文章は、セミナーの音声データを文字起こししたものです。このデータからFAQを作成してください。
最後に、ChatGPTを搭載した便利な文字起こしツールを用途ごとにご紹介します。
『ObotSERVE Biz』は、株式会社ObotAIが提供する業務効率化ツール。利用したデータを学習に利用しない、安全なChatGPTを組み込んだ文字起こしが利用できます。企業の議事録作成やセミナーなど、機密情報を含んだ音声データを安全に文字起こししたい場合におすすめです。
OpenAIのアカウントは取得不要なだけでなく、法人契約も可能。ChatGPTを業務で活用したいと考えている場合は検討してみてはいかがでしょうか。
Youtubeの動画を文字起こししたいのであれば、Chrome拡張機能の『Youtube Summary with ChatGPT』がおすすめです。Youtube Summary with ChatGPTは、Youtube動画を一瞬で文字起こしできます。
5つの要点にまとめる機能もあるので、ざっくり概要を知りたい場合にも便利なツールです。利用するAIモデルが、以下から選択できるのも特徴。専門家目線で言うと、Anthropic社のClaudeが使えるのは渋いですね。
インタビュー、会議、通話、講義などあらゆるシチュエーションに対応する文字起こしデバイスが『PLAUD NOTE』です。こちらもChatGPTに対応していてワンタッチで録音を開始。録音データは即座にOpenAIが提供する文字起こし機能Whisperによってテキストデータに変換可能です。
セキュリティ面もしっかりしていて、データは暗号化されてGoogle Cloudのサーバー上で管理されるため情報漏えい対策済みなのも心強いですね。
ChatGPTはとても便利なツールです。しかし、AIといえど万能ではありません。あくまで最終確認は人間がしましょう。
AIと人間が協業することでより良いアウトプットが短時間で生み出せます。これこそがChatGPTを使う最大のメリットです。
(執筆:コロスキー 編集:齊藤颯人)
ChatGPTは記事作成に使える? AIを活用して高品質な記事を作成する方法【記事制作用プロンプト付き】
Workship MAGAZINE
音声入力ツール「Voice In」と「ChatGPT」の組み合わせは最強! 使い方を愛用者が解説
Workship MAGAZINE