エンジニアの副業は週1からでも可能?副業の例や探し方も解説
- ITエンジニア
- 副業
「紙の書類やPDFを、Wordなどの編集できる形に変換したい!」
しかしどうしても難しく、仕方なく手入力で打ち直した……という経験はありませんか? じつは「OCR」を使えば、かんたんに編集可能なファイルに変換できちゃうんです。
OCR(光学的文字認識)とは、いままでは編集できなかった紙の書類やPDF、画像などを、編集可能なテキストデータに文字起こしする技術。OCRを活用するとPDFから文章を抽出できるようになり、いままでの業務が便利になること間違いなし!
この記事ではOCRの仕組みや具体的な利用方法、おすすめアプリを紹介します。
※本記事は株式会社ワンダーシェアーソフトウェアの提供でお送りします
OCR(Optical Character Recognition)とは、PDFや画像に書かれた文字を認識し、編集できるテキストとしてデータ化する技術です。
じつはOCR自体は、最新のテクノロジーというわけではありません。しかし近年のAI技術の発展により文字認識精度が向上し、スマートフォンの機能や製造現場など、さまざまな場面で活用されるようになりました。
身近な例では、スマートフォンのカメラで外国語を読みとり即時翻訳する、といった機能にもOCRの技術が使用されています。
OCRは次の順番で処理されます。
なにやら複雑そうに見えますが、2〜5はOCR機能が自動でおこなってくれるため、人の手が必要なのは1のスキャンのみ。読み取りたい書類やPDFファイルさえあれば、OCRで簡単にテキスト化できます。
OCRによりできるようになることは、おもに次の2つです。
それぞれ以下でくわしく説明します。
OCRにより文字を認識することで、PDFをダイレクトに編集することができます。
「PDFって、PDFのままで編集できるの??」と思われる方もいるかもしれませんね。
そもそもPDFとは、文字や画像、動画などの情報を、閲覧する環境を問わず同じように表現できるようにパッケージした情報の集合体です。
なので、PDFに含まれる文字情報を認識することができれば、PDF自体の編集も可能というワケです。
基本的にPDFで配布するような資料は、WordやPowerPointなどで作成し、PDFに書き出すケースがほとんどだと思います。ただこの場合、PDFに書き出した後の資料に修正ポイントが発覚した場合、PowerPointの資料を修正して再度PDF書き出し直す、という方が多いのではないでしょうか。
ここで『PDFelement』のような、OCRを活用したPDF編集ソフトの出番です。簡単な修正であれば、PDFのままで修正してしまいましょう。
OCRの便利さは「テキストファイルとして出力する」だけにとどまりません。PDFをOCRにかけると、WordやPowerPoint、Excelなどのファイルとしても出力可能になるのです。
たとえばクライアントからもらった紙の書類やPDFを、PowerPointに変換して保管/編集する、といった使い方も可能になります。
情報管理の自由度がぐっと広がりますね。
OCRを用いた業務効率化の事例について5つ紹介します。
なんだかんだ多くのスペースを取りがちな紙の書類。これらをスキャンし電子データとして取り込むことで、保管スペースの削減が可能になります。
しかしOCRなしに、ただスキャンをしただけでは検索で見つけられず、かえって資料探しが大変になってしまうことも。
ここでOCRを用いることで、データ内に含まれるテキストを検索できるようになるのです。
『PDFelement』であれば、たった2ステップでOCR機能を活用して検索可能なデータに変換可能に。
OCRがあれば「あの資料どこやったかな〜」ともおさらば、ですね。
PDFを編集可能なテキストデータにするOCRさえあれば、もう画面を見ながら1文字ずつ手打ちする必要はありません。
たとえば以下のPDF資料をもとに、上司やクライアントを説得する資料を作りたいとき。
OCRを知らない状態であれば、おそらく左の文言を、画面とにらめっこをしながら手入力することになるでしょう。
また右の図はPDFのままではコピペできないため、そっくりの図をエクセルなどで作るか、PDFを開いたPC画面のスクリーンショットを撮ることになります。
しかしOCR機能が実装された『PDFelement』であれば、簡単にコピペを駆使して資料作成ができるようになるのです。
今回のように「社内などの内輪向けに、なるべく時間をかけずにとりあえず情報をまとめたい」といったケースでは、OCRのコピペ機能はかなり便利といえるでしょう。
「紙の書類をデータ化したはいいけど、編集できないから不便……」
そんな悩みも、OCRを使えば解決。
OCRによって紙の書類データからテキストを抽出し、編集可能な状態にできます。
OCRでテキストデータを拾えるということは、テキストデータを翻訳し、外国語のPDF資料を日本語に変換することも可能なのです。
OCR機能のあるPDF編集ソフトを活用することで、契約書などを印刷なしでサイン&捺印が可能になります。
たとえばクライアントから契約書がPDFで送られてきたとします。いままではPDFを紙に印刷し、ハンコを押して再度スキャンして返送、というフローだった人も多いはず。
しかし『PDFelement』のようなPDF編集ソフトであれば、PDFを紙に印刷することなく、PDFのままでサインや捺印が可能なのです。
一度ハンコを登録してしまえば、あとは何度でも再利用可能。いちいち印刷する場合と比べ、大幅な時間短縮となるでしょう。
なおPDFelementは電子署名に対応しているので、電子契約にも使用できます。
「あ! PDFにミスが……またPowerPointを立ち上げて修正しないと……」
「以前クライアントからもらった資料、どこいったっけ……」
「請求書にハンコを押すために、コンビニに印刷にいかないと……」
OCRを活用することで、このようなちょっとした雑務を大幅に減らすことができます。そしてその分だけ、クライアントへ価値を提供するために充てる時間が増えるのです。
そんなOCRを導入するにあたってのおすすめアプリは『PDFelement』。
ここまでOCRを活用したPDFelementの便利な機能をいくつかご紹介しましたが、じつはPDFelementにはまだまだ便利な機能が満載です。
毎日の雑務やちょっとしたストレスの積み重ねが、PDFelementで解消できるかもしれません。
PDFelementの料金体系は以下のとおり。(詳細は公式サイトをご確認ください)
プロ版+iOS版 | 標準版 | |
永続ライセンス | 9,380円(税込) | 5,980円(税込) |
1年間プラン | 7,280円(税込) | 4,980円(税込) |
※参考:Adobe Acrobat Standard 1年間プラン 18,216円(税込)/Adobe Acrobat Pro 1年間プラン 23,760円(税込)
値段を見て「思ったよりいい値段するし、やっぱ試すのやめとこうかな」という人もいるかもしれません。
ただOCRによって(少なめに見積もって)毎月3時間程度の時間が雑務以外の時間に充てられるとすると、年間36時間は雑務に費やされている計算になります。時給が1,000円だったとしても、PDFelementには年間36,000円の価値があるのです。
その価値が年間4,980円〜で受け続けられると思うと、なかなか「アリ」なのではないでしょうか。
「どれくらいPDFelementが便利なのか、一度試せないかな?」と考えている方に朗報です。
新製品であるPDFelement Ver.9のリリースに合わせ、プロ版の7日間無料体験キャンペーンが行われます!
PDFに関する機能が総合的に詰まったPDFelementが無料で手に入るチャンス、ぜひお見逃しないよう。
なお基本的な機能については、いつでも試用版を無料ダウンロードできます。「とりあえずPDFelementの使用感を確かめたい!」という人は、こちらもぜひお試しください。
(執筆:すめし 編集:じきるう)