大量の請求書をスキャンしてPDF化し、OCRで読み込むことは可能か?

電子帳簿保存
大量の請求書をスキャンしてPDF化し、OCRで読み込むことは可能か?

紙で受領した請求書を、いちいち手入力して支払管理していませんか?

紙で受領した請求書をスキャンしてPDF化し、OCRで読み込むことができれば、手入力の手間を大幅に削減できます。

この記事では、経理担当者に向けて、OCRを活用して請求書業務を効率化する方法を解説します。

この記事の目次

    発注先に依頼して、請求書をデータでもらうのがベスト

    結論から言うと、請求書をデータで管理したいのであれば、発注先に請求書をデータでもらうように依頼するのがベストです。

    ただし、請求データを送信してもらえるかどうかは取引先次第です。請求データの入手が難しい場合は、スキャナーとOCRでデータ化する方法を検討してみてください。

    そもそも、OCR(光学文字認識)とは?

    OCRは、画像データ(印刷された文字)をテキストデータに変換する技術です。正確には、「Optical Character Recognition(光学文字認識)」であり、略してOCRと呼びます。

    OCRの精度を疑問視する人は多いですが、時代とともに文字の認識率は向上しており、最近では手書きの文字情報を読み取れるOCRソフトもあります。また、OCRは文書のレイアウトも認識してデータ化できます。文書内の段組み、改行などもデータへと反映させるので、出力時に元の文書と同じ書式を保つこともできます。

    紙の請求書をデータ化する方法

    スキャナーとOCRを活用して、紙の請求書をデータ化する方法を解説します。

    紙の請求書をスキャンして、画像データとしてパソコンに取り込む

    まず、紙の請求書をスキャンして画像データ化します。イメージスキャナを使って請求書をパソコンに取り込んでいきます。

    大量の請求書をスキャンする場合は、事前に送信先フォルダの指定や、ファイル名の設定をしておくと管理しやすいです。

    請求書の画像データ(PDF)をOCRで読み込んでテキスト化する

    スキャンされたデータは、PDFファイルとしてパソコン内に保管されます。このPDFをOCRで読み込み、テキストデータへと変換していきます。OCRでは、まず文書の構成を読み取ります。その後、文字列を認識し、いずれの列から解析するべきかを決定します。それから、文字列の行、文字の順で分解していきます。OCRは1文字ずつ、数字や漢字、カタカナのどれにあたるかを分類していきます。

    それから、マッチングへと移ります。OCRシステムに登録されているデータベースと文字を照会する作業です。照合する文字があるデータは、テキスト化されていきます。こうした作業が高速で処理され、帳票データの全体がテキストになります。テキスト化が終わったら、WordやExcelに出力して完了です。

    OCRの注意点

    データ入力に便利なOCRシステムですが、どれほど高性能でも認識率は100%ではありません。

    スキャンの解像度を上げる

    OCRの文字認識の精度は、スキャン時の解像度に左右されます。解像度が低いと、当然ながらOCRの認識率は下がります。文字がかすれていると、誤った形状で認識して本来とは別の文字と置き換えてしまう可能性があります。新しくスキャナーを購入するのであれば、解像度の高いものを検討してみてください。

    白黒でスキャンする

    請求書であれば、そこまで過度な装飾がされているケースは無いはずですが、スキャン時に白黒でデータを取り込むのも方法の一つです。カラーの画像データよりも、白黒の画像データの方が認識率が高まります。

    拡大してスキャンする

    こちらも請求書ではあまりないケースですが、文字が小さすぎる場合は、拡大してスキャンするのも効果的です。字が小さいほど認識率は低くなるので、できるだけ見やすいサイズでスキャンするように心がけましょう。

    請求書をスキャンデータで保管する際の注意点

    社内処理用に請求書をスキャンする分には問題ありませんが、保管目的でスキャンする場合は注意が必要です。

    電子帳簿保存の要件を満たすためには、PDFでスキャン保存しながらタイムスタンプを付けるなど、電子帳簿保存の要件を満たす必要があります。

    運用ハードルが高めなため、従来通り紙として保管するケースが多いです。

    関連記事:PDF請求書の原本保存は必要?

    まとめ

    請求書のデータ入力を効率化したいのであれば、OCRは有効な選択肢です。文字の認識率は上がっているので、興味があれば検討してみてください。

    ただし、OCRの認識率は100%といえないので、まずは取引先に請求書の電子化をお願いしてみるのが良いでしょう。

    【無料】3分でわかる!電子帳簿保存システム「楽楽電子保存」資料請求はこちら>>>

    ラクスのクラウドサービス累計導入社数95,000
    電子帳簿保存システム「楽楽電子保存」
    受け取った書類の電帳法対応をラクに
    「楽楽電子保存」はあらゆる書類を、
    まとめて一元管理・保存できるシステムです。

    ※2025年3月末時点

    この記事のカテゴリー:

    記事執筆者紹介
    株式会社ラクス「楽楽電子保存」コラム編集部

    「楽楽電子保存」のコラムでは、電子帳簿保存法の要件や、あらゆる書類の効率的な保管方法についてご紹介します。

    楽楽電子保存
    TOPに戻る