GoogleドキュメントでOCR実験

Googleドキュメントで画像からテキスト化してくれる(OCR)という記事を見つけたので、どんな精度なのか実験してみました。

【参考記事】
https://support.google.com/drive/answer/176692?hl=ja
超絶便利!画像化されている文字からテキストを抽出できるGoogleドキュメント(OCR)

step.1 テキスト化する画像を用意

今回はフラットベットスキャナで書籍を画像化。
●ファイル形式:TIFF
●カラーモード:RGB/8bit ●解像度:200ppi
【使用書籍】
デザインの学校 これからはじめるInDesignの本 〔CS6/CS5.5対応版〕
(技術評論社)

Step.2 Googleドライブにログイン

Googleがあれば15GBまで無料でいろんなファイルが保管できます。
(2017年5月現在)

 

Step.3 Googleドライブに画像をアップ

今回はファイル形式による違いを確認したかったので、取り込んだTIFF画像をJPEG・GIF・PNGにそれぞれ変換してアップ。

Step.4 Googleドキュメントで開く

Googleドライブにアップした画像を右クリックして「アプリで開く >」から「Googleドキュメント」を選択。

少し解析時間がかかります。

Googleドキュメントで画像が開かれると、

画像の下のほうにテキストが表示されます。

開いた画像と同じ場所にGoogleドキュメントのファイルが自動保存されてます。

これだけ。。。まぁ簡単な。

 

補足と結果

Photoshop(PSD)形式・TIFF形式では、右クリックのアプリ一覧にGoogleドキュメントがでてきません。ネットで利用できる画像形式しか無理みたいですね。

PDF形式では画像は表示されずにテキストだけが表示されました。

 

今回試した画像内容では、JPEG・GIF・PNG・PDF形式のうち一番精度が良かったのはJPEG形式だと思います。

以下、変換した画像(JPEG)とテキスト(原文のまま)のサンプル


音楽の森の

妖精たち

&

(3) 地図の画像を クリックして配置する

マウスポインタがグラフィック配置アイコン較 になります。ドキュメント上の何もないところでク リックして、画像を配置します●。

(4) 地図の画像を移動する

[選択]ツール「k目をクリックし●、配置された 地図の画像上に移動します。画像の中央に表示 されるドーナツ型のマーク(コンテンツグラバー) と、フレームの枠線以外の部分に、ポインタを合 わせて押したままにし@、フレームをドキュメント 右下のマージンガイドが交差している部分までド

|下音楽の森の ●エクリック| 『リ |一*」「@エ で押したまま (3) Fラエ ww. ラッグします@。

リンク画像の管理

InDesignでは、配置した画像ファイルを、「リンク画像」として管理しています。通 常のレイアウト時には、動作が遅くならないように配置した画像の軽い「プレビュー画像」 で表示していますが、[高品質表示] にした時、印刷する時、PDFに書き出す時など には、元の画像ファイルまで情報を呼び出しに行きます。そのため、InDesignでは、[リ ンク」バネルで配置した画像を管理できるようになっています。国が付いた画像は 配置した時より後に画像が更新されたもの、[○]が付いた画像は、画像ファイルの存 在場所が InDeSign側でわからなくなっているものを示しています。それらの画像は

|[○回や国をクリックして、リンクを正しい状態に戻します。最終的にはこの2 つのマークが表示されていない状態にしてから、印刷、PDF書き出し、パッケージ作 成などを行ってください。

塔前

s– 5-RG-Logo-ai Sa 5-Mainmage.psd

5-DisplayGiftl.psd 5-DisplayGift2.psd 5-Displaygift3.psd 5-Gardening1.psd

1 aæiR es

ఫీ .

0

:

谢娜

الأمير


昔のようにドキュメントスキャナとOCRソフトを購入するなんて、今さら必要性を感じませんし、無料でこれだけの精度なら充分じゃないでしょうか。
(個人の感想です)

Final Cut Pro 音源にプチプチノイズが入る件

音源をFinal Cut Proのシーケンスに配置すると、所々プチッとノイズが、
耳ざわりなのでどうにかならないかググってみたところ、フォーマットの周波数帯が一致していないためと判明。

音源(mp3)はネットからダウンロードさせていただいたフリー素材。
ファイル情報ではチャンネル数とビットレートしか確認できないので、QuickTimeのムービーインスペクタで確認してみたところ周波数は44.1kHz。
シーケンスの標準設定は48kHzだったので、44.1kHzに変更したらノイズは少なくなりました。

動画や音楽の編集はたまにしかやらないので、いつもこんな初歩的?なところで迷走してます・・・。

異なった周波数の音源を複数使うなら、iTunesなどで変換して、周波数を統一するしかなさそうですね。