元・地方の中規模印刷会社で苦悩するWebデザイナー改めWebディレクターの日記

書類をPDFでスキャンすれば「Adobe Acrobat」でテキスト化(OCR)できる

どういうことかというと、まずは説明したいと思います。

最近のプリンターには複合機と言ってプリンターだけの機能ではなく、スキャナやコピー、中にはファクスにまでなってしまうインクジェットプリンターもあります。
そういったプリンターの中にはスキャンしたデータをPDFもしくはJPEGにしてSDカードに保存してくれるといったものもあります。
わざわざパソコンを繋いだりしなくてもSDカードにスキャンしたデータを保存できるんです。
で、そういったプリンターを使って書類をPDFでスキャンします。

スキャンしたPDFのデータは「Adobe Acrobat」で開くことができます。
で、このAcrobatで画像データの文字をテキストデータに変換することができるというわけ。
そう、つまり、OCRの機能をいつのまにかAcrobatは持っていたんですね。

>> 続きを読む

Tumblr(タンブラー)を自分の言葉でつぶやこう(ツイッター連携時に自由にツイートする方法)

Tumblr(タンブラー)とツイッターの連携の仕様が最近になって変わった。

今までは、 だったり だったのだが、
最近になってダブルクォーテーションで囲まれた引用部分がなくなり、
だったり だったりになってしまった。
>> 続きを読む

マシンを変えたらFlashの画質が落ちたと言われたときにチェックすること

あるお客さんからマシンを変えたらFlashの画質が悪くなったとの相談を頂いた。
そこで、該当のFlashを調べてみると以下のことがわかった。

むむむ。。
>> 続きを読む

テキストが選択できないPDFファイルからテキストを抽出する方法

時々、PDFファイルを渡されて「これをホームページにしてくれない」と言われることがある。
PDFだったらそのままPDFでリンクだけ張っちゃろうかい! なんて思うこともあるが
そういうわけにも行かず、PDFファイルからテキストをコピー&ペーストしてセコセコHTMLファイルにするのだが、
中にはセキュリティ上の問題かテキストが選択できないPDFファイルもある。
だからって、プリントアウトして文字入力なんて非生産的なことはできない。
そんなときに使えるツールを発見しました。
>> 続きを読む




    最新コメント