Monday, November 3, 2008

Googleが画像からインデックスを作成

Google先生のオフィシャルブログによると、PDF内の画像をOCRを使ってインデックスを付けることにしたんだそうな。
Official Google Blog: A picture of a thousand words?
何を言っているかというと、Web上にある、スキャナで取り込んだ文書(PDFフォーマットの画像)から、中の文章を抽出して、検索できるようにしたってこと。この機能がGoogleデスクトップに搭載されたら大変な事になりますね...。
# ま、技術の流出という問題があるので難しいかもしれませんが。

ストリートビューもそうですが 「そんなリソースあるわけない」 と思考停止してしまうようなアイデアを実現してしまう、その実現力に驚かされます。

No comments:

Post a Comment