太陽がまぶしかったから

C'etait a cause du soleil.

若者のスクショ共有文化はもう戻せないのでカジュアルOCRを推進すべき

いちばんやさしいRPAの教本 人気講師が教える現場のための業務自動化ノウハウ 「いちばんやさしい教本」シリーズ

若者のスクショ文化

 若者がスクショでシェアしがちという話をよく聞く。テキスト形式でないとURLや再利用ができないといった弊害があるからやるべきではないという話になりがちだけど、特にスマートフォンは文章を範囲選択しづらいし、フォントスタイルやイメージなども保存しておこうと思えば、スクリーンショットのが楽だ。

 自分自身もスマートフォンにおいてはスクリーンショット画像をそのまま Evernote などに保存する事が多い。それでもあまり困らないのは Evernote は保存した画像を OCR で解析して単語検索可能にしてくれるからである。

f:id:bulldra:20200623222751p:plain

 縦書き雑誌のスクリーンショットを単語検索することさえ可能だ。アプリ上に統一的なグラフィックとして出力されているテキストであれば文字認識の精度も良いので必ずしもテキストコピーでなければとは言えない状況になったと考えている。

Twitter 読み上げ機能と長文スクリーンショット

 画像にしてしまえばサービスやアプリを跨いだ流通の手間が少ないというのはあって、例えばTwitterの140文字制限を一番簡単に突破するのはメモ帳に長文を書いて画像として貼り付ける事だ。それ自体は検索避けにも使われてきたが、最近の Google では画像上の文字をOCRでテキスト認識して検索できる。

前からOCRの影響ではと思う検索結果もあったにはあったのですが、こうして自分の体験として実感するとリアリティが近付いてきますねw

 OCRでテキスト化した内容をALT(なぜか1000文字入力可能)に設定するパイプラインを組めば音声読み上げさせる事さえ可能だろう。テキストとして入力するよりも制限がゆるくなるのだ。

 もちろん、音声認識結果をインデックスする事もできる。 深夜ラジオやPodcast は検索されないから炎上しづらい説は人力による「書き起こし」によって崩れたが、書き起こしも機械によってそれなりの精度で無限に実施可能だ。

シームレスなOCR入力ユーティリティが欲しい

 とはいえ 、いちいちOCR音声認識にかけるのも面倒だと思う事もある。画像としてコピーしたクリップボードの内容を自動的にOCRにかけてテキストとしてペーストできるような入力ユーティリティをアップルやサードパーティベンダーに作ってほしいところだ。Excelの「形式を選択して貼り付け」のようなもの。iOS内やAndroid内のスクリーンショット形式として文字情報をメタデータとして含んでも良いだろう。

 若者の考え方を変えていくというのも方法のひとつではあるが、要素技術としては揃ってきているし、人間の側が機械に合わせる必要性も減ってきている。この文化はもう戻せない物としてコンピュータが扱えるデータ型にカジュアルに変換できるように考えていく方が建設的なのではないか。にんげんはねぇ、コンピュータから扱いやすいようにこの世に生まれてきたのではないんだよ。にんげんがさき。コンピュータがあと。

追記