2017-08-14

手書き数字認識の機械学習を通じて学んだこと

パソコン

仕事で自動採点用に、手書き数字の機械学習（AI）の構築にトライしている。その過程で人間の”認識プロセス”に対する理解が深まった。

一桁の数をAIに認識させようと、実際に人間が書いた手書きの数字を読み込ませると、90%の精度でしか認識することが出来なかった。実験レベルなら99％認識できるので問題はAIの構造ではなく。

実は AI が仕事をするのに一番大変で大切なのは、 AI が理解しやすい形にデータを（人間が）加工してあげることだった。教本にはそう書いてあって読んだときは本当かいな？AIの仕組みを作るほうが大変ちゃうの？と思ってたけど、いやいやデータの加工に95％くらい時間を取られる。

作るAIのレベルにもよるのだけど、AIは基本的に訓練のときに使われた「データ群の癖」に囚われてしまう。

簡単な例でいうと、解答欄に大きく描かれた[７]という形を、数字の ” 7 ” として学習したAIは、同じ解答欄に小さく書かれた判別したい[７]を全く別物として捉えてしまう。

そのズレ感をイメージ化する。

数字のパートを"1"、背景を"0"で表現すると以下のような形で画像になっている。

f:id:molingit:20170814075033j:plain

AIが認識してる形にそれぞれ直すと、

f:id:molingit:20170814075041j:plain

となり、上の画像の形なら似てるじゃん！と思うけど、一行の形だとたしかに同じものとは言うのは無理があるかなーと。まぁ本来ならそれでも似てるパターンを探し出して、認識するのがAIの役目だとは思うんだけど。

文句を言ってもしょうがないのでBの判別したい[７]を加工（余白削除）する

f:id:molingit:20170814075038j:plain

こうすると、判別したいB’の余白削除後の[７]の数字並びの比率が、Aの学習した「７」と似てくるせいか（上と下で約2:1のサイズ比）、

f:id:molingit:20170814075046j:plain

AIはやっと加工後の[７]を" 7"として認識するようになる（本当になにで認識してるのかは分からない）。

このように、「余白の割合を同一の比率にしたり、数字の斜め書きを縦に戻したり、筆圧の低い人の字を適度な濃さにしたり、、、という想定されるあらゆるデータのズレを補正する作業」を（現段階では）人間がしている。そうやってAIが食べやすい形にデータを直して与えることで初めて、AIは仕事をすることができる。

･･･このことから思いつくのは、人間が紙に書かれた[７]を認識しているときも、たんに概念としての"7"を認識しているだけじゃなくて、

紙に書かれた[７]の、「サイズの調整、色の濃さの調整、回転の調整、移動の調整、枠線と数字の区別、、、などなどが全て自動で脳のなかで加工」されて、最後に『算数や数学の概念認識のプロセス』が動いて、ついに数字の ” 7 ” として認識されているんだと。

逆にいうと、なんらかの事情で脳のなかの画像加工機能のほんの一部が動かなくなるだけで、数字の概念は使えるのに紙に書かれた[７]の認識すら、出来なくなるんだろうなぁと。これはディスレクシアの原因になるのかもしれない。

というわけで、AIを構築する作業というのは『概念認識』のような高度な部分はわずかで、その前のデータを食べやすい形にする単調作業がほとんどの仕事だった。

で、リアルな問題としてその単調作業を繰り返して、認識率を最低99%にあげないと仕事にならん・・・。

（追記）

8/16　…94％あと二歩。

8/19　…99％！完成！

↓　こんな感じで数字認識結果が出る。

f:id:molingit:20170819212341p:plain

結局、AIを訓練するためのデータに色んな種類のノイズを加える方法を新たに追加したことが、残り９％を上げるポイントだった。

つまり数字が斜めになってたり、枠からはみ出てたり、読みにくかったりする数字でAIを訓練させたら、実践対応能力が上がったと。これって人間でも使える訓練方法だったりしないのかな。。。

2017-08-10

本　ゆらぐ脳

本

「ゆらぐ脳」池谷裕二さん著。

池谷さんは、モノゴトが「わかる」を、これまでの「” 分けて ” わかる」に加えて、「（分けずに）そのままわかる」という方法論を作り出そうとしている。脳の研究者としてもすごい実績を上げているのに、新種の「わかる」を作り出すって野望大き過ぎ！（笑）

これって、「自転車の乗り方」みたいな、体で「わかる」とかに近いことなんじゃないのかな。動的平行で有名な福岡伸一さんも「世界は分けてもわからない (講談社現代新書)」って言ってるし、「まるごと受け止める」ことは、新たな方向性として何か感じるものがある。

ゆらぐ脳

作者: 池谷裕二,木村俊介
出版社/メーカー: 文藝春秋
発売日: 2008/08/07
メディア: 単行本
購入: 5人クリック: 40回
この商品を含むブログ (48件) を見る

本の全体の内容は珍しく、研究生活にまつわるリアリティで、研究に進みたい人にとっては参考になるかもしれない。ただ、池谷さんのとっている研究方法はサイエンスの世界で、ものすごく異端だと思う。

仮説を立てずに、好奇心を一番大事にして、新たな何かが分かりそうなトライアルをひたすら続けていくというもの。どこに転がるかわからないし、ポイントもないし、方向性も、進捗状況も本人すらわからない。単年度で成果を毎年上げなければいけない制度の中では存在しずらい方法論。

でもこれって、すごく自然な感じがする。自分が ” いい状態 ” の時の心のありようって、たいてい仮説（予定）を忘れて、好奇心の赴くままに街歩きをしたりして、発見していく時だから。自分の枠組みから自由になってるから、新しいことにどんどん出会える。

池谷さんには個人的に人類栄誉賞をあげたい。

2017-08-06

本　騎士団長殺し

本

本「騎士団長殺し」村上春樹さん著。

いままでの小説と同じ結末では、あらない。ある種、ノルウェイの森の違った未来がここにあるような気もする。それがいまの村上さんから生まれるものなのだろう。

いったい、まりえはなぜ消えてなくてはいけなかったのか。それが主人公とどう関わっているのかいまだわからない。そこに論理を求めてるわけでもなく、村上さんがどこからか取り出してきた世界のあり方に疑問を挟むわけでもなく、ただ、その世界ともう少しやりとりして、「そういうことも、ある」と自然に言えるように、その世界にもっと浸りたいというのが本当のところ。

騎士団長殺し :第1部顕れるイデア編

作者: 村上春樹
出版社/メーカー: 新潮社
発売日: 2017/02/24
メディア: 単行本
この商品を含むブログ (58件) を見る

主人公の言葉に、絵は、描き手が終わりを決めるんじゃなくて、絵が終わりを決めるという話が出てくる。おそらく、間違いなく、村上さんの長編は（村上さんではなく）文章自体が最後を決めているのだと思う。であれば、この新しい結末が意味するところは、文章の器となる村上さん自身がなんだか次のステップに移ったんだなと。ノルウェイの森の宿題に答えを出したような。実際の村上さんは知らないけど、小説を生み出すときに文の中かそばにいるムラカミさんがやっと何かに向き合えたような。

そして自分の問題として騎士団長殺しから逃げていることを思い出させられる。それを自分自身が終えない限り、ノルウェイの森から卒業できず、この本を本当にわかることもできない気がする。

2017-08-03

本　マインドフルネス最前線

本

本「マインドフルネス最前線」香山リカさん対談集。

読んでみて、マインドフルネスを始めたい、そして出来るなら継続したいと思った。実利的かつ面白かったのは、マインドフルネスや瞑想、ヴィッパサナーを継続すると、遺伝子の発現率が変化することが研究でわかったこと。脳のネットワーク組成すら変化してしまうこと。さらにはテロメアの修復酵素が出てくるようになったりと。ウハウハ。

マインドフルネス最前線: 瞑想する哲学者、仏教僧、宗教人類学者、医師を訪ねて探る、マインドフルネスとは何か？ (サンガ新書)

作者: 香山リカ
出版社/メーカー: 株式会社サンガ
発売日: 2015/11/29
メディア: Kindle版
この商品を含むブログを見る

マインドフルネス自体は僕の理解では、自分の感情をある程度コントロールできる対象だと認識して、具体的に取り扱う技術体系の一つだと。おおまかにはこの本を読めばわかるが、実際にやるには誰かの元に行ってやるしかない。

この本の別の面白さとしては、香山リカさんが科学者であることによる限界を、よくも悪くも見せてくれること。「誰でも・いつでも・どこでも」再現できないことは科学になれない。

でも人生のほとんどは一回限りのことだし、医療でいうなら「治療」という行為にはそれが外傷であれ心の傷であれ、人間が関わる以上、”相性”や”タイミング”や”運”が存在するのは誰でもわかる。そういった個別性を無視したり、「科学が存在できる範囲」だけで出来ることをしようとすると、科学自身が、治療の範囲を狭めてしまう。

個人的には現代の科学がその範囲に含むことのできない、一回限りのことをいかに毎回上手に扱うかを自分の技術として磨いていきたい。科学はその定義上、誰でもできることだから。マインドフルネスはその間にある。

2017-07-13

本　コンテンツの秘密

本パソコン

本「コンテンツの秘密」川上量生さん著。

ドワンゴ会長の川上さんが、2年間ジブリの鈴木敏夫さんのカバン持ちをしながら考えたこと。から考えたことを。

コンテンツの秘密ぼくがジブリで考えたこと (NHK出版新書)

作者: 川上量生
出版社/メーカー: NHK出版
発売日: 2015/04/10
メディア: 新書
この商品を含むブログ (12件) を見る

人間が良いと思うものは脳内で単純化されて、特徴的な姿になっているハズという著者の結論。そしてそれはAI（機械学習）でコンピューターが認識する”特徴”と似ているものじゃないかと。

これは一時有名になった、googleのAIが何千万枚もの写真（を011100101…化したもの）の特徴を見つけ出し、それを画像化したもの。

f:id:molingit:20170713202411p:plain

これを見たときに人間は ” ネコ ” だと思う。それもけっこう ” ネコらしいネコ ” だと思うんじゃないだろうか。僕は絵本の100万回生きたねこの主人公を思い出した。この100万回生きたねこは、お話しの良さもさることながら、絵柄が個性的なようでいて、実は ” ネコらしいネコ ” であったことが人気の秘密なんじゃないか。

つまり、AIになにか作りたいもののたくさん（〜何千万枚）の写真を見せて、でてくる ” 特徴的な画像 " を製品デザインにしたら、どれもが人間のおもう " まさにそれ ” を作り出すことが出来るかもしれない。

ああそっか、ビートルズの曲をAIが作ったとか、フェルメールの筆跡で描いた新たな絵が最近ニュースになってたのはこれか。このAI技術が産業分野で一巡したあとに残される ” すべきこと ” ってなんだろう。

AIは既に確立された分野の ” 最高 ” を作り出すわけだから、 ” 分野 ” というものが出来がり次第人間にすることはなくなり、常に新しく作り出す苦しみを ” 全員 ” が味わうようになるんだろうか。

2017-07-07

本　動的平衡

本

「動的平衡」福岡伸一さん著。久しぶりに読み返してみる。

人間の体は固定的なものでは全くなくて、いまこの瞬間も体の中で、タンパク質がものすごい勢いで作られてかつ、ものすごい勢いで壊されている。その、束の間存在するタンパク質が徒然に存在した”効果”として、僕たちは、生命は、ふわっとそんざいしている。川のみずはどんどん流れていくのに、そこに”同じ”川があるように。

福岡さんはその考え方を、自らの研究の失敗のなかで学んだ。ある遺伝子が発現しないノックアウト・マウスを作ったのに、全然支障なくそのマウスは生きていたと。複雑に絡み合いつつ動的な流れの中にある体内では、ある一つ機能に穴が開いていても、時間変化の中でどんどんそれを代替する作用が働いてしまうのが普通であると。

新版動的平衡: 生命はなぜそこに宿るのか (小学館新書)

作者: 福岡伸一
出版社/メーカー: 小学館
発売日: 2017/05/31
メディア: 単行本
この商品を含むブログを見る

この動的平衡の視点は、DNAの二重螺旋構造の発見前から存在していて、一部の人は知っていたのだろうけど、日本ではおそらくずっと知られてなかった。今でも知らない人が圧倒的なんだろう。もっとも昔にいけば漢方や東洋医学系では逆に動的平衡に似た発想が、当然の知識としてあったんだろうけど。

現代では代わりに、体のイメージは機械論的で、薬やサプリメントを飲めばすぐに効果が現れるハズという、線形・単一的発想になっている。筋トレも同じ。

おそらく人の ” 意識 ” は「同時多発・相互連携的なコト」を捉えるのが苦手で、今はその ” 意識 ” が幅を利かす時代になっている。その結果、体の捉え方も " 意識 " が得意な範囲でとなり、固定的・線形的な発想になってきたんだろう。

つながるか分からないけど、最近流行りのAI（機械学習）が成果をあげられるようになったのは、線形・単一的なロジックによる処理をやめて（成果をあげられなかった！）、人間にはよく分からないモノゴトの捉え方をパソコンに（任せて）やらせたら上手くいったのだと。最先端はすごく動的平衡っぽいやり方だなと思った次第。