NHKシチズンラボ:みんなの「あ」平均化プロジェクトについて

   

8月22日放送のNHKシチズンラボにおいて「みんなの「あ」平均化プロジェクト」に協力してました。

このプロジェクトでは、市民の皆様(およびNHKの方々、サンシャイン池崎さん)のご協力のもと、700人を超えるひとの手書きが収集され、それだけの多くの人の手による「あ」の平均とは何なのかを明らかにするというものでした。研究室ではなかなか集めることが困難な、多様な参加者による手書きを717人分も集めていただき本当にありがとうございました!(ワコム株式会社さんにもタブレットPCを10台貸与いただき本当に助かりました)

ちなみに、NHKシチズンラボにおける最終報告はこちらのページの通り。5万件を超える「あ」が集まり、それを平均化できたのは本当に楽しい経験でした。

 

さて、番組では全体の平均と各々の平均だけが紹介されていましたが、せっかくなので手書きをしてくれた717人の方のすべての手書きと平均手書きを重畳したものはこのような感じとなりました。

717人の「あ」と平均の「あ」

717人の「あ」と平均の「あ」

細い線がそれぞれの方が書いてくれた「あ」で、黒い太線が全員の平均の「あ」となっています。これだけ多くの人が様々な書き方をしているのにもかかわらず、とてもきれいで理想的な手書きの「あ」となっているのが印象的でした。平均のちからは強いですね。

ちなみに最終報告ページでもそれぞれの結果が示されていますが、Webシステムで集めた49134件(5万件以上投稿されていましたが、ノイズも多くあったため除外したところこれだけが残りました)の平均に重ね合わせたものはこのような感じ。こちらもなんともインパクトのある仕上がりとなっています。スマホで指で入力してもらってるケースが多いため、どうしても指の太さ由来の始点や終点のばらつきがあること、また指とディスプレイとの間の摩擦の影響でしっかり書こうとして長くなる傾向などがありましたが、こちらもきれいですねぇ。

49134人分の平均の「あ」

49134人分の平均の「あ」

あと興味深かったのが番組でも紹介した各年代の「あ」をそれぞれモーフィングしつつ動画にしたものがこちらになります。どの年代でもきれいな「あ」なのですが、若い年齢ほど小学校などでやったひらがなの手書き練習のお手本に近く(コンピュータを使用して見かけるフォントの文字に近いという言い方もできるかもしれません)、年齢が上がれば上がるほど一画目の横棒が短くなり、三画目の最後の払いが伸びていっています。一般に「美文字」と言われるような文字に傾向が近寄っているようにも思います。

 

Image from Gyazo

図中で年齢を示すことができていませんが、年齢別に作った平均を重ね合わせたものがこちら。年齢が上がれば上がるほど二画目の縦棒の長さが短くなっています(二画目がの終点が上にあればあるほど年齢が高い)。

過去の研究で、どの群をとっても類似することや、年齢があがるにつれて徐々に文字が小さくなるという傾向は明らかにしていましたが、このような形で年齢による字形変化があったことを確認できてはいなかったのでとても面白い結果でした。また平均化によりそうしたことを明らかにできるというのも面白い点だなと思います。

また、ひとによるぶれがこの程度であるということが明らかになった点も個人的には嬉しい結果でした。こうしたばらつきが明らかになることは、今後例えば字の練習においてなかなかうまくかけない子どもが何に困っているのかを明らかにできる可能性があるかなと思っています。単純にやる気が無いのか、そうではなく手がうまく動かせないのか、はたまたそもそも文字をうまく認知できていないのかなどを理解できれば、それに応じた適切な指導を行っていけるのではと期待しています。

今回、利き手については左利きの人の手書きが十分に集まらなかったので比較はできませんでしたが、左利きのひとの中に一画目の書き順が小学校のときに指導される左右逆の人が複数名確認されました。これは、現在の書き順が右利きのひとに最適化されすぎており、左利きのひとにとっては書きにくいものであることが原因として考えられます。手書きを多く集めていくことによってそうした点を明らかにできれば、左利きのひとの学習のための書き順なども示していけるかもしれません(まぁ、そもそも正しい書き順なんてものは無いわけですが...)。

番組では手書きの「あ」以外にも、ドラえもんも紹介されていましたが、やはり平均手描きの絵がきれいになるという傾向も明らかになって面白く見ていました。色んな人の個性的なドラえもんが組み合わさることによってきれいになるというのは本当に面白いところです。

なお、番組では「あ」のみを集めていましたが、Webシステムの方では「あ」以外の文字も集めていました。私からすると「こんな『心』を書きたい!」「こんな『え』を書きたい!」「こんな『村』を書きたい!」など理想的な手書きが並んでおり、平均いいなぁと改めて思った次第です。あと、へのへのもへじがなんともきれいになっているのも印象的でした。

このサイト、好きな文字を登録して平均を集めることができるので、お好きにお試しいただければと思います。ちなみに平均的な文字を作るというのは、夏休みの自由研究とかにももってこいかなとか思います。

 

さて、今回の放送で、番組の裏側を知れたり、何度も慎重に素材を作り直す(or 作成を依頼する)様子を見れたり、嘘がないように慎重にやり取りをする様子はとても刺激になりました。普段見れない色々なものを知れるのは社会見学としても良いですね。いい機会をいただきありがたく思っております。

また、あまりアクセスが集中するようなサービスを組んだことがなかったので、これだけのアクセスを頂いたということと、それに向けてさくらVPSのいいやつを借りて準備したのは得難い経験でした。まぁ、1分に5000人近くの方にアクセスいただけるとは思っていませんでしたが...。

番組中に少し繋がりにくくなったのはサーバの処理が追いつかなかったというわけではなく、通信量的な問題でさばけなかったことが原因っぽく、「あ」以外について残していた全員分の平均生成ページが1000人分や2000人分の手書きデータを送信しようとして帯域を食っちゃってたことが悪かったようで、「あ」以外にそこまでの手書きが集まると想定していなかったための失着でした。なかなか予測することは簡単ではないですね。ただ、番組では繋がりにくくなることも想定してわざとリロードせずに準備されていたようで、本当に素晴らしいなと思いました。

さて、今回NHKさんに提供させていただいていた手書き文字の収集システムおよび可視化システムのベースとなったものはGithubにコードを公開しています(勢いで組んだコメントもない雑なコードですが)。もしご自身でも色々試してみたいなどありましたら、こちらに公開しているProcessingのコードを使いつつお試しいただければと思います。これの1つ前のバージョンを提供させていただいた高校生が研究に取り組み、その成果が情報学研究コンテストにて奨励賞を取ったということもあったようです。

また、手書きに関する共同研究または技術顧問の案件はドシドシ募集しておりますので、何かありましたらご連絡いただければと思います

 - news, research , , , , ,