文責:ジェムコ日本経営 コンサルティング事業部 丸川 隆文

ドラエモン開発のコンセプトを「人の生活を楽にする」としました。AIを搭載したドラエモンは世間の情報をSNS経由等で収集して、形態素解析等を通して困り事に関連した単語等を分類・整理していきます。ここで、ひとつ開発者サイドとして、悩ましい事柄が発生します。果たしてSNS上のあらゆる情報をそのまま読み込ませてしまっても良いものでしょうか?ご記憶の方も多いかとは思いますが、中国IT企業の対話プログラムにて「中国の夢は米国への移住」などと、中国政府にとっては好ましくない発言を連発したり、米国IT企業の対話プログラムは米国では最大のタブーである人種差別発言をしたりと、全てをAI任せにはできない面があります。映画の話になりますが、「チャッピ-」(2015年)ではギャングに育てられた?AIがギャングの行動規範で動くようになってしまいます。

ここで、AIがどのように学習をしていくかということに関連して、教師あり学習-教師なし学習-強化学習という3つの機械学習に関わる考え方について触れておきたいと思います。

まず「教師あり学習」ですが、簡潔に表現すると「正確とみなす情報があるデータを基準にモデル化」する方法です。例えば、住宅価格を求めたいとき、住宅の広さ、間取り、住所、駅からの距離、周辺の施設、等々と住宅価格のデータをもとに住宅価格算定モデルを作成するようなイメージです。この例の場合であれば、従来からあった多変量解析と同様な手法と言っても良いかもしれませんが、コンピューターの性能アップで膨大なデータに対しても処理できるようになったとともに、随時新たなデータを取込んでモデル修正を行なっていける部分が従来の多変量解析から機械学習が進んだ部分と言えます。第3AIブームの火付け役のひとつの事象であるGoogleが画像処理と深層学習でネコの画像を認識させることに成功したのも、「これはネコだ」といって数百万枚のネコの画像を読み込ませて、ネコの特徴からネコを判別できるようにしたからですが、これも教師あり学習にあたるものです。「ネコ」ではなく「ネズミ」としてデータ入力していれば、ネコの画像をネズミとして回答するようになっていたはずです。このように書くと当たり前と思われるかもしれませんが、次のような場合はどうでしょうか?ある研究機関で人の遺伝子情報からある病気との関連性をAIを活用して研究していましたが、人間だと思って取り扱っていたサンプルの中にイヌのものが入っていたようで、あやうく狼人間の研究をするところだったという笑えない話もあります。ここにも、まだまだ、恣意的ではないにしてもAI任せにする訳にはいかない例がありますね。健康診断用のサンプルにペットのものを出した記憶がある読書の方はいらっしゃいませんか?

教師なし学習と強化学習については、次回以降に記載させて頂きます。