イベント / EVENT
平成30年度 第2回 Q&A
第2回 2018年8月24日(金)
理解発見データマイニング
-AIはなんでもしてくれるわけじゃない-
講演当日に頂いたご質問への回答(全36件)
※回答が可能な質問のみ掲載しています。
スライド28 「マイニングの技術の歴史」について、可能ならばもう少し詳しく教えてください
技術的には、講演でご紹介したような感じで、詳しくなると、ここに書ききれないほど長くなりますので、、、
マイニングとは何ですか?
日本語に訳せば、「採掘」「発掘」です。データの山から、なんかいいものを掘り出す、という意味で使われているようです。
最近流行の「ビットコイン」において「マイニング」という用語が使われていたと思いますが、本日のテーマの「データマイニング」との相違についてご教示ください。
ビットコインの決済をするために、計算が必要なのですが、それもマイニングと呼ばれています。難しい計算をするので、解を探し出すことをマイニングと呼ぶのかと思います。データマイニングとは関係ありません。
宇野先生の研究室でデータマイニングの勉強をしたい場合、どのような基礎や素養が必要でしょうか。
アルゴリズムの理論と、データを読み解くことを愛する心かと思います。
データ研磨を実ビジネスに活用した場合、使用料とか特許料などはどうなるのでしょうか。(研究者の方々へのフィードバックがないと今後の研究・開発が広がっていかないように思うのですが。)
データ研磨のプログラムは一般公開していますので、特許料や使用料は発生いたしません。
最近のAIでは「ディープラーニング」というワードが良く出てきますが、本日の「データマイニング」とはどういう関係なのでしょうか?
ディープラーニングは画像や音声などを認識するための計算技術です。データマイニングとはお隣さんの技術という感じかと思います。
Google検索とデータマイニングはどういう関係にあるのか教えてください。
検索は、調べたいものが具体的にわかっているときに、それを見つける作業で、マイニングは、何が知りたいかよくわからないけど何かを見出したいときに使う技術かと思います。
データマイニングで数学の定理‐公理のようなものを見つけることはできますか。
自動証明という技術がありますので、そちらのほうが良いかと思います。データマイニングですと、「最近はこんな定理が良く見つかっている」というような感じになるかと
「AIが人間をサポートする」ならば、シンギュラリティは来ますか。
人間の知的活動の、どの機能に対するシンギュラリティか、で変わりますが(計算とかはとっくに抜かれてます)、あらゆる面で人間を超えることは、できるかどうかわからないくらい難しいのではないでしょうか。
データマイニングの粒度はどのように設定? 飲み物 ジュース おにぎり しゃけ・・・ 対象をどこにするのかの判断は?
難しいところです。人によって見たいものが違うので、決まった答えはありません。確実なことは、出てきたものを何に使おうと思っているのか、が重要ということです。店舗レイアウトを考えているなら、生鮮食品、のような単位で見たいでしょうし、セールするなら具体的な単品がいいでしょう。イベントするなら、意外な組み合わせ、ということで、あえて粒度が違うほうが面白いかもしれません。この辺は、デザイン思考の技術ですね。
データマイニングとAIとの関係はどういうものなのですか?データマイニングにバイアスはかけますか?
AIは、データマイニングや最適化など、人間の知的活動を代替する技術すべてを指します。データマイニングはその一つです。
データマイニングなどの問題点を改善するために、情報オリンピックのようなコンテストを開いたりしていないのですすか?
たくさん開かれています。オリンピックではなく、どこかの学会や企業が、データ解析コンペ、のような形で行っているものが多いです。
人間の思考をデータマイニングにする方法はあるか。そもそも数値にする方法があるか。
片鱗はできるかもしれませんが、世のみなさんが納得するようなレベルのことは、今の人類には無理だと思います。子孫のがんばりに期待いたしましょう。
私は設備管理の業務に従事しています。最近は各種稼働データを多量に取れるようになってきました。そのデータから異常の兆候を発見するのに、人間が逐一見ているようでは追いつきません。データマイニングを活用できる分野だと思います。この場合、発見したパターンの中から本当に以上の兆候とそうでない(例えば使用環境条件の変化など)場合をうまく区別するには、さらにどのような処理をすればよいでしょうか。
兆候を認識する、という作業になりますので、どちらかというと認識が得意な、機械学習の技術を使うべきと思います。そのうえで、想定外のものがないかどうかを調べるとき、あるいはたくさんある予兆の傾向を見たい、とか思ったときに、データマイニングかと思います。
犬、猫を分別できるのに、言葉で表せないのはなぜですか。
人間の言語というものは、まだまだ未熟なのだと思います。言語が、違いを表現する力を持っていないのだと思います。
「AIは考えられない。人間の思考をサポートするもの。」とのことですが、何ができるようになれば(どのような技術革新等ができれば)、AIが考えられるようになるのでしょうか。夢(実現を目指すための夢)を教えていただきたいです。夢を長期的に実現するもの
思考とか感情とかがどのようにしておこり、どのように進んでいくのか、これを論理的な言葉で説明できれば、そこを足掛かりにして進めると思います。ここでいう説明は、「犬と猫の違いを言葉で説明してください」のように、感情というものをまったく知らない宇宙人にでも、ちゃんと説明できるような説明です。
(AIの話ですが)AIの技術が進むと、現在高度に知的な職業(例えば弁護士)の存在価値が大きく変化するような報道を目にします。先生の話では「人間が考えるしかない」領域の仕事はAIに置き換えられないとのことでしたが、前記の報道のようなことは生じないと考えて良いのでしょうか。
弁護士さんの仕事も、定型的な部分と、顧客と相談して物事を決めていく創造的な部分があります。定型的な部分はAIがとってしまいますが、それで仕事を失うのは、定型的な仕事しかしていない方々です。普通に考えれば、AIが定型の仕事をサポートしてくれる、とみるべきでしょう。
データ→AI→出力 の→部分はどうやってやるのか
一言で語れないほどたくさんのものが詰まっています。データベース、アルゴリズム、オントロジー、、、
相関がわかったところで「人」の価値(変数)には時間、つまり関係性や積み上げてきた実績 信頼関係の要素が無視できないと考えます。その要素を無視できる 越える要素はなにか?体験談があったら語ってほしいです。
現在は、その深い部分を気にしないでいいことを、AIにやらせましょう、ということと思います。婚活のお勧めで見た例ですが、人の思考が迷子になっているとき、固まってしまっているときなどに、AIは、まったく違った視点を与えることができるようです(人間もできますが)。AIは人間でないから、という、人間に対するものとは違う、信頼感があるのかもしれません。これは、人間とAIの関係性がどうなっていくのか、という命題かもしれません。
「あなたを支配し、社会を破壊する、AI・ビッグデータの罠」キャシー・オニール 著 を読むと、米国における「数学破壊兵器」の個人データ侵害を追及しています。日本は遅れているのでまだ侵害の状況は酷くはないのでしょうか。
侵害しているかどうかは、被害が出ないとわからないかと思います。いくつかの企業から個人データが流出する事件が報道されていますが、その流出でひどい目にあった人、というのはあまり聞きませんので、個人データで悪いことして一儲けする方法が、まだできていないのかもしれません。
「AIはなんでもしてくれるわけではない」「人生の決定を代わりに選んでくれるわけではない」「人生の決定を代わりに選ばせるとまずい!」 では、 ①「人生の決定にどうAIを利用すればよいですか?」 ②「ネットを利用した普通の人がネットをどう使って(研究者でないのでビッグデータは扱えないのでせいぜいネットだけしか利用できない)人生をどうやって決めればいいですか?」 よい方法を教えてください!
AIの出すものは、参考にすればいいと思います。人生の決定をするときには、調べ物をたくさんすると思うのですが、その調べものにAIを使えばいいと思います。たとえば、ネット検索には、結果の並び替えするところにAIが入ってますから、検索結果を上位から調べていく、というのが、ある種AIを使って調べ物をしていることになります。この程度の利用の仕方だと思います。そのうち、検索結果を、もう少し上手にまとめてくれるツールが出てくるかもしれません。そういうものは役に立つと思います。最後の最後、考え抜いて選択肢を絞ったあとであれば、もうAIにはどうしようもないほど難しいと思いますので、むしろサイコロで決めたほうがいいかもしれません。
多数決による決定が、必ずしも最適でない場合がある、と考えます。それを解決する方法はありますでしょうか。
最適という言葉がなかなか難しいのです。誰にとって、どういう最適、なのか。どういう最適を目指すかは、多数決の参加者が決めることで、それは人が社会をどう作っていくのか、というくらい、根源的な問いかと思います。
音声認識はどんな技術を使っていますか
すみません、専門外なのですが。最近は、ディープラーニングを使っていることが多いと聞いています。
重なった指紋をどのような仕組みで分離するのですか?
すみません、専門外でよくわかりません。
膨大なデータを解析するときに、どのくらいの量(何分の一)があればそのデータの正確が一応分析できるのか。
何を分析したいかによります。平均であれば、統計の研究があって、n個のデータに対して、ルート n くらいで十分だそうです。例えば事故の分析のような、まれなイベントの解析をするときには、まるまる全部あってもまだ足りない、となります。一般には、多様性が高ければ高いほど、データの量が必要になるとお考えいただいてよいと思います。身長や足の大きさのように、人間はみな同じような形をしていて、多少の違いを数字としてみているような場合は、多様性が低いので、ルートnくらい手に入れれば十分かと思います。
「理解発見・・・」となってますが、理解は発見の対象になるのでしょうか。
ほんとは、「理解・発見、データマイニング」でして、理解や発見をするためのデータマイニング、ということで、両者は並列です。
物理現象を、AIで推論・考察することは可能になるでしょうか。
たぶん、数学の証明と同じようなことをするのだと思います。数学の自動証明の技術を適用して、でいかがでしょうか
「主観的に価値を創出」とは具体的にどういうことか。
「自分の中にある、経験や深い洞察、思考から導かれた価値観にしたがって、ビジネスや社会の課題を考え出し、それを解決する手段を作りだす」ということです。
「主観を生む現場の強さが日本は世間トップレベル」とは具体的にどういうことか。
組織の中で、具体的な業務に携わる現場の方がたが、その現場のことをよく観察し、自分事として問題意識を持ち、それを解決する方法を考え、実践している、という点が、日本は諸外国に比べて強いと、よく言われています。その引用です。
「暑いですね」と声をかける例で考えて、「他者の感情を推測するメカニズム」を実際の人間が行っていることを教え込むことができるようにならないのか?
教えるさいに、何をどう教えるかが難しいです。何しろ、人間がほかの人に教えようとしても、他者の感情をどうやって推測するか、言葉で説明できませんので。データをたくさん取得して、機械学習的に「こういう場合かな」とざっくりとらえることはできるかと思いますが、その人のいったいどこを見て判断すればいいのかわからないので、そこも難しいかもしれません。
人間が知識や経験から思考する場合とコンピュータやデータからパターンを見つけることの違いは何か?
コンピュータは、データの中で、ある、数式できっちりと記述できる条件にあてはまるものをすべて見つけています。人間が考えるときはこんなことはしていないと思います。
音楽のパターンや音色などと、人間がどう感じるか?などに応用できるのでしょうか?
はい、できると思います。ただ、うっすらとしたものでしょうが。人間は気づいていないけれども、こんな傾向がありました、というようなものが見つかったらおもしろいですね。
プログラミングを独学でやるのはきびしいですか。どんな方法がおすすめですか。
ゲームでもWebサイトでもいいので、作りたいものがあると速いです。楽しいので。
データ情報はすべて正しい(?)ものとして研究していますか。人間なのでうそ誤解とか含まれているのではないかと。
はい、嘘が混ざってます。ですが、コンピュータは単なる道具なので、嘘が与えられたら、嘘の答えを正確に出すのが使命です。車のブレーキは、踏まれたら必ず止まらなければいけません。踏み間違いかどうかを判断するのは、また別の話です。
アルゴリズムの進化はあれ、実際の進化は難しいということ。あいまいささえ無くせば?とは思ったが、どこかでブレイクスルーするのでしょうか?
すみません、意図を外しているかもしれませんが。あいまいさが小さければ計算によるアプローチは、なんであれ、ブレイクスルーとまでいいませんが、楽になります。楽に、精度を上げたり、高速化できます。
客観的なデータの何を基準に判断すればいいのか?特に個と全体の関係において
何を基準にするかは、何が大事かを決めることに相当します。大事さは、意味を理解しなければならず、計算や、簡単な手法では導き出せないところです。非常に一般的な話でいえば、個を理解するには、一般化、抽象化を行い、単なる個性から、いくつかのものについて共通する個性や、共通性を理解していきます。データ全体を数値化しても何もできないので、いくつかの種類や集まりに分割して特徴を際立たせ、それぞれを理解していきます。個と全体は、抽象化と具体化によってつながっており、個から全体へと抽象度を横断して俯瞰することで、判断がしやすくなるかと思います。