knowledge explorer

Column
— ナレッジ活用コラム —

AIの肝は『学習データ』

著者:図研プリサイト 倉本 将光

みなさんこんにちは。倉本です。

最近、訪問先で頻繁に「うちの会社もAIで何かやれないのか、と上から言われていまして...」と言う話を耳にします。AIで何かやれ?犬と猫の顔でも判別できるようにしましょうか?と言う訳にもいかないので、お客様もいろいろと頭をひねっていらっしゃいます。

当然、犬と猫の顔ではないにせよ、いろいろな業務に対してAIを適用できないかと考える時に必要になってくるのが学習データです。教師データなんて呼び方もしますよね。

学習データとは簡単に言ってしまうと、AIが何かをできるようになるための情報の事。生まれたてのAIは何も学習していないためそのままでは何もできません。例えば、例題と答えをたくさん学習するからこそ、未知の問題が来たときにもAIが答えを出せるようになる。

まさに人間が過去の経験(ナレッジ)から「この場合はこうなるのでは」と判断できると言う事と同じようなイメージに見えます。

column08_1.jpg

ナレッジマネジメントに悩んでいる皆様の企業であれば、ウチの会社だったら○○のデータがたくさんあるな、××の件だったら膨大に蓄積しているな。ではそれをAIに学習させて。。。と思われると思いますが。

それって本当に全部学習させてしまって大丈夫でしょうか。

中にはこれは特例だな。そもそもこれって間違えていない?そんなデータも入っていたりしないでしょうか。そういった物を間引くとなると、膨大だと思っていた数が減っていったり、そもそも間引く時間が。。。

取り組もうとする内容にもよりますが、場合によっては膨大な量と質の学習データが求めらます。どのくらいのデータ量が求められるのか、学習したAIに何かをさせた結果にどのくらいの精度を求めるのか、これは取り組みを行う企業様が自分たちの責任で、ある程度の認識を持っていなければいけません。

column08_2.jpg

冒頭にも出てきた犬と猫の顔を判別するという程度であれば、大量の学習データは必要無いかと思いますが、「企業における重要な何かの判断を支援する」場合にはどうでしょうか。

じゃあ企業の学習データを揃えなければ、企業でAIは使えないのかと言うとそうではない部分もあります。そのあたりの話はまた今度にでも。 See you