■ 仕事

理系の仕事の流儀【人工知能の知識を身に付けるべき理由】

■ 仕事

 こんにちは黒部です。 
理系の仕事の流儀として、人工知能の知識を身に付けることは重要だと思っています。皆さんも、「 少しは勉強した方が良いのかな、、。なんかすごい勢いで進歩しているけど、実際なんだろう。」と思ったことはありませんか?

是非とも少しでも身に付けましょう。本記事ではその理由を解説します。

 プログラミングなどに詳しい方向けではありません。サイトを立ち上げたばかりなので、まずは雑談レベルで記事投稿しようと思います。

理系の仕事の流儀【人工知能の知識を身に付けるべき理由】

 なぜなら、AI技術を活用したデバイスが急速拡大するため、少しでもAI知識を身につけ、AIの曖昧さを理解し、正確に有効活用することがあなたの価値向上に繋がるからです。

 AI関連技術は進化が続き、複雑で高度な仕組みが登場し、ビジネスにおける応用範囲も広がり、すこしずつスマホアプリや生活基盤にまで普及してきています。AIの基本的な性質を理解しておくことは、ビジネスに携わる全ての人々に必要になります。

機械学習、ディープラーニングとは

 しかしながら、「よし、AIの知識を身につけよう!」と思っても何から勉強したらいいか分からないと思います。はじめに勉強すべきは以下の2つの性質です。

①機械学習 ②ディープラーニング

機械学習とは

 まず、機械学習についてざっくり説明します。人間は様々な事柄を、見て聞いて触って五感を使って感じ、学習します。例えば目の前に犬と猫がいたら経験から自然に犬と猫を識別できます。

 しかし、元来コンピュータにはその識別能力は備わっていません。では、どのようにして犬と猫を識別しているのでしょうか。犬と猫の写真を使ってコンピュータに識別能力を備えさせたい場合を考えてみましょう。

一般に機械学習を用いてコンピュータに識別能力を備えるには、
①大量の犬と猫の写真を用意
②全写真を人間が犬か猫かパソコン上で分類
人間が「犬と猫の違い」を考える
 (例えば顔と体の比率や耳の大きさ)
人間が違いを特徴量として数値化
⑤全写真の特徴量をコンピュータに学習させる

 ①~⑤を行うことで、コンピュータは新しい犬と猫の画像を与えられたときに、特徴量、つまりここでは体の比率や耳の大きさをもとに犬か猫かを識別できるようになります。

 つまり、機械学習は事前に与えられた大量のデータの特徴量を学習することで識別能力を備え、犬か猫かを判断できるようになるのです。

 機械学習のデメリットは人間が犬と猫の違いの目の付け所を間違えた場合、正確に識別能力を得ることができないということです。上のグラフでいくと、青い点と赤い点が混在するような特徴量の付け方をしてしまうと閾値がうまく決定されず、識別ミスにつながります。※チェスなどの具体的なルールのもとにおいては機械学習が非常に有効。

具体的に機械学習でできることは主に以下になります。
・画像に写る物体を識別
・音声から何の音かを識別。テキストに変換
・文章のカテゴリ分け。テキストの構文解析

ディープラーニングとは

 次にディープラーニングについて説明します。深層学習とも言われます。なぜ注目されるかは、機械学習より性能が良く、最近で性能が飛躍的に向上するブレークスルーがあったからです。

 毎年行われていたILSVRCという大規模画像の識別精度を競うコンテストで、2012年にトロント大学のチームがディープラーニングを利用して圧倒的な認識精度で優勝したことがブレークスルーとなりました。この背景にはコンピュータの高性能化や過去の世界中のプログラミング研究の積み重ねがありました。

 先ほどの機械学習との本質的な違いは、機械学習では先ほどの例でいくと「顔と体の比率」に着目するように指定するのに対し、ディープラーニングでは区別するための特徴をAIが自分で学習し、その性能を向上させていくことです。

①大量の犬と猫の写真を用意
②全写真を人間が犬か猫かパソコン上で分類
コンピュータが「犬と猫の違い」を考える
コンピュータが違いを特徴量として数値化
⑤全写真の特徴量をコンピュータが学習する

 下のグラフでいくと、ディープラーニングでは、より高精度な識別を行えるよう、学習と同時に特徴量A、Bを自動で定め、閾値を決定します。

 ディープラーニングの精度が圧倒的となる理由は、データ量が多いほど、どこに注目すればよいかを自分で学習し、人間からの指示を待たずに自動でどんどん賢くなっていくことです。識別するための特徴量もA、Bだけでなく何千個にも増えていきます。人間には到底設定できないほどです。

 ディープラーニングのデメリットは、最終的にコンピュータが何をもって犬と猫を識別しているかは分からないということです。極端な話、なんだかよくわからないけど精度よく識別できてるヨシヨシとなってしまうわけです。

 この機械学習、ディープラーニングの「性質の違い」「曖昧さ」を少し理解していれば、これからのAI時代に片足を入れた状態になっていると言えます。

 これからはもっと本記事の内容を深堀りして、具体的に実益のある情報を記事にしていけたらなと思います。かなり雑記風となってしまいましたが、これからCLIP HACKERをの記事をお見逃しなく。