【第2回】東大松尾研発スタートアップ・AIを活用した品質保証業務
AI・大規模言語モデルとは?
1. AIとは
株式会社EQUES(えくえす)CEOの岸です。
前回は初めての記事掲載とのことで、会社の事業紹介や、EQUESの構想する品質保証×AIの取り組みについてご紹介させていただきました。
今回は、そもそもAI・大規模言語モデルとはどんなものなのか、どのように精度の高い予測や会話ができるようになっているのか、ご紹介したいと思います。
そもそも、AIと合わせて、「機械学習」「深層学習」などの単語を聞いたことがある方もいらっしゃるかもしれません。まずは、これらの単語を整理したいと思います。
- 人工知能(AI):人が行う認識、予測、判断といったことを、コンピュータにもできるように人工的に再現するもの
- 機械学習(Machine Learning):データから、その背景にあるルールやパターンを発見し、予測や判断を行う手法
- 深層学習(Deep Learning):機械学習の手法の1つで、多層構造のニューラルネットワークを用いて、画像認識や言語処理を行う手法
上の図のように、人間が実現する様々な行動や知性を再現する「AI」の中で、データに基づく判断を機械的に行うのが「機械学習」、さらにその中でもニューラルネットワークと呼ばれる人間の脳の働きを模した手法によるものが「深層学習」となります。
機械学習は、予測や判断といったタスクに応じたデータセットから、その背景にあるパターンを「学習」します。この学習の仕方には大きく3つの方法があります。
- 教師あり学習:全てのデータに正解データが付与された状態で学習を行う
- 半教師あり学習:一部のデータにしか正解データが付与されていない状態で学習を行う
- 教師なし学習:全てのデータに正解データがない状態で学習を行う
機械学習の学習のさせ方としてメインとなるものは一つ目の「教師あり学習」です。ある医薬品の日次販売量の予測を例として考えてみます。教師あり学習では学習データセットが「正解データ」「特徴量データ」の2つに分けられます。正解データとは機械学習で予測したいデータのことで、今回は、過去の医薬品の販売量を時系列順に並べたデータを指します。特徴量データとは、予測したいデータに影響しそうなデータを指します。販売量予測の場合は、曜日や天気、医薬品の種類などが挙げられ、適切な特徴量を選ぶことは販売量予測の精度向上につながるため、とても重要な工程になります。
コメント
/
/
/
コメント