AIの「学習」と「モデル」は、同じものではありません。

この記事で得られる視点

  • 学習 を、例を見せて答え方を整える過程として見る
  • モデル を、学習後に使う計算の本体として見る
  • データ の質がAIの振る舞いに影響すること

いま何を扱うか

この記事では、AIを語るときによく出てくる「学習」と「モデル」を分けます。

扱うのは次の3つです。

  • 学習は作る過程であること
  • モデルは使う本体であること
  • 学習に使うデータが結果に影響すること

学習は、たくさんの例を見る過程

学習 は、AIに多くの例を見せながら、内部の調整値を変えていく過程です。入口では「答え方のくせを整える」と考えると分かりやすくなります。

文章なら、どんな言葉の次にどんな言葉が来やすいかを大量に見ます。

画像なら、どんな形や色の並びが何を表しやすいかを見ます。

人間の勉強と同じではありません。AIの場合は、例を使って計算の中身を調整している、と見る方が実態に近くなります。

モデルは、学習後に使う本体

モデル は、学習の結果としてできた、答えを出すための計算の本体です。

ユーザーが質問したときに動くのは、このモデルです。

たとえるなら、学習は調整作業で、モデルは調整後に実際に使う本体です。

モデルがあるから、毎回すべての学習データを見直さなくても答えを出せます。

データの偏りは答えに出る

AI は、学習で見たデータの影響を受けます。

例が偏っていれば、答え方も偏りやすくなります。

また、古い情報だけで学習していれば、新しい出来事には弱くなります。

AIの答えを見るときは、どんな例から作られたのかを完全には見えなくても、データの影響を受ける機械だと意識しておくことが大事です。

つまずきやすいところ

  • 学習とモデルを同じ言葉として使ってしまう
  • モデルが毎回インターネット全体を読んでいると思ってしまう
  • AIの答えを、データの偏りや古さと切り離して見てしまう