岡野原 大輔 著 「大規模言語モデルは新たな知能か」メモ
岡野原 大輔 著
「大規模言語モデルは新たな知能か」メモ
<まとめ>
・言語モデルは文に対して確率を割り当てることのできるモデルで、確率分布に従い新しく文を生成可能。
・BERTは大量のテキストデータにおいて、ランダムに単語を消去、消去された単語を残りのテキストから予測できるよう学習を進め、獲得した特徴抽出器と内部表現を別の目的に利用。
・汎化は未知のデータでもうまく予測できることで、機械学習の最大の目標は汎化能力を獲得すること。