LLM(大規模言語モデル)とは?
読み方: エルエルエム
30秒まとめ
大量のテキストデータで訓練された巨大なAIモデル。ChatGPTやClaudeの基盤技術。
LLM(大規模言語モデル)の意味・定義
LLM(Large Language Model、大規模言語モデル)は、インターネット上の膨大なテキストデータを使って訓練されたAIモデルです。数十億〜数兆のパラメータを持ち、人間のような自然な文章を生成する能力を持ちます。GPT-4(OpenAI)、Claude(Anthropic)、Gemini(Google)、LLaMA(Meta)などが代表的なLLMです。テキスト生成だけでなく、翻訳、要約、コード生成、質問応答など幅広いタスクをこなせます。Transformerアーキテクチャをベースに構築されており、自己注意機構(Self-Attention)により文脈を理解します。近年はマルチモーダル化(テキスト以外に画像、音声、動画も理解)が進んでいます。