LLM(大規模言語モデル)とは?

読み方: エルエルエム

30秒まとめ

大量のテキストデータで訓練された巨大なAIモデル。ChatGPTやClaudeの基盤技術。

LLM(大規模言語モデル)の意味・定義

LLM(Large Language Model、大規模言語モデル)は、インターネット上の膨大なテキストデータを使って訓練されたAIモデルです。数十億〜数兆のパラメータを持ち、人間のような自然な文章を生成する能力を持ちます。GPT-4(OpenAI)、Claude(Anthropic)、Gemini(Google)、LLaMA(Meta)などが代表的なLLMです。テキスト生成だけでなく、翻訳、要約、コード生成、質問応答など幅広いタスクをこなせます。Transformerアーキテクチャをベースに構築されており、自己注意機構(Self-Attention)により文脈を理解します。近年はマルチモーダル化(テキスト以外に画像、音声、動画も理解)が進んでいます。

関連するAIツール

関連する用語

運営者が開発したAIマーケティングツール