LLM(Large Language Model) : 대규모 언어 모델
□ LLM 기본개념
ㅇ LLM은 "Large Language Model", 즉 대규모 언어 모델을 의미합니다. 엄청나게 많은 양의 텍스트 데이터를 학습해서, 사람이 말하거나 쓰는 문장을 이해하고 자연스럽게 생성할 수 있는 인공지능입니다.
※ 대표적으로 LLM : ChatGPT, Claude, Gemini, PaLM 등
□ LLM 탄생배경 및 필요성
ㅇ 기존의 AI는 특정 작업에 특화되어 있었고, 일반적인 문장 생성이나 이해는 어려웠습니다.
하지만 LLM은 방대한 데이터를 학습하여 요약, 번역, 문서 생성, 질문 응답 등 다양한 작업을 하나의 모델로 처리할 수 있게 되었죠.
또한 기업에서는 LLM을 이용해 업무 자동화, 고객 응대, 보안 분석, 보고서 작성 등을 수행할 수 있어 매우 유용합니다.
□ LLM 동작과정
1. 사용자가 질문을 입력
2. 입력 문장을 벡터(숫자 형태)로 변환
3. 학습된 파라미터를 기반으로 예측
4. 가장 자연스러운 단어를 선택하여 문장을 생성
- "다음에 어떤 단어가 올지"를 예측하며 문장을 만드는 구조입니다.
□ LLM 주요 구성요소
□ LLM을 이용한 정보보안 분야 활용 사례
□ LLM 장점
□ LLM 단점
□ LLM 종류 및 접속 정보(URL)
모델 | 특징 | URL |
ChatGPT (OpenAI) | 가장 널리 쓰이는 LLM | https://chat.openai.com |
Claude (Anthropic) | 안전성과 직관성 강조 | https://claude.ai |
Gemini (Google) | 검색 기반 LLM, GMail과 연동 | https://gemini.google.com |
Mistral | 오픈소스, 빠르고 가벼운 LLM | https://mistral.ai |
LLaMA (Meta) | 페이스북에서 개발한 오픈 LLM | https://ai.meta.com |
감사합니다.
생성형 AI, 제대로 이해하기 (1) | 2025.04.12 |
---|---|
RAG(검색 기반 생성) 쉽게 이해하기 (0) | 2025.04.06 |