AI/Big Data · 한장정리

[기술사토픽] 자연어처리 & LLM 완벽 정리 - 한장정리

NLP 처리 단계, Transformer·BERT·GPT 구조, RAG·프롬프트 엔지니어링, LLM 활용까지 기술사 최신 주제를 완벽 정리합니다.

NLPTransformerBERTGPTLLMRAG프롬프트엔지니어링정보관리기술사

Ⅰ.자연어처리 기초 & Transformer

개념: NLP(Natural Language Processing)는 인간의 언어를 컴퓨터가 이해·생성·분석하는 AI 분야입니다.

NLP 처리 단계	설명
토크나이제이션	텍스트를 토큰(단어·서브워드)으로 분할
어휘화·임베딩	토큰을 밀집 벡터로 변환 (Word2Vec·GloVe·BERT)
언어 모델링	다음 토큰 예측 확률 학습
파인튜닝	사전학습 모델을 특정 태스크에 적응

나. BERT vs GPT

LLM(Large Language Model)은 수천억 개 파라미터를 가진 대규모 언어 모델입니다. GPT-4·Claude·Gemini·LLaMA가 대표적입니다.

시험 포인트

RAG = 벡터DB에서 관련 문서 검색 → LLM 프롬프트에 컨텍스트로 주입 → 생성.
할루시네이션(Hallucination): LLM이 사실이 아닌 내용을 자신있게 생성하는 문제. RAG로 완화.

결론

LLM은 AI 민주화의 핵심 기술로 모든 산업에 적용되고 있습니다.
향후 멀티모달 LLM·에이전트 AI·소형 언어 모델(SLM)로 발전합니다.

"LLM은 인류 지식의 압축이다. RAG는 그 지식에 현재를 연결하는 다리이다."

블로그: 기술사 학습노트 · imt-log.tistory.com