RLHF1 AI 안전성 정렬 문제 핵심 개념 정리 기술사 학습노트› AI / 빅데이터› AI 안전성 & 정렬AI / Big Data · 한장정리[기술사토픽] AI 안전성 & 정렬 완벽 정리 - 한장정리AI 안전성 개념, 정렬 문제(Alignment Problem), 적대적 공격·방어, AI 레드팀, 책임 있는 AI 프레임워크까지 완벽 정리합니다.AI안전성AI정렬적대적공격RLHF레드팀책임있는AI정보관리기술사Ⅰ.AI 안전성 위협 체계개념: AI 안전성(AI Safety)은 AI 시스템이 의도한 대로 동작하고 의도치 않은 해로운 결과를 방지하는 연구 분야입니다. LLM의 급속한 발전으로 2023년 이후 핵심 과제로 부상했습니다.위협 유형설명예시오정렬(Misalignment)AI가 인간 의도와 다른 목표를 추구목표 사양 오류·보상 해킹적대적 공격 (Advers.. 2026. 3. 26. 이전 1 다음 반응형