tinyml2 온디바이스 AI 엣지 AI NPU 양자화 정리 기술사 학습노트› AI / 빅데이터› 온디바이스 AI·엣지 AIAI/Big Data · 한장정리[기술사토픽] 온디바이스 AI·엣지 AI 완벽 정리 - NPU·양자화·프라이버시 - 한장정리지연시간/전력/프라이버시 제약이 큰 환경에서 AI를 “가까운 곳”으로 옮기는 전략을 정리합니다. 경량화와 NPU 실행이 핵심입니다.온디바이스AI엣지AINPU양자화Ⅰ.왜 온디바이스/엣지인가온디바이스 AI와 엣지 AI는 데이터가 생성되는 위치에서 추론을 수행해, 지연시간을 줄이고 네트워크 비용을 낮추며, 민감 데이터를 로컬에서 처리할 수 있어 프라이버시 측면에서도 유리합니다.요구조건영향설계 제약지연시간실시간 제어배치/서빙 구조 제한전력배터리/발열경량 모델 필요오프라인끊김 대비로컬 업데이트/캐시프라이버시데이터 유출 위험로컬 처.. 2026. 3. 25. AI 반도체 NPU 엣지 AI 개념 정리 기술사 학습노트› AI / 빅데이터› AI 반도체 & 엣지 AIAI / Big Data · 한장정리[기술사토픽] AI 반도체 & 엣지 AI 완벽 정리 - 한장정리GPU·TPU·NPU·FPGA AI 가속기 비교, 엣지 AI 개념, 모델 경량화(양자화·가지치기·지식증류), TinyML까지 완벽 정리합니다.AI반도체NPUTPU엣지AI모델경량화양자화TinyML정보관리기술사Ⅰ.AI 가속기 (AI Accelerator) 종류개념: AI 가속기는 행렬 연산·텐서 연산에 특화된 하드웨어로, 범용 CPU 대비 AI 연산을 수십~수천 배 가속합니다.가속기특징장점단점주 용도GPU (그래픽처리장치)수천 개 코어·병렬 행렬 연산범용성 높음·소프트웨어 생태계전력 소비 큼·고비용클라우드 AI 학습·추론TPU (텐서처리장치)Goog.. 2026. 3. 24. 이전 1 다음 반응형