용어집 (Glossary)

A~Z 순 핵심 용어. `(Ch N)`은 해당 용어가 도입되거나 집중 논의된 챕터.

정의는 모노레포의 공통 마스터(`glossary/master_ko.md`)와 동일하게 유지된다.

A

Agentic Coding: 모델이 코드를 작성·실행하고 에러 피드백을 받아 수정하는 루프를 반복하는 자율 에이전트 패턴. (Ch1, Ch2, Ch3, Ch4, Ch5, Ch6, Ch7, Ch8, Ch9, Ch10, Ch11)

Agentic Robotics: 동일한 자율 인지·행동·반성 루프를 물리 세계 로봇으로 확장한 패러다임. (Ch1, Ch2, Ch3, Ch4, Ch7, Ch8, Ch9, Ch10, Ch11)

AutoRT: 구글의 대규모 자율 로봇 데이터 수집 시스템 — LLM planner로 태스크 후보 생성 + 안전 가드레일. (Ch1, Ch2, Ch4, Ch8, Ch9, Ch10, Ch11)

AutoTAMP: 자연어 지시를 TAMP(Task and Motion Planning) 문제로 자동 변환. (Ch2, Ch3, Ch5, Ch7, Ch10)

B

BUMBLE: 폐루프 로봇 플래너 — 실패 감지 시 반성(reflection)과 재계획을 수행. (Ch1, Ch2, Ch4, Ch8, Ch10, Ch11)

C

Closed-loop: 폐루프 — 실행 결과를 피드백으로 받아 계획을 갱신하는 구조. (Ch1, Ch8, Ch10)

Code as Policies (CaP): LLM이 로봇 제어를 위한 Python/함수 호출 코드를 직접 생성하여 정책으로 삼는 접근. (Ch1, Ch3)

Co-training: 사람 데이터와 로봇 데이터를 함께 학습시켜 상호 보완적 표현을 얻는 전략. (Ch4)

D

Dexterous manipulation (다지 조작): 다지 핸드를 이용한 정밀 물체 조작 — in-hand rotation, assembly 등. (Ch4, Ch6)

Diffusion Policy (확산 정책): 조건부 잡음 제거 확산 과정으로 행동 분포를 학습하는 정책 학습 방법. (Ch1, Ch3, Ch4, Ch6, Ch10)

DoF (Degrees of Freedom, 자유도): 관절의 독립적 운동 축 수. 인간 손은 약 27 DoF. (Ch9)

DROID: 다중 기관 협업으로 수집한 대규모 조작 데이터셋. (Ch4, Ch6, Ch10)

E

Embodied-RAG: 체현 기억을 검색 증강 생성(RAG)으로 활용하여 장기 계획을 지원. (Ch2, Ch7, Ch10, Ch11)

F

Flow Matching: 연속 정규화 흐름으로 행동 분포를 학습하는 방법 — pi0의 핵심 기법. (Ch4, Ch6)

Foundation Model: 대규모 데이터로 사전학습된 범용 모델 — Sparsh(촉각), pi0(VLA) 등. (Ch3, Ch4, Ch5, Ch6, Ch8, Ch9, Ch10)

G

Grounding (그라운딩): LLM의 추상 언어를 환경의 가능한 행동·객체·상태에 접지시키는 과정. (Ch1, Ch2, Ch3, Ch7, Ch8, Ch10)

H

HAMSTER: 계층적 VLA — high-level subgoal과 low-level policy를 분리. (Ch4, Ch5, Ch6, Ch10)

Hi Robot: 지시를 계층적으로 분해·계획하는 로봇 플래너. (Ch5, Ch10)

I

IL (Imitation Learning, 모방 학습): 인간 시연을 직접 모방하여 정책을 학습. (Ch3)

K

KARMA: 공간·시간 메모리를 유지하는 로봇 에이전트. (Ch1, Ch2, Ch7, Ch8, Ch10, Ch11)

L

LLM Planner: 자연어 지시를 high-level 단계 시퀀스로 분해하는 LLM 기반 플래너. (Ch1, Ch2, Ch3, Ch4, Ch5, Ch10)

O

Open X-Embodiment: 34개 연구실의 1M+ 궤적을 통합한 최대 규모 오픈소스 로봇 데이터셋. (Ch4, Ch6, Ch9, Ch10)

OpenVLA: 오픈소스 VLA 기반 모델 — 7B 파라미터, Open X-Embodiment로 학습. (Ch1, Ch4, Ch5, Ch6, Ch10)

P

PaLM-E: 구글의 embodied 멀티모달 언어 모델 — 이미지·상태·언어를 같은 토큰 스페이스로 통합. (Ch1, Ch2, Ch4)

pi0 (π₀): Physical Intelligence의 flow-based VLA 기반 모델. (Ch1, Ch4, Ch6, Ch10)

Policy transfer: 한 도메인(예: 사람 시연)에서 학습한 정책을 다른 도메인(예: 로봇)으로 이전. (Ch9)

PragmaBot: 실용적 대화를 통해 지시를 명확화하는 로봇 플래너. (Ch1, Ch3, Ch8, Ch9, Ch10)

R

REFLECT: 실패를 반성하고 재계획하는 폐루프 패턴. (Ch1, Ch2, Ch8, Ch10, Ch11)

RL (Reinforcement Learning, 강화학습): 보상 최대화를 통한 정책 학습. (Ch3)

RT-2: 구글 DeepMind의 VLA 모델 — 웹 VQA와 로봇 조작을 통합 학습. (Ch1, Ch2, Ch4)

RT-H: 계층적 action 표현 — language motion + low-level control. (Ch5, Ch9, Ch10)

S

SayCan: "말할 수 있는 것"(LLM)과 "할 수 있는 것"(affordance)을 결합한 grounded planning. (Ch1, Ch2, Ch4, Ch8, Ch11)

SayPlan: 3D 씬 그래프 기반 계층적 semantic search로 LLM planning horizon을 단축. (Ch1, Ch2, Ch7, Ch10)

Scene Graph: 객체와 관계를 노드·엣지로 표현한 구조적 세계 표현. (Ch2, Ch7, Ch8, Ch10)

SIMPLER: 시뮬레이션과 실세계 평가 결과를 정렬하는 벤치마크. (Ch1, Ch3, Ch9, Ch10)

T

TAMP (Task and Motion Planning): 고전적 작업·운동 통합 계획 프레임워크. (Ch3, Ch4, Ch5, Ch10)

V

VLA (Vision-Language-Action): 시각·언어 입력에서 로봇 행동을 직접 출력하는 통합 모델. (Ch1, Ch2, Ch3, Ch4, Ch5, Ch6, Ch8, Ch10)

Z

Zero-shot planning: 추가 학습 없이 LLM이 새 작업의 계획을 생성하는 능력. (Ch2)