PROGRESS
1 / 7
단원
데이터 구조화: AI 전처리 17
데이터의 규칙: 예측 로직 14
옷의 시너스: 판단 로직 1
예와 아니오: 판단 로직 6
닮은꼴 찾기: 관계 로직 7
최적의 경로: 강화 로직 7
층층이 지능: 신경망 로직 7
전체 목록
강화학습의 4대 구성 요소
30 P
QUESTION 01 #395
강화학습에서 "에이전트(Agent)가 환경에서 받는 피드백"을 의미하는 용어는?
다음 중 옳은 것을 고르세요
강화학습 핵심 용어
| 용어 | 의미 | 예시 |
|---|---|---|
| Agent | 학습 주체 | 게임 캐릭터 |
| State | 현재 상황 | 캐릭터 위치 |
| Action | 선택한 행동 | 상하좌우 이동 |
| Reward | 행동의 결과 점수 | +10 (보물), -5 (함정) |