파이온 - Python Online Learning

AI/머신러닝 기초 과정

최적의 경로: 강화 로직

PROGRESS

1 / 7

단원 데이터 구조화: AI 전처리 17 데이터의 규칙: 예측 로직 14 옷의 시너스: 판단 로직 1 예와 아니오: 판단 로직 6 닮은꼴 찾기: 관계 로직 7 최적의 경로: 강화 로직 7 층층이 지능: 신경망 로직 7 전체 목록

다음 문제

강화학습의 4대 구성 요소

30 P

QUESTION 01 #395

강화학습에서 "에이전트(Agent)가 환경에서 받는 피드백"을 의미하는 용어는?

다음 중 옳은 것을 고르세요

1 행동(Action) 2 상태(State) 3 보상(Reward) 4 정책(Policy)

강화학습 핵심 용어

용어	의미	예시
Agent	학습 주체	게임 캐릭터
State	현재 상황	캐릭터 위치
Action	선택한 행동	상하좌우 이동
Reward	행동의 결과 점수	+10 (보물), -5 (함정)

용어사전