AI한테 “알아서 해줘”라고 던지면 어떻게 될까? 십중팔구 두루뭉술한 답변이 돌아온다. 에이전트 시대가 왔다고 하는데, 정작 제대로 시키는 법을 아는 사람은 많지 않다.
바이브 코딩 클럽은 바로 이 지점에서 출발한다. AI 에이전트가 뭔지, 왜 지금 중요한지, 그리고 어떻게 시켜야 제대로 일하는지를 다뤄보려 한다. 단순한 개념 강의가 아니라, 직접 프롬프트를 설계하고 결과를 확인하는 실습 중심 구성이다.
AI 기술 족보 정리
에이전트를 이해하려면 먼저 기술의 계보를 알아야 한다. 뉴스에서 AI, 딥러닝, GPT 등 수많은 용어가 쏟아지는데, 관계를 한 번에 정리하면 이렇다.
AI(인공지능) 가 가장 넓은 범위다. 인간의 지능을 흉내 내는 모든 기술을 포함한다. 그 안에 머신러닝이 있고, 머신러닝 중에서 인공 신경망을 사용하는 게 딥러닝이다. 딥러닝 기술로 엄청난 양의 텍스트를 학습한 언어 전문가 모델이 바로 LLM(거대언어모델) 이다. GPT가 여기에 해당한다.
여기서 몇 가지 관련 개념도 짚어두자.
- 생성형 AI(Generative AI): 단순히 분류하거나 예측하는 걸 넘어서, 새로운 콘텐츠(텍스트, 이미지, 코드 등)를 직접 만들어내는 AI. ChatGPT나 Midjourney가 대표적이다.
- 매개변수(Parameter): AI 모델의 지능 크기를 결정하는 요소. 파라미터가 많을수록 더 복잡한 추론이 가능하다.
- 토큰(Token): AI가 문장을 이해하는 최소 단위. 비용 계산이나 처리 속도의 기준이 되기도 한다.
- 프롬프트 엔지니어링(Prompt Engineering): AI에게 원하는 결과를 얻기 위해 질문이나 명령어를 효과적으로 구성하는 기술이다.
에이전트란 무엇인가
이제 핵심이다. 에이전트(Agent)란 무엇인가.
단순히 질문에 답만 하는 건 에이전트가 아니다. 목표를 달성하기 위해 스스로 판단하고, 필요한 도구를 꺼내 쓰는 상태가 에이전트다.
비교하면 차이가 명확하다.
- 일반 AI: “서울 날씨 어때?” → “맑습니다.” (단순 응답)
- 에이전트: “내일 서울 출장인데 일정 좀 짜줘.” → 날씨를 확인하고, 야외 미팅 대신 실내 카페를 제안하고, 이동 수단까지 고려해서 리스트업을 시작한다.
에이전트를 이해하려면 세 가지를 알아야 한다.
- LLM (뇌): 에이전트의 지능 그 자체. GPT나 Gemini 같은 모델이다. 지식은 엄청나지만, 스스로 움직이는 의지는 없다.
- Prompt (명령): 이 뇌를 깨우는 자극. 똑같은 뇌라도 어떤 자극을 주느냐에 따라 결과가 완전히 달라진다.
- Context Window (기억 상자): AI가 한 번에 머릿속에 담아둘 수 있는 기억의 용량. 이 상자가 클수록 복잡한 맥락을 잊지 않고 긴 작업을 수행할 수 있다.
ChatGPT는 에이전트일까?
자주 나오는 질문이다. 정확히 말하면 역할이 나뉜다.
- 채팅창(인터페이스)은 우체통이다. 명령을 전달하는 통로일 뿐이다.
- 모델은 도서관이다. GPT-4 같은 모델은 방대한 지식이 저장된 뇌다.
- 에이전트는 지배인이다. 우체통으로 들어온 명령을 읽고, 도서관에서 정보를 찾고, 필요하면 검색이나 계산을 해서 결과물을 만들어내는 전체 과정의 주체가 에이전트다.
토큰을 아끼는 팁
개발 도구에서 토큰은 곧 돈이자 성능이다. 효율적으로 쓰려면 다음을 기억하자.
- 불필요한 파일 제외: 프로젝트 전체를 읽게 하지 말고, 관련 있는 파일만 선택해서 질문하기
- 대화 초기화: 주제가 바뀌면 새 채팅을 여는 게 유리하다. 이전 대화 내용이 전부 입력 토큰으로 계산되어 비용이 누적된다.
- 코드 요약: 전체 소스코드를 붙여넣기보다 문제가 되는 부분만 골라서 질문하기
왜 지금 에이전트인가
작년까지만 해도 AI와 채팅하는 데 만족했다. 하지만 2026년 지금, 패러다임이 완전히 바뀌었다. 단순히 “A가 뭐야?”라고 묻는 시대에서 “A를 처리해줘”라고 명령하는 시대가 된 것이다.
수동적 AI vs 능동적 에이전트
가장 큰 차이는 능동성이다.
- 수동적 AI(기존): 도서관 사서와 같다. “제주도 맛집 책 찾아주세요”라고 하면 딱 그 책만 찾아준다. 다음 행동은 내가 직접 해야 한다.
- 능동적 에이전트(현재): 유능한 여행사 직원이다. “나 제주도 가고 싶어”라고 한마디만 던지면, 취향을 분석하고 맛집을 검색하고 예약 가능 여부를 확인한 뒤 캘린더에 일정까지 넣어준다.
일일이 과정을 지시하지 않아도 최종 목표(Goal)를 이해하고 중간 단계를 스스로 채워 넣는 것이 에이전트의 핵심이다.
에이전트의 두 가지 형태
우리가 당장 쓸 수 있는 에이전트는 크게 두 가지다.
네이티브 에이전트 (Native Agents) — 기존 앱 속에 내장된 형태다. Gemini가 대표적이다. 예전에는 메일 내용을 복사해서 Gemini에 붙여넣고 요약해달라고 했지만, 이제는 “지난주 김 대리가 보낸 메일 찾아서 핵심만 요약하고, 답장 초안 써줘”라고 하면 Gemini가 직접 메일함에 들어가서 처리한다.
커스텀 에이전트 (Custom Agents) — 나만의 맞춤형 에이전트다. GPTs, n8n, Zapier 같은 도구로 만들 수 있다. 매일 아침 특정 키워드의 뉴스를 수집해서 요약한 뒤 슬랙으로 보고하는 뉴스 브리핑 에이전트를 만들 수도 있다. 내가 깨우지 않아도 정해진 시간에 스스로 판단하고 행동한다.
하지만 도구가 좋아졌다고 저절로 일이 끝나지는 않는다. 에이전트라는 유능한 신입 사원이 들어왔을 때, 일을 제대로 시키지 못하는 팀장은 고생만 한다. 에이전트에게 “알아서 잘해”라고 하면 에이전트는 길을 잃는다.
에이전트적 사고와 구조적 프롬프트
에이전트에게 일을 시키는 건 친구와 카톡하는 게 아니다. 유능한 신입 사원에게 업무 매뉴얼을 만들어주는 과정이다.
CoT (Chain of Thought)
에이전트적 사고에서 가장 먼저 기억해야 할 개념이다. 원리는 간단하다. 한 번에 답하지 말고, 단계별로 생각하게 만드는 것.
사람도 “우리 회사 매출 올릴 전략 짜봐”라는 질문을 받으면 바로 답이 안 나온다. 현재 상황 분석 → 경쟁사 조사 → 문제점 파악 → 대안 수립이라는 단계를 거친다.
AI에게도 똑같이 시키면 된다. “최종 결과물을 내기 전에, 먼저 어떤 순서로 생각할지 계획부터 세워줘”라고 말하는 것만으로 답변의 정확도는 수직 상승한다.
P-C-T-C
네 가지만 기억하면 된다.
1. Persona (역할) — “너는 누구니?”
단순히 ‘마케터’라고 하지 말고, ‘10년 차 IT 서비스 마케팅 팀장’처럼 구체적인 페르소나를 주자. AI는 그 역할에 빙의해 해당 분야의 용어와 전략을 가져온다.
2. Context (배경) — “우리는 지금 어떤 상황이니?”
내가 누구인지, 타겟이 누구인지 정보를 줘야 한다. “예산은 100만 원이고, 대상은 20대 사회초년생이야” 같은 정보가 에이전트의 판단 근거가 된다.
3. Task (작업) — “정확히 뭘 해야 하니?”
“이메일 써줘”가 아니라 “신규 고객의 재방문을 유도하는 친절한 톤의 이메일 초안을 써줘”라고 구체적인 동작을 지시하자.
4. Constraint & Output (제약과 형식) — “어떻게 보여줄 거니?”
“300자 이내로”, “표 형식으로”, “비개발자도 이해할 수 있는 쉬운 단어로”처럼 결과물의 모양을 정해주자.
Before & After
차이를 보면 바로 느낀다.
Before:
신규 앱 홍보 문구 좀 작성해줘.
→ 평범하고 뻔한 문구가 나온다.
After (에이전트적 설계):
너는 카피라이팅 전문가야. 20대 직장인을 타겟으로 한 자산관리 앱의 홍보 문구
3개를 짜줘. 먼저 이 앱을 쓸 때 사용자가 얻을 핵심 이득 3가지를 분석하고,
그다음에 각각의 이득을 강조하는 문구를 표 형식으로 작성해줘.
→ AI에게 생각할 순서(단계)를 지정해주었기 때문에, 훨씬 깊이 있는 결과물이 나온다.
구분자(Delimiter) 활용 팁
LLM이 이해하기 쉬운 프롬프트를 작성할 때 구분자를 잘 활용하면 좋다.
#,##등 마크다운 헤딩"""삼중 따옴표--------- 아래 -----------같은 구분선
구분자를 쓰면 각 섹션의 역할이 명확해지고, AI가 지시 사항을 혼동할 확률이 크게 줄어든다.
실습
개념 정리가 끝났으니, 직접 해보는 시간이다.
실습 1
P-C-T-C 설계도를 적용해서 AI에게 넌센스 같은 질문을 제대로 시켜보는 실습이다.
# Persona
너는 수만 명의 데이터 분석을 통해 최적의 배우자를 찾아주는
'냉철한 데이터 기반 커플 매니저'야.
# Context
질문자는 '사랑보다는 경제적 안정'을 1순위로 생각하지만,
가끔 외모에 흔들리는 사람이야.
# Task
'100억 유병재 vs 무일푼 차은우' 중 누구를 선택하는 것이
장기적인 행복지수가 높을지 분석해줘.
# Chain of Thought
1. 100억 자산의 가치와 차은우 외모의 잠재적 수익을 비교
2. 질문자의 성향(경제 중심)을 고려해 우선순위 정리
3. 선택 후 발생할 수 있는 '후회 포인트'와 해결책 제시
# Output
분석 보고서 형태로, 논리적이고 깔끔하게 작성해줘.
재밌는 건, Persona를 ‘낭만주의 소설가’로 바꾸면 결과가 완전히 달라진다는 점이다. 지시서 한 줄에 에이전트의 관점 자체가 바뀐다.
실습 2
이직을 해야 할까, 점심에 뭘 먹을까, 주말 부모님 생신 선물은 뭘로 할까. 어떤 고민이든 에이전트 설계도를 적용해볼 수 있다.
- Persona — 내 고민 분야의 권위자를 설정 (이직 고민이면 헤드헌터, 식단 고민이면 전문 영양사)
- Context — 고민의 배경을 솔직하고 구체적으로 적기
- CoT — “그냥 알려줘”가 아니라 “먼저 내 상황의 장단점을 분석하고, 그다음 대안을 3가지 제안해줘”라고 단계를 나누기
돌아보면 차이는 질문의 깊이에서 났다. 단순히 물어볼 때와 구조적으로 설계해서 물어볼 때, 답변의 질이 체감될 정도로 달랐다.
실습 3
실무에서 자주 마주치는 문제다. 5명의 팀원이 모두 참석 가능한 1시간 회의를 잡는 상황을 에이전트에게 맡긴다.
# Role
너는 1분의 오차도 허용하지 않는 글로벌 대기업의
'수석 스케줄러 에이전트'야.
# Context (데이터 주입)
다음은 5명 팀원의 월요일 가용 시간 데이터야.
- A: 월요일 오후 2시 ~ 4시 가능
- B: 월요일 오후 3시 ~ 5시 가능
- C: 화요일은 전일 가능하지만, 월요일은 오후 4시 이후부터만 가능
- D: 월요일 오후 1시 ~ 3시 30분 가능
- E: 모든 요일 오후 3시 ~ 4시 30분 가능
# Task
모든 팀원이 "60분 내내" 한 명도 빠짐없이 참석 가능한 최적의 시간을 찾아줘.
전원 참석이 불가능하다면, 참석 가능 인원이 가장 많은 시간대를 제시해.
# Chain of Thought
Step 1. 각 팀원별 가용 시간을 [시작-종료]로 리스트업
Step 2. 60분 단위의 모든 후보 시간대를 검토
Step 3. 각 후보 시간대별로 5명의 참석 가능 여부를 OX 체크
Step 4. 참석 확정 인원수를 비교
Step 5. 최종안 선발 후, 불참자 사유를 데이터와 대조 검증
# Output Format
1. 최종 제안 시간: [00:00 ~ 00:00]
2. 참석 확정 인원 (0명): [이름 나열]
3. 불참 인원 및 사유
4. 검증 로그: 5명 각각에 대해 참석 가능 여부(Yes/No) 표시
이 프롬프트에서 가장 중요했던 건 Chain of Thought로 단계별 사고 로직을 명시한 것과, Output Format으로 결과물 형태를 미리 못 박아둔 것이었다. 덕분에 AI가 대충 넘기지 않고 검증까지 하게 만들 수 있었다.
내가 다시 꺼내 쓰기 쉽게 표로 묶어두면 이렇다.
| 기둥 | 설명 | 예시 |
|---|---|---|
| Role (Persona) | 누구인지 정의 | “수석 스케줄러 에이전트” |
| Context | 어떤 상황/데이터인지 | “5명 팀원의 월요일 가용 시간 데이터” |
| Task | 무엇을 해야 하는지 | “60분 내내 전원 참석 가능한 시간 찾기” |
| Chain of Thought | 어떻게 생각할지 | “Step 1~5의 사고 로직” |
| Output Format | 어떤 형태로 결과를 낼지 | “최종 제안 시간, 참석 인원, 검증 로그” |
1주차를 마치며
100억 유병재를 고르든, 무일푼 차은우를 고르든 중요하지 않다.
중요한 건 AI라는 거대한 지능(LLM)에게 내가 원하는 방향으로 생각할 수 있는 구조를 만들어주었다는 점이다.
에이전트적 사고는 기술이 아니라, 상대방이 일을 완벽하게 수행할 수 있도록 명확한 가이드를 주는 리더십과 같다. 오늘 배운 P-C-T-C 구조를 내일 업무 메일이나 보고서 작성에 바로 적용해볼 수 있다.
다음 시간에는 No Code 자동화 도구와 n8n을 직접 만져보게 될 텐데, 오늘 잡은 틀을 어디까지 가져갈 수 있을지 확인해볼 생각이다.
메모
- 에이전트: 목표를 이해하고, 스스로 판단하며, 도구를 사용해 실행까지 하는 자율적 AI
- 에이전트의 3요소: LLM(뇌), Prompt(명령), Context Window(기억 상자)
- CoT (Chain of Thought): 한 번에 답하지 말고, 단계별로 생각하게 만드는 기법
- P-C-T-C: Persona(역할) → Context(배경) → Task(작업) → Constraint & Output(제약/형식)
- 결론: AI에게 “알아서 해줘”는 최악의 지시다. 구조를 주면 결과가 달라진다.