🧭 한눈에 보기
1단계 (AI)2단계 (+MCP)3단계 (+웹 서치)4단계 (+스킬)5단계 (+캐시). 능력이 쌓일수록 비용도 함께 늘다가, 5단계 캐시에서 다시 합리적으로 떨어집니다.
🧭 At a Glance
Stage 1 (AI)Stage 2 (+MCP)Stage 3 (+Web Search)Stage 4 (+Skill)Stage 5 (+Cache). As capabilities increase, so does the token cost, until Stage 5 Cache brings it back down to a reasonable level.

1단계 · AI (기본 상태)

“우리 집을 전혀 모르는 방구석 지식인”

  • 개념 — 책을 많이 읽어서 아는 건 많지만, 인터넷도 안 되고 우리 집에 와본 적도 없는 상태입니다.
  • 장점 — “여름철 실내 온도 낮추는 꿀팁 알려줘” 같은 질문에 자연스럽게 대답합니다.
  • 단점 — 우리 집에 에어컨이 있는지, 바깥 날씨가 어떤지 모릅니다. 때로는 모르는 것도 아는 척하며 그럴듯한 거짓말(환각)을 합니다.
  • 🧠 토큰 사용량 (가장 적음) — 질문을 읽고 머릿속 지식으로 대답만 하면 되므로 처리 비용이 가장 적습니다.

Stage 1 · AI (Base State)

"The armchair expert who's never left their room and knows nothing about your house"

  • Concept — It has read a lot of books and knows a ton, but it doesn't have internet access and has never visited your home.
  • Pros — It can naturally answer general questions like "Give me some tips on lowering indoor temperatures in the summer."
  • Cons — It doesn't know if you have an air conditioner or what the weather is like outside. Sometimes it pretends to know things it doesn't, making up plausible-sounding lies (hallucinations).
  • 🧠 Token Usage (Lowest) — It only needs to read your question and answer from the knowledge in its head, making processing costs the lowest.

2단계 · AI + MCP (SmartThings MCP) AEB v1.0.2+

“비서가 외부 도구를 부를 수 있는 ‘표준 규격’을 익히다”

  • 개념 — MCP는 AI가 가전과 직접 연결되는 ‘케이블’이 아니라, 외부 도구(SmartThings, 캘린더, 메일 등)를 부르는 표준 약속입니다. 비유하자면 “어떤 가게에 가도 똑같이 통하는 표준 주문서 양식”입니다. AI는 이 양식대로 “에어컨 켜줘”라는 주문서를 SmartThings MCP 서버로 보내고, 서버가 실제 SmartThings 클라우드를 호출해 가전을 움직입니다.
  • 장점 — 가전마다 따로 연결 코드를 짤 필요가 없어지고, AI가 도구를 발견하고 부르는 방식이 통일됩니다.
  • 단점 — 뒤에서 길을 닦는 기술이라 일반 사용자 눈에는 큰 변화가 보이지 않습니다.
  • 🧠 토큰 사용량 (증가) — 연결된 MCP 서버가 제공하는 스킬 목록과 사용법(스키마)이 매 대화마다 AI에게 전달되어야 합니다. 스킬이 많을수록 토큰도 늘어납니다.

Stage 2 · AI + MCP (SmartThings MCP) AEB v1.0.2+

"The assistant learns the 'standard protocol' to call external tools"

  • Concept — MCP isn't a direct 'cable' connecting the AI to your appliances. It's a standard agreement for calling external tools (SmartThings, calendar, mail, etc.). Think of it as a "standardized order form that works at any store." The AI sends an "turn on the AC" order form using this format to the SmartThings MCP server, and the server calls the actual SmartThings cloud to move the appliance.
  • Pros — There's no need to write separate connection code for every appliance, and the way the AI discovers and calls tools is unified.
  • Cons — It's a foundational technology working behind the scenes, so regular users won't see much of a visible change.
  • 🧠 Token Usage (Increases) — The list of skills and how to use them (schemas) provided by the connected MCP server must be sent to the AI for every conversation. The more skills you have, the more tokens it takes.

3단계 · AI + MCP + 웹 서치 AEB v1.0.3+

“비서에게 눈과 귀가 생기다”

  • 개념 — 이제 비서가 실시간으로 바깥 세상의 정보를 검색해서 가져옵니다.
  • 장점 — “오늘 서울 날씨 어때? 환기해도 돼?”라고 물으면 실시간 날씨와 미세먼지 정보를 검색한 뒤, 객관적 근거를 바탕으로 “미세먼지가 심하니 환기하지 마세요”라고 정확하게 대답합니다. 환각이 크게 줄어듭니다.
  • 단점 — 대답은 정확해졌지만, 창문을 닫거나 공기청정기를 트는 ‘행동’은 여전히 사람이 해야 합니다.
  • 🧠 토큰 사용량 (크게 증가) — 검색해 온 뉴스/날씨 페이지를 AI가 다 읽어들여야 답할 수 있으므로, 입력 토큰이 확 늘어납니다.

Stage 3 · AI + MCP + Web Search AEB v1.0.3+

"The assistant gets eyes and ears"

  • Concept — The assistant can now search for and retrieve real-time information from the outside world.
  • Pros — If you ask, "What's the weather like in Seoul today? Can I open the windows?", it will search for real-time weather and air quality info, and give you an accurate answer based on objective facts: "The air quality is bad, so don't open the windows." Hallucinations are drastically reduced.
  • Cons — While the answers are accurate, you still have to be the one to actually perform 'actions' like closing windows or turning on the air purifier.
  • 🧠 Token Usage (Increases Greatly) — The AI has to read through the news/weather pages it searched for to answer, so input tokens jump significantly.

4단계 · AI + MCP + 웹 서치 + 스킬(Skill) AEB v1.0.4+

“비서에게 손과 발이 생기다”

  • 개념 — 검색으로 상황을 파악하는 것을 넘어, 비서가 MCP를 통해 실제로 가전을 작동시키는 ‘스킬(Skill)’을 발동시킵니다. 스킬은 “에어컨 켜기”, “공기청정기 터보 모드” 같이 미리 준비된 능력 패키지입니다.
  • 장점 (최고의 혁신) — “나 10분 뒤 도착해. 알아서 쾌적하게 해줘.” 한 마디면 끝입니다. AI가 바깥 날씨를 검색하고, 알아서 “에어컨 24도로 켜기, 공기청정기 터보 모드” 스킬을 발동시켜 가전을 작동시킵니다.
  • 단점 — AI가 실수로 엉뚱한 스킬을 발동시킬 위험이 약간 있습니다.
  • 🧠 토큰 사용량 (가장 많음, 단 효율적인 방식으로)
    • 늘어나는 부분 — “상황 파악 → 어떤 스킬을 쓸지 결정 → 실행 → 결과 확인 → 사용자에게 보고”라는 여러 턴의 대화가 오가므로, 4단계가 토큰을 가장 많이 씁니다.
    • 효율적인 부분 — 그래도 AI가 직접 코드를 짜서 가전을 제어하는 것보다는 훨씬 효율적입니다. AI는 “에어컨 켜기”라는 짧은 스킬 호출만 만들면 되고, 복잡한 API 통신은 MCP 서버가 알아서 처리해주기 때문입니다.

Stage 4 · AI + MCP + Web Search + Skill AEB v1.0.4+

"The assistant gets hands and feet"

  • Concept — Going beyond just grasping the situation through search, the assistant actually triggers 'Skills' via MCP to operate your appliances. Skills are pre-packaged abilities like "Turn on AC" or "Air purifier turbo mode".
  • Pros (The Ultimate Innovation) — "I'll be home in 10 minutes. Make it comfortable." One sentence is all it takes. The AI checks the weather outside, and automatically fires off skills like "Turn AC to 24°C" and "Air purifier turbo mode" to run your devices.
  • Cons — There's a slight risk of the AI accidentally triggering the wrong skill.
  • 🧠 Token Usage (Highest, but Efficiently)
    • Why it increases — The back-and-forth multi-turn conversation of "Understand situation → Decide which skill to use → Execute → Check result → Report to user" makes Stage 4 use the most tokens.
    • Why it's efficient — It's still vastly more efficient than having the AI write code to control appliances directly. The AI only needs to generate a short skill call like "Turn on AC", and the MCP server takes care of the complex API communications.

5단계 · AI + MCP + 웹 서치 + 스킬 + 캐시(Cache) AEB v1.0.4+

“비서가 ‘자주 쓰는 매뉴얼’을 머릿속에 미리 저장해두다”

  • 개념 — 지금까지 AI는 대화할 때마다 “스킬 목록과 사용법”을 매번 새로 읽어야 했습니다. 우리집에 연결된 스마트 기기가 50개라면, 그 50개의 사용 설명서를 매 질문마다 처음부터 다시 읽는 셈이죠. 캐시는 이 반복되는 부분을 “이미 읽은 걸로 치고 저장해두는” 기능입니다. 비유하자면 단골 식당에 갈 때마다 메뉴판을 처음부터 다시 읽지 않고, “늘 먹던 거”라고 외워둔 상태와 같습니다.
  • 장점 (비용 폭탄 방지)
    • 매번 수천~수만 토큰씩 들어가던 스킬 목록이 캐시되면, 두 번째 대화부터는 그 부분 비용이 약 90% 절감됩니다.
    • 응답 속도도 빨라집니다. 매번 다시 읽지 않으니까요.
  • 단점
    • 캐시는 일정 시간(보통 5분~1시간)이 지나면 사라지므로, 오랜만에 쓰면 다시 비용이 듭니다.
    • 스킬 목록이 자주 바뀌면(새 기기 추가 등) 캐시가 무효화되어 다시 만들어야 합니다.
  • 🧠 토큰 사용량 (대폭 절감)
    • 첫 대화 — 4단계와 비슷하거나 살짝 더 비쌈 (캐시 만드는 비용 약간 추가).
    • 두 번째 대화부터 — 스킬 목록 부분이 약 1/10 가격으로 처리됨. 자주 쓸수록 이득이 커집니다.

Stage 5 · AI + MCP + Web Search + Skill + Cache AEB v1.0.4+

"The assistant keeps 'frequently used manuals' in its head"

  • Concept — Until now, the AI had to read the "list of skills and how to use them" from scratch every single conversation. If you have 50 smart devices connected, it's like reading 50 user manuals from the very beginning for every question. Cache is a feature that takes this repetitive part and saves it, treating it as "already read". It's like going to your favorite restaurant and ordering "the usual" instead of reading the menu from cover to cover every time.
  • Pros (Prevents Bill Shock)
    • Once the skill list, which used to cost thousands to tens of thousands of tokens, is cached, the cost for that portion drops by about 90% from the second conversation onward.
    • Response times get faster too, since it doesn't have to re-read everything.
  • Cons
    • The cache expires after a certain amount of time (usually 5 minutes to an hour), so if you haven't used it in a while, you'll have to pay the full token cost again.
    • If your skill list changes often (like adding a new device), the cache is invalidated and must be rebuilt.
  • 🧠 Token Usage (Massively Reduced)
    • First conversation — Similar to Stage 4 or slightly more expensive (a small added cost to build the cache).
    • Second conversation onward — The skill list portion is processed at about 1/10th the price. The more often you use it, the bigger the savings.

💡 한눈에 보는 최종 종합 요약

단계 비유 핵심 변화 토큰 AEB 버전
1단계 AI만 방구석 지식인 사람처럼 대화가 잘 통함 가장 적음
2단계 +MCP 표준 주문서 양식 외부 도구를 부르는 길이 통일됨 증가 (스킬 목록 탑재) v1.0.2+
3단계 +웹 서치 스마트폰(눈과 귀) 실시간 정보로 환각 감소 크게 증가 (검색 결과 읽기) v1.0.3+
4단계 +스킬 로봇 팔(손과 발) 가전을 직접 작동시킴 가장 많음(멀티턴), 단 직접 코딩보다는 효율적 v1.0.4+
5단계 +캐시 단골 식당 “늘 먹던 거” 자주 쓰는 부분을 저장해 반복 사용 시 비용 폭락 두 번째 대화부터 약 90% 절감 v1.0.4+
🎯 결론
AI에 MCP·웹서치·스킬·캐시가 차곡차곡 더해진다는 것은, 말만 잘하던 AI가 ‘바깥 상황을 이해하고, 나를 대신해 집안 가전을 직접 제어해 주는 자동화 비서’로 거듭나면서, 동시에 그 비용까지 합리적으로 관리되는 과정입니다. 4단계까지는 능력이 커지는 만큼 비용도 커지는 트레이드오프였다면, 5단계에서 캐시가 그 부담을 상쇄해 “똑똑하면서도 경제적인” 진짜 실용 단계에 도달하게 됩니다.

💡 Final Comprehensive Summary

Stage Metaphor Core Change Tokens AEB Version
Stage 1 AI Only Armchair Expert Converses well like a human Lowest
Stage 2 +MCP Standard Order Form Unified way to call external tools Increases (loads skill list) v1.0.2+
Stage 3 +Web Search Smartphone (Eyes/Ears) Real-time info reduces hallucinations Greatly Increases (reads search results) v1.0.3+
Stage 4 +Skill Robot Arm (Hands/Feet) Directly controls appliances Highest (multi-turn), but more efficient than coding v1.0.4+
Stage 5 +Cache "The Usual" at a Diner Saves frequent parts, plummeting costs on reuse About 90% Savings from 2nd chat v1.0.4+
🎯 Conclusion
Adding MCP, Web Search, Skills, and Cache to an AI step-by-step is the process of a chatty AI evolving into an 'automated assistant that understands the outside world and directly controls your home appliances for you', while keeping costs reasonably managed. Up to Stage 4, it was a trade-off where greater capabilities meant higher costs. But in Stage 5, Cache offsets that burden, finally reaching a truly practical stage that is both "smart and economical."