
"한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬받아 작성된 서평입니다."
https://www.hanbit.co.kr/store/books/look.php?p_code=B4205161590
📌 책의 핵심 메시지
"그럴듯한 프로토타입은 누구나 만든다. 하지만 무너지지 않는 서비스는 '설계'에서 갈린다."
이 책은 LLM API를 붙여 데모를 만드는 시대를 지나, 그 데모를 실제 사용자에게 내보내는 '프로덕션'의 문턱에서 모두가 부딪히는 골짜기-환각, 매번 달라지는 응답, 지식 공백-를 정면으로 다룬다.
저자는 이 문제들을 "프롬프트를 더 잘 쓰면 된다"는 식으로 넘기지 않는다.
대신 시스템 설계의 문제로 격상시킨 뒤, 현업에서 반복적으로 마주치는 32가지 상황을 문제 정의 → 해결 방식 → 코드 예제 → 트레이드오프라는 일관된 형식의 '패턴'으로 정리한다.
👍 이 책이 좋은 이유
1. '패턴'이라는 형식의 힘 — GoF의 AI 버전
오래전 개발자들이 손에 들고 다니던 GoF 디자인 패턴서를 떠올리면 가장 가깝다.
모든 패턴이 동일한 구조로 서술되어, 정답을 외우는 게 아니라 판단의 좌표계를 얻게 된다. 덕분에 설계 회의에서 "지금 우리 RAG는 검색 품질 검증 단계가 비었으니 CRAG 패턴을 넣을지 보자"고 말할 팀 공용 언어가 생긴다.
2. RAG를 '검색 붙이기'에서 '아키텍처'로 끌어올린다
분량으로 보나 깊이로 보나 이 책의 심장은 RAG다.
"임베딩 + 벡터DB"라는 흔한 한 줄 요약을 넘어, CRAG(검색된 문서 품질을 재검증), Self-RAG(모델이 스스로 근거가 충분한지 점검)까지 단계적으로 분화시킨다. 검색 결과 하나만 잘못 들어와도 답변 전체가 무너지던 고질병을 아키텍처로 푸는 방법을 보여준다.
3. "모델은 틀릴 수 있다"를 전제로 설계한다
심판형 LLM(LLM-as-a-Judge)과 성찰(Reflection) 패턴은 AI가 낸 답을 또 다른 AI가 평가하고 스스로 고치게 만든다. 그 밑에 깔린 "AI도 테스트의 대상"이라는 관점이 인상적이다.
기존 소프트웨어의 단위 테스트처럼, 생성형 AI를 검증 가능한 엔지니어링 안으로 끌어들인다.
4. 특정 모델·프레임워크에 종속되지 않는다
GPT든 클로드든 제미나이든, 랭체인이든 무엇이든 가리지 않는다.
무게중심을 구현이 아니라 설계 사고에 두었기 때문에, 코드 예제는 낡아도 패턴은 살아남는다. 변화 속도가 빠른 AI 환경에서 비교적 오래 참고할 수 있다는 게 가장 영리한 선택이다.
5. 가장 가려운 곳 — 신뢰성·안전·비용까지 챙긴다
후반부에서는 프롬프트 인젝션 방어, 행동 제한, 자체점검을 다루며 "에이전트가 외부 도구를 쓰는 순간 보안은 곧 설계 문제가 된다"는 걸 체감시킨다.
소규모 언어 모델(SLM), 프롬프트 캐싱, 인퍼런스 최적화로 비용과 지연시간이라는 현실적 제약까지 놓치지 않는다.
🙆 이런 사람에게 추천
- LLM API는 이미 붙여봤고, 이제 진짜 서비스 구조를 고민하기 시작한 개발자
- RAG를 단순 검색이 아니라 운영 수준의 아키텍처로 이해하고 싶은 엔지니어
- 환각·비결정적 응답이 무서워 배포 직전에 멈춰 서본 적 있는 사람
- 모델과 도구가 바뀌어도 오래 통하는 설계 원칙을 손에 쥐고 싶은 사람
- AI 도입의 방향을 판단해야 하는 아키텍트·기술 리더·PM·CTO
- AI 에이전트 트렌드를 흥분이 아니라 견고한 시스템 설계 역량으로 바꾸고 싶은 사람
🙅 이런 사람에게는 조금 어려움
- LLM을 한 번도 다뤄본 적 없는 완전 입문자 (1장 '서론'부터 Temperature·LoRA·RLHF가 빠르게 지나간다. 사실상 압축된 AI 개론이라 초반 진입 장벽이 높다)
- 코딩 없이 'AI 활용법'만 알고 싶은 라이트 유저 (이 책은 활용서가 아니라 명백히 개발, 설계자를 위한 설계서다)
- 책의 코드를 그대로 베껴 바로 돌아가길 기대하는 사람 (MCP, 에이전트 프레임워크는 변화가 빨라 예제는 금세 낡는다. 깃허브 저장소 병행이 사실상 필수다)
- "버튼만 누르면 끝"인 A-Z 완성형 튜토리얼을 기대하는 사람 (어디까지나 방향성과 인사이트가 핵심인 책이다)
✍ 총평
이 책의은 AI를 써보는 단계에서 AI로 시스템을 설계하는 단계로 데려다 준다.
시중의 AI 책 상당수가 "이런 게 가능해요!"에서 멈추는 반면, 이 책은 출력 형식 제어부터 RAG 고도화, 신뢰성 검증, 다중 에이전트 협업, 비용 최적화, 가드레일까지 프로덕션을 떠받치는 전 과정을 촘촘히 안내한다.
특히 인상 깊었던 건 두 가지다.
첫째, 관점의 전환.
"모델은 틀릴 수 있다"를 전제로 시스템을 설계한다는 한 문장이, 배포를 망설이던 마음의 매듭을 풀어줬다.
둘째, 레퍼런스로서의 가치.
쉽게 읽히는 책은 아니다. 하지만 생성형 AI 정보가 사방에 흩어진 지금, 책상 옆에 꽂아두고 설계 회의 전에 꺼내 보게 될 그런 책이다.
앞으로의 경쟁력은 "얼마나 큰 모델을 쓰느냐"가 아니라 "그 모델을 얼마나 신뢰할 수 있는 시스템으로 엮어내느냐"에서 갈린다. AI 도구에 어느 정도 익숙해진 분이라면, 이 책으로 분명히 한 단계 더 나아갈 수 있다.