엔지니어 한 명에 월 5억 달러 — Perplexity CEO가 인텔 무대에서 '엣지 AI' 정면승부

엔지니어 한 명에 월 5억 달러 — Perplexity CEO가 인텔 무대에서 '엣지 AI' 정면승부 📺 2026-06-03 · 마켓레이더 대가들의 대화 · Computex 2026에서 공개한 하이브리드 추론 시스템과 5개월 만에 매출 3배 — 한국 HBM·AI PC 공급망이 받을 영향 2026년 6월 3일 보도에 따르면, AI 검색 스타트업 Perplex

Share
엔지니어 한 명에 월 5억 달러 — Perplexity CEO가 인텔 무대에서 '엣지 AI' 정면승부

📺 2026-06-03 · 마켓레이더 대가들의 대화 · Computex 2026에서 공개한 하이브리드 추론 시스템과 5개월 만에 매출 3배 — 한국 HBM·AI PC 공급망이 받을 영향

2026년 6월 3일 Venturebeat 보도에 따르면, AI 검색 스타트업 Perplexity가 Intel과 손잡고 대만 Computex 2026 무대에서 '하이브리드 로컬 서버 추론 오케스트레이터(orchestrator, 작업 조율 시스템)'라는 긴 이름의 새 시스템을 공개했다. 알맹이는 단순하다. AI 작업을 일일이 클라우드 서버로 보내지 않고, PC와 클라우드 사이에서 자동으로 나눠 처리하는 소프트웨어다.

이 발표가 단순한 기술 시연으로 끝나지 않는 이유는 따로 있다. Perplexity CEO Aravind Srinivas는 같은 인터뷰에서 "엔지니어 한 명이 한 달에 5억 달러에 가까운 토큰 비용을 쓰는 경우도 있다"고 털어놓았다. AI 추론 비용이 본격적으로 사업 모델을 압박하기 시작했다는 신호다.

코스피의 SK하이닉스·삼성전자 HBM(High Bandwidth Memory, 고대역폭 메모리) 라인은 그동안 '클라우드 데이터센터 폭주'라는 단일 시나리오에 의존해왔다. Perplexity가 던진 메시지는 그 시나리오에 균열과 새 기회를 동시에 만든다.

무슨 일이 있었나 (한 줄 요약)

Perplexity가 Computex 2026에서 공개한 하이브리드 추론 시스템은 AI 작업을 자동으로 분배하는 운영체제 같은 소프트웨어다. 사용자가 어떤 질문을 던지면, 시스템이 "이건 PC 안의 작은 모델로 처리해도 충분하다", "이건 클라우드의 거대 모델까지 보내야 정확하다"를 즉시 판단한다.

핵심은 '칩에 구애받지 않는다'는 점이다. Srinivas는 인터뷰에서 "Intel과 NVIDIA RTX 모두에서 동작한다"고 분명히 밝혔다. Venturebeat도 솔루션이 칩 중립(chip agnostic, 어느 칩 제조사 제품에도 동작)으로 설계됐다는 점을 명시했다. 모델 중립을 넘어 칩 중립으로 확장하겠다는 선언이다.

오케스트레이터는 단순 라우터가 아니다. 정확도, 비용, 프라이버시, 응답 속도, 파일 민감도 같은 변수를 한꺼번에 저울질한다. Srinivas는 이를 "여러 목적을 동시에 균형 잡는 운영체제"라고 표현했다.

회사 실적은 이 전략이 시장에 통하고 있음을 뒷받침한다. Thenextweb 2026년 5월 6일 보도에 따르면 Perplexity 매출은 2026년 1월부터 5개월간 약 3배 늘었고, 같은 매체는 3월 시점에 약 4억 5,000만 달러 수준이라고 전했다. Srinivas 본인은 4월 중순 무렵 연 매출 기준으로 5억 달러를 넘겼다고 MSN 보도를 통해 밝혔다.

진짜 충격 — '엔지니어 한 명에 월 5억 달러'

가장 충격적인 발언은 토큰 비용 부분이다. Srinivas는 인터뷰에서 토큰 비용 문제를 정면으로 짚었다. "엔지니어 한 명이 한 달에 5억 달러에 가까운 토큰 비용을 쓰는 경우도 있다 (Some people are spending half a billion dollars per month per engineer)" — Aravind Srinivas, Bloomberg Talks 인터뷰. AI 추론 시장이 단순히 빠르게 성장하는 단계를 넘어, 고객 입장에서 비용 통제가 사실상 불가능한 구간으로 접어들었다는 신호다.

이 발언은 두 가지 의미를 동시에 담는다. 첫째, 거대 클라우드 단일 의존 모델은 재무적으로 지속 불가능하다는 인정이다. OpenAI·Anthropic의 프론티어 모델(frontier model, 최첨단 최대 규모 AI 모델)만으로 모든 작업을 돌리면, 기업 고객의 토큰 청구서가 폭발한다. 둘째, 해법은 단순히 더 싼 모델을 쓰는 것이 아니라 '작업별 최적 경로'를 자동화하는 소프트웨어라는 것이다.

이 지점에서 한국 시장이 받을 영향을 봐야 한다. 한국 반도체 업계는 그동안 'AI 수요 폭증 = 클라우드 데이터센터 확장 = HBM 수요 증가'라는 직선 시나리오에 길들여져 있었다. 하지만 Perplexity가 제시한 시나리오는 클라우드와 엣지(Edge, 사용자 기기 단)의 동시 확장이다. AI 워크로드의 30~40%가 PC·노트북 같은 로컬 디바이스로 분산되는 그림이 현실화되면, 데이터센터 GPU 증가율은 시장 컨센서스보다 완만해질 가능성이 있다.

반대로 Intel처럼 AI PC(NPU, Neural Processing Unit, 신경망 전용 칩 내장 노트북) 진영은 새 명분을 얻는다. Perplexity 같은 거대 AI 회사가 "우리 워크로드의 상당 부분이 로컬에서 돌아간다"고 인증해주는 셈이기 때문이다. 코스피의 LG전자·삼성전자 PC·노트북 사업부와 NPU·SoC(System on Chip, 통합 반도체) 후공정 협력사에는 잠재적 호재로 읽힐 수 있다.

CNN의 저작권 소송도 같은 인터뷰에서 짧게 다뤄졌다. Srinivas는 "진실과 사실에는 저작권이 없다"는 입장을 재확인했다. Techtimes 2026년 5월 31일 보도에 따르면, CNN은 Perplexity의 검색 답변이 자사 콘텐츠를 사실상 무단 인용한다고 주장하며 연방 저작권법 위반 소송을 제기했다. AI 검색 서비스가 매출 5억 달러 구간을 넘어서면서 미디어 진영의 법적 압박이 본격화되는 국면이다.

마켓레이더 핵심 인사이트

💡 토큰 비용이 AI 사업 모델의 새 천장이다 — AI 추론 시장은 그동안 '수요만 있으면 무한 성장' 시나리오로 평가받았다. 하지만 Srinivas가 직접 거론한 '엔지니어 한 명에 월 5억 달러'급 청구서는, 클라우드 단일 의존 모델이 곧 비용 한계에 부딪히고 있음을 보여준다. AI 사용량 폭증이 곧바로 클라우드 매출 폭증으로 직결되지 않을 수 있다는 신호이며, 추론 인프라 비용 구조 자체를 재설계해야 한다는 메시지가 담긴다. 코스피 AI 관련 종목군을 평가할 때 '수요 한 축'만 보는 관점은 위험해진 단계다.

🔥 Perplexity의 칩 중립 선언은 NVIDIA에도 양날의 검이다 — Srinivas는 "Intel과 NVIDIA RTX 모두에서 동작한다"고 밝혔고 Venturebeat도 칩 중립 설계를 보도했다. 단기적으로는 RTX 진영도 추가 수요를 가져가는 그림이지만, 중장기로는 AI 워크로드가 데이터센터 GPU에만 머무르지 않는다는 인정이기도 하다. NVIDIA가 견인해온 'AI = 데이터센터 GPU' 단일 내러티브에 미세한 균열이 시작되는 시점으로 관찰 가치가 있다.

고가 구독 비중 30%, AI 검색의 '프리미엄 전환' 본격화TechCrunch 2025년 7월 2일 보도에 따르면 Perplexity Max 플랜은 월 200달러로 책정됐다. Srinivas는 이번 인터뷰에서 Max 플랜과 Pro 플랜의 가입자 비중이 2026년 초 약 9 대 91에서 5월 기준 약 30 대 70으로 이동했다고 밝혔다. 연 2,400달러를 자기 돈으로 내는 '파워 유저'가 빠르게 늘고 있다는 의미다. 기업 도입 이전에 개인 유료 전환 구간이 빠르게 두꺼워지고 있다는 신호로 읽을 수 있다.

거장의 한마디

"엔지니어 한 명이 한 달에 5억 달러에 가까운 토큰 비용을 쓰는 경우도 있다 (Some people are spending half a billion dollars per month per engineer)" — Aravind Srinivas, Perplexity CEO (Bloomberg Talks 인터뷰)

이 한마디는 AI 추론 산업이 '성장통' 단계에 진입했다는 진단이다. 클라우드 프론티어 모델 단일 의존 구조가 기업 고객의 재무 부담을 폭발시키는 지점에 도달했고, 이를 풀 해법으로 Perplexity가 내놓은 답이 바로 하이브리드 추론 시스템이다. 한국 투자자 관점에서는 데이터센터 GPU·HBM 폭증 시나리오와 동시에, AI PC·NPU·온디바이스 AI 가속기가 함께 성장하는 두 축 구도가 본격화될 수 있음을 시사한다. 한쪽 시나리오만 따라가는 종목군은 변동성 노출이 커진다는 의미이기도 하다.

한국 시장 영향

📌 HBM·후공정 공급망 — SK하이닉스·삼성전자 HBM 라인은 단기적으로는 영향이 크지 않다. Perplexity 같은 AI 회사 매출이 5개월에 3배 늘었다는 사실 자체가 결국 데이터센터 측 추론 수요가 줄어든 게 아니라 여전히 폭증 중이라는 증거다. 다만 중장기 관점에서 AI 워크로드 절반 가까이가 엣지로 분산되는 시나리오를 동시에 가정해두는 것이 안전하다. 체크 지표는 두 가지다 — ① SK하이닉스 분기 HBM 매출 가이던스 변화율한미반도체·이오테크닉스의 HBM 본더·웨이퍼 처리 장비 수주 흐름. 두 지표가 동반 상승세를 유지한다면 데이터센터 단일 시나리오는 건전한 흐름으로 봐도 무방하지만, 어느 한쪽이 둔화 신호를 먼저 보이면 분산 시나리오가 현실화되는 초기 신호로 해석할 여지가 생긴다.

📌 AI PC·엣지 디바이스 진영 — Intel과 Perplexity의 협업이 한국 PC·AI PC 시장에 던지는 시그널은 분명하다. LG전자·삼성전자 PC 사업부는 그동안 'AI PC가 정말 새 카테고리를 만들 것인가'라는 질문을 안고 있었다. Perplexity 같은 거대 AI 서비스가 직접 "우리 워크로드의 상당 부분이 로컬에서 돌아간다"고 인증하면서, AI PC는 단순 마케팅 키워드를 넘어 실수요 카테고리로 진화할 가능성이 열린다. 관찰 포인트는 ① 삼성전자 갤럭시북·LG전자 그램 AI PC 라인업 출하량 추이NPU·온디바이스 AI 가속기 관련 후공정 협력사 수주 동향(파두·텔레칩스 등 팹리스 SoC 진영 포함)이다. 글로벌 PC 출하량 데이터에서 AI PC 비중이 빠르게 올라간다면 한국 PC 부품 공급망 전반에 호재가 될 수 있는 환경이다.

📌 데이터센터 전력·냉각 인프라 — 토큰 비용 폭증의 근본 원인은 결국 전력 비용이다. Srinivas가 강조한 "와트당 토큰 가치"는 사실상 데이터센터 전력 효율이 AI 사업 모델 경쟁력을 좌우한다는 의미다. 코스피·코스닥의 LS ELECTRIC·HD현대일렉트릭·일진전기 등 전력 인프라 종목군은 '데이터센터 폭증 → 전력 수요 폭증' 단순 시나리오에서 한 단계 더 나아가, 전력 효율·냉각·배전 효율화까지 가치사슬이 확장될 가능성을 함께 관찰하는 것이 안전하다. 관찰 지표는 한국전력 분기 산업용 전력 판매량 추이, 국내 데이터센터 신규 인허가 건수, 그리고 미국 빅테크 데이터센터 부지 발표(전력 인프라 발주 선행 지표)다.

한 줄 결론

Perplexity의 칩 중립 선언과 토큰 비용 경고는, 코스피 AI 관련 종목군이 '데이터센터 단일 시나리오'에서 '클라우드 + 엣지 양 축'으로 관찰 프레임을 넓혀야 할 시점임을 시사한다.

---

🎬 원본 영상

Perplexity CEO Aravind Srinivas Talks AI Boom | Bloomberg Talks · 채널 Bloomberg Podcasts
https://www.youtube.com/watch?v=h-df8F-LhiY


📡 마켓레이더 · AI 기반 글로벌 시장 분석
@marketradar_kr

⚖️ 본 콘텐츠는 AI가 공개된 정보를 종합·정리한 것으로, 특정 종목의 매수·매도를 권유하지 않습니다.
모든 투자 판단과 그에 따른 손익의 책임은 투자자 본인에게 있습니다.