ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • OpenAI의 음성 AI 파트너 LiveKit, 10억 달러 유니콘 등극 - Index Ventures 주도 1억 달러 투자 유치 (2026년 1월 23일)
    AI 트렌드 2026. 1. 23. 18:32
    반응형

    OpenAI의 음성 AI 파트너 LiveKit, 10억 달러 유니콘 등극

    2026년 1월 22일, 실시간 음성 및 영상 AI 인프라 기업 LiveKit이 Index Ventures 주도의 1억 달러(약 1,450억 원) 시리즈 C 투자를 유치하며 10억 달러(약 1조 4,500억 원) 기업가치를 달성했습니다. 이로써 LiveKit은 음성 AI 인프라 분야에서 유니콘 기업으로 도약하게 되었습니다. 이번 투자에는 Salesforce Ventures, Hanabi Capital, Altimeter, Redpoint Ventures 등 유수의 투자사들이 참여했으며, 이전 시리즈 B 투자 이후 불과 10개월 만에 이루어진 성과입니다.

    LiveKit은 OpenAI의 ChatGPT Advanced Voice Mode를 비롯해 xAI, Salesforce, Tesla 등 글로벌 테크 기업들에게 실시간 음성 및 영상 스트리밍 인프라를 제공하는 핵심 파트너입니다. 이번 투자 유치는 음성 기반 컴퓨팅 시대의 도래를 앞당기려는 LiveKit의 비전이 시장에서 인정받았음을 보여주는 중요한 이정표입니다.

    팬데믹이 낳은 혁신: LiveKit의 탄생 배경

    LiveKit의 시작은 2021년 여름, 코로나19 팬데믹 한복판으로 거슬러 올라갑니다. 공동 창업자 Russ d'Sa는 당시 Medium에서 프로덕트 책임자로 근무하고 있었습니다. 전 세계가 재택근무로 전환하면서 그는 회사 문화에 심각한 변화가 생겼음을 목격했습니다. "금요일 저녁 함께 마시는 술 한 잔, 커피를 함께 내리며 나누는 대화 같은 동료 간의 일상적인 교류가 사라졌습니다"라고 그는 회상합니다.

    d'Sa는 2020년 개인 프로젝트를 진행하던 중 실시간 오디오와 비디오 애플리케이션을 쉽게 구축할 수 있는 오픈소스 솔루션이 존재하지 않는다는 사실을 발견했습니다. 당시 Clubhouse 앱이 알파 버전으로 출시되었을 때, 그는 자신의 동료들을 위한 유사한 서비스를 만들고 싶었습니다. Clubhouse가 Agora를 기반으로 구동된다는 것을 알게 된 후, 그는 직접 데스크톱 앱을 개발하기 시작했습니다. 앱을 출시하자마자 1,300개가 넘는 기업이 대기자 명단에 등록했고, 이는 새로운 원격 근무 환경에서 기업들이 새로운 솔루션을 얼마나 절실히 원하는지를 보여주었습니다.

    결국 d'Sa는 해당 앱 프로젝트를 중단했지만, 시장의 강력한 수요를 확인한 그는 공동 창업자 David Zhao와 함께 LiveKit을 설립했습니다. WebRTC는 P2P 실시간 통신을 위한 개방형 프로토콜을 제공했지만, 대규모로 실시간 통신을 구축하고 확장할 수 있는 무료 오픈소스 인프라는 존재하지 않았습니다. LiveKit은 바로 이 빈틈을 채우기 위해 탄생했습니다.

    오픈소스 철학: 개발자 커뮤니티에 대한 헌신

    LiveKit의 핵심 철학은 오픈소스에 대한 깊은 헌신입니다. David Zhao와 Russ d'Sa에게 LiveKit은 단순한 오픈소스 프로젝트가 아니라 오픈소스 '제품'입니다. 개발자로서 오픈소스의 혜택을 받으며 성장해온 그들은 전 세계 개발자들에게 현대적이고 완전한 WebRTC 스택을 무료로 제공하는 것이 중요하다고 믿었습니다.

     

    LiveKit의 오픈소스 프로젝트는 빠르게 성장했고, 이를 중심으로 활발한 개발자 커뮤니티가 형성되었습니다. GitHub에서 LiveKit Agents 프레임워크는 매달 100만 회 이상 다운로드되며, 개발자들이 자신만의 음성 AI 에이전트를 프로그래밍 방식으로 완전히 제어할 수 있도록 지원합니다. 이 프레임워크는 수백 개의 AI 모델 통합을 지원하고, 턴 감지 및 대화 중단 처리와 같은 대화 역학을 자동으로 관리합니다.

    ChatGPT Advanced Voice Mode의 핵심 인프라

    LiveKit의 가장 주목할 만한 성과 중 하나는 OpenAI와의 파트너십입니다. 2023년 9월, LiveKit과 OpenAI는 ChatGPT Voice Mode를 함께 공개했습니다. LiveKit Cloud는 전 세계 수백만 명의 사용자가 매일 사용하는 ChatGPT의 Advanced Voice Mode를 지원합니다.

    이 파트너십의 기술적 구조는 다음과 같습니다. LiveKit은 WebRTC를 단순화하는 오픈소스 인프라이며, LiveKit Cloud는 최저 지연 시간으로 대규모 오디오를 안정적으로 라우팅하도록 최적화된 글로벌 서버 네트워크입니다. 사용자 기기에서 오디오를 송수신하기 위해 OpenAI는 ChatGPT 앱에 LiveKit 클라이언트 SDK를 통합했습니다. 백엔드에서는 서버 환경에서 WebRTC를 사용하도록 설계된 또 다른 LiveKit SDK가 사용자로부터 스트리밍 오디오를 수신하고 다시 사용자에게 오디오를 스트리밍합니다.

    OpenAI가 이 새로운 기능을 출시했을 때, LiveKit도 개발자들이 자신만의 음성 AI 에이전트를 쉽게 구축할 수 있는 오픈소스 프레임워크인 LiveKit Agents를 함께 공개했습니다. 이후 LiveKit은 OpenAI의 Realtime API를 기본 지원하는 새로운 Multimodal Agent API를 출시하여, 개발자들이 ChatGPT처럼 사용자와 실시간으로 듣고 말하는 GPT-4o 기반 앱을 구축할 수 있게 되었습니다.

    글로벌 기업들의 선택: xAI, Tesla, Salesforce

    LiveKit의 고객 목록은 AI 및 테크 산업의 핵심 기업들로 구성되어 있습니다. OpenAI 외에도 xAI, Salesforce, Tesla, Meta, Spotify 등이 LiveKit의 인프라를 활용하고 있습니다. 특히 주목할 만한 것은 2025년 12월 발표된 xAI와의 파트너십입니다.

    매일 전 세계 수백만 명의 사람들이 xAI의 퍼스트파티 앱과 Tesla 차량에서 Grok과 대화합니다. Grok에 생명을 불어넣는 기본 모델은 인간 음성의 표현 범위를 이해하고, 웃고, 속삭이고, 한숨을 쉴 수 있는 표현력 있는 응답을 생성할 수 있는 음성-음성(voice-to-voice) 모델입니다. LiveKit과 xAI의 파트너십을 통해 개발자들은 이제 Grok 음성 경험을 구동하는 것과 동일한 기술 스택을 자신들의 음성 AI 애플리케이션에서 활용할 수 있게 되었습니다.

    [이미지 3번 위치]

    Grok Voice Agent API는 700밀리초 이내의 빠른 응답 시간을 제공하며, 단일 모델 내에서 음성 입력 처리와 출력 생성을 모두 수행합니다. LiveKit Agents의 Python 플러그인으로 제공되어 한 줄의 코드만으로 Grok 음성 모드와 동일한 표현력과 속도를 가진 맞춤형 음성 에이전트를 생성할 수 있습니다. Grok은 이미 Tesla와 Starlink 지원 전화를 통해 대규모로 고객과 상호작용하고 있습니다.

    LiveKit Agents: 음성 AI 개발의 새로운 표준

    LiveKit Agents 프레임워크는 실시간 음성 AI의 핵심 과제를 해결하기 위해 설계되었습니다. STT-LLM-TTS 파이프라인을 통한 오디오 스트리밍, 신뢰할 수 있는 턴 감지, 중단 처리, LLM 오케스트레이션 등을 위한 구성 요소를 포함하고 있습니다. 대부분의 주요 AI 제공업체를 위한 플러그인을 지원하며, 지속적으로 더 많은 플러그인이 추가되고 있습니다.

    LiveKit Agents의 주요 기능은 다음과 같습니다:

    기능 설명
    음성, 비디오, 텍스트 실시간 입력을 처리하고 모든 모달리티로 출력을 생성하는 에이전트 구축
    도구 사용 모든 LLM과 호환되는 도구 정의 및 프론트엔드로 도구 호출 전달 가능
    멀티 에이전트 핸드오프 복잡한 워크플로우를 더 단순한 작업으로 분해
    광범위한 통합 LLM, STT, TTS 등 거의 모든 AI 제공업체와 통합
    최첨단 턴 감지 자연스러운 대화 흐름을 위한 맞춤형 턴 감지 모델 사용

    LiveKit은 두 가지 유형의 음성 에이전트를 제공합니다. MultimodalAgent는 OpenAI의 멀티모달 모델과 실시간 API를 사용하여 사용자 오디오를 직접 처리하고 오디오 응답을 생성합니다. VoicePipelineAgent는 STT, LLM, TTS 모델의 파이프라인을 사용하여 LLM이 반환한 텍스트를 애플리케이션이 수정할 수 있도록 하여 대화 흐름에 대한 더 큰 제어권을 제공합니다.

    음성 기반 컴퓨팅 시대를 향한 비전

    LiveKit CEO Russ d'Sa는 음성이 "우리가 가진 가장 자연스러운 인터페이스"라고 강조합니다. 그는 2026년이 음성 AI가 전 세계적으로 광범위하게 배포될 해가 될 것으로 전망합니다. LiveKit은 이러한 비전을 실현하기 위해 네 가지 핵심 영역의 기술 스택을 구축하고 있습니다:

    영역 내용
    Build 클라이언트 SDK 및 LiveKit Agents 프레임워크 제공
    Test 통계적 테스트 및 에이전트 시뮬레이션 지원
    Deploy 서버리스 에이전트 및 글로벌 데이터센터 네트워크 구축
    Observe Agent Observability 플랫폼으로 실시간 모니터링

    이번 시리즈 C 투자금은 새로운 컴퓨팅, 스토리지 및 네트워크 서비스를 구축하고, 음성 기반 및 컴퓨터 비전 기반 애플리케이션을 위한 인프라를 확장하는 데 사용될 예정입니다.

    2026년 음성 AI 시장 전망

    LiveKit의 성장은 더 넓은 음성 AI 시장의 폭발적인 성장과 궤를 같이합니다. 음성 AI 시장은 2024년 31억 4천만 달러에서 2034년 475억 달러로 성장할 것으로 전망되며, 이는 연평균 34.8%의 성장률을 나타냅니다. 글로벌 AI 음성 생성기 시장 규모는 2023년 35억 달러에서 2030년 217억 5천만 달러에 이를 것으로 예상되며, 29.6%의 연평균 성장률로 성장할 것입니다.

    2026년 음성 AI의 주요 트렌드는 다음과 같습니다:

    에이전틱 음성 AI의 부상: 2026년까지 고객 서비스 상호작용의 10분의 1이 에이전틱 음성 AI에 의해 완전히 자동화될 것으로 예상됩니다. 이는 단순한 챗봇이 아니라 맥락을 이해하고, 다단계 워크플로우를 계획하며, 복잡한 작업을 자율적으로 수행할 수 있는 정교한 시스템입니다. 23%의 조직이 이미 에이전틱 AI 시스템을 확장하고 있으며, 39%가 적극적으로 실험 중입니다.

    감정 지능의 통합: 감정 AI 시장은 2020년 195억 달러에서 2026년 371억 달러로 성장했습니다. 음성 에이전트는 이제 미묘한 톤, 긴급성 수준, 불만을 인식하여 더 공감적인 응답을 가능하게 하고 에스컬레이션을 25% 줄입니다.

    산업별 채택 확대: 북미가 현재 40.2%의 점유율로 글로벌 시장을 선도하고 있습니다. 은행, 금융 서비스 및 보험(BFSI) 부문이 32.9%의 시장 점유율로 가장 큰 산업 수직을 차지하며, 헬스케어, 소매, 통신이 그 뒤를 잇고 있습니다. 음성 AI는 예약 일정 관리, 증상 확인, 환자 후속 조치 자동화를 통해 2026년까지 미국 의료 경제에 연간 1,500억 달러를 절약할 것으로 예상됩니다.

    투자 히스토리와 성장 궤적

    LiveKit은 이번 시리즈 C 이전에 3개 라운드에 걸쳐 8,300만 달러를 조달했으며, 이로써 현재까지 조달한 총 자금은 1억 8,300만 달러에 달합니다. 2025년 4월 시리즈 B 투자 당시 기업가치는 3억 4,500만 달러였으며, 불과 10개월 만에 기업가치가 약 3배 증가한 것입니다.

    라운드 시기 투자금 기업가치
    시리즈 B 2025년 4월 4,500만 달러 3억 4,500만 달러
    시리즈 C 2026년 1월 1억 달러 10억 달러

    2025년 4월 시리즈 B 발표 이후, 음성 AI는 금융, 헬스케어, 소매, 고객 지원, 교육, 로보틱스 분야에서 급속도로 확산되었습니다. 스타트업들은 청구 처리, 학생 튜터링, 환자 분류, 고객 지원, 채용 면접 등의 작업을 수행할 수 있는 음성 에이전트를 구축하기 시작했습니다. 이제 대기업들도 워크플로우 자동화, 고객 경험 개선, 새로운 수익 창출을 위한 음성 에이전트를 평가하고 구축하고 있습니다.

    결론: 음성 AI 인프라의 새로운 장

    LiveKit의 10억 달러 기업가치 달성은 단순한 재무적 성과를 넘어, 음성 기반 컴퓨팅 시대의 도래를 알리는 신호탄입니다. 2021년 팬데믹 시기에 오픈소스 프로젝트로 시작한 이 회사는 이제 OpenAI, xAI, Tesla, Salesforce 등 세계 최고의 테크 기업들이 신뢰하는 핵심 인프라 파트너로 성장했습니다.

    CEO Russ d'Sa가 말했듯이, 음성은 인간이 가진 가장 자연스러운 인터페이스입니다. 키보드와 마우스, 터치스크린을 넘어 음성이 컴퓨팅의 주요 인터페이스가 되는 시대가 다가오고 있습니다. LiveKit은 이러한 변화의 중심에서 개발자들이 음성 AI 애플리케이션을 쉽게 구축할 수 있는 인프라를 제공하며, 음성 기반 컴퓨팅 시대를 앞당기고 있습니다. 2026년은 음성 AI가 실험 단계를 넘어 본격적인 대중화 단계로 진입하는 원년이 될 것으로 전망됩니다.

    카테고리: AI 뉴스

    반응형
Designed by Tistory.