티로를 만드는 사람들: 김상철 공동 창업자

티로를 만드는 사람들의 두번째 이야기
Mark's avatar
Jun 02, 2025
티로를 만드는 사람들: 김상철 공동 창업자

들어가며

티로(Tiro)는 서울대 학생들이 모인 작은 창업팀으로부터 시작되었습니다. 오늘은 서울대학교 컴퓨터공학부를 졸업하고 현재 7년차 개발자에 들어선 김상철(여울)님에 대한 인터뷰를 통해 ‘티로를 만드는 사람들’의 첫 번째 이야기를 들어보겠습니다.

자기소개

notion image

Q. 안녕하세요, 여울님! 간단한 자기소개 부탁드립니다.

안녕하세요, 저는 서울대학교 컴퓨터공학부 17학번으로, 2025년 2월에 졸업한 여울이라고 합니다. 2019년 병역특례제도를 시작으로 회사 두 군데를 거쳐 현재 7년차 경력을 보유하고 있습니다. 첫 직장은 가상화폐 거래소 프로비트(ProBit)였고, 이후 글로벌 에듀테크 기업 콴다(Qanda)에서 엔지니어로 4년간 근무했습니다.
현재는 더 플레이토(The Plato)의 공동창업자로, 여울이라는 이름으로 활동하고 있습니다.

Q. 현재 티로에서 어떤 일을 하고 계신가요?

티로의 공동창업자 3명은 퍼즐처럼 맞아떨어지는 강점들이 있어요.
저의 강점은 일단 1) 제품에 하나 있고, 2) 사람에 또 하나 있는 것 같습니다. 1) 제품의 측면에서는 티로의 기술을 담당하며 기술적인 어려움을 책임지고 해결하고 있습니다. 2) 사람 쪽으로는 팀 내에서 헬스 체크를 한다거나 팀원들이 ‘으싸으쌰’ 할 수 있도록 하는 것을 되게 좋아하고, 실제로 팀 내에서 그런 역할을 맡고 있어요.

창업계기

Q. 가상화폐 거래소, 글로벌 에듀테크 기업을 거쳐오셨는데, 비교적 생소한 STT 서비스인 티로를 창업하게 된 계기가 궁금합니다.

기술보다는 사람이 먼저였던 것 같아요.
3, 4년전만 해도 STT(Speach-To-Text)를 가지고 제품을 만들려는 시도가 그렇게 많지 않았어요. 비교적 신생 분야여서, 기술적인 것보다는 그냥 공동창업자들과 같이 미래에 대해 이야기하고, 각자 세우고 싶은 기업에 대해 이야기를 하다가 이 팀이 마음에 들었습니다. 그래서 ‘창업을 한다면 이들과 해야겠다’는 생각을 먼저 했어요. 그러다가 저도 음성 AI를 관심있게 보고 있었는데, 다른 공동창업자가 이 아이템으로 제안해줘서 ‘재밌겠네’하고 시작한 게 큰 것 같아요.

Q. 기존 STT 기술을 사용하면서 느꼈던 페인 포인트가 있었나요?

기술과 제품의 차이라고 생각해요. 클로바노트를 쓸 때는 ‘기록해준다’는 안정감이 있었어요. 기술적 안정감. 그런데 (기록된 내용을) 한 번도 다시 본 적이 없었어요. 그렇지만 ‘언젠가 보겠지’ 하는 마음으로 썼던 것 같아요.
그런데 사실 제가 되게 많은 말을 하고, 그 말을 정리해서 글을 쓰기도 하고, 또 수업이라든지 유튜브 영상이라든지 수많은 음성 언어들을 듣는데 그걸 저장하고, 기록하고, 관리하는데 좋은 ‘제품’은 없는 거예요. 그 점에 문제의식을 느껴 티로를 만들기 시작했습니다. 그래서 티로라는 제품을 만들 때 클로바노트의 경쟁자라고 생각한 적은 없었던 것 같아요. 클로바노트는 ‘기술’이고 저희는 그 기술을 이용한 ‘제품’이니까, 완전 다른 거 아닌가 하는 생각을 했었어요.

개발자가 말하는 티로(Tiro)

티로 개발시 (기술적으로) 어려운 점이 있었다면?

가장 어려웠던 것 중에 하나는 실시간성이었습니다.
조금 쉽게 설명을 해보면, 일반적인 앱 서비스들은 다들 비동기적이에요. 서버에 하나의 요청을 보내고, 그 요청에 대해서만 응답을 받고, 또 다른 요청을 보내고, 또 그 요청에 대해서 응답을 받는 식인데, 저희는 실시간성이고 굉장히 타임 스코프(time scope)가 짧거든요. 10 밀리세컨드(=0.01초)마다 서버에 요청을 보내야 해서 연결이 복잡하게 얽혀있어요.
저희 유저가 1만 명, 2만 명 이러면 요청이 많으니까 물리적으로 여러 대의 컴퓨터가 있어야 해요.
그런데 옛날에는 기본적인 서비스들은 1번 컴퓨터에 요청해서 1번에서 받고, 3번 컴퓨터에 요청해서 3번에서 받고 이러니까 상관없었는데, 실시간성을 구현하려면 항상 어떤 서버에 연결이 되어 있어야 해요. 예컨대 저희는 1번 서버하고만 연결이 되어 있는 거죠. 그러다보니 1번 서버가 고장나는 등의 이슈가 있으면, 유저 입장에서는 갑자기 연결이 끊어져서 더 이상 기록이 안 되는 문제가 발생하죠. 그런 문제는 사실 재현하기도 어렵고 구현하기도 어려워요. 그런 어려움이 조금 있었습니다.

실시간 서비스의 기술적 문제는 어떻게 해결하고 있나요?

현재 여러 개의 서버가 돌아가는데, 그 앞에 캐시 서버를 하나 두었어요. 뒤에 서버가 몇 대가 있든, 서버가 내려가든 올라가든 크게 상관이 없도록 중간 매개체를 둔 거죠.
수많은 유저들이 중간 매개체를 통해서 뒤의 서버와 연결되니까, 뒤의 서버가 조금 바뀌어도 약간 느슨하게 구현이 되어 있어요.

다른 서비스와 차별화되는, 티로라는 제품만의 강점이 있다면?

제가 생각했을 때는 저희 팀이 제일 똑똑한 것 같아요. 저는 이런 말을 하는 걸 되게 안 좋아하는 사람인데도.
어떤 새로운 기술이 나왔다고 했을 때, 보통 그날 테스트를 하고 괜찮다 싶으면 그날 바꿔요. 그래서 새로운 기술을 수용하고, 적용하고, 강도 높게 제품에 반영하는 것을 저희가 제일 잘 하지 않나 싶습니다.
실제로 이게 어떻게 증거로 나타나냐면, 티로를 쓰는 유저들이 다른 걸 안 쓰고 티로를 쓰는 이유가 “품질” 때문이에요.
예컨대 저희가 A라는 기능을 출시해도, 모든 유저가 A라는 기능을 인지하는 것은 아니거든요. 그런데 그걸 인지하지 않는 유저들’도’ 티로를 되게 좋아해요. 그럼 저희는 ‘A를 출시해서 유저에게 더 좋아졌어’라고 말하기가 어렵죠. 왜 여전히 티로를 좋아하나 보면 그냥 거의 ‘품질’이에요.
그리고 저희는 이 STT 시장을 1년 전부터 들어와서 계속 노하우를 쌓고 있다 보니까, 거기서 생기는 경험들도 무시하기 어려워요. 단순히 STT를 구현해서 어플리케이션을 낸다는 것보다, 유저들이 음성을 기록하는 데 있어서 ‘어떤 부분에서 미묘한 품질 저하를 느끼는지’ 이런 것들을 알고 있다보니 거기서 오는 강점들이 있는 것 같아요.

유저들의 목소리를 경청하고, 유저들의 반응에도 민감하게 반응하는 게 티로의 강점인 것 같아요.

그렇죠. 근본적으로 이 시장에서 해자(moat, 진입장벽 내지는 경쟁자로부터의 방어전략)라는 걸 구축하기가 좀 어려운 것 같아요. 예컨대 코카콜라같은 회사는 너무 해자가 많잖아요. 고유한 레시피, 전 세계에 뻗어있는 유통망, 브랜드 파워 등등…
그런데 이 STT 시장은 이제 막 열린 시장이다보니까 기술적으로 차이점을 가져오기에도 한계가 있어요. 다만 저희가 가진 기술력이 상대방보다 얼마 정도 앞서 있다, 시간을 번 것 뿐이고 언제든 금방 따라잡힐 수 있는 거죠. 그래서 지금부터 그 경쟁력을 구축하는 단계로 가야 한다고 생각하고, 그 이후의 강점들은 품질이나 제품의 완성도를 넘어서서 계속 브랜딩(branding)을 해야 하는 것 같아요. 그래서 유저들에게 민감하게 반응하는 것이 저희의 강점 중 하나가 되기를 기대하고 있어요.

유저의 목소리와 팀의 방향성이 충돌하는 적도 있었나요?

네, 있었죠. 예를 들면 유저들은 보통 현상을 이야기하는 경우가 많아요.
“당장 A가 안 되니까 A를 해결해달라”. 그런데 저희 팀은 저희가 가진 제품의 내부적인 방향성도 있을 거고, 또 어떤 유저는 “A를 없애라”고 하는데 다른 유저는 “A를 유지해달라”고 하는 상반된 요구도 고려해야 하죠. 그래서 일단 고객 CS가 들어왔을 때는 최대한 친절하게 답변을 드리되, 버그처럼 확실하게 답변드릴 수 있는 건 “버그다, 고쳐야 한다”고 말씀드려요. 그러면 보통 그날 패치가 나가고요.
애매한 부분들은 맥락을 충분히 설명드리는 것 같아요. 유저에게 ‘내부적으로 논의할 만한 것 같다.’ 혹은 ‘이전에 논의했었는데 이러이러한 것 때문에 (해당 기능은) 지원하지 않고 있다’ 이렇게 얘기를 하는 것 같아요.
그래서 저희는 고객의 피드백을 무작정 수용하지는 않지만, 그러한 피드백은 저희에게 되게 중요한 정보로 작용합니다. 제품의 심각한 결함을 지적하는 피드백은 바로 고치되, 어떤 부분이 불편하다 혹은 인지를 못 하고 있다고 하면 조금 누적되기를 기다릴 필요도 있는 것 같고요. 애초에 더 큰 차원에서, 저희 팀이 가려고 하는 제품 방향이 아니면 가끔은 넘어가야 할 필요도 있는 것 같아요.

티로는 다양한 환경, 예컨대 시끄러운 환경이나 두 세명 이상의 화자가 말하는 상황에서도 상당히 정확하게 인식하는데, 비결이 궁금합니다.

회사의 보안상 이슈로 정확하게 공유드릴 수는 없지만, 전처리와 후처리를 많이 합니다. 음성 레벨에서 당연히 전처리와 후처리를 하기도 하고, 그 결과물에 한번 더 전체 후처리를 해요. 특히 전처리 과정에서는 저희가 따로 개발한 노이즈 제거, 에코 캔슬레이션 등을 이용해요.
그리고 유저들이 입력한 맥락을 이용해서, STT가 애매하게 읽어낸 것들을 ‘이런 맥락이면 유저가 이렇게 말했겠다’ 하고 텍스트 차원에서 처리하고 있어요. 이게 노하우인게, 저희가 다양한 환경에서 직접 많이 써봤거든요. 케이팝 틀고 회의하고.

역시 직접 사용해봐야 좋은 서비스가 나오는 군요. 그럼 티로의 특장점인 ‘대화의 맥락을 인식한다’는 것에 대해 구체적으로 설명해주실 수 있나요?

제가 인공지능이라는 단어를 그렇게 좋아하지는 않지만, 제가 생각하는 ‘지능’은 어떤 대상이 자기가 목표로 하는 행위를 달성하기 위해 무언가를 활용할 수 있는 능력을 의미하거든요.
인공지능과 관련해서, 예를 들어서 변호사와의 미팅 상황에서 우리가 원하는 것은 ‘이 대화는 변호사와 대화하는 것이니 법률 관련 얘기 나올 거니까 알아서 적어’ 잖아요. 이처럼 어떤 목적들을 입력했을 때, 티로가 그 목적을 이해하고 그에 맞게 내용들을 가공하는 것을 의미하는 것 같아요. 그래서 지적인 시스템에 있어서는 맥락을 이해하는 것이 중요한 것 같습니다.
정리하면, AI라는, LLM(Large Language Models, 대규모 언어모델)이라는 도구를 사용해서 우리가 원하는 결과 혹은 성능 향상을 얻어내기 위해서는 1) 이들의 스케일을 엄청 키우거나, 2) 맥락을 잘 입력하는 두 가지 방식으로 해결할 수 있는데, 사실 전자는 저희가 강점이 있는 분야는 아니예요. 그래서 후자, 즉 맥락을 어떻게 입력하게 할 것인가가 사실 이 시스템의 완성도를 높이는데 가장 중요하다고 판단했어요.
그런데 지금 글로벌에서 좀 앞서나가는 서비스들은 다 ‘맥락’을 활용하고 있어요. 저희는 저희가 가장 빠르다고 생각하지 않고, ‘어떻게 하면 맥락을 조금 더 쉽게 입력하도록 하지?’, 예를 들어서 ‘나 지금 변호사와 대화하고 있어’라고 하지 않아도 연락처의 OO 변호사님과 대화하고 있으면, 혹은 어떤 캘린더 미팅의 노트를 생성했는데 그 캘린더에 대략적인 아젠다가 적혀있었으면 그 아젠다를 집어넣어서 티로가 ‘이런 대화겠구나’라고 판단하게 만드는 것. 그것이 저희의 강점 중의 하나죠.

대화 맥락 입력 시의 팁이 있을까요?

notion image
사실 맥락은 엄청 단순하게만 넣어도 잘 작동합니다. 예를 들면 아무것도 입력하지 않는 것보다 ‘나 지금 변호사와 대화하고 있어, 지금 대화는 이혼 소송에 관련된 내용이야’와 같은 내용만 넣어도, 저희가 사용하는 모델 프로바이더들이 매우 폭넓은 intelligence를 갖고 있기 때문에 그 맥락을 충분히 반영해요. 그래서 이 대화 상황이 어떤 상황인지를 넣는 것 자체가 매우 중요한 것 같아요.
그 다음으로는 고유명사를 넣어주는 것이 되게 좋은 것 같아요. 예컨대 사람 이름 혹은 회사 이름. 저희도 처음에 성능 강화할 때 ‘티로(Tiro)’ 이름 엄청 많이 넣었거든요.
그래서 상황과 고유명사 정도만 잘 넣어줘도 성능이 충분히 좋아지지 않나 싶습니다.

음성 파일 업로드 기능은 어떤 계기로 추가하게 되었나요?

notion image
예를 들어 미팅이 끝나고 나서 “아, 티로 켰어야 했는데!” 하는 경우가 있을 수 있잖아요. 그게 아니더라도 과거에는 (티로가 없어서) 단순히 음성 파일만 쌓아놨거나, 일일이 들으면서 했는데 이제는 그냥 티로에 넣고 싶은 경우도 있죠. 이런 유저들이 많았어요. 어느 정도였냐면, 전체 고객 문의 중 15% 정도? 그래서 이거는 보안 문제를 해결하고 지원하는 것이 맞다고 판단해서 지원하게 되었어요.
이 부분은 철저히 고객들이 정말 원했고, 저희 입장에서 실시간성은 조금 떨어질 수 있겠지만, 애초에 고객 입장에서는 실시간 대화가 아닌 경우니까. 그리고 저희는 ‘대화’를 다루는 서비스인데, 녹음된 음성파일도 저희가 다뤄야 하는 ‘대화’의 범주에 속하니까 지원해야 한다고 판단하고 결정했던 것 같아요.

제품 개발할 때의 철학이 있다면?

저는 개인적으로 예술가적 성향이 강하다고 느껴요. 예를 들어 ‘티로가 어때야 할까?’라고 하면, ‘고객들이 무엇을 원하지?’ 보다는 ‘내가 생각하는 음성을 기록하는 서비스는 어떻게 생겼지?’가 먼저 떠오르는 사람이에요.
그런데 최근 알베르 카뮈의 노벨문학상 수상소감을 어쩌다 보게 되었는데, 이런 내용이 있었어요.
“자신이 남들과 다르다고 고집하는 것만으로는 예술도, 독창성도 유지할 수 없다.”
딱 이게 제가 지향하는 ‘제품을 만드는 과정’인 것 같아요.
뭐냐면, 제가 만들고 싶은 아름다운 어떤 모습이 있는 거죠. 그게 꼭 티로일 필요는 없지만, 저는 지금 티로를 만들고 있고, 그렇기 때문에 이 제품(티로)을 제가 생각하는 ‘아름다움’의 경지에 도달하게 만들고 싶은 것 같아요. 그런데 한편으로는 제 생각에 아름답다고 해서 그것이 제가 속한 공동체에게 이득을 주지 않는다면, 그건 또 제가 원하는 방향은 아닌 거죠. 그 사이에서 끝없는 줄다리기를 하는 과정인 것 같아요.
시지푸스 이야기를 아시나요? 그런 느낌인 것 같아요. 열심히 줄다리기를 해서 딱 균형을 맞추더라도, ‘아름다움’의 정의도 바뀌고, 제 주변 사람들도 바뀌는 거죠. 그렇지만 그에 굴하지 않고 다시 균형을 맞추기 위해 노력하는 그 상태를 좋아하는 것 같아요. 그것이 지금 제가 티로를 만드는 마음가짐인 것 같기도 하고요.
정리하자면, 지금은 ‘아름다운 제품을 만들자. 그리고 그 아름다움을 향유하는 대상은 내 주변 공동체여야 한다.’ 그 정도 생각으로 제품을 만들고 있습니다.
 
Share article
Subscribe to our newsletter.

티로 블로그