대기업 S사 퇴사 후, 2년 동안 '자연어 처리' 책을 집필하고 있는 이유?

조회수 2021. 9. 15. 19:56 수정
번역beta Translated by kaka i
번역중 Now in translation
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 다양한 분야의 재밌고 유익한 콘텐츠를 카카오 플랫폼 곳곳에서 발견하고, 공감하고, 공유해보세요.

위키독스 Best 3위 『딥러닝을 이용한 자연어 처리 입문』 저자의 이야기

자연어 처리란?
인간의 언어를 컴퓨터가 인식하여 이를 처리할 수 있도록 하는 기술이며, 최종 목표는 컴퓨터가 사람의 언어를 이해하여 다양한 문제를 수행할 수 있도록 하는 것입니다.

자연어 처리 시장이 성장하고 있지만 아직 자연어 처리 관련 도서는 국내에 단 4-5권 밖에 없는데요.
그중 첫 번째로 집필된 도서이죠. 자연어 처리를 아신다고 하면 누구나 들어봤을 도서! 위키독스에서 Best 3위에 랭크되며,  1,170 추천수를 받은 『딥러닝을 이용한 자연어 처리 입문』인데요.

  이 베스트셀러의 저자이자 러닝스푼즈의 강사, 자연어 처리의 선구자유원준저자님의 이야기 함께하세요. 😉

자연어 처리 책을 쓰기 시작한 이유

출처: 위키독스 [딥 러닝을 이용한 자연어 처리 입문]

자연어 처리가 지금에는 굉장히 성능이 좋아졌지만 제가 갈 길을 선택하던 한 3년 전에는 자연어 처리가 비전 분야에 비해서 성능이 많이 밀려있는 상태였습니다.
 
그리곤 자연어 처리를 막상 공부하려고 보니까 일단 한국어로 된 자료가 거의 없었고, 영어로 된 자료도 깔끔하게 정리된 자료보다는 거의 논문을 보면서 공부해야 하는 수준이었어요. 그냥 주먹구구식이었죠.  
뭔가 구체적인 계기가 필요할 것 같더라고요. 그래서 일단 책을 써야겠다고 생각했습니다. 남들한테 알려주는 형식으로 글을 쓰게 되면 제가 제대로 알 때까지 자료를 계속 찾아볼 수밖에 없거든요. 그래서 바로 제 스스로 채찍질을 하기 위해서 위키독스라는 곳에다 일단 제목부터 박고 시작했어요. 『딥러닝을 이용한 자연어 처리 입문』이라고 말이죠.
블로그가 아닌 온라인 책을 제작·공유하는 플랫폼(위키독스)을 활용하여 지속적으로 내용을 수정해가며 책을 쓰고 있어요. 계속 수정하다 보니 갓 쓴 글보다 몇 달 전에 쓴 글이 완성도가 더 높더라고요. 그렇게 책을 시작한 게 벌써 2년이 다 되어가네요. 책을 쓰며 논문, 스터디, 프로젝트 등 하는 게 점점 많아지다 보니 더 늦어진 부분도 있는 것 같아요.

제가 처음에 책을 쓰기 시작할 땐 출판된 책이 한 권도 없었는데, 저보다 늦게 시작한 책들이 벌써 3, 4권이 나왔더라고요. 그래서 저도 이번엔 책을 마무리해야겠다 싶어서 올해 말 완성을 목표로 하고 있습니다.

책을 쓰면서 강의까지?

출처: 러닝스푼즈 강의 현장

책과 서로 상호보완적인 관계가 될 것 같아 강의를 시작했습니다.  강의를 하다 보면 수강생들이 질문을 하는데요. 가끔씩 굉장히 날카로운 질문이 들어올 때가 있어요. 일하면서는 생각지도 못하는 질문이어서 그 질문에 대한 답변을 준비하다 보면 저도 공부가 되고, 또 그게 책의 내용으로 들어기도 하고요.
제가 가진 지식도 정리하는 것과 더불어 수강생들이 주는 질문에 의해 책이 보완될 수도 있기 때문에 상호보완적인 관계로 책을 마무리하는 시점에 강의를 진행하고 있습니다.

책 집필, 강의, 프로젝트, 논문, 스터디까지...
쉬는 시간은 있으신가요?

최근 한 2년 동안은 정말로 쉬는 날이 거의 없었던 것 같아요. 책을 쓰는 와중에도 공부는 되지만, 개발 능력이 더 올라가진 않는 것 같아 여기저기 프로젝트도 많이 하기 시작했거든요. 프로젝트, 책, 논문, 스터디 등 여기저기 발을 담가 놓은 곳이 많다 보니까 쉬지도 않고 달렸죠.  엄청나게 피곤하거나 그러진 않은 것 같아요. 이제는 이런 생활이 굉장히 익숙해져서 아무것도 안 하고 며칠간 쉬면 제가 오히려 초조해지더라고요. 뒤쳐지고 있다는 그런 생각?
저만의 팁을 드리자면 뒤쳐지고 있다고 생각될 때 가장 좋은 것은 커뮤니티를 괜히 들어가 보는 거예요. 들어가 보면 거의 매일 좋은 글을 올리시는 분들이 많거든요. ‘내가 이걸 개발했는데 봐주세요’라고 글을 올리시는 분들, 질문과 답변을 주고받는 많은 분들을 보면 ‘이 사람들은 이때 공부하고 있었는데 내가 놀았네?’ 이런 생각을 가지면서 다시 마음을 다잡게 되죠.  
여담이지만 어떤 때는 제가 유튜브를 자꾸 딴 걸 보게 되니까 일부러 유튜브 앱을 종료하기 전에 AI 영상을 많이 클릭 해 놓거든요. 그러면 추천 영상에 계속 관련 영상이 뜨기 때문에 이런 식으로라도 계속 머릿속에 뭔가 넣으려고 하고 있어요.

마지막으로, 앞으로의 목표가 있다면?

한국어 자연어 처리는 어려워요. 자연어 처리하시는 분들은 다 공감하실 텐데 일단 영어보다 까다롭고요. 영어 모델을 그대로 가져온다고 바로 쓸 수 있는 게 아니라 한국어를 위한 전처리도 해야 하기 때문에 그 부분이 까다로워요. 최신 모델들은 보통 실리콘밸리의 유명한 기업들에서 나오니까 논문도 영어 논문이고요. 데이터도 영어 같은 경우는 공개가 된 게 많은데 한국어는 데이터가 공개된 게 사실 그렇게 많지는 않아요.
제일 좋은 것은 큰 기업들이나 자연어 처리하는 기업에서 꾸준히 자신들의 노하우를 공개해주는 게 중요하긴 하죠. 그래도 최근에는 그런 사례들도 많이 늘어난 것 같아요. LG CNS가 코쿼드 같은 대회를 열어준 것도 그런 사례인 것 같고, 그런 움직임이 계속 있어야 한국어 자연어 처리를 할 줄 아는 기업들이 좀 더 많아질 것 같아요. 개인적으로 갖고 있는 한국 자연어 처리 시장에서의 바람입니다.
제가 하고자 하는 목표는 지금 현재까지 나온 최신 모델들을 한국어에 맞게 튜닝해서 공개한다거나, 가벼운 모델이더라도 사람들이 성능을 높게 얻을 수 있는 모델을 만들어보고 싶어요. 저만의 생각은 아니고 자연어 처리를 하시는 분들이라면 ‘다른 사람들이 쉽게 쓸 수 있는 인정받는 모델을 만들고 싶다.’ 이런 생각들은 다 가지고 있을 거예요. 한국어 자연어 처리를 위한다면 더욱더 말이죠.


스스로의 지식을 정리하고 보다 많은 이들과 공유하고자 책을 쓰는 유원준 저자님!
책을 쓰면서도 강의, 프로젝트, 논문, 스터디 등 다양한 활동을 겸하며 끊임없는 학습으로 자기 개발하는 모습이 정말 대단합니다.
앞으로 자연어 처리 개발자, 강사 등 유원준 저자님의 다양한 활동을 러닝스푼즈가 응원하겠습니다. 😊

이 콘텐츠에 대해 어떻게 생각하시나요?