통합 검색어 입력폼

소셜미디어의 가짜 계정이 선거에 미치는 영향

조회수 2018. 11. 8. 15:36 수정
번역beta Translated by kaka i
번역중 Now in translation
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 다양한 분야의 재밌고 유익한 콘텐츠를 카카오 플랫폼 곳곳에서 발견하고, 공감하고, 공유해보세요.

소셜미디어에는 수많은 봇 계정이 존재한다.

2016년 미국 대통령 선거 전 트위터에서 정치적 활동을 하는 ‘소셜미디어 봇’*의 3분의 2는 도널드 트럼프를 지지했습니다. 하지만 트럼프를 지지하는 다수의 봇이 힐러리 클린턴을 지지하는 적은 수의 봇보다 사람들의 의견을 바꾸는데 효율적이지는 않았습니다.


*'봇'은 트위터 등 소셜미디어에서 프로그램을 통해 자동으로 글을 올리거나 이용자가 가상의 인물인 것처럼 가장해 운영하는 계정을 말한다.

출처: ⓒ미주한국일보

저의 최근 연구는 매우 활동적인 적은 수의 봇이 사람들의 정치적 의견을 바꿀 수 있다는 걸 보여줍니다. 중요한 건 봇의 숫자가 아니라 각 봇이 올린 트윗의 숫자입니다.


저는 주로 군사나 국가 안보가 소셜미디어와 어떤 관련성이 있는지를 연구합니다. 2018년 중간 선거에 봇이 어떤 영향을 미칠지 흥미를 느꼈죠. 때문에 2016년 선거에서 봇이 어떤 역할을 했는지 조사하기 시작했습니다. 조사에 대한 다양한 이야기가 나왔지만, 기본적인 사실은 봇을 이용한 정보전에 성공했다면 유권자의 의견이 변화했을 것이라는 점입니다.


저는 사람의 정치적 견해를 바꾸는데 봇이 얼마큼 책임이 있는지 살피고자 했습니다. 이를 위해 소셜미디어 봇을 구분해내고 그들의 활동을 평가하는 방법을 찾아야만 했죠. 그후 소셜미디어 사용자의 의견을 측정했습니다. 봇이 존재하지 않았다면 사람들의 의견이 어땠을지 추정할 방법 역시 찾아야 했습니다.

출처: ⓒSBS

트위터 사용자와 봇을 구분하기

연구의 규모를 줄이기 위해 저와 학생들은 선거와 관련된 한 사건, 클린턴과 트럼프의 두 번째 토론에 대한 트위터 담론에 집중했습니다. 우리는 토론과 관련된 키워드 및 해시태그를 포함한 트윗 230만 개를 모았습니다.


다음으로 해당 트윗을 올린 78,000명의 트위터 사용자 리스트를 만들고 사용자마다 팔로잉 네트워크를 구성했죠. 그 중 봇을 구분해내기 위한 작업을 했습니다. 봇의 경우 사람들의 트윗을 자주 리트윗하지만, 자신의 트윗은 자주 리트윗되지 않습니다. 우리는 이 알고리즘을 사용했고 396개의 봇 계정을 발견했습니다. 활동적인 트위터 사용자의 1% 미만인 숫자죠.


봇 계정 중 10%의 계정들은 서로를 팔로우하고 있었습니다. 기분 좋은 사실이었죠. 서로 연결돼있지 않은 적은 수의 봇들이 사람들의 의견에 큰 영향을 만들어내는 것이 가능하지 않다고 생각했기 때문입니다.

출처: ⓒ셔터스톡

가까이서 관찰한 결과

그 뒤 우리는 사람들의 의견을 측정하기 시작했습니다. 본 연구는 뉴럴 네트워크라는 머신 러닝 알고리즘을 이용해 각 트윗의 콘텐츠를 평가하고 각 트윗이 얼마나 클린턴이나 트럼프를 지지하는지의 정도를 결정했죠. 개인의 의견은 그들이 올린 각 트윗의 지지 정도의 평균으로 계산됐습니다.


(봇이 아닌) 트위터 사용자가 클린턴이나 트럼프를 얼마나 강하게 지지하는지를 나타내는 점수를 부여하는 과정에서 우리는 봇이 사람들의 의견을 얼마나 많이 변화시켰는지를 측정하는 데 어려움을 겪었습니다. 사람들의 의견이 봇이 존재하지 않았다면 어땠을지 계산해내는 것이었죠.

출처: ⓒ게티이미지

다행히도 1970년대로 거슬러 올라가 소셜네트워크 내 사람들이 어떻게 연결돼 있는지를 통해 감정을 측정해내는 모델을 발견했습니다. 이 네트워크 기반 모델에서 개인의 의견은 사람들이 어떻게 연결돼 있는지와 일치합니다.


해당 모델을 트위터에 맞게 약간 수정한 뒤 우리는 이를 통해 사람들이 트위터에서 – 트윗 콘텐츠 자체가 아닌 – 누구를 팔로우하고 있는지 분석해 그들의 의견을 계산해냈습니다. 우리는 네트워크 모델을 통해 계산해낸 사람들의 의견이 그들이 올린 트윗의 콘텐츠에서 측정된 의견과 일치한다는 것을 발견했습니다.

봇이 없었다면?

위 결과는 트위터의 팔로워 네트워크 구조가 사람들의 의견을 정확하게 예측해낼 수 있다는 것을 보여줬습니다. 이제 이런 질문을 던져보죠. 만일 네트워크가 달랐다면 사람들의 의견은 어땠을까요? 여기서 다른 네트워크는 봇이 없는 네트워크입니다.


마지막 단계로 우리는 사람들의 의견이 봇이 존재하지 않았다면 어땠을지 보기 위해 봇 계정을 네트워크에서 없앤 뒤 네트워크 모델을 다시 계산했습니다. 물론, 봇은 인간 사용자의 의견을 변화시켰습니다.  


그 방식은 다소 놀라웠습니다. 대다수의 뉴스 보도가 말했듯 우리는 봇이 트럼프를 도왔을 것으로 예측했습니다. 하지만 결과는 그렇지 않았습니다. 봇이 없는 네트워크에서 평균적인 (봇이 아닌) 사용자들이 클린턴에게 우호적인 정도는 100점 중 42점이었습니다. 봇이 있는 네트워크에서 사람들이 클린턴에게 우호적인 점수는 58점으로 증가했죠. 

출처: ⓒMBC

데이터에서 봇이 차지하는 비중이 매우 적고 서로 연결돼 있지 않았다는 점을 고려했을 때 이 차이는 기대했던 것보다 컸습니다. 네트워크 구조 자체가 봇의 영향력을 증폭시켰죠.


우리는 클린턴 봇이 트럼프 봇보다 효과적인 이유가 무엇인지 의문을 가졌습니다. 자세히 관찰한 결과 트럼프를 지지하는 260개의 봇이 113,498개의 트윗을 올렸다는 사실을 발견했죠. 봇 당 437개의 트윗이 올라온 셈입니다. 하지만 클린턴에게 우호적인 150개의 봇은 96,298개, 봇 당 708개의 트윗을 올렸죠.  


이는 클린턴 봇의 영향력이 봇 자체의 숫자가 아닌 얼마나 자주 트윗을 올렸는 지에서 온다는 점을 보여줍니다. 봇이 올린 대부분의 트윗은 후보자들이나 다른 영향력 있는 사람들의 트윗을 리트윗한 게시물이었습니다. 봇은 스스로 트윗을 올리기보다는 기존에 존재하는 다른 사람의 트윗을 공유했죠.


물론, 본 연구는 전체 유권자 인구와 비교했을 때 상대적으로 적은 수의 사용자를 분석했습니다. 또한, 상대적으로 짧은 기간 동안 캠페인 중 특정 사건을 대상으로 이뤄졌죠. 그러므로 본 결과가 전체 선거 결과에 주는 시사점은 없습니다. 하지만 이는 봇이 사람들의 의견에 끼칠 수 있는 잠재적인 영향을 보여줍니다.

출처: ⓒ세계일보

적은 수의 매우 활동적인 봇은 실제로 사람들의 의견을 상당히 변화시킬 수 있습니다. 소셜미디어 기업의 노력에도 불구하고 여전히 유권자에게 영향력을 행사하기 위해 계속해서 트윗을 올리는 많은 수의 봇이 존재합니다.


이건 소셜미디어에서 당신이 읽는 것, 당신이 믿는 것에 주의를 기울이라는 메시지입니다. 우리는 당신이 아는, 믿는 사람들을 팔로잉하는 것을 다시 한번 확인해볼 것을 권장합니다. 또한, 당신이 가장 좋아하는 해시태그에 누가 트윗을 올리고 있는지도 주의 깊게 살펴보세요.

원문: 더컨버세이션(Tauhid Zaman) 

* 외부 필진 뉴스페퍼민트 님의 기고 글입니다.

<직썰 추천기사>

'비정규직 제로 시대? 자회사의 함정에 빠진 사람들'

이 콘텐츠에 대해 어떻게 생각하시나요?