해외 시사

트위터, 우익 정치인과 매체에 대한 알고리즘 편항성 인정

Zigzag 2021. 10. 23. 03:06
반응형

* 페이스북 내부 고발자 프랜시스 하우겐은 페이스북이 명사들의 포스팅을 일반인들의 포스팅에 더 특혜를 제공하고, 광고 클릭을 위해 혐오와 차별 포스팅을 더 부각하며, 인스타그램에서는 10대 소녀들을 거식증을 더 부추긴다는 수만 건의 내부 문서와 연구를 폭로했다. 페이스북은 하우겐의 폭로를 공식적으로 인정하지 않았다. 이에 비해 트위터는 자신들의 알고리즘이 우파 정치인과 매체들의 포스팅을 타임라인에 더 노출시킨다는 내부 연구를 자발적으로 공개했다. 이러한 연구는 7개국 선출직 공무원, 즉 정치인들과 미국 언론 매체에 대한 27쪽의 연구문서를 통해서 밝혀졌는데, 흥미롭게도 독일에서는 그렇지 않았다. 이 글은 Guardian의 10월 22일 자 기사 Twitter admits bias in algorithm for rightwing politicians and news outlets의 번역으로 트위터의 이 내부 연구 방법, 연구 내용과 결과, 트위터의 대응, 그리고 이 문서가 페이스북에는 어떤 영향을 미칠 것인가를 자세히 분석하고 있다. - 역자 주

트위터, 우익 정치인과 언론 기관에 대한 알고리즘의 편향 인정

홈 피드는 좌파 트윗보다 우파 트윗을 촉진, 내부 연구 결과에서 밝혀짐

트위터 내부 연구는 영국, 미국, 캐나다, 프랑스, 스페인, 일본에서 우익에 기울어진 트위터 알고리즘 편향을 발견했지만 독일에서는 그렇지 않았다. 사진 출처: Matt Rourke/AP

트위터(Twitter)는 좌파 소스의 콘텐츠보다 우파 정치인과 뉴스 매체의 트윗을 더 많이 증폭시킨다고 인정했다.

이 소셜 미디어 플랫폼은 영국, 미국, 캐나다, 프랑스, ​​독일, 스페인, 일본 등 7개국에서 선출직 공무원의 트윗을 조사했다. 또한 주로 폭스 뉴스(Fox News), 뉴욕타임스(New York Times) 및 버즈 피드(BuzzFeed)와 같은 미국 뉴스 매체를 중심으로 뉴스 조직의 정치 콘텐츠가 트위터에 증폭됐는지 여부도 연구했다.

이 연구는 트위터의 '홈' 타임라인(2억 명의 사용자에게 트윗을 제공하는 기본 방식으로 알고리즘이 사용자가 보는 것을 조정한다)과 가장 최근의 트윗이 제일 먼저 나타나는 전통적인 타임라인을 비교했다.

이 연구는 독일을 제외한 7개국 중 6개국에서 우파 정치인들의 트윗이 좌파보다 알고리즘으로부터 더 많은 증폭을 받았다. 우파 뉴스 매체는 좌파보다 더 증폭되었다. 그리고 일반적으로 정치인들의 트윗은 시간순 타임라인보다 알고리즘 타임라인에 의해 더 증폭되었다.

27페이지에 달하는 연구 문서에 따르면 트위터는 독일을 제외한 모든 국가에서 "정치적 우익에 유리한 통계적으로 유의미한 차이"를 발견했다. 이 연구에서 0%의 값은 알고리즘 맞춤 타임라인에서 트윗이 시간순 타임라인과 동일한 수의 사용자에 도달하는 반면 100%의 값은 도달 범위의 두 배를 달성하는 것을 의미한다. 이를 근거로 볼 때 좌우의 격차가 가장 큰 나라는 캐나다(자유당 43%, 보수당 167%)였으며, 영국(노동당 112%, 보수당 176%)이 뒤를 이었다. 고위 공직자들을 제외하더라도 결과는 비슷하다고 이 문서는 밝혔다.

트위터는 홈 타임라인이 이러한 결과를 생성한 이유가 명확하지 않으며 이제 알고리즘을 변경해야 할 수도 있다고 밝혔다. 럼맨 차우두리(Rumman Chowdhury) 트위터 소프트웨어 엔지니어링 담당 이사와 루카 벨리(Luca Belli) 트위터 연구원이 블로그에 올린 글에서 이번 연구 결과는 "문제가 될 수 있고" 더 많은 연구가 수행되어야 한다고 말했다. 이 게시물은 사용자가 자신의 타임라인을 조정하는 알고리즘과 상호 작용하는 방식의 결과로 특정 트윗이 ​​특혜를 받는지 여부에 대해 우려하고 있음을 인정했다.

이 포스트는 “알고리즘이 구성되는 방식과 사람들이 알고리즘과 상호 작용하는 방식의 함수로서 특혜 처리가 있다면 알고리즘 증폭은 문제가 된다. 홈 타임라인 알고리즘에 의한 악영향을 줄이기 위해 어떤 변화가 필요한지를 결정하기 위해서는 추가적인 근본 원인 분석이 필요하다"라고 밝혔다.

트위터는 연구 결과를 학계 등 외부인에게 공개하고 제삼자가 데이터에 더 많이 접근할 수 있도록 준비 중이라고 밝혔는데, 이는 페이스북(Facebook)에 이와 같은 조치를 취하기 위한 더 많은 압력을 가할 것으로 보인다. 페이스북은 내부 고발자 프랜시스 하우겐(Frances Haugen)에 의해 인스타그램 앱이 10대 정신건강을 해친다는 폭로를 포함한 수만 건의 내부 문서가 유출된 이후 대서양 양안의 정치인들은 페이스북의 연구를 제삼자에게 배포하라고 촉구하고 있다.

트위터 연구는 사용자가 자신의 타임라인을 볼 수 있는 두 가지 방법을 비교했다. 첫 번째는 알고리즘을 사용하여 사용자가 가장 많이 상호 작용하는 계정 및 기타 요소를 기반으로 사용자가 관심을 가질 수 있는 트윗에 대한 맞춤형 보기를 제공한다. 다른 하나는 사용자가 가장 최근 게시물을 역순으로 읽는 보다 전통적인 타임라인이다.

이 연구는 일부 정치인, 정당 또는 뉴스 매체가 다른 것보다 더 증폭되었는지 여부를 고려하여 두 가지 유형의 타임라인을 비교했다. 이 연구는 2020년 4월 1일에서 8월 15일 사이 선출직 공무원의 수백만 건의 트윗과 같은 기간 동안 주로 미국을 중심으로 한 뉴스 기관의 수억 건의 트윗을 분석했다.

트위터는 연구를 제삼자에게 제공할 것이라고 밝혔지만 개인 정보 보호 문제로 인해 "원 데이터"를 제공할 수 없다고 말했다. 이 게시물은 "우리는 요청 시 주요 연구 결과를 재현하고 방법론을 검증하고자 하는 제3의 연구자들을 위해 집계된 데이터 세트를 사용할 수 있도록 하고 있다."라고 밝혔다.

트위터는 정기적으로 내부 데이터를 외부 소스에 제공할 준비를 하고 있다고 덧붙였다. 이 회사는 머신러닝 윤리, 투명성, 책임감 팀이 사용자의 사생활을 보호하기 위한 방안을 최종 확정 중이라고 밝혔다.

트위터는 "이 접근법은 새로운 것이며 이 정도 규모로 사용되지는 않았지만 알고리즘의 투명성을 저해할 수 있는 프라이버시 대 책임성의 맞바꾸기(tradeoffs) 문제를  다룰 것으로 낙관하고 있습니다"라고 말했다. "우리는 이 연구가 우리의 내부 연구를 재현하고 검증하고 확장하고자 하는 외부 연구자들과의 향후 협력을 위해 열 수 있는 기회에 대해 흥분하고 있습니다."

반응형