인터넷 기업들은 데이터에 대한 대가를 지불해야 하는가?
어쩌면 우린 여러 직업을 갖고 있던 걸지도 모르겠다. 그 일은 아침에 일어나서 폰을 집어드는 걸로 시작되는데, 바로 실리콘 벨리가 무엇보다도 귀중하게 여기는 데이터들을 생성해주는 것이다. 이런 식으로 데이터 생성을 직업으로 간주하는 게 앞으로 우리가 가야할 길일지도 모른다. 최근 발표된 경제학 논문에 따르면 우린 모두 디지털 노동자로서, 구글과 페이스북이 막대한 이익을 얻는데 큰 도움을 주고 있다. 미래의 경제가 제대로 작동하도록 하기 위해서라도, 그리고 대규모 기술적 실업 위기를 막기 위해서라도, 우린 거대 인터넷 기업과 유저 간의 관계를 다시 생각해 봐야만 한다.
인공지능은 계속 발전하고 있으며, 곧 산업 전반을 변화시킬 기세라고 논문 저자들은 말한다(스탠포드대의 Imanol Arrieta Ibarra와 Diego Jiménez Hernández, 콜럼비아대의 Leonard Goff, 마이크로소프트의 Jaron Lanier와 Glen Weyl). 하지만 알고리즘이 차를 운전하거나 얼굴을 인식하기 위해선 방대한 데이터가 필수적이다. 인터넷 기업들은 유저들이 구글 검색 결과를 클릭하거나 알렉사로 물건을 주문할 때마다 이런 데이터를 얻는다. 캡챠 같은 도구도 데이터를 빨아들이는 데 유용하다. 책의 텍스트를 판독하는 것처럼 사람에겐 쉬운 일도 기계에겐 상당히 어려울 수 있기 때문이다. 캡챠는 봇을 걸러낼 뿐만 아니라, 책을 디지털화하는 데도 도움이 되는 셈이다. 사람들은 공짜 서비스의 대가로 데이터를 '지불'해왔던 것이다.
이런 데이터는 해당 기업의 자본이 되며, 강력한 경쟁우위의 원천이 된다. 인터넷 거대 기업에게 도전할 가능성이 있는 스타트업들은 거대 기업들이 소유하고 있는 데이터에 접근할 수 없기 때문에 인공지능을 훈련시킬 수 없다. 유일한 희망은 이런 거대 기업들에게 인수되는 것인데, 이는 시장에 경쟁이 부족하다는 문제를 더욱 악화시킨다.
논문 저자들에 따르면, 현재 생산성 향상에 대한 인공지능의 기여폭이 작은데, 이는 부분적으로는 공짜 데이터 모델로 수집되는 데이터의 질이 좋지 않기 때문이다. 기업이 인공지능에 쓰일 어플리케이션을 만들려고 할 때, 보유 중인 데이터가 충분하지 않으면 유저를 유인해서 더 나은 정보를 공짜로 제공하게끔 해야 한다. 예컨대 캡챠처럼 웹사이트 방문자에게 흐릿한 글자를 판독하게 해야 하는데, 그 과정에서 사람들이 짜증을 내거나 서두르는 바람에 실수하기 쉽다는 게 문제다.
그렇더라도, 인공지능이 발달할수록 기술발달로 대체될 위협에 처하는 일자리수는 증가할 것이고, 경제에서 생성되는 가치는 노동자보단 수익성 높은 기업에게 점점 더 많이 돌아갈 것이다. 저자들이 지적했듯이, 전체 GDP 중 노동자에게 임금으로 지급되는 비율은 이미 지난 수십 년 전부터 하락해온 추세다.
이런 문제들을 해결하기 위해, 저자들은 급진적인 해결책을 제안했다. 데이터를 자본으로 간주할 게 아니라 노동으로 취급해야 한다는 것이다. 보다 명확히 말하자면, 기업에게 보수를 받고 대가로 넘기지 않는 한, 데이터는 이를 생산한 사람의 자산으로 간주되어야 한다는 것이다. 이렇게 된다면, 유저 데이터는 여러 기업에게 여러번 팔릴 수 있으며, 이를 통해 데이터가 시장 진입 장벽으로 작동하는 정도를 완화할 수 있다. 기업이 유저에게서 대이터를 사야 하므로 인공지능에 의해 생성되는 부를 분배하기도 한층 수월할 것이다. 기업들은 대가를 지불함으로써 보다 나은 데이터를 얻을 수 있다. 예컨대, 쇼핑센터를 돌아다니는 사람들이 뭘 하고 있는지 추측하는 대신, 기업들은 각각의 개인들에게 정확히 어떤 상점에 들렀는지, 어떤 상품을 살펴봤는지 물어볼 수 있다. 어쩌면 데이터 노동은 임금을 받는 일자리만큼 존엄한 일로 여겨지게 될지도 모른다. 이를 대규모 자동화 시대의 바람직한 부작용이라고 일컬을 수도 있을 것이다.
아직 저자들의 아이디어에는 살을 좀 더 붙일 필요가 있다. 이 논문은 무척 흥미롭긴 하지만 5쪽밖에 되지 않으며, 일부 아이디어는 실용성이 부족해 보인다. 사람들이 자신이 아침에 뭘 했는지, 사무실에서 어떻게 행동하는지 묘사하는 데 상당한 금전적 보수 없이도 흥미를 느낄까? 그리고 이들이 만든 데이터는 기업들이 그만한 보수를 지불할 만큼 유용할까? 혹시 쓸모없는 데이터를 남발하고 돈만 챙기려 드는 사람들이 나타나진 않을까?
그렇더라도, 논문에는 데이터의 역할에 대한 논의를 촉발한 만한 통찰이 담겨 있다. 그 중 하나는 데이터 시장에서 힘이 한쪽으로 쏠려있다는 점이다. 이는 부분적으론 거대 인터넷 기업으로 집중되는 현상 때문이기도 하지만, 한편으론 전체 데이터는 중요하지만 각각의 데이터는 그다지 가치있지 않기 때문이기도 하다. 페이스북 유저 한명이 자신의 데이터를 없애겠다고 협박해봤자 페이스북에겐 아무런 위협도 되지 못한다. 그러므로 인터넷 기업과 효과적으로 협상하기 위해선 집단적 노력이 필요할 수도 있다. "데이터 노동조합"을 결성하는 것처럼 말이다.
물론 단점도 있을 수 있다. 예컨대 데이터 노동조합이 지나치게 많은 보상을 요구해서 인공지능 발전에 방해가 되는 식으로 말이다. 어쩌면 모든 유저 데이터를 무료로 만드는 대신 이윤의 일정량을 요구할 수도 있다. 그럴 경우 저자들이 데이터의 질을 높이는데 필수적이라고 본, 데이터 노동에 대가를 지불하는 모델이 위험에 처할 수도 있다. 그렇더라도, 전통적 노동조합이 위기에 처한 가운데, 데이터 노동조합은 노동자들의 힘을 확고히 하는 방법이 될 수 있다.
무엇보다도 중요한 점은, 저자들의 제안은 인공지능 사회에서 가치가 집합적으로 형성된다는 점을 중요히 여긴다는 것이다. 화석연료 경제가 작동하게 만드는 유정처럼, 각 개인은 유정이 되어 디지털 경제가 작동하게 만드는 연료를 퍼낸다. 공정성과 효율성 둘 모두를 얻기 위해선, 이 연료에 의해 생성된 수입이 각각의 기여에 따라 균등하게 배분되어야 한다. 다만 문제는 이를 위한 구체적 방법일 것이다.
원문:
https://www.economist.com/news/finance-and-economics/21734390-and-new-paper-proposes-should-data-providers-unionise-should-internet
-----
꽤 재밌는 글이 이코노미스트에 올라왔길래 번역해 봤습니다. 구글 같은 거대 인터넷 기업들이 사용자들이 제공하는 데이터를 이용하여 엄청난 이득을 얻고 있고, 근미래에 인공지능이 계속 발달하여 사회 곳곳을 장악해갈수록 더욱 더 큰 이익을 얻을 텐데, 정작 인공지능 개발에 필수적인 데이터들은 공짜로 얻고 있다는 점에 문제를 제기한 기사입니다.
데이터가 그만큼 가치 있다면, 미래엔 게임하면 데이터를 만들어줘서 감사하다고 돈을 주는 세상이 올지도 모르겠습니다. 아예 직접 특수한 시뮬레이션을 설계해 만들고 피실험자를 고용해서 넣을지도 모르죠.
만일 대량 실업이 현실화된다면 구글에게 데이터값을 지불하라는 운동이 생길지도 모르겠습니다. 그렇더라도 각각의 개인이 생성한 데이터가 얼마만큼의 가치를 갖느냐는 객관적으로 측량하기 어려울 텐데, 그렇다면 결국 정치적 힘겨룸이 될 것 같네요.