플랫폼이란 무엇이고

마지막 업데이트: 2022년 1월 28일 | 0개 댓글
  • 네이버 블로그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 트위터 공유하기
  • 카카오스토리 공유하기
카카오택시. 사진=연합뉴스

[김정민 변호사] 지난 10월 26일에는 공정거래위원회가 가맹택시에 콜(승객호출)을 몰아준 의혹을 받고 있는 카카오모빌리티에 대해 현장조사를 벌여 알고리즘을 확보했다고 한다. 이는 카카오모빌리티가 자사 가맹택시를 우선배정하고, 타사 택시는 배제하고 있다는 택시업계의 의혹 제기와 신고에 따른 플랫폼이란 무엇이고 것이다.

플랫폼 기업 알고리즘 공개여부 '논란'

앞서 지난해 10월 6일 공정위는 네이버가 쇼핑·동영상 분야 검색서비스의 ‘우선 노출 알고리즘’을 수년간 인위적으로 조정해 자사 서비스를 검색결과 상단에 올려온 행위에 대해 시정명령과 함께 과징금 267억 원을 부과한 적이 있다. 구체적으로는 네이버쇼핑 내에 스마트스토어(자사 오픈마켓) 제품의 노출 개수를 점차 늘리도록 알고리즘을 변경했고, 동영상 검색에서 네이버TV 동영상이 타사 동영상보다 더 잘 노출되도록 알고리즘을 조정했다고 본 것이다.

이렇듯 최근 플랫폼의 불공정행위가 화두가 되고 있고, 그 비난의 화살이 알고리즘의 불공정으로 모아지고 있다. 그렇다면 플랫폼 기업의 알고리즘이란 무엇이고, 알고리즘은 반드시 공정해야 하는가?

현재 우리의 일상을 보면, 플랫폼으로 시작해서 플랫폼으로 끝난다고 해도 과언이 아니다. 우리는 SNS로 커뮤니케이션하고, 쇼핑 플랫폼에서 물건을 사며, 동영상 플랫폼이 추천해주는 컨텐츠를 소비한다. 현재 이런 플랫폼 기업의 알고리즘은 우리의 일상생활 속에 깊숙이 스며들어 영향력을 점차 확대해 가고 있다. 한마디로 거대한 광고판이 된 SNS, 네이버쇼핑, 유튜브라는 플랫폼 위에서 기업들은 상위 노출에 목숨을 걸고 있고, 고객들은 상위 노출된 것을 위주로 소비한다.

결국 핵심은 '순위'이고 '줄세우기'다. 그 순위를 정하는 기준과 원칙이 알고리즘인 것인데, 시험 점수가 좋은 사람이 좋은 대학을 가고, 시험 점수대로 합격자가 정해지며, 알고리즘상 점수가 높은 순서로 상위 노출되어야 하는 것은 일견 당연해 보인다. 시험 점수가 낮은 사람이 합격을 하고, 점수가 낮은 것이 상위노출이 되면 공정성에 의심을 받는 것이다. 플랫폼의 영향력이 지대하기에 플랫폼의 공정성에 대한 요구도 더욱 강조될 것이다.

카카오택시. 사진=연합뉴스

카카오택시. 사진=연합뉴스

카지노 플랫폼도 공정성 지키는데

플랫폼 사업자는 기업이다 보니 자사의 이익을 극대화해야하는데 자사의 이익을 극대화하는 가장 확실한 방법은 자사의 이익을 극대화하도록 알고리즘을 설정하는 것이다. 자사의 상품(또는 용역)을 상위 노출시키고, 광고비를 많이 내는 것을 상위 노출시키면 된다. 그러나 과도한 이익 극대화는 플랫폼 사업을 망하게 할 수도 있다는 것도 깨달아야 한다.

카지노와 슬롯머신을 생각해보자. 카지노측과 고객의 승률을 적절히 설정하는 것이 카지노 플랫폼의 아주 기초적인 알고리즘이라고 할 수 있다. 이익 극대화를 위해서는 카지노 승률을 최대로 하면 된다. 하지만 고객은 그런 카지노를 금방 외면할 것이다. 대박이 터지지 않는 슬롯머신은 고객을 유인할 수 없다. 따라서 카지노는 승률을 적정한 수준으로 설정할 수밖에 없다.

플랫폼에도 이와 비슷하게 사업자 스스로 자정이 가능하다는 논리가 있다. 즉, 불공정한 알고리즘은 결국 도태된다는 것이다. 그러나 플랫폼에서는 카지노와 다르게 고객이 유불리를 즉각적으로 확인할 수 없다는 한계가 있다. 고객은 최저가에 가까운 쇼핑을 했고, 택시를 타고 목적지로 이동했다. 어차피 물건을 누구에게 샀는지, 어떤 회사의 택시를 탔는지는 고객에게 고려사항이 아니다.

플랫폼의 알고리즘은 우리가 모르는 사이 불공정하게 바뀔 수 있다. 그 피해는 고객보다는 경쟁관계에 있는 기업이 입게 된다. 따라서 플랫폼 내에서 경쟁관계에 있는 자가 플랫폼의 공정을 요구할 수밖에 없다. 문제는 플랫폼이 이미 독점화되었기 때문에 경쟁관계에 있는 기업이 플랫폼을 갈아탈 수 없다는 것이다. 따라서 독점화된 플랫폼에 대해 공정의 화두를 던질 수밖에 없다.

'영업비밀', '어뷰징' 이유로 공개거부는 안돼

알고리즘이 공개되면 역효과는 없을까? 알고리즘 비공개의 정당성을 주장하는 주요 논거로 ‘영업비밀’과 ‘어뷰징(어뷰즈 공격)’ 예방이 있다. ‘영업비밀’ 정도에 해당하는 알고리즘은 극히 소수에 불과하므로 논외로 하고, 어뷰징에 대해서만 살펴보자. 점수를 매기는 기준이 알려지면, 이 기준의 허점이나 버그를 이용해 편법으로 점수를 올릴 수 있다는 것이 핵심이다. 어뷰즈 공격으로 인해 대다수 선의의 이용자들이 피해를 볼 수 있다.

마치 실력은 없으면서 시험 점수만 잘 받을 수 있다는 것이데, 한국 교육의 현실이 떠올라 씁쓸한 느낌이 든다. 점수만 높은 인재를 거르고 실력 있는 인재를 뽑는 것이 대학과 기업의 책무이듯, 어뷰즈 공격을 방지하는 것은 플랫폼의 책무이다. 어뷰징이 가능한 알고리즘은 도태되어야 한다. 플랫폼 스스로 개선책을 찾아야 한다.

고객의 알권리 측면에서도 알고리즘의 공개는 필요하다. 예를 들어 ‘요기요’에서 음식을 시킬 때 상위 노출되는 음식점 순위가 광고비 순인지, 근거리 순인지, 평점 순인지 정도는 이용자들이 알 수 있어야 한다. 플랫폼 기업 입장에서는 이를 적극적으로 마케팅에 활용할 수도 있다. 즉 공개가 필요한 알고리즘은 프로그램을 포함한 구제척인 알고리즘 전체가 아니라, 알고리즘의 기준과 원칙이다. 이런 기준과 원칙이 불공정하다면 비판을 받고 수정해야 하는 것이다.

알고리즘 공개의 범위에 대한 해답은 상장법인이 공개하는 회계정보에서 찾을 수 있다. 상장법인이 재무제표와 사업보고서 등 개괄적 정보는 공개하되 개별 계약서, 영수증 등은 공개하지 않는 것처럼, 구체적인 알고리즘이 구현된 프로그램 자체는 비공개로 하되, 회사가 운영하고 있는 알고리즘의 기준과 원칙은 공개해야 한다.

나아가 기업의 탈세나 법규위반이 문제가 됐을 때 세무조사나 감독청의 조사를 받는 것처럼, 플랫폼이 불공정한 알고리즘을 사용하고 있다는 합리적인 의심이 있다면 구체적인 알고리즘을 감독당국만이라도 들여다보아야 하고, 그 속에 불공정성이나 법규 위반이 있다면 그 위반 결과만을 공개할 수 있어야 한다.

중요한 건 '기준과 원칙'. 변경기록도 꼭 남겨야

독점성이 높은 플랫폼에 대한 알고리즘 감사를 해야 한다는 주장도 있는데, 감사의 전문성이나 실효성이 있을지는 의문이다. 컴퓨터 전문가가 다양한 검색어 묶음으로 테스트해보면 나오는 결과치를 가지고 플랫폼 알고리즘에 관한 역추적(리버스엔지니어링)이 가능하고, 추측된 알고리즘의 불공정성이 의심이 된다면 감독당국에 조사를 의뢰할 수 있으면 된다.

사후 조사와 처벌도 중요하지만 예방은 더욱 중요하다. 플랫폼 기업의 알고리즘을 무턱대고 강제로 공개하는 법규와 규제를 만드는 것은 바람직하지 못하다. 우선은 플랫폼 기업이 어떤 기준과 원칙으로 알고리즘을 구성했는지를 공개하도록 하고, 구체적인 프로그램과 알고리즘을 수정·변경하는 경우 그 내용과 어떤 절차와 결재를 거쳤는지를 있는 그대로 회사 내부 자료로 기록할 의무를 부과할 필요가 있다. 그래야만 문제가 발생하고 위법한 알고리즘 수정·변경이 행해졌을 때 책임소재를 분명히 할 수 있기 때문이다.

나아가 알고리즘 변경의 모든 과정이 기록된다면, 문제 발생시 책임을 회피하기 위해 내부 직원들이 위법한 알고리즘 조작·변경하는 것을 기피하게 될 것이며, 알고리즘 불공정을 미연에 예방하는 효과도 있을 것이다.

※ 김정민 변호사는 서울대에서 컴퓨터공학, 법학(부전공)을 공부했다. 4회 변호사시험에 합격했으며 IT기업 준법팀장을 거쳐 법무법인 로베이스 파트너변호사로 있다. 前대한변호사협회 IT블록체인특위 대외협력기획 부위원장, 한국블록체인법학회 정회원, 한국블록체인사업협동조합 자문변호사이다.

플랫폼이란 무엇이고

이번에 [코린이 프로젝트]에서 소개할 주제는 ‘이더리움’ 입니다. 비트코인 다음으로 많이 언급되는 암호화폐가 이더리움(ETH)입니다. ETH 가격은 작년 이맘 때만 해도 약 15만 원이었습니다. 현재는 100만 원이 넘는 가격에 거래되고 있습니다. 대체 이더리움은 플랫폼이란 무엇이고 무엇이고, 왜 가격이 오르는 걸까요?


이더리움은 두 가지 의미를 담고 있습니다. 이더리움 플랫폼과 플랫폼 상에서 쓰이는 암호화폐 이더리움(ETH) 입니다. ‘ETH’라는 표기로 쓰이면 암호화폐를 의미합니다.

ETH은 대표적인 알트코인입니다. 비트코인(BTC)을 제외한 모든 코인을 알트코인이라 부릅니다. 사실상 1세대 알트코인이자 다른 알트코인이 나올 수 있도록 토양을 제공한 게 이더리움입니다.

비트코인(BTC)이 있는데 왜 그렇게 수 많은 알트코인이 생긴 걸까요?

BTC는 가치의 저장과 전달이라는 역할을 수행하기에는 적절하지만 다른 기능을 하기엔 데이터 처리 속도가 느립니다. 이러한 한계를 뛰어넘고자 많은 대안(alternative) 코인이 등장했습니다.

이더리움 플랫폼은 안드로이드에 비유되곤 합니다. 안드로이드 위에서 앱이 작동되는 것처럼 이더리움이란 플랫폼 위에서 다양한 디앱(DApp)이 돌아갈 수 있습니다.

기관들이 매수하고 있고, 사람들의 관심이 집중됐기 때문이란 분석이 있습니다. 이더리움은 여러 프로그램에서 활용도가 높습니다. 특히 작년에 가장 주목을 받았던 분야는 디파이(De-Fi, 탈중앙화금융) 입니다. 2021년 1월 디파이 예치 규모는 약 23조원에 달합니다.

스마트 컨트랙트는 플랫폼이란 무엇이고 프로그램 상에서 특정 조건을 충족하면 자동으로 계약이 실행되도록 하는 것입니다. 이더리움 스마트컨트랙트는 게임, 금융 등 다양한 분야에 적용할 수 있습니다.

비트코인과 달리 이더리움은 창시자가 명확히 알려져 있습니다. 비탈릭 부테린(Vitalik Buterin)입니다. 94년생인 그는 대학을 중퇴한 뒤 이더리움을 개발했습니다. 지난 2014년에는 페이스북 창업자 마크 저커버그를 제치고 ‘월드 테크놀로지 어워드’에서 IT 소프트웨어 수상자로 뽑히기도 했습니다. 블록체인 커뮤니티에서 상당한 영향력을 발휘하고 있는 인물입니다.

이더리움은 ‘이더리움2.0’으로 업그레이드 중입니다. 이더리움2.0에선 합의 알고리즘이 변경됩니다. 새로운 블록체인에 대한 기대감 때문에 ETH가격이 오르고 있다는 분석이 있습니다.

플랫폼이란 무엇이고

오늘은 투이톡 영상 큐레이팅 서비스 두번째 시간으로, '데이터 전략'을 주제로 관련 영상들을 큐레이팅 해보겠습니다.

먼저 데이터 전략 관련하여 가장 먼저 보면 좋은 영상으로 데이터 엔터프라이즈 프레임워크의 구성요소와 추진전략 을 추천 드립니다. 본 영상에서는 데이터엔터프라이즈로 탈바꿈하기 위한 추진전략을 설명하면서 데이터 기업이 갖추어야할 구성요소들까지 모두 소개하고 있습니다.

많은 주제의 내용을 포함하고 있어 중간중간 관련 참조 영상을 소개해 드리겠지만, 가급적 데이터 엔터프라이즈 프레임워크의 구성요소와 추진전략 을 끝까지 먼저 시청 하신 후, 추가적으로 궁금하신 내용들은 추천 드린 영상을 보시면 좋을 것 같습니다.

“ 데이터 엔터프라이즈 프레임워크의 구성요소와 추진전략 ” 에서 다루는 내용을 간략하게 소개하겠습니다. 본 영상에서는 기업들이 데이터 엔터프라이즈로 탈바꿈 하기 위해서는 데이터 캐즘을 해소해야 한다고 설명하고 있습니다. 데이터 캐즘? 어려운 단어 나왔죠? 데이터 캐즘이 무엇이고 어떻게 해소할 수 있는지에 대한 자세한 설명은 ' 데이터 캐즘 ' 영상을 참조 하시면 됩니다.

데이터 캐즘이 발생하는 이유는 데이터 엔터프라이즈 프레임워크로 접근하지 않기 때문입니다. 데이터 엔터프라이즈 프레임워크는 1) 데이터 전략, 2) 데이터 사이언스, 3) 데이터 거버넌스, 4) 데이터 플랫폼 4가지 요소로 구성됩니다. 각 구성요소를 간략히 설명 드리면

1) 데이터 전략
데이터 전략은 상위수준에서 데이터 엔터프라이즈의 방향을 정하는 것입니다. 본 영상에서는 데이터를 활용하여 비즈니스 성과를 내는 방법으로 최적화(Optimization) 방법과 탈바꿈(Transformation) 방법 두가지를 소개하고 있습니다. 최적화 방법 및 탈바꿈 방법 등 데이터 전략에 대한 상세 내용은 ' 데이터 전략이란 무엇인가 ' 영상에서 확인해 보실 수 있습니다.

2) 데이터 사이언스
데이터 사이언스는 데이터를 축적하고 분석하고 활용하는 능력입니다. 이중 데이터 활용역량을 데이터 리터러시라고 명명합니다. 데이터 리터러시가 무엇이고, 왜 필요한지에 대한 상세 내용은 ‘ 데이터 리터러시, 어떻게 접근할것인가? 와 ‘ 데이터 가치창출 이라는 영상을 통해 확인하실 수 있습니다.

3) 데이터 거버넌스
데이터 거버넌스는 데이터를 관리하는 조직, 역할과 책임, 프로세스 등입니다. 데이터 거버넌스만으로도 큰 주제이고 관련 영상이 많아 데이터거버넌스를 주제를 별도로 소개하는 큐레이팅 영상 을 만들었으니 이를 참고하시기 바랍니다. 또, 데이터 직무를 소개하는 영상 도 추가로 보시면 데이터 거버넌스를 이해하시는데 큰 도움이 되실 것 같습니다.

4) 데이터 플랫폼
데이터 플랫폼은 데이터의 확보, 보관, 관리, 활용을 위한 인프라를 의미합니다. 데이터 플랫폼은 데이터 관련 하드웨어, 소프트웨어, 통신기술 등을 포함합니다. 데이터 플랫폼에 대한 내용은 데이터 프레임워크 라는 영상을 보실 것을 추천 드립니다.

“ 데이터 엔터프라이즈 프레임워크의 구성요소와 추진전략 ” 영상의 결론부분에서는 데이터 엔터프라이즈 프레임워크를 플랫폼이란 무엇이고 구축하기 위해서는 주제 중심 전략과 성숙 중심 전략의 2가지 전략 방향이 있는데 데이터 엔터프라이즈로 탈바꿈하기 위해서는 주제 중심 전략 보다 성숙 중심 전략이 효과적이라고 설명하고 있습니다. 성숙 중심 전략은 앞서 설명 드린 데이터 엔터프라이즈 프레임워크를 바탕으로 합니다.

이번 영상에서는 플랫폼이란 무엇이고 데이터 전략을 데이터 엔터프라이즈 프레임워크를 기반으로 접근하고, 관련해서알아 두어야 할 데이터 캐즘, 데이터 리터러시, 데이터 거버넌스, 데이터 플랫폼 등을 설명하는 영상을 같이 소개하였습니다. 본 큐레이팅 영상을 통해 소개한 여러 영상들이 데이터 전략이라는 큰 주제와 관련 소주제를 체계적으로 이해하시는데 도움이 플랫폼이란 무엇이고 되셨기를 바랍니다.

[CDP] ① 고객 데이터 플랫폼(CDP: Customer Data Platform)이란?

몇 해 전부터 CDP 이야기가 자주 나오기 시작했다. 우리나라 개인정보보호법과 유럽 연합의 일반 데이터 보호 규정(GDPR : General Data Protection Regulation)과 미국 캘리포니아 소비자 개인정보 보호법(CCPA : California Consumer Privacy)과 같은 개인 데이터 관련 접근과 수집, 활용에 대한 규제들이 광범위하게 적용되고 있다.

서드파티 쿠키 활용이 자유롭지 못하고 그에 따라 퍼스트 쿠키, 제로 쿠키 활용 이슈도 등장했고 애플의 앱 투명성 추적(ATT), 구글의 프라이버시 샌드박스 정책 도입 등 정부 규제 이슈 못지않게 개별 플랫폼 사업자들의 개인 정보 보호 대책들도 강화되면서 기업들은 고객을 온전히 이해하기 위해 더 많은 고민에 빠질 수밖에 없다.

이런 외부 환경의 변화와 별개로 기술적으로는 데이터레이크의 등장과 이 플랫폼을 활용하는 CDP가 주목받는 키우드로 떠오르고 있다.

궁금해졌다. 그래서 국내외 CDP 제공 업체들을 만나서 그들이 제공하는 서비스가 무엇이고 어떤 사례들이 등장하고 있는지 취재해 보고 싶어졌다. 아이지에이웍스와 한국마이크로소프트, 전자상거래 분석 서비스 제공 업체인 커즈360를 만났다. 또 앞으로 다른 기업들도 만날 수 있었으면 좋겠다. 이번 기사는 개별 기업들 인터뷰에 앞서 CDP가 무엇인지 간단히 정의하고 넘어가고 싶어서 작성하는 글이다.

시장 조사 업체인 가트너의 자료를 한번 보자.

가트너는 CDP에 대해 ‘다른 시스템에서 접근할 수 있는 지속적이고 통합된 고객 데이터베이스를 생성하는 패키지 소프트웨어’라고 정의한다.

또 CDP의 장점에 대해 데이터수집, 프로필 통합, 세그먼테이션, 활성화를 통해 고객 단일 뷰, 민첩성과 유연성, 데이터 민주화, 고객 경험과 마케팅 효율성 향상, 운영 효율성을 꼽는다.

너무 뜬구름 잡는 거 같다. 그리고 그런 시스템이 이전에는 없었나 하는 생각마저 든다.

기업들은 웹사이트와 모바일 앱, 디지털 비서와 챗팅 봇 같은 채팅 채널를 통해 고객 행동 데이터를 확보해 왔다. 전자상거래 기업의 경우 유입된 고객이 사이트에서 제품을 살펴보고 검색하고 장바구니에 담고 구매 사이트에 갔다가 결제를 완료하기도 하지만 중간에서 이탈하는 걸 파악할 수 있다. 심지어 결제 창에서 이탈하기도 한다.

결제 데이터를 쌓기도 하고 외부 결제 시스템을 통해 받기도 한다. 또는 물리적인 매장을 운영할 경우 판매시점 데이터(POS)도 모아서 보고 싶어한다. 회원 가입을 유도해 이름과 생년월일, 배송 주소를 확인할 수 있는 인구통계 데이터도 함께 섞어서 보고 싶다.

설명만 들어서는 기존 시스템들과 별반 다른게 없다.

다만 아이지에이웍스나 한국마이크로소프트, 커즈360 관계자들이 전하는 말엔 공통점이 있었다.

그건 바로 “개발자의 도움을 최소화하고 마케터들을 포함한 현업 사용자들이 자신이 원하는 고객 데이터를 아주 손쉽게 활용할 수 있습니다”라는 대목이다.

고객을 이해하기 위해 항상 기획을 해도 데이터 엔지니어들이 관련 데이터를 IT팀에 부탁해서 뽑아서 전달받던 방식이 아니다. 사전에 CDP 업체들과 사내 개발팀이 협력해서 이전 문제를 개선했다.

또 대규모 구축 프로젝트를 추천하지 않는다. 작게 시작해 성과를 측정하면서 확산 여부를 결정한다. 이전 데이터 관련 프로젝트들이 대규모로 진행했다가 인력과 자금, 장비 투자, 전사 프로젝트에 따른 시간 이슈까지 발생하면서 성과 문제에 발목이 잡혔던 것과는 좀 다른 행보다.


0 개 댓글

답장을 남겨주세요