1. 서론

정보화의 물결 속에서 데이터는 핵심 자원으로 부상하고 있으며, 데이터의 가치가 높아지면서 데이터 수집 기술인 웹 크롤링(Web Crawling; 이하 ‘크롤링')의 활용도도 높아졌다. 크롤링이란 수많은 컴퓨터에 분산 저장되어 있는 웹사이트, 하이퍼링크, 데이터, 정보 자원을 자동화된 방법으로 수집하여 검색 대상의 색인으로 포함시키는 기술이다.

이처럼 크롤링이 광범위하게 이용되고 있는 현실에도 불구하고 크롤링을 바라보는 사회적 시각에는 대립이 존재하고 한국법상 크롤링의 허용범위에 대한 기준도 명확히 정립되어 있지 않다. 이런 가운데 기업들은 불안은 호소하고 있고, 데이터를 활용한 신산업 발달에 지장이 초래되고 있다는 지적도 나온다.

이하에서 판례를 중심으로 크롤링에 관한 주요한 법적 주장(또는 항변)들을 살펴 일관된 기준의 정립가능성에 대해 모색한다.

  1. 크롤링에 대한 법위반 주장
    1. 저작권 또는 데이터베이스제작자의 권리 침해 주장과 저작권 제한

가. 저작권법상 관련 규정의 개요

저작권법상 저작권자는 저작물에 대해 제한된 독점권을 가지며, 저작물을 복제, 배포, 공연, 전시하고, 2차적 저작물을 제작할 권리를 가지며(제16조이하), 창작성이 결여되어 저작물이 될 수 없는 데이터베이스를 제작한 제작자에게도 저작권에 유사한 권리가 인정된다.

한편 저작권법은 저작권의 제한 조항을 규정하고 있고(제23조 내지 제38조), 데이터베이스제작자의 권리에서도 이를 준용하여(제94조) 권리자의 의사에도 불구하고 저작권 등 행사가 제한되는 경우를 규정하고 있다. 이는 미국법상 ‘fair use'라고 칭해지는 소위 공정이용에 대응하는 규정이다.

나. 크롤링에 관한 저작권 및 데이터베이스 제작자 권리의 침해 관련 판결

여러 웹 페이지로부터 공개데이터를 크롤링 하다보면 경우에 따라 저작물을 복제하거나 데이터베이스를 복제할 가능성이 있다.

법원은 사람인(피고)이 잡코리아(원고)의 웹 사이트에 게재된 채용정보를 크롤링 방식으로 수집하여 피고(사람인)의 웹 사이트에 게재한 사건에서, 피고가 별도 비용 없이 반복적·체계적으로 원고의 데이터베이스의 채용정보 부분을 복제하였고, 원고는 수년 동안 채용정보를 구축해왔다는 등의 이유로, 데이터베이스제작자 권리(복제권 등) 침해를 인정하였고(서울고등법원 2017. 4. 6. 선고 2016나2019365 판결), 관련 민사소송에서는 피고의 불법행위가 인정되어 대법원에서 확정되었다.

반면 여기어때 측(피고인들)이 야놀자(피해자 회사)의 숙박업체 정보를 크롤링한 사건에서 대법원은 피고(여기어때)가 숙박업소 정보 50개 항목 중 3개에서 8개 사이 정보를 크롤링한 점, 숙박업소의 정보는 이미 상당히 알려진 정보로서 수집에 상당한 비용이나 노력이 들 것으로 보이지 않는 점 등을 들어, 피고인들이 피해자 회사의 이익을 부당하게 해친 경우로 볼 수 없다고 판시하였다.

  1. 정보통신망이용촉진 및 정보보호 등에 관한 법률 위반 주장

가. 정보통신망이용촉진 및 정보보호 등에 관한 법률상 관련 규정의 개요

정보통신망이용촉진 및 정보보호 등에 관한 법률(이하 ‘정보통신망법') 제48조 제1항에서는 “누구든지 정당한 접근권한 없이 또는 허용된 접근권한을 넘어 정보통신망에 침입하여서는 아니 된다”는 금지조항을 두고, 제72조 제1항 제1호에 “제48조제1항을 위반하여 정보통신망에 침입한 자”를 처벌하도록 하여 정보통신망침입죄를 규정하고 있다. 이는 2000년대 초 사이버 공격 기법이 등장함에 따라 ‘해킹행위'를 처벌하기 위해 신설된 조항이다.

나. 크롤링에 관한 정보통신망법 위반 관련 판결

법원은 사람인 측(피고인)이 잡코리아(피해자회사)의 채용정보를 크롤링한 사건에서, 피해자회사가 일률적으로 크롤링을 금지한 상황에서 피고인이 가상사설망(VPN)을 활용해 침투한 행위라는 이유로 정보통신망법상 정보통신망 침입죄가 성립한다고 보았다.

한편 여기어때와 야놀자 사건에서 항소심은 패킷 캡처(프로그램 소스 분석 프로그램) 또는 웹 크롤링이 약관으로 금지된 것이 아니고 API 서버는 모바일 뿐만 아니라 PC 웹 브라우저에서도 접근 가능하며 접근권한이 제한되지 않았다고 보아 무죄를 선고하여(서울중앙지방법원 2021. 1. 13. 선고 2020노611 판결) 대법원에서 그대로 확정되었다.

  1. 형법상 컴퓨터 등 장애 업무방해 주장

가. 컴퓨터 등 장애 업무방해죄의 개요

컴퓨터 등 정보처리장치 또는 전자기록 등 특수매체기록을 손괴하거나 정보처리장치에 허위의 정보 또는 부정한 명령을 입력하거나 기타 방법으로 정보처리에 장애를 발생하게 하여 사람의 업무를 방해한 경우 컴퓨터 등 장애 업무방해죄가 성립한다(형법 제314조제2항).

나. 크롤링에 관한 컴퓨터 등 장애 업무방해 관련 판결

앞서본 여기어때 측(피고인들)이 야놀자(피해자회사)를 크롤링 사안에서 항소심과 상고심은 피고인들의 업무방해 고의가 인정되지 않고, 피해자의 업무가 방해되었다는 증거도 없다고 보아 업무방해죄도 무죄로 판시하였다.

  1. 부정경쟁방지 및 영업비밀보호에 관한 법률 위반 주장

가. 부정경쟁방지 및 영업비밀보호에 관한 법률상 관련 규정의 개요

부정경쟁방지 및 영업비밀보호에 관한 법률(이하 ‘부정경쟁방지법') 제2조제1호(파)목은 “그 밖에 타인의 상당한 투자나 노력으로 만들어진 성과 등을 공정한 상거래 관행이나 경쟁질서에 반하는 방법으로 자신의 영업을 위하여 무단으로 사용함으로써 타인의 경제적 이익을 침해하는 행위”를 부정경쟁행위로 규정하고 있다.

한편 2022. 4. 22.부터 데이터 산업진흥 및 이용촉진에 관한 기본법(이하 ‘데이터기본법')이 시행되었는데, 그 위임을 받아 제정된 부정경쟁방지법 제2조제1호(카)목은 보호대상인 데이터를 데이터기본법보다 좁게 한정하고 있고, 부정사용행위도 데이터기본법보다 좁게 규정하고 있다.

나. 크롤링에 관한 부정경쟁방지법위반 관련 판결

부정경쟁방지법 제2조제1호(카)목(이하 ‘(카)목')의 신설 전까지 크롤링의 대상이 되는 데이터 역시 부정경쟁방지법 제2조제1호(파)목(이하 ‘(파)목')에 따른 보호가 가능한 것으로 보았고, 크롤링이 시장에서의 (잠재적) 경쟁 관계에서 있는 웹/앱 서비스를 대상으로 하는 이른바 무임승차(free-ride)에 해당하는 경우 부정경쟁행위를 구성한다고 보았다.

다만 앞서 언급한 엔하위키 대 엔하위키미러 사건에서 원고들은 부정경쟁방지법 위반도 주장하였으나, 일반 부정경쟁행위의 보충성으로 인해 법원은 저작권 침해를 인정하고 부정경쟁방지법에 대해 나아가 판단하지 않았다.

한편 사람인 대 잡코리아 사건의 민사 1심 법원은 부정경쟁방지법상 부정경쟁행위를 긍정하였는데(서울중앙지방법원 2016. 2. 17. 선고 2015가합517982 판결), 그 이유로 피고가 VPN 업체를 통해 IP를 분산한 뒤 검색로봇의 User-Agent에 정체를 명시하지 아니하고, 원고의 robots.txt를 확인하지 아니한 채 HTML 소스를 크롤링하였다는 점을 들었다.

야놀자 대 여기어때 사례는, 형사 2심에서 무죄가 선고되었음에도 불구하고, 민사 1심 재판부가 구법상 (파)목에 의한 부정경쟁행위를 긍정하여 10억원의 손해배상책임 및 숙박업소 정보의 복제 등 중지를 명했다(서울중앙지방법원 2021. 8. 19. 선고 2018가합508729 판결). 법원은 원고의 데이터들이 공공영역(public domain)에 속한 것이라 볼 수 없으며, 원고는 당해 정보를 수집하기 위해 각 숙박시설마다 월 5회 내지 10회씩 방문하였고, 숙박정보 수집을 위하여 상당한 비용을 투입하였다면서 데이터베이스가 보호 대상이라고 인정하였다.

  1. 크롤링의 법적 허용기준 정립에 관한 검토

이상에서 살핀 것처럼 저작권법 등 전통적인 법제가 데이터의 보호에 초점을 맞추고 있어 크롤링 행위는 매우 다양한 법 위반 주장에 맞닥뜨리고 있다.

저작권법은 공정이용 조항을 도입하여 크롤링 행위에 대한 면책 가능성이 인정되고 있다고 할 것이나, 포괄적인 일반조항인 만큼 명확성에 한계가 있다. 특히 여타의 관련 법제에는 공정이용에 유사한 면책규정조차 마련되어 있지 않다. 결국 크롤링이 공정이용으로 저작권법상 면책되더라도 다른 법령에 기하여 민,형사책임에 노출될 가능성을 배제할 수 없다.

이와 같은 불확실성은 4차산업혁명 시대에 알맞은 정보기반 산업을 영위하고자 하는 기업들에게 위협으로 작용할 수 있다. 따라서 저작권법에 통상적인 크롤링 행위가 면책될 수 있는 구체적 공정이용 사유를 추가하고, 다른 유관 법제에서도 유사한 조항을 도입하거나 준용하는 등으로 크롤링의 허용기준을 입법적으로 명확히 하는 노력이 필요해 보인다.

공정이용의 인정기준과 선행한 논의들을 종합하여 볼 때, 크롤링의 목적, 대상, 방법, 결과가 면책의 기준이 되어야 할 것으로 보인다. 반면 기술의 발달과 인터넷 환경에 비추어 이용데이터의 비중이나 분량 등은 중요 기준이 되기 어렵다고 보인다.

목적과 관련해서는 크롤링의 목적이 부정한 무임승차에 있는지 여부가 판단되어야 할 것이다. AI 학습용 데이터셋을 수립하기 위한 목적이나, 검색 또는 비교, 전략 수립 등 목적으로 수행하는 크롤링은 무임승차 목적으로 하는 크롤링과는 구별되어야 할 것이다.

대상과 관련해서는 크롤링으로 수집한 데이터가 공개된 데이터인지 암호화되는 등으로 비공개된 데이터인지가 일차적인 기준이 될 것이다. 특히 공개된 데이터가 원본데이터(raw data)의 축적인 경우는 웹 사이트 소유자의 지속적인 검증과 보완 노력에 따른 산물인 경우와는 달리 취급해야 할 것이다.

크롤링의 방법이 보편적, 정상적인지도 중요하게 고려되어야 할 것이다. 이는 그간 판례가 크롤링 사건에서 견지해온 태도이기도 하다. 즉, 미러링과 같이 웹 사이트 전체를 복제하여 경쟁적인 사업을 영위하는 방식은 정상적인 크롤링과는 차별화되어야 할 것이다.

마지막으로 크롤링의 결과 데이터 보유자의 이익이 침해되는지 고려되어야 한다. 크롤링된 데이터를 아웃링크 방식으로 데이터베이스화 하는 경우와 같이 데이터 보유자의 이익 침해 가능성이 비교적 낮은 경우는 함부로 위법한 크롤링이라고 보아서는 안될 것이다. 또한 공개데이터에 대한 수집 및 활용은 다른 한편 소비자 후생 증가 등 공공의 이익으로 돌아가므로 이에 대한 판단에 있어서는 이익형량의 과정이 필요할 것이다.

  1. 결론

데이터에 대한 권리증진과 법적보호는 데이터의 생산을 촉진하는 순기능을 갖는다. 그러나 그 권리를 과잉 보호하면 데이터의 수집과 이용을 위축시키고 장기적으로 산업의 발전을 저해하여 데이터 생산까지 되려 위축시킬 수 있다.

특히 공개된 데이터, 특히 원본데이터나 단순데이터에 해당하는 데이터의 수집과 활용까지 금지된다고 보는 것은 여러모로 문제가 있다. 위와 같은 데이터는 사회의 공공재이지 그 데이터를 먼저 축적한 자의 전유물이라고 보기 어렵기 때문이다.

따라서 데이터 보호가 중요한 만큼이나 선량한 크롤링 행위에 대한 법적 보호에도 유의할 필요가 있다. 이를 위한 첫 번째 실천과제는 명확한 법적 기준의 마련이 될 것이다.

참 고 문 헌

The content of this article is intended to provide a general guide to the subject matter. Specialist advice should be sought about your specific circumstances.