이전 글에서 웹사이트를 크롤링(웹스크래핑)할 때 참고해야하는 robots.txt에 대해서 알아보았습니다. 이전 글 robots.txt 확인하고 크롤링(웹스크래핑) 하고 계신가요? 많은 분들이 프로그래밍 언어를 사용해 만든 크롤러, 또는 웹스크래퍼를 이용해서 인터넷 사이트에 있는 웹 사이트의 정보들을 수집합니다. 이러한 행위를 크롤링, 또는 웹스크래핑이라고 하는 redfox.tistory.com robots.txt에 대해 이야기하면서 크롤링이 불법 행위가 아니라는 말을 했었는데요. 읽기 전에해당 글은 비전문가의 개인적인 관점을 기준으로 작성되었음을 밝힙니다. 크롤링으로 인해 고소를 당한 사례크롤링이 불법이 아닌데, 크롤링을 하다가 고소를 당하고, 불법이라는 판결까지 받게 되다니 앞뒤가 맞지 않는 말처럼 보이는데요. 채용정보 무단복제 ‘사람인HR’, 잡코리아에 120억 지급 - 시장경제 채용공고 불법 복제 및 게재하는 웹크롤링 행위를 두고 10여 년간 갈등을 빚어온 사람인과 잡코리아가 마침내 합의를 이뤘다.사람인은 웹크롤링 소송 합의금으로 잡코리아에 120억을 지불했다. www.meconomynews.com 여기어때, 야놀자 DB 무단수집 위법 판결…심명섭 전 대표 1심 집유 위드이노베이션(여기어때)가 경쟁업체 야놀자 숙박정보 데이터베이스(DB)를 무단 크롤링(분산 데이터 추출 기술)한 행위가 위법하다는 법원 판단이 나왔다. 서울중앙지법 형사5단독 신민석 판사 www.etnews.com 크롤링 행위로 왜 고소를 당하게 되었을까?이전 글에서 말했던 것처럼 '크롤링'하는 '행위' 자체는 불법이
아닙니다. 위 소송 사례들을 보면 파나결의 요점이 크롤링을 하는 행위보다는 크롤링한 데이터를 가지고 추가적인 작업을 한 것에 대해 판결이 내려졌습니다. 사람인의 경우 잡코리아에 게시되는 채용정보들을 크롤링한 다음 해당 내용을 그대로 복제해서 자신들의 사이트에 게시한 것에 대해서, 1. 크롤링한 데이터를 기반으로 타인에게 서비스를 제공, 이득을 얻는 행위 2. 데이터를 크롤링하면서 대상 서버에 무리한 트래픽 요청으로 인한 해당 사이트 이용자들의 정상적인 서비스 이용 방해 제 생각에 각 판결들의 요점은 위 2가지로 보입니다. 즉, 좀더 유용하게 데이터를 수집하고 활용하기 위해 크롤링을 하는 '행위'는 용납될 수 있지만, 이렇게 크롤링을 하는 행위가 대상 서버에 무리한 트래픽 요청을 하는 것으로 인해 다른 이용자들의 정상적인 이용을 방해를 하게 되는 경우와 두 가지 모두 누군가에게 금전적인 손실을 입게 만들었거나, 또는 상대방에게 데이터 사용에 대한 동의 없이 임의로 데이터를 가공한 것을 이용해 금전적인 이익을 보았을 경우 이를 위법하다고 보게 되는 겁니다. 특히 사이트에서 수집할 수 있는 데이터의 경우 대부분의 사이트에서 해당 사이트에서 수집한 데이터를 재가공하여 타인에게 제공하는 행위를 금지하는 항목을 서비스 이용 규정에 명시해 놓은 곳이 많습니다. 아래는 네이버의 이용 약관 중 일부를 캡쳐해온 것입니다. Successfully reported this slideshow. 누구도 알려주지 않는 크롤링의 함정 누구도 알려주지 않는 크롤링의 함정 by Hong3 누구도 알려주지 않는 크롤링의 함정 by Hong3 More Related Content
|