유용한 TIP

웹사이트 데이터를 엑셀로 가져오기 - 리스틀리

정데만 2023. 7. 2. 13:40
728x90
 

 

데이터를 분석하다보면 인터넷에 있는 정보를 긁어서 사용할 일이 많다.

 

간단한 내용은 그냥 마우스로 드레그하여 엑셀에 붙여넣은 후 사용하지만, 깔끔하게 복사되지 않기 때문에 불필요한 부분은 잘라내거나 표에 맞춰서 정리하다 보면 2~30분은 후딱 지나버린다.

 

게다가 상품정보와 같이 여러페이지를 수집해야 할 경우 같은 일만 반복하면서 하루가 그냥 지나가버리고, 아무리 단순작업이라해도 지칠 수 밖에 없다.

 

이번에 소개할 툴은 이러한 작업에 특화된 무료 프로그램이다. 


1. 브라우저 확장기능 설치 및 회원 가입

 

리스틀리(https://www.listly.io/ko)

 

홈페이지에 접속하면 첫번째 화면에 확장프로그램 추가라는 버튼부터 보인다. 엣지, 크롬, 웨일브라우저 모두 지원하니 자신이 사용하는 브라우저에 프로그램을 추가하자.

 

 

설치 후 확장프로그램에 마우스를 갖다대면 아래와 같은 화면이 나온다.

 

 

 

이제 긁고 싶은 페이지에 가서 확장프로그램을 누른 후 전체버튼을 클릭하면 알아서 전부 긁어준다.

 

 

2. 전체 버튼 누른 후 엑셀로 다운로드

긁으려고 하는 페이지에서 확장 프로그램을 클릭한 후 '전체'버튼을 클릭해보자.

 

 

그러면, 아래와 같이 웹페이지를 자동으로 인식하여 Result페이지를 보여준다. 화면의 가장 윗부분은 긁어온 페이지, 그리고 중간에는 엑셀과 구글시트로 전달하는 버튼이 있으며 아래에 추출할 탭을 선택하는 화면이 나온다.

 

 

추출할 탭을 눌러보면 같은 형태의 컨텐츠끼리 묶어 있는데, 쿠팡에서 소고기 검색페이지를 긁었더니 상품목록에 있는 정보들이 가지런하게 나와있는 모습을 볼 수 있다.

 

 

컨텐츠를 확인한 후 중간 부분의 엑셀버튼을 클릭하면 아래의 파일을 다운받을 수 있다.

 

 

상품 이미지주소와 상품명, 할인률, 가격 등이 따로 다듬을 필요 없이 같은 컨텐츠끼리 깔끔하게 표로 들어가있다. 

 

 

만약 회원가입과 로그인을 해둔 상태라면 결과화면에서 상단의 DATABOARD를 누르면 방금 긁은 페이지가 히스토리로 저장되어 언제든지 다시 확인할 수 있다.

 

회원가입은 이메일주소와 비밀번호로를 기입하고 이메일인증만 하면 가입이 완료된다.

 


 

3. 링크를 같이 다운로드

다시 쿠팡 검색결과에서 전체를 선택한 후 결과화면의 중간부분에서 하이퍼링크라고 되어있는 체크박스를 선택한 후 다시 엑셀로 다운받아 보자.

 

 

해당 페이지에 있던 각 상품정보로 들어가는 URL이 표에 추가된 것을 볼 수 있다.

 

 

4. 특정 부분만 긁어오기

리스틀리를 쓸 때는 전체를 누르면 어차피 컨텐츠별로 탭이 나오기때문에 굳이 부분만 긁는 기능을 쓸 필요는 없어보이지만, 부분 버튼을 누르면 긁으려는 부분을 선택할 수 있고, 좀 더 자세하게 탭이 나눠져 있는 것을 볼 수 있다.

 

 

아래는 상품정보의 후기부분을 긁은 내용으로 좀 더 상세하게 컨텐츠가 나눠져 있어서 필요한 부분을 쉽게 선택할 수 있다.

 

 

5. 엑셀 기능과 비교

참고로 엑셀에도 데이터탭에 웹에서 바로 가져오는 기능이 있다. 아래와 같이 데이터 가져오기 > 기타 원본에서 > 웹을 선택한 후 가져올 URL을 입력하면 된다.

 

 

아래는 URL에 finance.naver.com를 입력한 결과이다.

 

 

원하는 영역을 선택 후 데이터 변환을 누르면 다음과 같이 데이터를 가져올 수 있다.

 

 

하지만, 엑셀2016부터 지원하는 기능이며 표로 된 데이터만 가져올 수 있고, 조금 느리기도 하고, 복잡한 사이트는 아에 멈추기도 하니... 리스틀리는 상당히 강력한 프로그램인 셈이다.

 


728x90