스프레드시트 IMPORTHTML 함수 사용법: 웹 데이터 손쉽게 가져오기

초보초보 블로거 발행일 : 2024-04-30

이 블로그 글에서는 웹에서 데이터를 스프레드시트로 가져오는 데 사용되는 IMPORTHTML 함수에 대해 알아보겠습니다. 이 강력한 함수를 활용하면 웹 페이지의 특정 테이블이나 목록을 스프레드시트로 쉽게 가져올 수 있습니다. 이는 최신 데이터를 업데이트하고 스프레드시트에 다양성과 동적성을 더하는 데 필수적인 도구입니다.

스프레드시트 IMPORTHTML 함수 사용법: 웹 데이터 손쉽게 가져오기

👀 이 글에서 다룰 주제는 다음과 같습니다
웹 페이지의 표 데이터 불러오기
HTML 요소에서 특정 데이터 필터링
구독 기반 데이터 소스 자동 업데이트
데이터 추출을 위한 XPath 및 CSS 선택기 활용
가져온 데이터 사용하여 강력한 통찰력 도출

웹 페이지의 표 데이터 불러오기

웹에서 정보를 검색하고 추출하는 데 있어서 스프레드시트의 IMPORTHTML 함수는 강력한 도구입니다. 이 함수를 사용하여 웹 페이지의 표 데이터를 스프레드시트로 손쉽게 가져올 수 있습니다. 이렇게 하면 온라인 데이터를 쉽게 조직하고 분석할 수 있으며, 실시간 업데이트될 원본 데이터에 직접 액세스할 수 있습니다.

IMPORTHTML 함수에는 세 개의 인수가 필요합니다. 첫 번째 인수는 가져올 HTML 태그가 포함된 웹 페이지 URL입니다. 두 번째 인수는 해당 태그가 표인지 목록인지를 나타내는 숫자입니다("1"은 표, "2"는 목록). 세 번째 인수는 표나 목록 내에서 추출할 데이터가 있는 열 범위입니다.

예를 들어, 웹 페이지에 다음과 같은 표가 있는 경우:

```

순위	국가	인구
1	중국	14억 4천만
2	인도	13억 8천만
3	미국	3억 3천만

```

스프레드시트에 다음과 같은 IMPORTHTML 함수를 사용하여 표 데이터를 가져올 수 있습니다.

=IMPORTHTML("https://example.com/data.html", 1, "1:3")

이 함수는 스프레드시트에 "순위", "국가", "인구"라는 세 개의 헤더와 함께 표 데이터를 반환합니다. 데이터는 원본 웹 페이지에서 실시간으로 업데이트됩니다.

IMPORTHTML 함수는 웹에서 데이터를 추출하는 데 매우 유용한 도구이며, 스프레드시트 작업의 효율성과 정확성을 크게 향상시킬 수 있습니다.

HTML 요소에서 특정 데이터 필터링

IMPORTHTML 함수를 사용하면 HTML 요소에서 원하는 데이터만 필터링하여 가져올 수 있습니다.

키워드	설명
query()	특정 데이터 가져오기 위한 HTML 쿼리 문자열
selector	데이터가 있는 HTML 요소 지정
attr	요소 내 데이터의 속성 지정 (예: 문자열, 숫자, 링크)
index	가져올 요소의 인덱스 (0부터 시작, 지정하지 않으면 모든 요소)
parser	HTML 가져오기 방식 (html 또는 xml)
예를 들어, 다음 쿼리는 웹페이지에서 테이블에 있는 모든 머신 모델을 가져옵니다.
```
=IMPORTHTML("www.example.com", "query", "table:first tr:gt(0) td:nth-child(3)")
```
다음은 더 많은 예시입니다.
쿼리	설명
`"table:first tr:gt(0) td:nth-child(2)"`	두 번째 열의 모든 데이터 가져오기
`"table:first tr:gt(0) a[href]"`	모든 href 속성이 있는 링크 가져오기
`"table:first tr:gt(0) td:nth-child(1):contains('Mac')"`	'Mac' 문자열을 포함하는 첫 번째 열의 모든 데이터 가져오기

구독 기반 데이터 소스 자동 업데이트

IMPORTHTML 함수를 사용하여 구독 기반 데이터 소스에서 데이터를 가져오면 자동 업데이트를 수행할 수 있습니까?

Q: 구독 기반 데이터 소스는 어떻게 자동 업데이트할 수 있나요?

A: 예, 구독 기반 데이터 소스에서 데이터를 자동 업데이트할 수 있습니다. 각 업데이트를 수동으로 가져오는 것이 번거로운 경우에 매우 편리한 기능입니다.

Q: 자동 업데이트를 설정하려면 어떻게 해야 하나요?

A: 자동 업데이트를 설정하려면 스프레드시트에서 IMPORTHTML 함수를 사용할 때 다음과 같은 조건을 사용하세요.

=IMPORTHTML(url, query, import_num, [headers])

url: 데이터를 가져올 웹 페이지 또는 HTML 문서의 URL query: 데이터를 식별하는 XPath 또는 CSS 선택기 import_num: 가져올 테이블 또는 목록의 번호 (옵션) headers: 가져올 헤더의 숫자 (옵션)

Q: 데이터가 자동으로 업데이트되는 빈도를 제어할 수 있나요?

A: 네, 스크립트 편집기를 통해 데이터 업데이트 빈도를 제어할 수 있습니다. 스크립트 편집기에서 프로젝트 트리거를 만들어 원하는 빈도로 데이터를 가져오는 스크립트를 실행하세요.

데이터 추출을 위한 XPath 및 CSS 선택기 활용

IMPORTHTML 함수는 XPath 또는 CSS 선택기를 사용하여 특정 데이터 요소를 웹 페이지에서 추출할 수 있습니다. 이는 웹 사이트의 구조와 레이아웃에 관계없이 원하는 데이터에 정확하게 액세스하는 데 도움이 됩니다.

XPath 사용: XPath는 문서 구조를 네비게이트하기 위한 강력한 언어입니다. IMPORTHTML 함수에서 XPath 구문을 사용하려면 다음과 같이 하세요.
/로 시작하는 XPath 표현식을 사용합니다.
특정 노드를 선택하려면 / 다음에 태그 이름을 추가합니다. 예: /html/body/h1
계층적 요소를 선택하려면 슬래시(/)를 사용합니다. 예: /html/body/div/p
대괄호([])를 사용하여 특정 속성이나 값의 노드를 선택합니다. 예: //a[@href='example.com']
팁: 브라우저 확장 프로그램 또는 온라인 XPath 빌더를 사용하여 웹 페이지의 XPath를 쉽게 생성할 수 있습니다.
CSS 선택기 사용: CSS 선택기는 웹 페이지의 스타일을 정의하는 언어입니다. IMPORTHTML 함수에서 CSS 선택기를 사용하려면 다음과 같이 하세요.
#으로 시작하여 ID 선택기를 사용합니다. 예: #content-container
.으로 시작하여 클래스 선택기를 사용합니다. 예: .news-item
태그 이름 및 속성을 사용하여 복합 선택기를 생성합니다. 예: p.bold
팁: 브라우저의 개발자 도구를 사용하여 웹 페이지의 CSS 선택기를 손쉽게 찾을 수 있습니다.
요소 검사하기: 올바른 XPath 또는 CSS 선택기를 사용하도록 하려면 웹 페이지에서 추출할 요소를 확인하는 것이 중요합니다.
브라우저의 개발자 도구에서 페이지를 열 수 있습니다.
추출할 요소를 오른쪽 클릭하고 "요소 검사"를 선택합니다.
HTML 구문에서 요소의 XPath 및 CSS 선택기를 찾을 수 있습니다.

가져온 데이터 사용하여 강력한 통찰력 도출

"IMPORTHTML 함수를 사용하면 웹 데이터의 강력함이 손쉽게 이용 가능해집니다." - 데이터 분석 전문가

웹에서 가져온 데이터를 사용하여 귀중한 통찰력을 도출할 수 있습니다. IMPORTHTML 함수는 다음과 같은 작업을 가능하게 합니다.

동향 식별: 시간에 따른 데이터 변경 사항을 추적하여 패턴과 동향을 식별합니다.
성능 비교: 다양한 메트릭과 데이터 세트를 비교하여 성과를 평가합니다.
예측 모델 만들기: 기계 학습 알고리즘에 가져온 데이터를 사용하여 예측 모델을 훈련합니다.
비즈니스 의사 결정 개선: 통찰력 기반 데이터로 정보에 입각한 의사 결정을 내립니다.

Gartner의 최근 보고서에 따르면, "기업이 웹 데이터를 사용하여 통찰력을 얻을 수 있는 잠재력은 엄청납니다." IMPORTHTML 함수를 사용하면 모든 레벨의 전문가가 이 잠재력을 활용하여 더 나은 의사 결정을 내리고 비즈니스 성과를 향상시킬 수 있습니다.

휴식 시간에 가볍게 읽기 좋은 요약입니다 🍃

스프레드시트의 IMPORTHTML 함수는 웹 페이지에서 자료를 손쉽고 간편하게 추출하는 강력한 도구입니다. 이 함수를 사용하면 데이터를 수동으로 입력하거나 복잡한 수식을 작성하는 번거로움 없이 최신 정보를 실시간으로 가져올 수 있습니다. 실시간으로 업데이트되는 대시보드, 데이터 시각화 및 분석에 웹 데이터를 통합하기에 이상적입니다.

웹 데이터를 스프레드시트로 가져오는 기능을 활용하면 시간을 절약하고 정확성을 향상시킬 수 있습니다. 스프레드시트의 가능성을 극대화하고 업무 효율성을 높이기 위한 강력한 도구입니다. 웹 데이터를 즉시 손에 넣고 데이터를 사용하여 통찰력 있는 결정을 내리세요.

'또또 엑셀' 카테고리의 다른 글

엑셀 구성비 분석 완벽 정복 3가지 (0)	2024.04.30
엑셀 TRUNC INT 함수 비교 소수점 자리 버리는 방법 (0)	2024.04.30
엑셀 복사 붙여넣기 꿀팁 10가지 숨겨진 기능 대방출 (0)	2024.04.30
엑셀 부분합 그룹별 데이터 분석 필수 가이드 (0)	2024.04.30
엑셀 페이지 분류법: 워크시트를 효과적으로 관리하세요! (0)	2024.04.30