스프레드시트 IMPORTHTML 함수 사용법: 웹 데이터 손쉽게 가져오기
이 블로그 글에서는 웹에서 데이터를 스프레드시트로 가져오는 데 사용되는 IMPORTHTML 함수에 대해 알아보겠습니다. 이 강력한 함수를 활용하면 웹 페이지의 특정 테이블이나 목록을 스프레드시트로 쉽게 가져올 수 있습니다. 이는 최신 데이터를 업데이트하고 스프레드시트에 다양성과 동적성을 더하는 데 필수적인 도구입니다.
스프레드시트 IMPORTHTML 함수 사용법: 웹 데이터 손쉽게 가져오기
👀 이 글에서 다룰 주제는 다음과 같습니다 |
---|
웹 페이지의 표 데이터 불러오기 |
HTML 요소에서 특정 데이터 필터링 |
구독 기반 데이터 소스 자동 업데이트 |
데이터 추출을 위한 XPath 및 CSS 선택기 활용 |
가져온 데이터 사용하여 강력한 통찰력 도출 |
웹 페이지의 표 데이터 불러오기

웹에서 정보를 검색하고 추출하는 데 있어서 스프레드시트의 IMPORTHTML 함수는 강력한 도구입니다. 이 함수를 사용하여 웹 페이지의 표 데이터를 스프레드시트로 손쉽게 가져올 수 있습니다. 이렇게 하면 온라인 데이터를 쉽게 조직하고 분석할 수 있으며, 실시간 업데이트될 원본 데이터에 직접 액세스할 수 있습니다.
IMPORTHTML 함수에는 세 개의 인수가 필요합니다. 첫 번째 인수는 가져올 HTML 태그가 포함된 웹 페이지 URL입니다. 두 번째 인수는 해당 태그가 표인지 목록인지를 나타내는 숫자입니다("1"은 표, "2"는 목록). 세 번째 인수는 표나 목록 내에서 추출할 데이터가 있는 열 범위입니다.
예를 들어, 웹 페이지에 다음과 같은 표가 있는 경우:
```
순위 | 국가 | 인구 |
---|---|---|
1 | 중국 | 14억 4천만 |
2 | 인도 | 13억 8천만 |
3 | 미국 | 3억 3천만 |
```
스프레드시트에 다음과 같은 IMPORTHTML 함수를 사용하여 표 데이터를 가져올 수 있습니다.
=IMPORTHTML("https://example.com/data.html", 1, "1:3")
이 함수는 스프레드시트에 "순위", "국가", "인구"라는 세 개의 헤더와 함께 표 데이터를 반환합니다. 데이터는 원본 웹 페이지에서 실시간으로 업데이트됩니다.
IMPORTHTML 함수는 웹에서 데이터를 추출하는 데 매우 유용한 도구이며, 스프레드시트 작업의 효율성과 정확성을 크게 향상시킬 수 있습니다.
HTML 요소에서 특정 데이터 필터링

IMPORTHTML 함수를 사용하면 HTML 요소에서 원하는 데이터만 필터링하여 가져올 수 있습니다.
키워드 | 설명 |
---|---|
query() | 특정 데이터 가져오기 위한 HTML 쿼리 문자열 |
selector | 데이터가 있는 HTML 요소 지정 |
attr | 요소 내 데이터의 속성 지정 (예: 문자열, 숫자, 링크) |
index | 가져올 요소의 인덱스 (0부터 시작, 지정하지 않으면 모든 요소) |
parser | HTML 가져오기 방식 (html 또는 xml) |
예를 들어, 다음 쿼리는 웹페이지에서 테이블에 있는 모든 머신 모델을 가져옵니다. | |
``` | |
=IMPORTHTML("www.example.com", "query", "table:first tr:gt(0) td:nth-child(3)") | |
``` | |
다음은 더 많은 예시입니다. | |
쿼리 | 설명 |
`"table:first tr:gt(0) td:nth-child(2)"` | 두 번째 열의 모든 데이터 가져오기 |
`"table:first tr:gt(0) a[href]"` | 모든 href 속성이 있는 링크 가져오기 |
`"table:first tr:gt(0) td:nth-child(1):contains('Mac')"` | 'Mac' 문자열을 포함하는 첫 번째 열의 모든 데이터 가져오기 |
구독 기반 데이터 소스 자동 업데이트

IMPORTHTML 함수를 사용하여 구독 기반 데이터 소스에서 데이터를 가져오면 자동 업데이트를 수행할 수 있습니까?
Q: 구독 기반 데이터 소스는 어떻게 자동 업데이트할 수 있나요?
A: 예, 구독 기반 데이터 소스에서 데이터를 자동 업데이트할 수 있습니다. 각 업데이트를 수동으로 가져오는 것이 번거로운 경우에 매우 편리한 기능입니다.
Q: 자동 업데이트를 설정하려면 어떻게 해야 하나요?
A: 자동 업데이트를 설정하려면 스프레드시트에서 IMPORTHTML 함수를 사용할 때 다음과 같은 조건을 사용하세요.
=IMPORTHTML(url, query, import_num, [headers])
url: 데이터를 가져올 웹 페이지 또는 HTML 문서의 URL query: 데이터를 식별하는 XPath 또는 CSS 선택기 import_num: 가져올 테이블 또는 목록의 번호 (옵션) headers: 가져올 헤더의 숫자 (옵션)
Q: 데이터가 자동으로 업데이트되는 빈도를 제어할 수 있나요?
A: 네, 스크립트 편집기를 통해 데이터 업데이트 빈도를 제어할 수 있습니다. 스크립트 편집기에서 프로젝트 트리거를 만들어 원하는 빈도로 데이터를 가져오는 스크립트를 실행하세요.
데이터 추출을 위한 XPath 및 CSS 선택기 활용

IMPORTHTML 함수는 XPath 또는 CSS 선택기를 사용하여 특정 데이터 요소를 웹 페이지에서 추출할 수 있습니다. 이는 웹 사이트의 구조와 레이아웃에 관계없이 원하는 데이터에 정확하게 액세스하는 데 도움이 됩니다.
- XPath 사용: XPath는 문서 구조를 네비게이트하기 위한 강력한 언어입니다. IMPORTHTML 함수에서 XPath 구문을 사용하려면 다음과 같이 하세요.
/
로 시작하는 XPath 표현식을 사용합니다.- 특정 노드를 선택하려면
/
다음에 태그 이름을 추가합니다. 예:/html/body/h1
- 계층적 요소를 선택하려면 슬래시(
/
)를 사용합니다. 예:/html/body/div/p
- 대괄호([])를 사용하여 특정 속성이나 값의 노드를 선택합니다. 예:
//a[@href='example.com']
- 팁: 브라우저 확장 프로그램 또는 온라인 XPath 빌더를 사용하여 웹 페이지의 XPath를 쉽게 생성할 수 있습니다.
- CSS 선택기 사용: CSS 선택기는 웹 페이지의 스타일을 정의하는 언어입니다. IMPORTHTML 함수에서 CSS 선택기를 사용하려면 다음과 같이 하세요.
#
으로 시작하여 ID 선택기를 사용합니다. 예:#content-container
.
으로 시작하여 클래스 선택기를 사용합니다. 예:.news-item
- 태그 이름 및 속성을 사용하여 복합 선택기를 생성합니다. 예:
p.bold
- 팁: 브라우저의 개발자 도구를 사용하여 웹 페이지의 CSS 선택기를 손쉽게 찾을 수 있습니다.
- 요소 검사하기: 올바른 XPath 또는 CSS 선택기를 사용하도록 하려면 웹 페이지에서 추출할 요소를 확인하는 것이 중요합니다.
- 브라우저의 개발자 도구에서 페이지를 열 수 있습니다.
- 추출할 요소를 오른쪽 클릭하고 "요소 검사"를 선택합니다.
- HTML 구문에서 요소의 XPath 및 CSS 선택기를 찾을 수 있습니다.
가져온 데이터 사용하여 강력한 통찰력 도출

"IMPORTHTML 함수를 사용하면 웹 데이터의 강력함이 손쉽게 이용 가능해집니다." - 데이터 분석 전문가
웹에서 가져온 데이터를 사용하여 귀중한 통찰력을 도출할 수 있습니다. IMPORTHTML 함수는 다음과 같은 작업을 가능하게 합니다.
- 동향 식별: 시간에 따른 데이터 변경 사항을 추적하여 패턴과 동향을 식별합니다.
- 성능 비교: 다양한 메트릭과 데이터 세트를 비교하여 성과를 평가합니다.
- 예측 모델 만들기: 기계 학습 알고리즘에 가져온 데이터를 사용하여 예측 모델을 훈련합니다.
- 비즈니스 의사 결정 개선: 통찰력 기반 데이터로 정보에 입각한 의사 결정을 내립니다.
Gartner의 최근 보고서에 따르면, "기업이 웹 데이터를 사용하여 통찰력을 얻을 수 있는 잠재력은 엄청납니다." IMPORTHTML 함수를 사용하면 모든 레벨의 전문가가 이 잠재력을 활용하여 더 나은 의사 결정을 내리고 비즈니스 성과를 향상시킬 수 있습니다.
휴식 시간에 가볍게 읽기 좋은 요약입니다 🍃
스프레드시트의 IMPORTHTML 함수는 웹 페이지에서 자료를 손쉽고 간편하게 추출하는 강력한 도구입니다. 이 함수를 사용하면 데이터를 수동으로 입력하거나 복잡한 수식을 작성하는 번거로움 없이 최신 정보를 실시간으로 가져올 수 있습니다. 실시간으로 업데이트되는 대시보드, 데이터 시각화 및 분석에 웹 데이터를 통합하기에 이상적입니다.
웹 데이터를 스프레드시트로 가져오는 기능을 활용하면 시간을 절약하고 정확성을 향상시킬 수 있습니다. 스프레드시트의 가능성을 극대화하고 업무 효율성을 높이기 위한 강력한 도구입니다. 웹 데이터를 즉시 손에 넣고 데이터를 사용하여 통찰력 있는 결정을 내리세요.
'또또 엑셀' 카테고리의 다른 글
엑셀 구성비 분석 완벽 정복 3가지 (0) | 2024.04.30 |
---|---|
엑셀 TRUNC INT 함수 비교 소수점 자리 버리는 방법 (0) | 2024.04.30 |
엑셀 복사 붙여넣기 꿀팁 10가지 숨겨진 기능 대방출 (0) | 2024.04.30 |
엑셀 부분합 그룹별 데이터 분석 필수 가이드 (0) | 2024.04.30 |
엑셀 페이지 분류법: 워크시트를 효과적으로 관리하세요! (0) | 2024.04.30 |
댓글