오류해결 List
1. 브라우저 꺼짐현상
2. selnium 테이블 읽기
https://passwd.tistory.com/187
문제 발생 hidecols1~5의 데이터를 읽지 못함
> xpath로 구조를 파악하여 table 데이터를 가져와서 분할하는 방법으로 전환
크롤링 기초 로직 완성 2023.12.20 14:00~17:37
크롤링 반복 로직 설계
## 반복 로직 구상안
# list & variables
url = 'https://www.airportal.go.kr/knowledge/statsnew/air/'
category = [ 'airport', 'route', 'country', 'airline' ]
year_sel = ['2020','2021','2022','2023']
month_sel = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
operate_sel = ['정기','부정기']
route_sel = ['국내선','국제선']
browser = webdriver.Chrome(options=chrome_options)
browser.get(url+category[1]+'.jsp') # 필요한 카테고리별로
for i in year_sel:
연도선택
for i2 in month_sel:
월 선택
for i3 in operate_sel:
운항종류 선택
for i4 in route_sel:
노선 선택
검색버튼 클릭
크롤링
데이터 csv로 저장
공항데이터 완료 > 추후 노선별, 지역-국가별,
IATA 코드 정리파일
https://community.tableau.com/s/question/0D54T00000C626xSAB/airport-codes-in-tableau-101
IATA 코드 적용
Tableau 연동법 gpt에 확인
https://chat.openai.com/share/dde290c6-5112-4e5b-a327-7645bd67f669
코로나 관련 Data 보완
WHO Data의 백신 관련 데이터가 시계열 특성이 부족한듯함 / 보완필요
새로운 데이터