-
오토핫키와 Winhttp #4. 파라미터를 주소에 표시하지 않는 사이트 파싱하기오토핫키/winhttp 2023. 2. 22. 05:23
압살맨 오픈채팅 바로가기
압살맨 유튜브 바로가기
시작
안녕하세요. 3강에서는 파라미터가 있는 주소를 숨기는 사이트를 알아봤는데요. 이번에는 파라미터 자체가 주소에 없는 사이트를 파싱하는 방법에 대해 알아볼게요.
본문
건강보조식품을 판매하는 미국에 자사를 두고있는 아이허브(iherb)
여기는 요즘 문제가 많다. 한국에서는 절대 쓰지 못하는 금지 성분을 쓰는 보조식품들이 많기 때문이다.
미국은 FDA 를 가지고 있는데 문제 안되겠지^^ 라고 생각하면 안되는게 FDA 가 이 성분은 안전하다. 무해하다. 라는 결과를 내기 전에 새로운 성분들은 마구잡이로 나오기 때문에 일단은 판매할게요. 라고 신고만 하면 허가를 주기 때문에 문제가 발생한다. 하지만 미국은 소송의 나라. 해당 식품을 섭취 후 처음 보는 부작용이 발생하게 된다면 소송을 통해 해당 회사가 직접 거액의 손해배상을 한다. 하지만 우리는 iherb 라는 중매사이트를 통해 직수입 후 해당 식품을 섭취하기 때문에 문제가 발생하더라도 보상을 받지 못한다. 서두가 존나 길었는데 어쨋든 여기를 한번 보자.
(광고 절대 아님. 코딩을 위한 연습일 뿐. 절대 홍보하거나 그런거 아님.)
https://kr.iherb.com/search?kw=%EB%B9%84%ED%83%80%EB%AF%BC
iherb 에서 '비타민' 을 검색했을 때 나오는 결과는
(광고 절대 아님. 코딩을 위한 연습일 뿐. 절대 홍보하거나 그런거 아님.)
이렇게 한글로 자동으로 바뀌어서 나온다. 현재 크롬에서 설정된 기본 언어를 파라미터로 받아오는 것 같다.
이걸 html 로 받아보면
이런식으로 유니코드가 있는데 이걸 찾아보면
(광고 절대 아님. 코딩을 위한 연습일 뿐. 절대 홍보하거나 그런거 아님.)
그렇다. 유니코드이긴 하지만 결과를 한글로 받아오는 것을 알 수 있다.
하지만 내가 영어로 결과를 받고싶을 때는 어떻게 해야하지?
아 이거 kr 만 en 으로 바꾸면 되겠네 ㅋㅋ 존나 쉽네
(광고 절대 아님. 코딩을 위한 연습일 뿐. 절대 홍보하거나 그런거 아님.)
네트워크 탭을 보자.
하나하나 차근차근 보니 language 나 lan 같은 언어를 설정하는 부분을 쿠키라는 헤더값으로 설정해주는 것을 알 수 있다.
그렇다면 이 쿠키를 영어를 쓰도록 바꾼후 헤더로 지정해서 쏴준다면
가독성을 위해 각 & 마다 줄바꿈으로 구분을 해줬다. 실제로는 이렇게 할 필요가 없다.
결과를 영어로 받아올 것이다. 한글이라면 당연히 저기 위에처럼 ko-KR 이겠지?
어떤 헤더가 더 필요하고 쿠키값을 얼마나 더 넣어줘야 하는지에 대해서는 설명하지 않는다.
그건 본인이 하는거다.
결론
이것을 통해 사이트 주소만이 아니라 헤더를 통해 파라미터를 지정하는 사이트도 있음을 알았다.
주소값이 안변하는데 어떻게 설정하지? 할 때는 헤더도 살펴보자.
난이도 : ★★★
'오토핫키 > winhttp' 카테고리의 다른 글
오토핫키와 Winhttp #6. multipart/form-data (0) 2024.07.13 오토핫키와 Winhttp #5. Winhttp 와 Adodb Stream 으로 파일 다운로드 구현 (0) 2023.07.11 오토핫키와 Winhttp #3. 원래 주소가 숨겨진 사이트를 파싱하는 방법 (0) 2023.02.16 오토핫키와 Winhttp #2. 파라미터가 주소에 입력되는 사이트 크롤링 (1) 2023.02.15 오토핫키와 Winhttp #1. winhttp 의 이해 (3) 2023.01.19