Requests2 스크래핑 0. 기초 requests, headers , re, BeautifulSoup HTML, XPath, 정규식 BeautifulSoup4 : 네이버 웹툰, 가우스 전자, 쿠팡, 다음 CSV : 네이버 금융 Selenium 네이버 로그인, 네이버 항공권, 구글무비 Headless 크롬, Wrap Up 웹사이트 접속 후, 전체 text 읽어오기 import requests res = requests.get("http://google.com") res.raise_for_status() print("응답코드 :", res.status_code) #200이면 정상 # print(len(res.text)) # print(res.text) with open("mygoogle.html", "w", encoding="utf8") as f: f.write(res.text) # if res.status.. 활용3. 웹스크래핑(0825-0829)/requests 2022. 8. 25. 2. ip 조회 : socket, requests, re 정규표현식 import socket import requests import re in_addr = socket.socket(socket.AF_INET, socket.SOCK_STREAM) in_addr.connect(("www.google.co.kr", 443)) print("내부IP: ",in_addr.getsockname()[0]) req = requests.get("http://ipconfig.kr") out_addr = re.search(r'추출할문자', req.text)[1] # 추출할문자 : IP Address : (\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}) # r' ' : raw string 백슬래시 문자를 해석하지 않는다. # \d 가 1~3번 있어야하고, # \. 은 있어야함.. python(0821-0908)/공브로(0821-0824) 2022. 8. 23. 이전 1 다음