Skip to content

Commit b57eeda

Browse files
committed
day2_4
1 parent 97d210c commit b57eeda

File tree

1 file changed

+30
-0
lines changed

1 file changed

+30
-0
lines changed

day2_4.py

Lines changed: 30 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,30 @@
1+
import requests
2+
from bs4 import BeautifulSoup
3+
4+
indeed_result = requests.get("https://www.indeed.com/jobs?q=Python&limit=50")
5+
6+
#페이지에 쓸 soup를 제작..페이지가 총 몇개인지 보기 위해서
7+
#soup는 특정 데이터를 찾아주는 오브젝트
8+
#html코드상에서 soup를 이용해서 데이터 탐색 및 추출이 가능함
9+
indeed_soup = BeautifulSoup(indeed_result.text, "html.parser")
10+
11+
#indeed soup에서 찾은걸 담아서 div를 찾은뒤 class명이 pagination인 요소를
12+
#반환했음
13+
#indeep_soup는 html을 통으로 긁어온 것..그걸 다듬어 div만 가져온것임
14+
pagination = indeed_soup.find("div", {"class":"pagination"})
15+
16+
# pagination에서 링크만 모두 찾아줬음 div안에 링크들을 모음
17+
links = pagination.find_all('a')
18+
pages = []
19+
20+
# 이렇게 걸러낸 리스트 안에 또 span이 있으므로 이를 리스트에 담아 추출.
21+
for link in links[:-1]: #마지막 요소는 읽지 않겠다는 뜻
22+
#pages.append(link.find("span").string) # string만 가져오길 원함
23+
pages.append(int(link.string)) #string -> integer 변환
24+
25+
# print(spans[0:4])
26+
27+
#pages = pages[0:-1] # 파이썬의 배열에 음수..끝에서부터란 뜻
28+
max_page = pages[-1]
29+
print(max_page)
30+

0 commit comments

Comments
 (0)