[데이터 분석] 사람인 채용공고 크롤링

크롤링 준비

from bs4 import BeautifulSoup
from urllib.request import Request, urlopen
import pandas as pd

사람인 채용정보 크롤링

# 데이터를 받을 리스트
title_t = []
company_t = []
addr_t = []
link_t = []

# 5페이지까지 크롤링
for i in range(1, 6):
    # 정보보호 직무 크롤링
    url = 'https://www.saramin.co.kr/zf_user/search/recruit?searchword=%EC%A0%95%EB%B3%B4%EB%B3%B4%EC%95%88&go=&flag=n&searchMode=1&searchType=search&search_done=y&search_optional_item=n&recruitPage=' + str(i) + '&recruitSort=relation&recruitPageCount=40&inner_com_type=&company_cd=0%2C1%2C2%2C3%2C4%2C5%2C6%2C7%2C9%2C10&quick_apply=&except_read='
    headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'}
    request = Request(url, headers=headers)
    response = urlopen(request)
    html = response.read()
    soup = BeautifulSoup(html, 'html.parser')

    # 제목
    title = soup.select('#recruit_info_list > div.content > div > div.area_job > h2 > a > span')
    for t in title:
        title_t.append(t.text)

    # 회사명
    company = soup.select('#recruit_info_list > div.content > div > div.area_corp > strong > a > span')
    for t in company:
        company_t.append(t.text)

    # 회사 위치
    addr = soup.select('#recruit_info_list > div.content > div > div.area_job > div.job_condition > span:nth-child(1)')
    for t in addr:
        addr_t.append(t.text)

    # 채용 공고 링크
    link = soup.select('#recruit_info_list > div.content > div > div.area_job > h2 > a')
    'https://www.saramin.co.kr' + link[0]['href']
    for l in link:
        link_t.append('https://www.saramin.co.kr' + l['href'])

# 데이터 저장
col = ['기업명', '제목', '주소', '링크']
data = pd.DataFrame(list(zip(company_t, title_t, addr_t, link_t)), columns=col)
data.to_csv('saramin.csv', index=False)
print("크롤링 완료")

크롤링 완료

저작자표시 (새창열림)

'데이터분석' 카테고리의 다른 글

[데이터 분석] sales 데이터 전처리하기 (0)	2021.06.30
[데이터 분석] sales 데이터 분석 (0)	2021.06.30
[데이터 분석] 오픈 API를 통한 데이터 수집 : 행정안전부_소방서위치조회서비스 (0)	2021.06.30
[데이터 분석] 아마존 ecommerse 데이터 분석 (0)	2021.06.30
데이터란 무엇인가? (0)	2021.06.26

CodingKwon IT일지

[데이터 분석] 사람인 채용공고 크롤링

'데이터분석' 카테고리의 다른 글

댓글

티스토리툴바

[데이터 분석] 사람인 채용공고 크롤링

'데이터분석' 카테고리의 다른 글

관련글

댓글

티스토리툴바