본문 바로가기

데이터분석9

[데이터 분석] 사람인 채용공고 크롤링 크롤링 준비 from bs4 import BeautifulSoup from urllib.request import Request, urlopen import pandas as pd 사람인 채용정보 크롤링 # 데이터를 받을 리스트 title_t = [] company_t = [] addr_t = [] link_t = [] # 5페이지까지 크롤링 for i in range(1, 6): # 정보보호 직무 크롤링 url = 'https://www.saramin.co.kr/zf_user/search/recruit?searchword=%EC%A0%95%EB%B3%B4%EB%B3%B4%EC%95%88&go=&flag=n&searchMode=1&searchType=search&search_done=y&search_op.. 2021. 6. 30.
[데이터 분석] 아마존 ecommerse 데이터 분석 Pandas 실전 연습 아마존 사이트에서 구입한 이력 데이터를 Pandas로 가져와 분석해 봅시다! 1. 데이터 로드 및 확인 import pandas as pd df = pd.read_csv('ecommerse.csv') 2. 데이터 조사 df.head() Address Lot AM or PM Browser Info Company Credit Card CC Exp Date CC Security Code CC Provider Email Job IP Address Language Purchase Price 0 16629 Pace Camp Apt. 448\nAlexisborough, NE 77... 46 in PM Opera/9.56.(X11; Linux x86_64; sl-SI) Presto/2... Ma.. 2021. 6. 30.
데이터란 무엇인가? 데이터란 무엇인가? 세상에 존재하는 모든 것은 데이터(Data)가 될 수 있음 정보(Information) : 데이터(Data)를 가공·처리해서 얻을 수 있는 결과 정량적 데이터 (정형 데이터) 정성적데이터 (비정형 데이터) 수치, 도형, 기호 등 언어, 문자, 그림, 영상 등 객관적 내용 주관적 내용 이용하기 쉬움, 비용 낮음 이용하기 어려움, 비용 높음 나이, 몸무게 등 뉴스기사, 음악 등 DIKW 모델 구분 내용 데이터 (Data) 데이터 자체로는 의미가 있을 수도 없을 수도 있는 객관적인 사실 정보 (Information) 특정한 목적을 위해 데이터를 가공해 만들어 낸 결과 지식 (Knowledge) 다양한 정보를 체계화시켜 만든 가치 지혜 (Wisdom) 패턴화 된 지식을 바탕으로 판단하는 능력.. 2021. 6. 26.
[파이썬 데이터 분석] 시각화, pyplot과 seaborn 라이브러리 튜토리얼 - 2 파이썬 데이터 분석 pyplot과 seaborn 라이브러리 튜토리얼 - 2 이 주피터노트북은 Seaborn에 대한 전반적인 설명을 담고 있습니다. 1. Seaborn이란? Seaborn은 Matplotlib을 기반으로 다양한 색상 테마와 통계용 차트 등의 기능을 추가한 시각화 패키지입니다. 기본적인 시각화 기능은 Matplotlib 패키지에 의존하며 통계 기능은 Statsmodels 패키지에 의존합니다. 2. 통계적 관계 시각화 Seaborn은 복잡한 데이터 세트 구조를 표현할 수있는 간단하고 이해하기 쉬운 데이터 표현을 사용하기 때문에 상당히 밝을 수 있습니다. 색조, 크기 및 스타일의 의미를 사용하여 최대 3개의 추가 변수를 매핑하여 향상시킬 수있는 2차원 그래픽을 플로팅하기 때문에 그렇게 할 수 있.. 2021. 6. 21.