일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 그리디
- Python
- 마이온
- 인턴10
- ux·ui디자인
- 알고리즘
- DFS
- 멋쟁이사자처럼
- folium
- graphrag
- seaborn
- paper review
- 멋재이사자처럼
- 프로젝트
- BFS
- 시각화
- Join
- Rag
- GIS
- 파이썬
- SQL
- intern10
- 마이온컴퍼니
- GNN
- DP
- TiL
- likelionlikelion
- parklab
- likelion
- 멋사
- Today
- Total
목록멋쟁이사자처럼 (18)
지금은마라톤중
2023.03.07 ● 상관계수는 -1~1 사이의 값 피어슨 상관계수(r) r이 -1.0과 -0.7 사이이면, 강한 음적 선형관계, r이 -0.7과 -0.3 사이이면, 뚜렷한 음적 선형관계, r이 -0.3과 -0.1 사이이면, 약한 음적 선형관계, r이 -0.1과 +0.1 사이이면, 거의 무시될 수 있는 선형관계, r이 +0.1과 +0.3 사이이면, 약한 양적 선형관계, r이 +0.3과 +0.7 사이이면, 뚜렷한 양적 선형관계, r이 +0.7과 +1.0 사이이면, 강한 양적 선형관계 질문🙋🏻♂️: 현실세계에서 양의 상관이 있는 것과 음의 상관이 있는것 무엇이 있을까요? - 양의 상관 교육 수준과 소득 수준. 기온과 아이스크림 판매량 회사규모와 평균연봉 - 음의 상관 체중과 운동량 강수량과 관광객 수 질..

2023.02.04 이번 미니프로젝트는 KOFIC 영화진흥위원회 홈페이지의 데이터를 사용하여 진행하였다. KOFIC에서 제공하는 박스오피스 데이터와 영화제 수상정보 데이터를 활용하여 영화제 수상이 해당 제작사와 배급사 주가에 영향을 미치는지는 분석해보려고 했다. https://www.kofic.or.kr/kofic/business/main/main.do 영화진흥위원회 홈페이지입니다.(1) 웹매거진 한국영화 영화산업계 주요 이슈를 취재, 분석하여 영화업, 영화정책 연구 분야 종사자에게 제공하는 월간지입니다. 한국영화연감 영화진흥위원회가 매년 발간하는, 한국영화 산업 현 www.kofic.or.kr import pandas as pd import numpy as np from glob import glob ..

스타벅스 api와 같이 국민청원 페이지의 정보를 스크랩핑해오는 미니프로젝트를 진행하였다. import pandas as pd import numpy as np import requests from bs4 import BeautifulSoup as bs import json from pandas.io.json import json_normalize import datetime 스타벅스 api는 post 방식이었지만 국민청원은 get방식을 사용하여 쿼리스트링을 url 뒤에 붙여 불러왔다. page_no = 1 url = f'https://petitions.assembly.go.kr/api/petits?pageIndex={page_no}&recordCountPerPage=8&sort=AGRE_END_DE-&s..

첫 미니 프로젝트이다. 스타벅스 api를 활용하여 지도에 지역과 매장타입을 입력 받으면 매장의 위치를 마크업하는 함수를 구현하였다. 또한 매장간 거리 차이를 이용하여 상도덕이 없는 매장은 어디인가? 라는 주제로 분석을 해볼려고 했다. 수업에서 계속 csv 파일만 이용하다가 json 형식을 처음 사용해보았다. 불러오는 방식부터 데이터프레임으로 만드는 방법까지 차이가 있어 처음에 당황했다. 불러올 때는 json.load(변수), 데이터프레임으로 만들 때는 json_normalize()를 사용한다. import pandas as pd import requests import json from pandas.io.json import json_normalize # jsnon을 데이터프레임으로 만들 때 사용 fro..

2023.02.08 오늘은 버거지수에 대한 분석을 진행해보았다. 버거지수란 ? : 한 도시의 발전 수준은 (버거킹의 개수+맥도날드의 개수+KFC의 개수)/롯데리아의 개수를 계산하여 높게 나올수록 더 발전된 도시라고 할 수 있다. - 버거지수가 클수록 발전된 도시로 판단 - 버거킹 관련 매장들을 살펴보았다. df.loc[df["상호명_대문자"].str.contains("버거킹|BKR"), "상호명_대문자"].unique() 🙋🏻♂️ 질문 : 현업에서 분석할 때 저런 (주) 버거킹티피 같은 예외적인 경우를 제거해주지 못한다면 어떤 문제가 생길 수 있나요? 크게 문제가 될 수 있나요?? 분석결과에 대한 신뢰를 어느정도 할 수 있느냐의 문제입니다. 지금 사용하는 데이터도 실시간 데이터는 아닙니다. 어느정도의 ..

20203.02.07 🙋🏻♂️질문 : sns.heatmap(), df.style.background_gradient() => 두 가지의 차이점? heatmap은 전체를 기준으로 확인할 때, background_gradient는 axis를 조절하여 행 또는 열 기준으로도 확인df.style.background_gradient() => 성질이 다른 각 변수를 각각 비교하고자 할 때 적합합니다. 예) 변수에 체중, 키, BMI지수, 콜레스테롤수치 처럼 스케일값이 다르고 성질이 다른 값의 스케일을 비교하고자 할 때 적합합니다. 🙋🏻♂️질문 : 왜 groupby 로 할 수 있는 것은 pivot_table로도 대부분 구현이 가능할까요? pivot_table이 groupby의 하이레벨 인터페이스 입니다 자유도가 ..

2023.02.06 ● Tidy-data => 깔끔한 데이터 🙋🏻♂️질문 : 왜 이 데이터는 깔끔한 데이터가 아닐까요? - 한 열에 하나의 변수가 있는게 아니라 다양한 열에 하나의 변수가 분포되어 있습니다 - 각 행이 개별 관측치가 아니라 집계가 되어 있는 데이터입니다. - 이전에 실습했던 서울코로나 데이터 => 각 행이 개별 관측치, 각 확진자에 대한 정보를 담고 있다. - 일별 시세 관측 데이터와 집계 데이터 중 어떤 것 일까요? => 집계데이터 ● pandas는 tidy data를 위해 melt라는 기능을 제공한다. ● melt() - 열에 있던 데이터를 행으로 녹인다. - wide-form => pandas plot()으로 막대의 색상을 다르게 지정하거나, 서브플롯을 그리거나, 시각화 하기에 좋..

2023.01.26 조건분기(CASE, IF) ● case - case와 end가 한 쌍이다. - when이 2번 이상 들어가면 첫번째 when은 if문의 역할이고 두번째부터 when 부터는 elif문의 역할을 한다. # case # when 조건 then 참일 경우_실행구문 # else 거짓일경우_실행구문 # end SELECT EXTRACT(year FROM created_at) as YEAR, count(CASE WHEN EXTRACT(quarter FROM created_at) = 1 THEN id END)AS Q1, count(CASE WHEN EXTRACT(quarter FROM created_at) = 2 THEN id END)AS Q2, count(CASE WHEN EXTRACT(quart..