일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- seaborn
- 인턴10
- 마이온
- 프로젝트
- 알고리즘
- likelionlikelion
- 멋사
- Plotly
- DFS
- DP
- 멋쟁이사자처럼
- intern10
- likelion
- 시각화
- 마이온컴퍼니
- TiL
- folium
- ux·ui디자인
- parklab
- 멋재이사자처럼
- SQL
- GNN
- GIS
- pyhton
- BFS
- Join
- 그리디
- 파이썬
- Python
- 멋쟁이사자처럼멋쟁이사자처럼
- Today
- Total
목록멋쟁이사자처럼 (43)
지금은마라톤중
20203.02.07 🙋🏻♂️질문 : sns.heatmap(), df.style.background_gradient() => 두 가지의 차이점? heatmap은 전체를 기준으로 확인할 때, background_gradient는 axis를 조절하여 행 또는 열 기준으로도 확인df.style.background_gradient() => 성질이 다른 각 변수를 각각 비교하고자 할 때 적합합니다. 예) 변수에 체중, 키, BMI지수, 콜레스테롤수치 처럼 스케일값이 다르고 성질이 다른 값의 스케일을 비교하고자 할 때 적합합니다. 🙋🏻♂️질문 : 왜 groupby 로 할 수 있는 것은 pivot_table로도 대부분 구현이 가능할까요? pivot_table이 groupby의 하이레벨 인터페이스 입니다 자유도가 ..
2023.02.06 ● Tidy-data => 깔끔한 데이터 🙋🏻♂️질문 : 왜 이 데이터는 깔끔한 데이터가 아닐까요? - 한 열에 하나의 변수가 있는게 아니라 다양한 열에 하나의 변수가 분포되어 있습니다 - 각 행이 개별 관측치가 아니라 집계가 되어 있는 데이터입니다. - 이전에 실습했던 서울코로나 데이터 => 각 행이 개별 관측치, 각 확진자에 대한 정보를 담고 있다. - 일별 시세 관측 데이터와 집계 데이터 중 어떤 것 일까요? => 집계데이터 ● pandas는 tidy data를 위해 melt라는 기능을 제공한다. ● melt() - 열에 있던 데이터를 행으로 녹인다. - wide-form => pandas plot()으로 막대의 색상을 다르게 지정하거나, 서브플롯을 그리거나, 시각화 하기에 좋..
2023.01.27 집합 ● UNION(합집합) - 두 집합을 합하는 것을 반환 • all : 중복 값을 포함한 모든 결과 확인 select * from `weniv.weniv_user` as user1 UNION ALL select * from `weniv.weniv_user3` as user3 • distinct : 중복 값을 제거한 모든 결과 확인 select * from `weniv.weniv_user` as user1 UNION DISTINCT select * from `weniv.weniv_user3` as user3 ● INTERSECT(교집합) - 두 집합 모두에 나타나는 것만 반환 select * from `weniv.weniv_user` as user1 INTERSECT DISTINCT..
2023.01.26 조건분기(CASE, IF) ● case - case와 end가 한 쌍이다. - when이 2번 이상 들어가면 첫번째 when은 if문의 역할이고 두번째부터 when 부터는 elif문의 역할을 한다. # case # when 조건 then 참일 경우_실행구문 # else 거짓일경우_실행구문 # end SELECT EXTRACT(year FROM created_at) as YEAR, count(CASE WHEN EXTRACT(quarter FROM created_at) = 1 THEN id END)AS Q1, count(CASE WHEN EXTRACT(quarter FROM created_at) = 2 THEN id END)AS Q2, count(CASE WHEN EXTRACT(quart..
2023.02.01 ● 왜도 - 왜도는 치우쳐진 정도를 통해 비대칭성을 확인하는 지표이다. - positive 왼쪽, negative 오른쪽 - 보통은 정규분포 형태가 가장 이상적인 형태입니다. - 그런데 현실세계에서는 정규분포 형태의 모양을 띄는 경우가 많지 않습니다. - 머신러닝, 딥러닝 등을 할 때는 정규분포 형태로 분포의 모양을 변경해 주기도 합니다. ● 첨도 - 관측치들이 어느 정도 집중적으로 중심에 몰려 있는가를 측정할 때 사용된다. - 납작한지 뾰족한지를 확인 - 첨도값(K)이 3에 가까우면 산포도가 정규분포에 가깝다. - 3보다 작을 경우에는(K3) 산포는 정규분포보다 더 뾰족한 분포로 생각할 수 있다. ● concat()을 이용한 병합 - concat(axis=0) => 컬럼명이 같은 여..
2023.01.31 ❗️꿀팁 아나콘다는 여러 도구를 한번에 설치해 주기도 하지만 가상환경을 제공해 줍니다. 설치했음에도 불구하고 No Module Not Found 오류가 발생할 때는 보통 여러 버전의 파이썬 혹은 아나콘다 등이 설치되어 있는데 현재 사용하고 있는 위치가 아닌 다른 위치에 설치되었을 때 이런 오류가 발생하게 됩니다. 보통 오류 메시지에 보면 어느 경로에 없다는 메시지가 나오게 됩니다. 해당 경로에 가서 보면 여러 라이브러리가 설치되어있는 폴더를 볼 수 있는데, 해당 위치에 사용하고자 하는 라이브러리를 다운로드 받아 옮겨주면 보통 잘 import 가 됩니다. ( base) 괄호 써주기 or 변수 할당하기 (연산자 우선순위) = 할당 == 같음 != 다름 ● str accessor - .st..
2023.01.30 EDA 수업이 시작되었다. - matplotlib는 정적인 시각화 - javascript이 좀 더 동적인 시각화 - 그리고 맷트폴립이 사용이 복잡하여 주변에 다른 도구들이 있음. ● 한글폰트 사용을 위해 설치 - matplotlib에서 한글폰트를 사용하기 위해서는 설치가 필요하다. ex) !pip install koreanize-matplotlib ● glob - 원하는 경로에 있는 파일을 보는 라이브러리 # glob를 임포트하고 /*을 통해 경로에 있는 파일들을 확인할 수 있다. # * 앞에 원하는 규칙을 넣을 수 있다. from glob import glob files = glob("data/seoul*.csv") file_paths = sorted(files) file_paths..
설날 끝나서 첫 수업이었다. 2023.01.25 숫자열 함수 ● round - 숫자를 반올림해주는 함수 - ex) select round(반올림할 숫자, 자릿수) ● trunc - 자릿수에 음수를 사용하여 버림을 하는 함수 - ex) select trunc(버림할 숫자, 자릿수) ● mod - 나머지를 구하는 함수 - ex) select mod(10,3) -> 10을 3으로 나눈다 ● power - 제곱하는 함수 - ex) select power(10,3) -> 10**3 ● sqrt - 제곱근을 구하는 합수 - ex) select sqrt(9) -> 3문자열 함수 ● substr(문자열, 시작 위치, 길이) - 시작번호가 0,1 둘다 가능하다. - 길이를 입력하지 않으면 시작 위치부터 끝까지 출력 ● ..