일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- SQL
- GNN
- 마이온
- 그리디
- DP
- 마이온컴퍼니
- DFS
- 시각화
- Plotly
- intern10
- 멋쟁이사자처럼멋쟁이사자처럼
- 인턴10
- pyhton
- Python
- folium
- 멋쟁이사자처럼
- seaborn
- ux·ui디자인
- GIS
- 멋재이사자처럼
- 멋사
- likelion
- BFS
- 프로젝트
- parklab
- TiL
- 알고리즘
- Join
- 파이썬
- likelionlikelion
- Today
- Total
목록likelion (15)
지금은마라톤중
2023.02.08 오늘은 버거지수에 대한 분석을 진행해보았다. 버거지수란 ? : 한 도시의 발전 수준은 (버거킹의 개수+맥도날드의 개수+KFC의 개수)/롯데리아의 개수를 계산하여 높게 나올수록 더 발전된 도시라고 할 수 있다. - 버거지수가 클수록 발전된 도시로 판단 - 버거킹 관련 매장들을 살펴보았다. df.loc[df["상호명_대문자"].str.contains("버거킹|BKR"), "상호명_대문자"].unique() 🙋🏻♂️ 질문 : 현업에서 분석할 때 저런 (주) 버거킹티피 같은 예외적인 경우를 제거해주지 못한다면 어떤 문제가 생길 수 있나요? 크게 문제가 될 수 있나요?? 분석결과에 대한 신뢰를 어느정도 할 수 있느냐의 문제입니다. 지금 사용하는 데이터도 실시간 데이터는 아닙니다. 어느정도의 ..
2023.02.03 ROLLUP - 집계된 데이터에서 그룹별 소계, 총계를 구하기 위해서 사용 - ex) rollup( gender) ### SQL 연습문제 -- thelook_ecommerce 데이터 세트, 회원(users) 테이블에서 연령대 별 성별의 소계 및 합계를 조회하시오 SELECT TRUNC(age, -1) || '대' AS age_group, gender, COUNT(id) AS user_count FROM `thelook_ecommerce.users` GROUP BY ROLLUP(age_group, gender) ORDER BY age_group 🙋🏻♂️질문 : SELECT문에 선언된 순서대로 필드를 1, 2처럼 숫자로 표현하는 경우가 있던데 현업에서도 많이 사용하는 방법인가요?? - ..
20203.02.07 🙋🏻♂️질문 : sns.heatmap(), df.style.background_gradient() => 두 가지의 차이점? heatmap은 전체를 기준으로 확인할 때, background_gradient는 axis를 조절하여 행 또는 열 기준으로도 확인df.style.background_gradient() => 성질이 다른 각 변수를 각각 비교하고자 할 때 적합합니다. 예) 변수에 체중, 키, BMI지수, 콜레스테롤수치 처럼 스케일값이 다르고 성질이 다른 값의 스케일을 비교하고자 할 때 적합합니다. 🙋🏻♂️질문 : 왜 groupby 로 할 수 있는 것은 pivot_table로도 대부분 구현이 가능할까요? pivot_table이 groupby의 하이레벨 인터페이스 입니다 자유도가 ..
2023.02.06 ● Tidy-data => 깔끔한 데이터 🙋🏻♂️질문 : 왜 이 데이터는 깔끔한 데이터가 아닐까요? - 한 열에 하나의 변수가 있는게 아니라 다양한 열에 하나의 변수가 분포되어 있습니다 - 각 행이 개별 관측치가 아니라 집계가 되어 있는 데이터입니다. - 이전에 실습했던 서울코로나 데이터 => 각 행이 개별 관측치, 각 확진자에 대한 정보를 담고 있다. - 일별 시세 관측 데이터와 집계 데이터 중 어떤 것 일까요? => 집계데이터 ● pandas는 tidy data를 위해 melt라는 기능을 제공한다. ● melt() - 열에 있던 데이터를 행으로 녹인다. - wide-form => pandas plot()으로 막대의 색상을 다르게 지정하거나, 서브플롯을 그리거나, 시각화 하기에 좋..
2023.01.31 ❗️꿀팁 아나콘다는 여러 도구를 한번에 설치해 주기도 하지만 가상환경을 제공해 줍니다. 설치했음에도 불구하고 No Module Not Found 오류가 발생할 때는 보통 여러 버전의 파이썬 혹은 아나콘다 등이 설치되어 있는데 현재 사용하고 있는 위치가 아닌 다른 위치에 설치되었을 때 이런 오류가 발생하게 됩니다. 보통 오류 메시지에 보면 어느 경로에 없다는 메시지가 나오게 됩니다. 해당 경로에 가서 보면 여러 라이브러리가 설치되어있는 폴더를 볼 수 있는데, 해당 위치에 사용하고자 하는 라이브러리를 다운로드 받아 옮겨주면 보통 잘 import 가 됩니다. ( base) 괄호 써주기 or 변수 할당하기 (연산자 우선순위) = 할당 == 같음 != 다름 ● str accessor - .st..
2023.01.16 ● range(len(리스트))를 좀 더 파이써닉한 방법으로 개선해 본다면? - index 순서를 가져오기 위해 range(len(리스트)) 사용했습니다. - 이 방법 외에도 인덱스 값을 가져올 수 있는 방법 : enumerate - enumerate(a,b) : 두번째 인자로 인덱스 시작을 지정할 수 있다. 🙋🏻♂️질문 : 사람마다 get이랑 post가 다르게 보일 수도 있나요? - 일반적으로는 GET 메소드를 통해 데이터를 읽어올 수 있게 서버에서 작성하지만 POST 메서드로 데이터를 읽어올 수 있게하는 경우는, GET 메서드는 파라미터를 URL에 포함하여 전달해야하기 때문에 파라미터들의 정보가 히스토리에 남지만 POST는 파라미터가 요청의 body 에 담겨 전달되기 때문에 브라..
2023.01.13 python만 공부하다가 처음으로 SQL을 배웠다. 파이썬을 어느정도 알고 배워서 그런지 이해를 좀 더 쉬웠던 것 같다. 수업 중 파이썬의 문법이 SQL에서 적용이 가능한지에 대해 궁금한 부분이 많았다. 내용정리 ● 데이터와 데이터 베이스(DB) - 데이터란 컴퓨터 안에 기록된 문자, 숫자를 말한다. - 이런 데이터들의 집합이 데이터베이스이다. ● 데이터베이스 관리시스템)(DBMS : 데이터베이스를 효율적으로 관리하는 소프트웨어 ● 관계형 모델 : 데이터를 표 형태로 구조적으로 관리하는 모델 - 관계형 데이터베이스(RDB) - RDB기반의 데이터베이스관리시스템이 RDBMS - RDBMS 소프트웨어로는 Oracle, DB2, SQL Server PostgreSQL, MySQL, SQLi..
2023.01.09 ~ 2023.01.11 멋쟁이사자처럼 4주차 2023.01.09 ● 데이터베이스 • 데이터베이스 : 주로 실시간으로 관리할 데이터를 저장 => 예) 회원정보, 장바구니 정보, 위시리스트, 게시판, 댓글, 캐릭터 정보, 인벤토리 정보, Status 관리가 필요한 정보 • 파일로 저장을 할 때는 주로 로그데이터 등을 저장하게 됩니다. 데이터베이스에도 로그성 데이터를 저장하기도 합니다. 한 시간에 1G이상씩 쌓이는 로그성 데이터라면 보통 파일로 저장하는 편입니다. => 예) 어떤 페이지를 누가 언제 방문했었는지, 게임에서 서버에 접속해서 어떤 액션을 취했는지 작은 액션 단위로 로그를 저장할 때 * 데이터분석가와 데이터엔지니어, 개발자, 기획자가 모여서 회의를 하면 어떤 데이터를 데이터베이스..