일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- GIS
- likelion
- TiL
- GNN
- seaborn
- Join
- BFS
- Rag
- 프로젝트
- DFS
- 그리디
- likelionlikelion
- 멋쟁이사자처럼
- 멋사
- ux·ui디자인
- 파이썬
- folium
- 마이온
- graphrag
- 알고리즘
- paper review
- 인턴10
- DP
- 시각화
- parklab
- 마이온컴퍼니
- 멋재이사자처럼
- Python
- intern10
- SQL
- Today
- Total
목록전체 글 (111)
지금은마라톤중

Titanic 9. Feature engineering - Fill Null in Age https://youtu.be/qVknmB5OElE * Feature Engineering : Feature Engineering은 머신러닝 알고리즘을 작동하기 위해 데이터에 대한 도메인 지식을 활용하여 특징(Feature)를 만들어내는 과정이다. 다른 정의를 살펴보면, 머신러닝 모델을 위한 데이터 테이블의 컬럼(특징)을 생성하거나 선택하는 작업을 의미한다. Feature Engineering은 모델 성능에 미치는 영향이 크기 때문에 머신러닝 응용에 있어서 굉장히 중요한 단계이며, 전문성과 시간과 비용이 많이 드는 작업이다. - Feature가 중요한 이유 머신러닝은 입력 데이터의 함수이며 선형 또는 비선형의 형태를..
파이썬 스터디 중에 여러 질문이 들어왔다... 선형대수도 모르고 여러모로 모르는게 많은 초심자라 정신이 없었다ㅜㅜ 그래서 멘토님이 주신 과제!! -시간복잡도와 공간복잡도 공부하기- 우선 시간복잡도와 공간복잡도는 알고리즘의 성능을 판단하는데 쓰인다. 그래서 좋은 알고리즘인지를 확인한다. 시간복잡도와 공간복잡도 모두 작은 것이 효율적이고 좋은 알고리즘을 의미한다. 1. 시간복잡도(Time Complexity) : 알고리즘을 수행하는데 걸리는 시간을 분석한 결과를 말한다. - 시간복잡도는 '실행시간'이 아닌 '연삿횟수'를 센다. - 만약 '실행시간'으로 시간복잡도 계산하면 1) 모든 컴퓨터(ex. 일반 컴퓨터, 슈퍼 컴퓨터)에서 동일한 결과를 산출하지 못한다. 2) 측정을 위한 완성된 프로그램이 필요하다. -..

캐글 타이타닉 Titainic 7. EDA - FamilySize https://youtu.be/TjcAtKuzVrg df_train['FamilySize']= df_train['SibSp']+df_train['Parch'] + 1 - pandas 시리즈끼리 사칙연산이 가능하다. - +1은 자신을 의미한다. print('Maximum size of Family:', df_train['FamilySize'].max()) print('Minimum size of Family:', df_train['FamilySize'].min()) f, ax = plt.subplots(1,3,figsize=(40,10)) sns.countplot('FamilySize', data= df_train, ax=ax[0]) ax[..

캐글 타이타닉 Titainic 5. EDA - Age, Sex, Pclass(violinplot) https://youtu.be/aeaEISnjH2I f, ax = plt.subplots(1,2,figsize=(18,8)) sns.violinplot('Pclass', 'Age', hue="Survived", data=df_train, scale='area', split=True, ax=ax[0]) ax[0].set_title('Pclass and Age vs Survived') ax[0].set_yticks(range(0,110,20)) sns.violinplot('Sex', 'Age', hue="Survived", data=df_train, scale='area', split=True, ax=ax[1]..
https://www.acmicpc.net/problem/1977 1977번: 완전제곱수 M과 N이 주어질 때 M이상 N이하의 자연수 중 완전제곱수인 것을 모두 골라 그 합을 구하고 그 중 최솟값을 찾는 프로그램을 작성하시오. 예를 들어 M=60, N=100인 경우 60이상 100이하의 자연수 중 완 www.acmicpc.net 처음에 이렇게 작성을 해서 실패하였다. 시간초과로 실패를 한 것은 처음이다. #1977번- 시간초과로 실패 a = int(input()) b = int(input()) lst=[] for i in range(a,b+1): for s in range(2,i): if s**2==i: lst.append(i) lst.sort() if len(lst)==0: print(-1) else:..

캐글 타이타닉 Titainic 3. EDA - Sex https://youtu.be/-v42Y-r9VqE?list=PLC_wC_PMBL5MnqmgTLqDgu4tO8mrQakuF f, ax = plt.subplots(1,2,figsize=(18,8)) df_train[['Sex', "Survived"]].groupby(['Sex'], as_index=True).mean().plot.bar(ax=ax[0]) ax[0].set_title('Survived vs Sex') sns.countplot('Sex', hue='Survived', data=df_train, ax=ax[1]) ax[1].set_title('Sex: Survived vs Dead') plt.show() 해석: 두 그래프는 성별에 따른 생존을..

공부 기록 블로그 시작!! 어떻게 쓰는건지 잘 모르겠다... 일기도 안 쓰고 기록이란걸 너무 오랜만에 해봐서..어떻게든 되겠지!!! 일단 go on 시작은 캐글 타이타닉 데이터로 https://youtu.be/_iqz7tFhox0?list=PLC_wC_PMBL5MnqmgTLqDgu4tO8mrQakuF 캐글 타이타닉 Titanic -1. Dataset check import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns plt.style.use('seaborn') sns.set(font_scale=2.5) import missingno as msno # ignore warnings import war..