일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- Python
- 마이온
- 그리디
- 프로젝트
- GIS
- 알고리즘
- 멋재이사자처럼
- likelion
- DP
- 멋사
- 시각화
- parklab
- pyhton
- seaborn
- TiL
- SQL
- folium
- 멋쟁이사자처럼
- 파이썬
- 인턴10
- 마이온컴퍼니
- Plotly
- DFS
- GNN
- ux·ui디자인
- BFS
- 멋쟁이사자처럼멋쟁이사자처럼
- Join
- intern10
- likelionlikelion
- Today
- Total
목록분류 전체보기 (105)
지금은마라톤중
멋쟁이사자처럼 AI스쿨 8기가 시작되었다. 저작권 문제로 코드를 직접적으로 올리지 못해서 내용 위치의 TIL을 작성해보려고 한다. 1일씩 포스팅하면 너무 많은 것 같고 1주일씩 포스팅하면 너무 적은 것 같아. 2~3일씩 묶어서 포스팅을 해보려고 한다. TIL가 오늘 배운 내용을 정리하는 것이지만 2~3일 분량인 것은 비밀~🤫 그럼 이제 포스팅 시작! 파이썬 기초 문법 1. 변수 설정 : < = 는 퇴화되고 = 사용 2. list와 dict 차이 : list [] 사용, dic {} 사용 3. dict 구조 : {”key” : “value” } 4. 반복문 : for 과 while 1) for : range 안에 임의의 x값을 하나씩 불러서 반복 2) while : Trued일 경우 무한 반복, break..
Titanic - 11. Feature engineering - Change string to categorical and Pearson coefficient https://youtu.be/9GmeGAoBM7M 이번에는 문자열을 그래도 사용하면 인식의 오류가 있어서 숫자열로 바꿔주는게 좋다. map 과 딕셔너리를 이용하여 숫자의 값으로 표현하여 효율성을 높이는 작업을 했다. df_train['Initial'] = df_train['Initial'].map({'Master':0, 'Miss':1, 'Mr': 2, 'Mrs': 3, 'Other': 4}) df_test['Initial'] = df_test['Initial'].map({'Master':0, 'Miss':1, 'Mr': 2, 'Mrs': 3, ..
Titanic 9. Feature engineering - Fill Null in Age https://youtu.be/qVknmB5OElE * Feature Engineering : Feature Engineering은 머신러닝 알고리즘을 작동하기 위해 데이터에 대한 도메인 지식을 활용하여 특징(Feature)를 만들어내는 과정이다. 다른 정의를 살펴보면, 머신러닝 모델을 위한 데이터 테이블의 컬럼(특징)을 생성하거나 선택하는 작업을 의미한다. Feature Engineering은 모델 성능에 미치는 영향이 크기 때문에 머신러닝 응용에 있어서 굉장히 중요한 단계이며, 전문성과 시간과 비용이 많이 드는 작업이다. - Feature가 중요한 이유 머신러닝은 입력 데이터의 함수이며 선형 또는 비선형의 형태를..
파이썬 스터디 중에 여러 질문이 들어왔다... 선형대수도 모르고 여러모로 모르는게 많은 초심자라 정신이 없었다ㅜㅜ 그래서 멘토님이 주신 과제!! -시간복잡도와 공간복잡도 공부하기- 우선 시간복잡도와 공간복잡도는 알고리즘의 성능을 판단하는데 쓰인다. 그래서 좋은 알고리즘인지를 확인한다. 시간복잡도와 공간복잡도 모두 작은 것이 효율적이고 좋은 알고리즘을 의미한다. 1. 시간복잡도(Time Complexity) : 알고리즘을 수행하는데 걸리는 시간을 분석한 결과를 말한다. - 시간복잡도는 '실행시간'이 아닌 '연삿횟수'를 센다. - 만약 '실행시간'으로 시간복잡도 계산하면 1) 모든 컴퓨터(ex. 일반 컴퓨터, 슈퍼 컴퓨터)에서 동일한 결과를 산출하지 못한다. 2) 측정을 위한 완성된 프로그램이 필요하다. -..
캐글 타이타닉 Titainic 7. EDA - FamilySize https://youtu.be/TjcAtKuzVrg df_train['FamilySize']= df_train['SibSp']+df_train['Parch'] + 1 - pandas 시리즈끼리 사칙연산이 가능하다. - +1은 자신을 의미한다. print('Maximum size of Family:', df_train['FamilySize'].max()) print('Minimum size of Family:', df_train['FamilySize'].min()) f, ax = plt.subplots(1,3,figsize=(40,10)) sns.countplot('FamilySize', data= df_train, ax=ax[0]) ax[..
캐글 타이타닉 Titainic 5. EDA - Age, Sex, Pclass(violinplot) https://youtu.be/aeaEISnjH2I f, ax = plt.subplots(1,2,figsize=(18,8)) sns.violinplot('Pclass', 'Age', hue="Survived", data=df_train, scale='area', split=True, ax=ax[0]) ax[0].set_title('Pclass and Age vs Survived') ax[0].set_yticks(range(0,110,20)) sns.violinplot('Sex', 'Age', hue="Survived", data=df_train, scale='area', split=True, ax=ax[1]..
https://www.acmicpc.net/problem/1977 1977번: 완전제곱수 M과 N이 주어질 때 M이상 N이하의 자연수 중 완전제곱수인 것을 모두 골라 그 합을 구하고 그 중 최솟값을 찾는 프로그램을 작성하시오. 예를 들어 M=60, N=100인 경우 60이상 100이하의 자연수 중 완 www.acmicpc.net 처음에 이렇게 작성을 해서 실패하였다. 시간초과로 실패를 한 것은 처음이다. #1977번- 시간초과로 실패 a = int(input()) b = int(input()) lst=[] for i in range(a,b+1): for s in range(2,i): if s**2==i: lst.append(i) lst.sort() if len(lst)==0: print(-1) else:..
캐글 타이타닉 Titainic 3. EDA - Sex https://youtu.be/-v42Y-r9VqE?list=PLC_wC_PMBL5MnqmgTLqDgu4tO8mrQakuF f, ax = plt.subplots(1,2,figsize=(18,8)) df_train[['Sex', "Survived"]].groupby(['Sex'], as_index=True).mean().plot.bar(ax=ax[0]) ax[0].set_title('Survived vs Sex') sns.countplot('Sex', hue='Survived', data=df_train, ax=ax[1]) ax[1].set_title('Sex: Survived vs Dead') plt.show() 해석: 두 그래프는 성별에 따른 생존을..