일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 멋재이사자처럼
- 시각화
- 알고리즘
- likelion
- intern10
- Plotly
- SQL
- 그리디
- 파이썬
- parklab
- ux·ui디자인
- 인턴10
- DFS
- BFS
- Python
- 멋쟁이사자처럼
- Join
- 마이온컴퍼니
- 멋쟁이사자처럼멋쟁이사자처럼
- DP
- seaborn
- GNN
- GIS
- 마이온
- TiL
- 멋사
- pyhton
- 프로젝트
- folium
- likelionlikelion
- Today
- Total
목록전체 글 (105)
지금은마라톤중
2023.04.18 ● 전이학습(Transfer Learning) 하나의 기계학습 문제를 해결하는 데에 학습된 모델의 일부 또는 전체를 새로운 기계학습 문제를 해결하는 데에 사용하는 기술입니다. 이는 기존의 모델이 이미 유사한 작업을 수행하도록 학습되어있기 때문에, 새로운 작업에서도 이전 모델의 학습 결과를 이용하여 학습을 빠르고 정확하게 수행할 수 있다는 장점이 있습니다. 전이학습은 크게 세 가지 종류로 나눌 수 있습니다. 첫째는 사전학습된 모델을 특징 추출기(feature extractor)로 사용하는 방법입니다. 이 경우, 기존의 모델은 이미지, 음성 또는 텍스트와 같은 입력 데이터의 특징을 추출하는데 사용되며, 이러한 특징 추출기는 새로운 모델을 학습하는 데에 사용됩니다. 둘째는 사전학습된 모델을..
20203.04.17 질문🙋🏻♂️ : 이미지에서는 주로 CNN 합성곱신경망을 사용하게 되는데 기존 DNN이 갖고있는 어떤 문제점 때문에 합성곱 신경망을 이미지에 주로 사용하게 될까요? 고차원 데이터를 처리하기에는 적합하지 않다 DNN은 이러한 상관 관계를 고려하지 않고 모든 입력 픽셀을 독립적으로 처리하므로, 이미지에서 복잡한 패턴을 인식하는 데 어려움이 있습니다. 질문🙋🏻♂️ : tf.keras.layers.Flatten(input_shape=(28, 28)), 입력층에서 데이터를 1차원 벡터로 변환하게 되면 어떤 문제가 있을까요? 2차원 이미지만의 특성이 없어집니다 1차원으로 펼치는 과정에서 원래 이미지 픽셀의 위치정보를 왜곡하게 됩니다 질문🙋🏻♂️ : 합성곱 신경망에서는 이 문제를 어떻게 해결..
2023.04.12 PyTorch ● torch.FloatTensor() : 입력된 텐서의 데이터 타입을 32비트 부동소수점(torch.float32)으로 변경 ● 이미지, 음성, 텍스트 등 다양한 데이터를 모델 입력으로 제공하기 위해서는 데이터를 부동소수점 형태의 텐서로 변환하는 과정이 필요합니다. -> GPU에 맞는 연산 가능한 형태로 데이터를 바꿉니다 TF => scikit-learn style API 와 유사 PyTorch => NumPy API 와 유사 ● batch => 작게 지정하면 학습을 더 빠르게 진행할 수 있으나, 클래스가 여러개인 분류 문제에서 클래스가 불균형하게 학습하지 않도록 주의가 필요합니다. ● batch size 훈련 데이터 하나의 크기를 256이라고 해봅시다. [3, 1, ..
2023.04.11 질문🙋🏻♂️: 네트워크를 깊게 쌓으면 대체적으로 성능이 좋아집니다. 하지만 어떤 문제가 발생할까요? 과적합문제 발생 질문🙋🏻♂️: 과적합 문제가 발생하면 어떤 방법으로 해결할 수 있을까요? dropout을 사용 질문🙋🏻♂️: 모델을 개선해 보는 방법 ? 레이어, 유닛 수 변경하기 Dropout 사용하기 early_stop 값 조정하기 epoch 조정하기 learning_rate 조정하기 batch 사용하기 질문🙋🏻♂️: 기울기소실 문제는 네트워크를 깊게 쌓았을 때 back propagation 과정에서 발생합니다. 이 문제는 어떻게 해결했을까요? 0보다 작은 같이 많으면 Leaky Relu 0보다 작은 같이 적으면 Relu ● 딥러닝에서 사용하는 대표적인 활성화함수 Sigmoi..
2023.04.10 머신러닝수업이 어느정도 진행되었고 오늘부터는 딥러닝에 대해 배운다. 딥러닝 => 비정형(이미지, 영상, 텍스트, 음성)데이터에 대한 피처를 추출할 때 알고리즘 내부에서 추출합니다. 1) 기본 네트워크에 대한 동작 방식을 배웁니다. 2) 심층신경망(DNN), Fully Connected Network, Densely Connected Network 3) 합성곱신경망(CNN) => 이미지, 텍스트 다 사용가능하지만 주로 이미지 분류에 사용합니다. 4) 순환신경망(RNN) => 순서가 있는 데이터, 시계열데이터, 자연어처리 등에 주로 사용합니다. ● CNN과 RNN CNN(Convolutional Neural Network)는 합성곱신경망으로도 불립니다. 주로 시각적 이미지를 분석하는 데 ..
2023.03.29 질문🙋🏻♂️ : 넘파이가 빠른이유? 코드 내부가 파이썬이 아니고 low level 언어로 만들어졌습니다. 내부적으로 반복을 사용하지 않습니다. 벡터, 행렬 연산을 합니다. ● 파이썬이 느림에도 불구하고 데이터사이언스에서 큰 역할을 하고 있는 것은 내부가 다른 언어로 만들어져있고 API가 파이썬으로 되어있기 때문에 장점만을 모아 만든 도구입니다. 파이썬은 문법이 직관적이고 고수준(사람이 이해하기 쉬운언어)이기 때문에 API를 파이썬으로 작성하고 내부를 저수준(사람이 이해하기 어려운 언어)로 만들어서 빠르게 동작하도록 했기 때문에 빠른속도와 (비교적)쉬운 인터페이스로 사용할 수 있도록 만들어졌습니다 질문🙋🏻♂️ : umpy 의 zeros, ones, zeros_like, ones_li..
2023.03.28 자연어처리 학습 ● CountVectorizer와 BOW(bag of words)차이 -CountVectorizer : 단어를 횟수 기반으로 벡터화해줌 - BOW(bag of words) : 텍스트를 담는 가방, 순서를 고려하지 않고 출현 빈도만 고려하는 텍스트 데이터의 수치화 표현 방법 , 단어의 순서가 완전히 무시됨 질문🙋🏻♂️: [^가-힣ㄱ-ㅎㅏ-ㅣa-zA-Z0-9] 이 정규표현식을 어떻게 해석할 수 있을까요? 1) 가-힣 2) ㄱ-ㅎ 3) ㅏ-ㅣ 4) a-z 5) A-Z 6) 0-9 질문🙋🏻♂️:[^조건식] 구문을 형태소로 구문 분석합니다. nouns -> 명사 추출 pos -> 품사 태깅 norm=True 옵션 -> 토큰 정규화 (되나욬 -> 되나요) stem=True 옵..
2023.03.27 질문🙋🏻♂️ : 왜 Accuracy 만으로는 제대로 된 분류의 평가를 하기 어려울까요? 데이터가 불균형한 경우에는 높은 Accuracy여도 정확하지 않기 때문이다. 예를 들어 암 여부를 예측하는 모델이라고 할 때 현실세계에서 건강검진을 했을 때 1000명 중에 1명이 암환자라면 학습을 했을 때 암환자의 특징을 학습하기도 어려울 뿐더러, 정확도인 Accuracy로 측정하게 되면 모두 암환자가 아니라고 했을 때 99.9%가 정확도로 나오게 됩니다. 1명의 암환자를 제대로 찾지 못했기 때문에 해당 모델은 잘 만든 모델이라고 평가할 수 없습니다. ● np.argmax -> 값이 가장 큰 인덱스(분류된 클래스!)를 반환 ● 분류기 출력 품질을 평가하기 위한 precision-recall 메트..