본문 바로가기

일별 학습일지

2/26 :: ML PJT 발표 2024.02.26 발표 Feedback 판서 사실 catboost가 메인이 되기 힘든 대회 Deep Learning 1. eeg 를 자체 signal로 해석 - wavenet - 1D singal transition 2. spectrogram 변환 및 RGB color로 해석 EfficientNetB0,1,2.. 3. Reasearch 논문 1D resnet & gru part 같은 eeg 데이터 여부 미지수지만, 비교적 높은 성능을 가져오고 있고 공개되어있음 아주 원론적으로 가면, EEG라는 신호를 해석할 수 있어야함 그 데이터를 시각화하여 봤을 때 골라내는 것들이 중요할 듯함 EEG를 알고 있다는 의사와 달리 이런 류의 대회는 그런 것들을 잘 판단할 수 있는 도메인 paper를 읽어보기 or 실제로.. 더보기
2/13~2/23 :: ML PJT PPT 작성용 참고자료 대회 개요 및 EEG 개념 https://cypress-chalk-568.notion.site/1-EEG-9e49251e0ef04222bbe85e65dd85f437 1. 대회개요와 EEG 개념 정리 | Notion 대회개요 : HMS - Harmful Brain Activity Classification cypress-chalk-568.notion.site 도메인 지식 https://www.notion.so/HMS-3dc166011e3c4b77a2ba8c1f2ba6d2de Spectogram 개념 https://cypress-chalk-568.notion.site/2-Spectrogram-355e880d73254748b587542105520361 2. Spectrogram 개념정리.. 더보기
2/7 :: 실강 Queue 시간 순서상 먼저 저장한 데이터가 먼저 출력되는 선입선출 형식 FIFO First In First Out enqueue dequeue : double ended queue Stack 시간순서상 가장 최근에 추가한 데이터가 가장 먼저 나오는 후입선출 LIFO Last In First Out 예제 :https://school.programmers.co.kr/learn/courses/30/lessons/12909 올바른 괄호 문제 # stack을 활용한 풀이 def solution(s): stack = [] for c in s: if c == '(': stack.append('(') else: if stack and stack[-1] == '(': stack.pop() else: stack.appe.. 더보기
2/6 :: 실강 자료구조와 알고리즘 개론 자료출처 Upstage AI Lab 2기 코딩테스트 대비 자료구조와 알고리즘 실강 ppt / 개발남 노씨 강사님 https://www.youtube.com/@nossi-dev 교육목표 1. 코딩 테스트 합격 2. 코드를 작성했을 때 예측 및 효율적인 변수, 자료구조에 어떻게 담을까, 논리구조를 어떻게 할까 우선순위 따라 진행, 필요하면 추가 공부 코딩 테스트 Tip 네이버 카카오 코딩 테스트 빡셈 잘 준비하면 경쟁자를 줄일 수 있음 기업마다 해나가는 방향성을 다르게 해야 (IT 기업 vs 제조업 기반 대기업) 기본 유형의 알고리즘만 차근차근해도 중견 기업은 충분히 가능 같은 기업이라도 팀마다 원하는 인재상에 따라 코딩테스트 난이도 차이 "그래도 기본은 해놓아야한다" 코딩테스트 목.. 더보기
1/24~2/2 :: ML 이론 (양이 많다보니 통합으로 정리 및 작성) 자료출처 Upstage AI LAB 2기 ML 이론 (1/24~2/2) 실강 PPT / 김용담 강사님 강의 진행용 PDF에 Adobe Reader 프로그램으로 필기진행 + (코랩 실습) 필기 및 강의 PPT 교안 스크린샷이 많으며, 제대로 이해못한 내용이 있을 수 있음 서론 데이터 분석가들은 문제를 해결할 수 있는 구체적인 방안(코드) 구상 필요 어떤 데이터를 수치화하게 되면 벡터라는 개념을 가져올 수 있게 됨 데이터는 벡터로 표현 가능 https://www.youtube.com/watch?v=fNk_zzaMoSs&list=PLZHQObOWTQDPD3MizzM2xVFitgF8hE_ab Q. 코사인 거리보다 그냥 각도를 normalize 해서 쓰는게 직관에 더 맞지.. 더보기
1/22 :: 실강 KNN K Nearest Neighbor 점선을 얼마나 실선에 맞추냐가 문제 K = 1 복잡한 모델 노이즈까지 학습한 상태 K = 100 모델이 단순, 전반적인 추세 볼 수 있음 자유도와 복잡도 모델 복잡도 모델 마다 다른 자유도로 인해 값이 많이 다를 수 있음 one hot encodding 0. % 쓰는 경우도 있음. 조율을 해주면 좋음 모델의 자유도 & 잔차의 자유ㅗ Regression Detail 선형 회귀 모영 헀던 내용 복습 이분산성의 문제점 - 분산이 계속 변화, mse 쓰기 어려워 어디서 패턴이 잡히는지 알면 좋음 Q. 정규성을 맞추는게 머신러닝 예측에 도움이 되는지 A. 그럴수도 아닐수도 있다. 만약 잘 안나온다면 다른 모델을 쓰는 것이 낫다. 다중 선형 회귀 다중공선성 Q. 기준이 되는.. 더보기
1/19 :: 실강 회귀 포아송 프로세스 GLM Clustering 군집화 Q. 선형회귀말고도 푸아송분포 같은 분포개념이 필요한 경우가 있나요? A. 엄청 많다. F분포(통계 유효성 검증), 카이제곱 분포(독립성 검증) 등 선형회귀 말고도 많이 쓰임 비슷한 관측치끼리 묶는 비지도학습 비슷하다? 거리Distance, 특히 유클리드 거리 사용 Normalization 정규화 다른 방법도 있지만, 원래 수치가 아닌 다른 수치를 사용해야한다는 것은 동일하다. K-means 학습 b) 먼저 x좌표를 랜덤하게 잡는다 c) 랜덤 할당된 데이터와 가까운 순서대로 설정 d) 해당 군집의 평균을 계산해서 다시 x 좌표 할당 .. 수렴할때까지 반복한다. ex) Nearest Neighbor cf) k-means는 변화하는데 계속 바뀌면 안되니.. 더보기
01/15 :: Git Branch 분기점을 생성하여 독립적으로 코드를 변경할 수 있도록 도와주는 모델 https://velog.io/@chojs28/Git-%EC%BB%A4%EB%B0%8B-%EB%A9%94%EC%8B%9C%EC%A7%80-%EA%B7%9C%EC%B9%99 커밋 메세지 규칙 연습하기 $ git branch 현재 branch 확인법 $ git branch -r remote branch 확인가능 처음에 등록된 주소를 관습적으로 origin이라고 함 $ git branch (이름) / $ git branch -D (이름) 추가 / 삭제 $ git switch 이름 해당 branch로 전환 $ git lg commit log로 해당 commit 아이디를 이용해 switch 새로운 branch에서 파일 편집 및 com.. 더보기