본문 바로가기

일별 학습일지

5/30 :: Fast-up report 1. AbstractGoal of the CompetitionDialogue SummarizationTask : SummarizationEvaluation Metric : ROUGE(Recall-Oriented Understudy for Gisting Evaluation)TimelineStart Date : May 13, 2024Final submission deadline : May 27, 2024 (13:00)Description of the workDataset overviewtrain : 12457dev : 499test : 250hidden-test : 249EDAData distribution of dialogue/topic/summary length.Analysis on special tok.. 더보기
4/23 :: Fast-up report 1. AbstractGoal of the CompetitionDocument Type ClassificationTask : Image ClassificationEvaluation Metric : Macro F1TimelineStart Date : April 11, 2024Final submission deadline : April 23, 2024 (19:00)Description of the workDataset overviewClass : 17 types of documentsTrain : 1570Test : 3140EDAAnalysis on label distribution of train dataAnalysis on size/hue distribution of train and test dataAn.. 더보기
4/12~4/13 :: Ideation Ideation : Online Preprocessingtrain data에 augmentation을 적용해 학습한다 해도 경우의 수가 많음 → 성능 저하가능test data를 기반 통계(최다빈도 augmentation 기법, rotation 각도, noise 적용률.. ) 사용불가(Data leakage에 해당하여 대부분 대회에서 금지)개별적으로 input됨을 가정하는 특성 고려 필요test data를 model이 예측하기 쉬운 형태로 실시간으로 전처리하는 방법 효과적일거라 가정Proceduretest data 전처리 및 모델별 학습 → train & validation loss 계산 → 모델 결정 → test data 전처리 → prediction 진행Preprocessing De.. 더보기
4/11 :: CV data Evaluation Metricmacro f1 score : 각 클래스에 대한 f1 score 개별적 계산 후, 평균Data Overviewtrain data : 1570   train.csv : 학습 이미지 이름 & 클래스 사이 mapping 정보 meta.csv : 클래스 이름 & 인덱스 간 mapping 정보train/:  학습이미지 경로  총 17개, 각 class 별 46~100장 (class별 수량이 다름)2개 클래스는 차량사진임 0. 계좌번호 (Account Number) 1. 임신 의료비 지불 신청서 (Application for Payment of Pregnancy Medical Expenses) 2. 차량 계기판 (Car Dashboard) 3. 입원 및 퇴원.. 더보기
4/5 :: CV Vison : 시각 정보의 집합 + 이미지를 숫자 형태의 데이터(tensor) 하여 저장 input data로 image를 사용 Image Processing Resize : 해상도 Color jitter : 색분할? Feature Extraction Edge detection axis 별 edge enhanced 식별 Segementation watershed (고전기법) img → img : Panorma Stitching img → world Multiview Stereo : 2D 사진 여러장으로 3D 및 질감 등 구현 Depth Estimation : 신호분야에서 사용 LIDAR : 자율주행 Semantics Object Detection Segmentation 활용사례 Pose Estimatio.. 더보기
ML Competition : Fast-UP Report 1. Abstract Goal of the Competition 주어진 데이터를 이용하여 서울 아파트 실거래가를 효과적으로 예측하는 모델 개발 Timeline March 20, 2024 - Start Date April 2, 2024 - Final submission deadline Description of the work 다양한 목적하에 다양한 부동산 관련 의사결정에 도움을 주기 위한 부동산 거래가격 예측모델 개발이 목적 총 4개의 데이터 세트가 제공 1 : 아파트 실거래가 데이터 국토교통부 제공 아파트의 위치, 크기, 건설 연도, 주변 시설 및 교통 편의성과 같은 다양한 기능을 포함 2,3 : 추가데이터 서울시 제공 지하철역과 버스정류장 관련 정보 포함 4 : 평가데이터 2. Process : Co.. 더보기
3/20~4/2 :: ML Competition 더보기
3/12 :: DL & Pytorch 스터디 발표 더보기