본문 바로가기

전체 글

5/30 :: Fast-up report 1. AbstractGoal of the CompetitionDialogue SummarizationTask : SummarizationEvaluation Metric : ROUGE(Recall-Oriented Understudy for Gisting Evaluation)TimelineStart Date : May 13, 2024Final submission deadline : May 27, 2024 (13:00)Description of the workDataset overviewtrain : 12457dev : 499test : 250hidden-test : 249EDAData distribution of dialogue/topic/summary length.Analysis on special tok.. 더보기
4/23 :: Fast-up report 1. AbstractGoal of the CompetitionDocument Type ClassificationTask : Image ClassificationEvaluation Metric : Macro F1TimelineStart Date : April 11, 2024Final submission deadline : April 23, 2024 (19:00)Description of the workDataset overviewClass : 17 types of documentsTrain : 1570Test : 3140EDAAnalysis on label distribution of train dataAnalysis on size/hue distribution of train and test dataAn.. 더보기
4/11~4/22 :: 히스토그램 균일화 중 CLAHE 기법 구상 train data 선명하게 위한 용도로 고안 import cv2import numpy as npimport matplotlib.pyplot as plt# CLAHE 적용 (histo_clahe.py)# 이미지 읽어서 YUV 컬러스페이스로 변경image_path = r'C:\Users\kimdo\바탕 화면\AI Lab\cv-competition\data\test/'file_name = '00c0dabb63ca7a16'imgae_name = image_path + file_name + '.jpg'image_ar = np.fromfile(imgae_name, np.uint8)image = cv2.imdecode(image_ar, cv2.IMREAD_UNCHANGED)img_yuv.. 더보기
4/11~4/22 :: Rectification cv2.HoughLinesP 및 object contour boxing 활용하여 직선만 추출방법 1. 추출된 직선을 기준으로 이미지를 회전하여 변형회전된 이미지에 직선을 시각화(변화 비교용)방법 2. 직선 추출 불가시 object contour boxing 기법 사용image noise에 따라 직선이나 object contour이 잘 안되는 경우 있음히스토그램 평준화나 clahe 적용 후 rotation 진행하는 방법 고안중(4/18 04:00 추가)Y님의 피드백 통해 전처리 코드의 한계 확인image roation 각도가 너무 크게 돌아가는게 몇개 보이며 이미지 손실이 커짐최소 회전을 위한 angle을 산출해 적게 회전하면서 이미지 내 픽셀보존 유지하려고 노력im.. 더보기
4/12~4/13 :: Ideation Ideation : Online Preprocessingtrain data에 augmentation을 적용해 학습한다 해도 경우의 수가 많음 → 성능 저하가능test data를 기반 통계(최다빈도 augmentation 기법, rotation 각도, noise 적용률.. ) 사용불가(Data leakage에 해당하여 대부분 대회에서 금지)개별적으로 input됨을 가정하는 특성 고려 필요test data를 model이 예측하기 쉬운 형태로 실시간으로 전처리하는 방법 효과적일거라 가정Proceduretest data 전처리 및 모델별 학습 → train & validation loss 계산 → 모델 결정 → test data 전처리 → prediction 진행Preprocessing De.. 더보기
4/11 :: CV data Evaluation Metricmacro f1 score : 각 클래스에 대한 f1 score 개별적 계산 후, 평균Data Overviewtrain data : 1570   train.csv : 학습 이미지 이름 & 클래스 사이 mapping 정보 meta.csv : 클래스 이름 & 인덱스 간 mapping 정보train/:  학습이미지 경로  총 17개, 각 class 별 46~100장 (class별 수량이 다름)2개 클래스는 차량사진임 0. 계좌번호 (Account Number) 1. 임신 의료비 지불 신청서 (Application for Payment of Pregnancy Medical Expenses) 2. 차량 계기판 (Car Dashboard) 3. 입원 및 퇴원.. 더보기
4/5 :: CV Vison : 시각 정보의 집합 + 이미지를 숫자 형태의 데이터(tensor) 하여 저장 input data로 image를 사용 Image Processing Resize : 해상도 Color jitter : 색분할? Feature Extraction Edge detection axis 별 edge enhanced 식별 Segementation watershed (고전기법) img → img : Panorma Stitching img → world Multiview Stereo : 2D 사진 여러장으로 3D 및 질감 등 구현 Depth Estimation : 신호분야에서 사용 LIDAR : 자율주행 Semantics Object Detection Segmentation 활용사례 Pose Estimatio.. 더보기
ML Competition : Fast-UP Report 1. Abstract Goal of the Competition 주어진 데이터를 이용하여 서울 아파트 실거래가를 효과적으로 예측하는 모델 개발 Timeline March 20, 2024 - Start Date April 2, 2024 - Final submission deadline Description of the work 다양한 목적하에 다양한 부동산 관련 의사결정에 도움을 주기 위한 부동산 거래가격 예측모델 개발이 목적 총 4개의 데이터 세트가 제공 1 : 아파트 실거래가 데이터 국토교통부 제공 아파트의 위치, 크기, 건설 연도, 주변 시설 및 교통 편의성과 같은 다양한 기능을 포함 2,3 : 추가데이터 서울시 제공 지하철역과 버스정류장 관련 정보 포함 4 : 평가데이터 2. Process : Co.. 더보기