2조
5조
점수에 연연하지 않기. 이후에 뭘 남길지를 계속 생각하기
마스터 클래스 질문
팀원들 발목만 잡고 있는 것 같다. 한 사람 몫 하기위해 어떤 공부를 하면 좋을지
주위에서 시험 문제를 던져줬을것이다. 발목을 잡는다고 생각한 배경에서 문제는 출제된 것이다. 고거 생각해라.
나는 EDA가 궁금함
모델: 리더보드? 기반으로 좋은 모델 선별하고 논문 읽어보고 내가 가진 데이터와 비슷한 테스크를 진행하기에 좋은 모델 골라낼 수 있다.
옵티마이저: 모델에 맞는 옵티마이저, lr 스케줄러? 잘 골라??
EDA: 훈련 / 테스트 데이터의 PCA 분포 → 증강 / 테스트 데이터의 PCA 분포, 지저분한 데이터, 증강 들어간거 등등
augmentation이 의외로 엄청 늦게 들어감 (모델 선정 이후)
좋은 트레이닝 코드: 데이터셋을 예시로 들 때 - 이 모델에는 사용되는데 저 모델에는 사용 안돼 → 나쁜 코드. 결합도 낮추기?
모델 선택: sota 모델 좋죠. 왜 sota 모델이 되었는지를 연구하기
재현이 안될 수도 있어요
왜 이용하려고 했는지 이해하려고 하세요
CLIP만 봐도 어떤 환경에선 좋고 어떤 환경에선 안좋다. 이런거 분석해야됨
“왜”를 강조
모르겠다 → 가설이라도 세워서 이렇지 않을까? 그렇다면 저 환경일 때 맞췄을 때 잘 맞아야 되는데 / 안맞아야 되는데 검증해보자. 하면서 가설 검증