UpstageAiLab 썸네일형 리스트형 자연어처리의 데이터 증강기법 EDA (Easy Data Augmentation):EDA는 네 가지 규칙에 따라 단어 수준에서 변형하여 새로운 문장을 생성하는 방법이다.Synonym Replacement (SR): 단어를 유의어로 교체하는 방법이다.Random Insertion (RI): 임의의 단어를 문장에 삽입하는 방법이다.Random Swap (RS): 두 단어의 위치를 변경하는 방법이다.Random Deletion (RD): 문장에서 임의의 단어를 삭제하는 방법이다.AEDA (An Easier Data Augmentation):EDA의 더 쉬운 버전으로, 성능이 더 좋음을 목표로 한다.다양한 문장부호(punctuation marks)를 입력 문장에 추가하여 문장을 변형한다.예시 문장부호: ".", ",", ";", "?", ".. 더보기 머신러닝의 모델 평가 지표(Classifier/Regressor) 분류기(Classifier) 평가1. 정확도(Accuracy): 전체 샘플 중 올바르게 예측된 샘플의 비율입니다. 데이터가 균등하게 분포되어 있지 않을 때는 이 지표만으로 모델의 성능을 평가하는 것이 적절하지 않을 수 있습니다.2. F1 Score: 정밀도(Precision)와 재현율(Recall)의 조화 평균입니다. F1 Score는 불균형한 데이터셋에서 특히 유용하며, 두 클래스의 중요도가 비슷할 때 좋은 평가 지표가 됩니다.3. 정밀도(Precision)와 재현율(Recall): 정밀도는 양성으로 예측된 경우 중 실제로 양성인 경우의 비율을, 재현율은 실제 양성 중 양성으로 예측된 비율을 나타냅니다.4. ROC-AUC: 수신자 조작 특성 곡선(Receiver Operating Characterist.. 더보기 패스트캠퍼스 AI랩 부트캠프 오리엔테이션 후기 패스트캠퍼스와 업스테이지가 주관하는 AI랩 부트캠프 오리엔테이션에 참석했다. AI에 대해서는 관심이 많았는데 마음에 드는 부트캠프를 찾을 수 있게 되어 기쁘다. 7개월동안 열심히 해서 취업성공까지 했으면 좋겠다. 더보기 이전 1 다음