02. 텍스트 전처리 -패딩(Padding), 원-핫 인코딩(One-Hot Encoding), 데이터의 분리, 한국어 전처리 패키지
·
DL/NLP
내용 정리 출처: 『딥러닝을 이용한 자연어처리』, 위키독스 (https://wikidocs.net/book/2155) 딥 러닝을 이용한 자연어 처리 입문`25년 1월 기준: 누적 조회수: 1,700만 베스트셀러` 많은 분들의 피드백으로 수 년간 보완된 현업 연구원들이 작성한 `딥 러닝 자연어 처리 교재 입문서`입니다. …wikidocs.net02-07. 패딩(Padding)각 문장(또는 문서)는 필연적으로 서로 길이가 다를 것이다.딥러닝 모델의 경우, 입력 데이터의 형태가 일정해야 한다. -> 길이가 동일한 문서들의 경우, 하나의 행렬로 보고 한번에 묶어서 처리가 가능(병렬 연산이 가능) 따라서, 문장의 길이를 맞추기 위해 짧은 문장에 빈 자리(0)을 채워 넣는 것이 패딩이다.  1. Numpy로 패딩하..