N-gram 이란 무엇인가N-gram은 연속된 N개의 요소로 구성된 시퀀스(문자, 단어, 토큰)를 기반으로 텍스트 데이터를 나누는 방법임.주로 텍스트 분석, 검색엔진 최적화, 자연어 처리(NLP) 분야에서 많이 활용됨.문장을 일정한 단위로 분할하여 빈도 분석, 패턴 인식, 자동 완성, 오타 교정 등에 활용할 수 있음.1. N-gram의 개념N-gram은 텍스트를 N개의 단위로 분리하는 기법임.N이 1이면 Unigram한 글자(또는 한 단어) 단위로 나눔.N이 2이면 Bigram두 글자(또는 두 단어)씩 묶음.N이 3이면 Trigram세 글자(또는 세 단어)씩 묶음.예시: "데이터"라는 단어를 대상으로 할 경우NN-gram 결과1 (Unigram)데, 이, 터2 (Bigram)데이, 이터3 (Trigram..