baek-dev 님의 블로그

  • 홈
  • 태그
  • 방명록

2025/04/13 1

N-gram

N-gram 이란 무엇인가N-gram은 연속된 N개의 요소로 구성된 시퀀스(문자, 단어, 토큰)를 기반으로 텍스트 데이터를 나누는 방법임.주로 텍스트 분석, 검색엔진 최적화, 자연어 처리(NLP) 분야에서 많이 활용됨.문장을 일정한 단위로 분할하여 빈도 분석, 패턴 인식, 자동 완성, 오타 교정 등에 활용할 수 있음.1. N-gram의 개념N-gram은 텍스트를 N개의 단위로 분리하는 기법임.N이 1이면 Unigram한 글자(또는 한 단어) 단위로 나눔.N이 2이면 Bigram두 글자(또는 두 단어)씩 묶음.N이 3이면 Trigram세 글자(또는 세 단어)씩 묶음.예시: "데이터"라는 단어를 대상으로 할 경우NN-gram 결과1 (Unigram)데, 이, 터2 (Bigram)데이, 이터3 (Trigram..

DB/Elasticsearch 2025.04.13
이전
1
다음
더보기
프로필사진

baek-dev 님의 블로그

baek-dev 님의 블로그 입니다.

  • Total (222)
    • BE (127)
      • Java (54)
      • Spring & Spring Boot (62)
      • Kotlin (11)
    • DB (14)
      • MySQL (9)
      • Elasticsearch (3)
    • FE (2)
      • React (2)
    • Infra (22)
      • OS (2)
      • Container (3)
      • Cloud (4)
      • CI-CD (1)
      • Performance (4)
    • AI (5)
    • CS (42)
    • Etc. (4)
      • 개인공부 (4)
    • Tips (4)

Tag

redis, 동시성, MySQL, 비동기, 낙관적락, lombok, Spring, jpa, dao, CS, SQL, http, java, 성능최적화, 웹소켓, Websocket, Kotlin, kubernetes, springboot, ElasticSearch,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/04   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바