44 lines
1.2 KiB
Python
44 lines
1.2 KiB
Python
# from konlpy.tag import Okt
|
|
# import re
|
|
|
|
# # KoNLPy의 Okt 형태소 분석기 인스턴스화
|
|
# okt = Okt()
|
|
|
|
# # 옵션명 예시
|
|
# option_names = [
|
|
# "카키 - 트레이 및 컵홀더 없음 - 좌식 및 리클라이닝 가능",
|
|
# "그린 그린-트레이 없음-컵 홀더 없음-좌석 리클라이닝 가능",
|
|
# "옵시디언 블랙-접시 없음-컵 홀더 없음-좌식 및 리클라이닝 가능",
|
|
# "블랙 및 화이트-접시 없음-컵홀더 없음-좌식 및 리클라이닝 가능",
|
|
# "아리스토크랫 화이트-식판 탈착식-좌식 및 리클라이닝 가능"
|
|
# ]
|
|
|
|
# # 옵션명에서 명사 추출
|
|
# nouns = []
|
|
# for option_name in option_names:
|
|
# extracted_nouns = okt.nouns(option_name) # 명사 추출
|
|
# nouns.extend(extracted_nouns)
|
|
|
|
# # 추출된 명사 중복 제거
|
|
# unique_nouns = list(set(nouns))
|
|
|
|
# print("추출된 고유 명사:", unique_nouns)
|
|
|
|
# print(okt.pos(option_name)) # 품사 태깅
|
|
|
|
|
|
from sejong.tokenizer import Khaiii
|
|
|
|
# Khaiii 형태소 분석기 초기화
|
|
tokenizer = Khaiii()
|
|
|
|
# 분석할 텍스트
|
|
text = "안녕하세요, Sejong 라이브러리입니다."
|
|
|
|
# 형태소 분석 수행
|
|
tokens = tokenizer.tokenize(text)
|
|
|
|
# 결과 출력
|
|
for token in tokens:
|
|
print(token)
|