AutoPercenty/edit/texet_test.py

44 lines
1.2 KiB
Python

# from konlpy.tag import Okt
# import re
# # KoNLPy의 Okt 형태소 분석기 인스턴스화
# okt = Okt()
# # 옵션명 예시
# option_names = [
# "카키 - 트레이 및 컵홀더 없음 - 좌식 및 리클라이닝 가능",
# "그린 그린-트레이 없음-컵 홀더 없음-좌석 리클라이닝 가능",
# "옵시디언 블랙-접시 없음-컵 홀더 없음-좌식 및 리클라이닝 가능",
# "블랙 및 화이트-접시 없음-컵홀더 없음-좌식 및 리클라이닝 가능",
# "아리스토크랫 화이트-식판 탈착식-좌식 및 리클라이닝 가능"
# ]
# # 옵션명에서 명사 추출
# nouns = []
# for option_name in option_names:
# extracted_nouns = okt.nouns(option_name) # 명사 추출
# nouns.extend(extracted_nouns)
# # 추출된 명사 중복 제거
# unique_nouns = list(set(nouns))
# print("추출된 고유 명사:", unique_nouns)
# print(okt.pos(option_name)) # 품사 태깅
from sejong.tokenizer import Khaiii
# Khaiii 형태소 분석기 초기화
tokenizer = Khaiii()
# 분석할 텍스트
text = "안녕하세요, Sejong 라이브러리입니다."
# 형태소 분석 수행
tokens = tokenizer.tokenize(text)
# 결과 출력
for token in tokens:
print(token)