Python: Tách từng từ theo space+hỏi+chấm+phẩy và xuống dòng


import re

# Tách các từ bởi khoảng trắng và dấu câu

speech ="Извините, пожалуйста, вы не знаете, где гостиница Салют?Извините, не знаю.Извините, пожалуйста, вы не знаете, как пройти в гостиницу Салют?Куда?В гостиницу Салют.Знаю. У вас есть план?"

# split this into words

# Tách các từ

words = re.findall(r'\b\w+\b|[.,?!]', speech)

# Tạo chuỗi mới với mỗi từ trên một dòng

new_text = '\n'.join(words)

# In chuỗi mới

print(new_text)


Nhận xét