เฉลย Regular Expression

#pip install deepcut
import re

eng_word_pattern = r"[ก-๙()]"
sentence = "เป็นการเขียนลำดับของตัวอักษรเพื่อสร้าง Pattern ที่ Match กับข้อความ (Text) ใช้สำหรับการ ลบอักขระ ตัวเลข การค้นหา เป็นต้น"

token = re.sub(eng_word_pattern, " ", sentence).lower().split()
print('Eng token = %s'%token)
print('Number of Word = %i'%len(token))

thai_word_pattern = r"[^ก-๙]"

token = re.sub(thai_word_pattern, "", sentence)
token = deepcut.tokenize(token)

print('Thai token = %s'%token)
print('Number of Word = %i'%len(token))