Skip to content

Latest commit

 

History

History
19 lines (11 loc) · 362 Bytes

README.md

File metadata and controls

19 lines (11 loc) · 362 Bytes

Chinese_Segment

中文分词

基于最大概率的的中文分词算法

语料库来自人民日报1998年1月新闻

test.txt为测试语料,result.txt为分词结果。

使用

python >= 3.6

python chineseSegment.py

分词效果

春节将至,欢乐的气氛已悄悄降临。

春节 将 至 , 欢乐 热闹 的 气氛 已 悄悄 降临 。