技术总结
本发明提供了一种获取泰文断句规则的方法及装置,其中所述方法包括:将泰文训练样本机器翻译为至少两种目标语言文本,并根据所述至少两种目标语言文本中的断句符号对所述泰文训练样本进行断句标注;确定所述泰文训练样本的断句特征;根据所述断句特征,对标注后的泰文训练样本进行机器学习,以得到泰文断句规则。通过上述方式,本发明能够有效提高泰文断句的准确性。
技术研发人员:何伯磊;马艳军;吴华;王海峰
受保护的技术使用者:百度在线网络技术(北京)有限公司
技术研发日:2013.05.02
技术公布日:2018.08.10