技术编号:6574421
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本发明涉及无词边界标记语言的分词技术,更具体地,本发明涉 及基于搜索的无词边界标记语言文本的分词方法和装置。背景技术与英文以及其它的西方语言不同,许多亚洲语言,例如中文、日 文、韩语以及泰语等语言没有用空格等词边界标记来划界。 一个句 子中会包括一串连续的字符,而在单词之间并没有定界符,也就是 分隔符。如何界定单词则依赖于所讨论的是否为音位单词、词汇单 词、语形学单词、依据造句法的单词、语义学单词或是心理学单词。 因此,在任何的基于单词的语言处理中,例如在...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。