正文抽取,content extraction
1)content extraction正文抽取
1.This paper concerns content extraction from news web pages based on decisions of two layers.首先根据实际应用的需要给出了新闻网页正文的严格界定,然后分析了新闻网页及其正文的特性,提出了基于双层决策的正文抽取策略,基于特征向量提取和决策树学习算法对上述双层决策进行了建模,并在国内10个主要新闻网站的1687个新闻页面上开展了模型训练和测试实验。
2.Pervasive information service based on web needs higher requirements for content extraction.基于互联网数据挖掘的正文抽取技术是提供普适的信息服务的基础,利用该技术分析巨大的网络信息源获得服务内容,同时从中提取出供咨询、参考和决策等用途的信息——情境信息,为普适服务中的Web高级应用奠定良好的基础。
3.This paper presents a new method for content extraction from Web pages based on statistic and content-features.该文提出了一种基于统计与正文特征的网页正文抽取方法。
英文短句/例句

1.Research on Content Extraction from Chinese Web Page Based on Statistic and Content-Features基于统计与正文特征的中文网页正文抽取研究
2.A Statistical Way to Extract Full Text from Chinese Web Pages一种基于统计的中文网页正文抽取方法
3.Research on Web-Based Extraction Technology of Hyperlink and Web Page Content;基于web的网页链接与正文抽取技术研究
4.Design and Research of Content Extraction Oriented Pervasive Computing面向普适计算的正文抽取技术的研究与设计
5.Web content extraction method based on logic lines and maximum admitting distances基于逻辑行和最大接纳距离的网页正文抽取
6.Domain Ontology-based Web Text Extraction基于领域本体的WEB文档正文的抽取算法
7.Extraction of Topical Information from Chinese Web Pages Based on the Statistic and Machine Learning基于统计和机器学习的中文Web网页正文内容抽取
8.Combing node frequency and semantic feature for webpage informative content extraction节点频度和语义距离相结合的网页正文信息抽取
9.A Research about the Pattern Acquisition for Free Text IE;自由文本的信息抽取模式获取的研究
10.A method of Extract Chi-nese Characteristic Words from the Sets of Docu-ments with No Dictionary;无词典的中文文档集特征词抽取方法
11.Research and Applications on Text Feathurs Extraction from Science and Technical Literatures科技文献的文本特征抽取研究与应用
12.Regular Expression and Application in Information Extraction正则表达式及其在信息抽取中的应用
13.Extraction Algorithm and Repairing of Ontology Mapping Based on Reasoning基于推理的本体映射抽取算法及修正
14.The most difficult point of information extraction is to extract information from unstructured texts.从无结构文本中抽取信息是信息抽取的难点之一。
15.Automatically Extracting Semantic Relations from Wikipedia Text;自动抽取维基百科文本中的语义关系
16.The Research of Chinese Named Entity Recognition and Its Relation Extraction;中文命名实体识别及其关系抽取研究
17.Research on Chinese Blog Pages Recognition and Content Extraction;中文Blog网页识别与内容抽取研究
18.The Research of Protein-Protein Extraction in Biomedical Literature;生物文献中蛋白质相互作用关系抽取
相关短句/例句

Web Page Content Extraction网页正文内容抽取
3)cross extract正交抽取
4)Text extraction文本抽取
1.A Text Extraction Method for Image with Complex Background Based on Conditional Random Field一种基于条件随机场的复杂背景图像文本抽取方法
2.Fast Web automatic text extraction algorithm based on template该算法先对网页噪声进行预处理,将其DOM树结构进行标签hash映射,通过自动训练的阈值快速判定网页的主要部分,根据数据块中的嵌套结构获取网页文本抽取模板。
5)Sentence Extracting文摘句抽取
6)Extractive Summarization抽取型文摘
延伸阅读

关正文关正文北京人。1982年毕业于北京师范大学中文系。历任北京师范学院中文系教师,作家出版社编辑,中外文化出版公司编辑、国际合作部主任,《小说选刊》杂志编辑、事业部主任,副编审。1998年加入中国作家协会。