main-annotation.plan 2.21 KiB
<?xml version="1.0" encoding="UTF-8"?>
<alvisnlp-plan id="main">
	<!--
  	///////////////////////////////////////////////////////////////////////////////////////
  	//
  	//  I. Load corpus
  	//
  	///////////////////////////////////////////////////////////////////////////////////////
  	-->
	<!-- Load and segment html pages -->
	<!-- Assign every page with corresponding names of each corpora -->
	<load-corpus>
		<d2kab class="XMLReader">
			<html/>
			<xslTransform>resources/segmentation/html2alvisnlp.xslt</xslTransform>
			<sourcePath>resources/corpus/test_d2kab/</sourcePath>
			<constantSectionFeatures>corpus=test d2kab</constantSectionFeatures>
		</d2kab>
		<vespa class="XMLReader">
			<html/>
			<xslTransform>resources/segmentation/html2alvisnlp.xslt</xslTransform>
			<sourcePath>resources/corpus/test_vespa/</sourcePath>
			<constantSectionFeatures>corpus=test vespa</constantSectionFeatures>
		</vespa>
		<alea class="XMLReader">
			<html/>
			<xslTransform>resources/segmentation/html2alvisnlp.xslt</xslTransform>
			<sourcePath>resources/corpus/test_alea/</sourcePath>
			<constantSectionFeatures>corpus=test alea</constantSectionFeatures>
		</alea>
	</load-corpus>
	<!--
  	///////////////////////////////////////////////////////////////////////////////////////
  	//  II. Preprocess
  	///////////////////////////////////////////////////////////////////////////////////////
  	-->
	<!-- Segment documents to phrases and words -->
	<!-- Plus, correct some POS-tags -->
	<preprocess-text href="modules/preprocess.plan"/>
	<!--
  	///////////////////////////////////////////////////////////////////////////////////////
  	//  III. Project concepts
  	///////////////////////////////////////////////////////////////////////////////////////
  	-->
	<!-- (1)Project RDF-->
	<!-- (2)Project TOMAP-->
	<project-concepts href="modules/projectors.plan"/>
	<!--
  	///////////////////////////////////////////////////////////////////////////////////////
  	//  IV. Find themes
7172737475767778798081
// /////////////////////////////////////////////////////////////////////////////////////// --> <!-- Segment bulletins thematically --> <find-themes href="modules/patterns/find-themes.plan"/> </alvisnlp-plan>