Mysql
 sql >> Datenbank >  >> RDS >> Mysql

Verbinden von MySQL mit Apache nutch

Holen Sie sich die Quelle von http://mirror.nyi.net /apache//nutch/apache-nutch-1.2-src.zip

Öffnen Sie org.apache.nutch.crawl.Crawl Klasse in Ihrem Editor.

Suchvariable Path crawlDb = new Path(dir + "/crawldb");

Die Variable gibt einen Hinweis darauf, wo Sie den Code ersetzen müssen, um Ihren eigenen CustomMySQLCrawl zu erhalten Klasse.

Die Persistenz findet während dieses Aufrufs statt:crawlDbTool.update(crawlDb, segs, true, true); // update crawldb Dort sollten Sie es also in der Datenbank speichern. An dieser Stelle sollten Sie erwägen, den Ruhezustand zu integrieren.