Holen Sie sich die Quelle von http://mirror.nyi.net /apache//nutch/apache-nutch-1.2-src.zip
Öffnen Sie org.apache.nutch.crawl.Crawl
Klasse in Ihrem Editor.
Suchvariable Path crawlDb = new Path(dir + "/crawldb");
Die Variable gibt einen Hinweis darauf, wo Sie den Code ersetzen müssen, um Ihren eigenen CustomMySQLCrawl
zu erhalten Klasse.
Die Persistenz findet während dieses Aufrufs statt:crawlDbTool.update(crawlDb, segs, true, true); // update crawldb
Dort sollten Sie es also in der Datenbank speichern. An dieser Stelle sollten Sie erwägen, den Ruhezustand zu integrieren.