Es tut mir leid, dass Sie die Ergebnisse nicht reproduzieren können. Auf einem MacBook Air (1,8 GHz i7, 4 GB RAM) mit 2 GB Heap, GCR-Cache, aber ohne Aufwärmen der Caches und ohne sonstiges Tuning mit einem ähnlich großen Datensatz (1 Million Benutzer, 50 Freunde pro Person) , bekomme ich wiederholt ca. 900 ms mit dem Traversal Framework auf 1.9.2:
public class FriendOfAFriendDepth4
{
private static final TraversalDescription traversalDescription =
Traversal.description()
.depthFirst()
.uniqueness( Uniqueness.NODE_GLOBAL )
.relationships( withName( "FRIEND" ), Direction.OUTGOING )
.evaluator( new Evaluator()
{
@Override
public Evaluation evaluate( Path path )
{
if ( path.length() >= 4 )
{
return Evaluation.INCLUDE_AND_PRUNE;
}
return Evaluation.EXCLUDE_AND_CONTINUE;
}
} );
private final Index<Node> userIndex;
public FriendOfAFriendDepth4( GraphDatabaseService db )
{
this.userIndex = db.index().forNodes( "user" );
}
public Iterator<Path> getFriends( String name )
{
return traversalDescription.traverse(
userIndex.get( "name", name ).getSingle() )
.iterator();
}
public int countFriends( String name )
{
return count( traversalDescription.traverse(
userIndex.get( "name", name ).getSingle() )
.nodes().iterator() );
}
}
Cypher ist langsamer, aber bei weitem nicht so langsam, wie Sie vermuten:ca. 3 Sekunden:
START person=node:user(name={name})
MATCH (person)-[:FRIEND]->()-[:FRIEND]->()-[:FRIEND]->()-[:FRIEND]->(friend)
RETURN count(friend)
Mit freundlichen Grüßen
ian