Mysql
 sql >> Datenbank >  >> RDS >> Mysql

Neo4j-Leistung im Vergleich zu MySQL (wie kann sie verbessert werden?)

Es tut mir leid, dass Sie die Ergebnisse nicht reproduzieren können. Auf einem MacBook Air (1,8 GHz i7, 4 GB RAM) mit 2 GB Heap, GCR-Cache, aber ohne Aufwärmen der Caches und ohne sonstiges Tuning mit einem ähnlich großen Datensatz (1 Million Benutzer, 50 Freunde pro Person) , bekomme ich wiederholt ca. 900 ms mit dem Traversal Framework auf 1.9.2:

public class FriendOfAFriendDepth4
{
    private static final TraversalDescription traversalDescription = 
         Traversal.description()
            .depthFirst()
            .uniqueness( Uniqueness.NODE_GLOBAL )
            .relationships( withName( "FRIEND" ), Direction.OUTGOING )
            .evaluator( new Evaluator()
            {
                @Override
                public Evaluation evaluate( Path path )
                {
                    if ( path.length() >= 4 )
                    {
                        return Evaluation.INCLUDE_AND_PRUNE;
                    }
                    return Evaluation.EXCLUDE_AND_CONTINUE;

                }
            } );

    private final Index<Node> userIndex;

    public FriendOfAFriendDepth4( GraphDatabaseService db )
    {
        this.userIndex = db.index().forNodes( "user" );
    }

    public Iterator<Path> getFriends( String name )
    {
        return traversalDescription.traverse( 
            userIndex.get( "name", name ).getSingle() )
                .iterator();
    }

    public int countFriends( String name )
    {
        return  count( traversalDescription.traverse( 
            userIndex.get( "name", name ).getSingle() )
                 .nodes().iterator() );
    }
}

Cypher ist langsamer, aber bei weitem nicht so langsam, wie Sie vermuten:ca. 3 Sekunden:

START person=node:user(name={name})
MATCH (person)-[:FRIEND]->()-[:FRIEND]->()-[:FRIEND]->()-[:FRIEND]->(friend)
RETURN count(friend)

Mit freundlichen Grüßen

ian