Τί άλλο θα ακούσουμε? Η Microsoft
εγκατέλειψε το δικό της Dryad για χάρη του Hadoop, ενώ έχει ήδη ανακοινώσει ότι ο SQL Server
θα υποστηρίζει το Hadoop. Όπου
Hadoop είναι open source project σε Java, χρησιμοποιείται ήδη από τα Amazon, Facebook, Yahoo κλπ και κάνει χοντρικά κάποιες από τις λειτουργίες ενός Azure Facric Controller:
Φροντίζει να σηκώσει JVMs τα οποία θα εκτελέσουν jobs είτε στο node στο οποίο βρίσκονται τα απαραίτητα δεδομένα ή όσο πιο κοντά σε αυτό (στο ίδιο rack) γίνεται. Επίσης φροντίζει για το replication των δεδομένων έτσι ώστε να υπάρχουν πολλαπλά αντίγραφα σε διαφορετικά racks.
Αν σκεφτεί κανείς ότι η Microsoft ΔΕΝ έχει δείξει ή καν αναφέρει κάτι για private cloud (PaaS εννοείται, δεν μιλάμε για virtualization automation εδώ), σε κάνει να αναρωτιέσαι αν θα πρέπει να αρχίσουμε να διαβάζουμε Java ξανά!
Γιατί μας ενδιαφέρει? Γιατί ακόμα και η καλύτερη υποδομή IaaS θα σου σηκώσει καινούρια VMs αλλά δεν θα σε βοηθήσει σε τίποτε για να εκτελέσεις jobs, πόσο μάλλον να σου επιλέξει και ποιό job θα εκτελεστεί σε ποιό κόμβο ή να κρατήσει πολλαπλά αντίγραφα. Οπότε ή θα γράψεις τον απαραίτητο κώδικα για scheduling μόνος σου ή θα επιλέξεις κάτι έτοιμο και ώριμο όπως το Hadoop.
Η Microsoft έχει ήδη βγάλει
Hadoop Connector για τον SQL Server 2008 R2 από τον Οκτώβριο, για όποιον βιάζεται να χρησιμοποιήσει τον SQL Server με το Hadoop από τώρα.
Παναγιώτης Καναβός, Freelancer
Twitter: http://www.twitter.com/pkanavos