Καλώς ορίσατε στο dotNETZone.gr - Σύνδεση | Εγγραφή | Βοήθεια
σε

 

Αρχική σελίδα Ιστολόγια Συζητήσεις Εκθέσεις Φωτογραφιών Αρχειοθήκες

Full Text Search και Ελληνικά σε SQL Server 2008

Îåêßíçóå áðü ôï ìÝëïò kyriakoy. Τελευταία δημοσίευση από το μέλος Παναγιώτης Καναβός στις 25-08-2008, 14:18. Υπάρχουν 5 απαντήσεις.
Ταξινόμηση Δημοσιεύσεων: Προηγούμενο Επόμενο
  •  19-08-2008, 13:40 44156

    Full Text Search και Ελληνικά σε SQL Server 2008

    Με την ευκαιρία της έκδοσης του νέου server (SQL Server 2008), επαναφέρω ένα "γνώριμο" θέμα.
    Μετά από ψάξιμο για την υποστήριξη σε word breaker και stemming, με απογοήτευση διαπίστωσα ότι δεν υπάρχει και πάλι η ελληνική γλώσσα σε αντίθεση με πληθώρα από καινούργιες γλώσσες !
    Αν μπορούσε και κάποιος άλλος να το επιβεβαιώσει ?

    Διαβάζοντας το Loading Licensed Third Party Word Breakers  μου γεννήθηκε το ερώτημα αν θα μπορούσαμε να κάνουμε register (με κάποιο τρόπο) τον αντίστοιχο ελληνικό που υπάρχει στο Sharepoint 2007 ?


    Nikos Κ.
    ALT.NET
  •  19-08-2008, 17:05 44163 σε απάντηση της 44156

    Απ: Full Text Search και Ελληνικά σε SQL Server 2008

    Λογικά, αν λάβουμε υπόψη τις προηγούμενες εκδόσεις των προγραμμάτων, το Exchange Server/Sharepoint Server/SQL Server/Search Server/Desktop Search, έχουν την "ίδια" μηχανή search. Δεν είναι απόλυτα ίδιες, μιας και κάθε προϊόν, έχει τις δικές του ιδιαιτερότητες και υπάρχουν optimizations ανάλογα το προϊόν.

    Τα iFilter plug-ins, που είναι άλλος πονοκέφαλος για το Search Engine, όταν παίζει για την μία, παίζει για τις άλλες. Δεν νομίζω ότι είναι διαφορετικά για τα stemmers και τα word breakers. Αλλά από ότι θυμάμαι δεν υπάρχει stemmer για τα Ελληνικά, παρά μόνο word breaker και χρειάζονται και τα δύο (δες σχετικό παλαιότερο thread). Παράλληλα ο Office Sharepoint Server 2007 έχει μόνο word breaker και όχι καλής ποιότητας, και αυτός είναι ο λόγος που είναι από default disabled στο SP1 του Office Sharepoint 2007.

     

    George J.


    George J. Capnias: Χειροπρακτικός Υπολογιστών, Ύψιστος Γκουράρχης της Κουμπουτερολογίας
    w: capnias.org, t: @gcapnias, l: gr.linkedin.com/in/gcapnias
    dotNETZone.gr News
  •  19-08-2008, 17:11 44164 σε απάντηση της 44163

    Απ: Full Text Search και Ελληνικά σε SQL Server 2008

    Απογοήτευση κι από την δική μου πλευρά. Ποιος έχει τον χρόνο και τη διάθεση για να αναπτύξει δικό του stemmer και w. breaker? Και στο κάτω κάτω, δεν πιστεύω ότι τα ελληνικά είναι τόσο δύσκολη γλώσσα ή ότι η ελληνική αγορά είναι τόσο αμελητέα σε σχέση με κάποιες άλλες που έχουν αναπτυχθεί για τον sql 2008.

    Μην αφήνετε τα media να σας "ταΐζουν"!
  •  19-08-2008, 17:49 44167 σε απάντηση της 44164

    Απ: Full Text Search και Ελληνικά σε SQL Server 2008

    Προς απάντησή σου, παλαιότερο thread...

     

    George J.


    George J. Capnias: Χειροπρακτικός Υπολογιστών, Ύψιστος Γκουράρχης της Κουμπουτερολογίας
    w: capnias.org, t: @gcapnias, l: gr.linkedin.com/in/gcapnias
    dotNETZone.gr News
  •  19-08-2008, 21:07 44169 σε απάντηση της 44167

    Απ: Full Text Search και Ελληνικά σε SQL Server 2008

    Ένας τρόπος για να ζητήσει κάποιος ένα feature για τον SQL Server είναι μέσω του αναβαθμισμένου Microsoft Connect (επιλογή "Product Feedback"). Κατόπιν, το request μπορεί να βαθμολογηθεί από άλλους. Προτείνω κάποιος να συντάξει ένα αξιοπρεπές κείμενο για το πόσο σημαντικό είναι αυτό για εμάς, να το κάνουμε submit και μετά να το βαθμολογήσουμε ώστε να αποκτήσει μεγαλύτερη βαρύτητα. Δυστυχώς δεν προλαβαίνω να συντάξω το κείμενο, ωστόσο εδώ (στο "Step 2 - Filing a request") έχει γενικές οδηγίες για όποιον θελήσει να ασχοληθεί.  


    Vir prudens non contra ventum mingit
  •  25-08-2008, 14:18 44266 σε απάντηση της 44169

    Απ: Full Text Search και Ελληνικά σε SQL Server 2008

    Μακάρι να ήταν τόσο απλό το θέμα. Όπως και με το spell checking του Office και το ελληνικό speech recognition μάλλον το πρόβλημα είναι θέμα συμφωνιών από αυτή την πλευρά του Ατλαντικού. Υπάρχουν εταιρείες οι οποίες έχουν βγάλει κατά καιρούς ελληνικό Stemming, Speech recognition, spell checking, αλλά δεν υπήρξε ενδιαφέρον για την ενσωμάτωση τους. Από την άλλη, οι εν λόγω εταιρείες ποτέ δεν έκαναν επαρκή προβολή του προϊόντος τους ή κυνηγούσαν τα "μεγάλα συμβόλαια" με αποτέλεσμα να περάσουν απαρατήρητες.

    Η αλήθεια είναι ότι είναι δύσκολο να πουλήσει κανείς ένα προϊόν το οποίο ο πελάτης θεωρεί ότι το δικαιούται δωρεάν, ή έστω με μικρό κόστος. Το FTS είναι χαρακτηριστικό του SQL Server, γιατί να πρέπει να πληρώσω χιλιάρικα για server/cpu/client licenses για κάτι το οποίο θα έπρεπε να μου το δίνει η Microsoft δωρεάν? Και γιατί να πρέπει να τα πληρώσω αυτά και για τις Express εκδόσεις?
    Από την άλλη, οι εταιρείες φοβούνται να βγάλουν ένα προϊόν που νομίζουν ότι δεν μπορούν να κλειδώσουν. Ή μάλλον, δεν μπορούν να κλειδώσουν όπως θέλουν (με έξτρα licenses ανά server, cpu, client κλπ). Προσπαθώντας να βγάλουν μερικά χιλιάρικα από τους μεγάλους πελάτες, χάνουν την ευκαιρία να πάρουν μερικά κατοσταρικα από όλους τους χρήστες SQL Server στην Ελλάδα. Τέλος, η απειλή ότι κάποια στιγμή η Microsoft θα βγάλει ελληνικό FTS και θα τους "κλείσει το σπίτι" τους έκανε μάλλον απρόθυμους να ασχοληθούν με αυτό.

    Τα πράγματα βέβαια δεν είναι ακριβώς έτσι το σωτήριον έτος 2008.
    • Καταρχήν, το software activation παρέχει πολύ καλύτερη προστασία από αντιγραφή από οποιαδήποτε τεχνολογία είχε βγει στο παρελθόν. Η πώληση των stemmers μπορεί να γίνει πολύ εύκολα και ανέξοδα μέσω ecommerce sites.  Δεν χρειάζονται πλέον τα HASP ή τα κλειδωμένα CD του παρελθόντος.
    • Η τεχνολογία που απαιτείται για το stemming είναι η ίδια με αυτή που χρησιμοποίησαν οι εταιρείες όταν προσπάθησαν να φτιάξουν stemmers την πρώτη φορά. Ίσως να χρειαστούν μερικές αλλαγές στον κώδικα, ο κώδικας όμως υπάρχει.
    • Ο αριθμός των πιθανών πελατών είναι πολύ μεγάλος, αν η τιμή του προϊόντος είναι σωστή. Γιατί να παλεύεις να χρεώσεις ανά CAL όταν μπορείς να πουλήσεις σε πολύ περισσότερους ανά server?
    • Άνετα μπορούν να βγούν διαφορετικές εκδόσεις των stemmer για Express ή Full έκδοση οι οποίες θα ενεργοποιούνται ανά server και θα διαφοροποιούνται όπως και οι εκδόσεις του SQL Server με βάση το scalability. Έχεις Express? Σου δίνω την Express του stemmer που υποστηρίζει ένα CPU. Έχεις standard? Σου δίνω 4 και απεριόριστη μνήμη, κ.ο.κ. Ή προσθέτω καλύτερους και ταχύτερους αλγόριθμους stemming ανά έκδοση.
      Υπάρχει ήδη το παράδειγμα εταιρειών οι οποίες πουλάνε multi-threaded IFilter για PDF παρότι ο Acrobat Reader ενσωματώνει ένα δωρεάν single-threaded IFilter.
    • Τέλος, η ίδια η Microsoft Hellas, εφόσον δεν προτίθεται να προσφέρει κάποια λύση ελληνικού FTS, θα μπορούσε να παρουσιάσει στο ελληνικό MSDN τις διάφορες λύσεις ελληνικού FTS που υπάρχουν και να επιτρέψει στους πελάτες να επιλέξουν αυτή που θέλουν. 
    Ή, θα μπορούσε το StudentGuru να κάνει ένα διαγωνισμό για ένα IFilter με δώρο ένα XBOX 360. Δεν είναι και τρομερή δουλειά να φτιάξεις ένα απλό single-threaded stemmer. Χρόνο χρειάζεται.

    Παναγιώτης Καναβός, Freelancer
    Twitter: http://www.twitter.com/pkanavos
Προβολή Τροφοδοσίας RSS με μορφή XML
Με χρήση του Community Server (Commercial Edition), από την Telligent Systems