Καλώς ορίσατε στο dotNETZone.gr - Σύνδεση | Εγγραφή | Βοήθεια
σε

 

Αρχική σελίδα Ιστολόγια Συζητήσεις Εκθέσεις Φωτογραφιών Αρχειοθήκες

Speech Recognition

Îåêßíçóå áðü ôï ìÝëïò R@_. Τελευταία δημοσίευση από το μέλος R@_ στις 27-03-2006, 11:21. Υπάρχουν 7 απαντήσεις.
Ταξινόμηση Δημοσιεύσεων: Προηγούμενο Επόμενο
  •  02-03-2006, 11:34 10298

    Speech Recognition

    Καλημέρα

    Έχει ασχοληθεί κανείς με Speech Recognition στις εφαρμογές του;

    Απλές εντολές (καταχώρηση/έξοδος), αριθμούς, Ναι/Όχι, τέτοια πράγματα.

    Κατέβασα το Speech SDK 5.1 - το οποίο "καταλαβαίνει" μόνο Αγγλικά και με ένα έξτρα αρχείο Κινέζικα και Κορεάτικα - έψαξα στο web για παραδείγματα και  εάν έχω καταλάβει καλά, μπορεί κανείς να προσθέσει τις δικές του λέξεις, ορίζοντας των τρόπο που προφέρονται με την χρήση (αγγλικών) phonemes. Π.χ. το ENA (λατινικοί χαρακτήρες) θα μπορούσε να περιγραφεί ως eh-n-aa. Δυστυχώς δεν έχω βρει κάποιο παράδειγμα. Το μόνο που βρήκα ήταν πώς να χρησιμοποιήσεις ένα δικό σου λεξικό : http://www.eggheadcafe.com/articles/20011124.asp

    Μήπως κάποιος έχει βρεί περισσότερα για το θέμα;

    Ευχαριστώ πολύ

  •  15-03-2006, 22:54 10700 σε απάντηση της 10298

    Απ: Speech Recognition

    Το speech recognition δεν δουλεύει με ομόηχες λέξεις. Θέλει implementation για την γλώσσα που θέλεις να χρησιμοποιήσεις.

    Δυστηχώς για τα ελληνικά, δεν υπάρχει διαθέσιμο από την Microsoft. Νομίζω ότι υπάρχει από την IBM (ViaVoice), χωρίς να είμαι απόλυτα σίγουρος. Σίγουρα υπάρχει ο "Λογογράφος" - ελληνικής εταιρείας που δεν θυμάμαι το όνομα - που είναι ένα implementation της μηχανής της Microsoft.

    Το έχεις δοκιμάσει;

     

    George J.


    George J. Capnias: Χειροπρακτικός Υπολογιστών, Ύψιστος Γκουράρχης της Κουμπουτερολογίας
    w: capnias.org, t: @gcapnias, l: gr.linkedin.com/in/gcapnias
    dotNETZone.gr News
  •  16-03-2006, 12:58 10712 σε απάντηση της 10700

    Απ: Speech Recognition

    Οι εταιρείες που βγάζουν προγράμματα για ελληνική αναγνώριση φωνής δεν έχουν διαθέτουν τις μηχανές αναγνώρισης για τα Windows, θεωρώντας ίσως ότι δεν υπάρχει η κατάλληλη αγορά, ή επειδή θέλουν να πουλήσουν τις δικές τους εφαρμογές, ή ακόμα επειδή θέλουν να συμμετέχουν και οι ίδιες σε όποιο προϊόν περιλαμβάνει αναγνώριση φωνής. Π.χ. αν αγόραζε κάποιος μια μηχανή αναγνώρισης δεν θα χρειαζόταν ούτε το "Λογογράφο" ούτε την "Αναγνώριση Εντολών" άλλης εταιρείας.

    Δυστυχώς, αν θες να ενσωματώσεις δυνατότητες φωνής στην εφαρμογή σου θα πρέπει να επικοινωνήσεις με αυτές τις εταιρείες, μήπως και έχουν διαθέσιμο κάποιο API. Φοβάμαι όμως ότι οι τιμές που θα απαιτήσουν θα είναι υπερβολικές.

    Η κατάσταση αυτή θα αλλάξει μόνο όταν η Ελληνική Microsoft αγοράσει ή αναθέσει σε κάποιον να φτιάξει μια ελληνική μηχανή αναγνώρισης την οποία θα ενσωματώσει στα Windows XP.
    Παναγιώτης Καναβός, Freelancer
    Twitter: http://www.twitter.com/pkanavos
  •  24-03-2006, 14:53 11073 σε απάντηση της 10298

    Απ: Speech Recognition

    Ευχαριστώ για τις απαντήσεις. Τελικά μετά από κάμποσο ψάξιμο άφησα στην άκρη αυτή τη λύση (μέχρι να ενσωματωθεί το ελληνικό engine στα Windows, όπως λέει και ο pkanavos ;). Αμέσως επόμενη λύση ήταν το TAPI. Έψαξα και εκεί, αρχικά στην Microsoft και στη συνέχεια σε programmers sites. Δεν μπορώ να πω ότι έμεινα ιδιαίτερα ικανοποιημένος από το πλήθος και την ποιότητα του κώδικα που βρήκα. Αλλά μάλλον θα ξεκινήσω μια νέα ενότητα με αυτό το θέμα. Ελπίζω να υπάρξει μεγαλύτερη (και ταχύτερη ;) ανταπόκριση.
  •  24-03-2006, 15:50 11079 σε απάντηση της 11073

    Απ: Speech Recognition

    Οι συζητήσεις για το Speech Recognition έχουν γίνει ήδη αρκετές φορές, ένα search στο DotNetZone θα σου είχε επιστρέψει την απάντηση (δεν έχει για Ελληνικά) από την πρώτη στιγμή.

    Το TAPI πάντως δεν έχει σχέση με Speech recognition. Μήπως εννοείς να χρησιμοποιήσει αναγνώριση DTMF μέσω TAPI? Αυτό γίνεται από το Speech SDK.


    Παναγιώτης Καναβός, Freelancer
    Twitter: http://www.twitter.com/pkanavos
  •  24-03-2006, 17:24 11084 σε απάντηση της 10298

    Απ: Speech Recognition

    Πριν ξεκινήσω το συγκεκριμένο θέμα, πράγματι έψαξα στο DotNetZone αλλά δεν βρήκα κάτι ιδιαίτερο. Τα keywords που έδωσα ήταν Speech Recognition, SAPI, telephony. Σίγουρα πάντως τα 5 - 6 posts (συνολικά) που μου έφερε η αναζήτηση δεν είναι, για μένα τουλάχιστον, πολλά. Ίσως να μην έδωσα τα σωστά keywords, αλλά συζήτηση για Speech Recognition που δεν περιέχει τις λέξεις Speech Recognition σε κανένα post, ε τι να πω; Surprise [:O]



    Ναι, το TAPI δεν έχει σχέση με Speech recognition. Γι'αυτό ξεκίνησα ένα νέο θέμα :TAPI - CAPI και ISDN Fritz!Card PCI ( http://www.dotnetzone.gr/cs/forums/11077/ShowPost.aspx )

  •  25-03-2006, 19:11 11138 σε απάντηση της 11084

    Απ: Speech Recognition

    Το θέμα είχε ξανασυζητηθεί το Νοέμβριο, σε ένα thread για Full Text Search και Ελληνικά. Πάντως, μια ανάγνωση του documentation εξηγεί ότι αυτό που χρειάζεται για να υποστηριχθεί μια γλώσσα είναι το αντίστοιχο Speech Engine, όχι περίεργα λεξικά και συνθέσεις. Γενικά, η καλύτερη (και αποδοτικότερη) λύση όταν κανείς έχει να αντιμετωπίσει ένα άγνωστο τεχνολογικό τομέα είναι να διαβάσει το documentation. Το MSDN μάλιστα περιέχει και αρκετά άρθρα από το MSDN Magazine που εξηγούν τί είναι, πως δουλεύει και πως χρησιμοποιείται το Speech API.

    Γενικώς, πριν κάνει κανείς ερωτήσεις καλό είναι να ελέγχει το documentation. Κι εμείς που απαντάμε αυτό κάνουμε και μερικές φορές χρειάζεται να ψάξουμε πολύ για την απάντηση, σε βάρος των υποχρεώσεων μας, εργασιακών και οικογενειακών. Αν νομίζεις ότι κάποιες απαντήσεις αργούν, υπάρχει πάντα και η περίπτωση να ρώτησες κάτι ειδικό και αυτοί που μπορούν να απαντήσουν να έχουν άλλες υποχρεώσεις.

    Ένας άλλος παράγοντας που επηρεάζει αν και πότε θα απαντηθεί μια ερώτηση είναι το πως είναι γραμμένη. Το Dotnetzone δέχεται πολλά posts κάθε μέρα και κανείς δεν προλαβαίνει να τα διαβάζει με προσοχή όλα. Αν μια ερώτηση είναι  δυσανάγνωστη ή δυσνόητη, ο κάθε αναγνώστης την παρακάμπτει για να διαβάσει τις υπόλοιπες. Μια δυσνόητη ερώτηση είναι πολύ εύκολο να παραπέσει.

    Επίσης σημαντικό είναι να κάνει κανείς τη σωστή ερώτηση. Από τα posts σου μαντεύω ότι ήθελες να μάθεις αν υπάρχει ελληνική υποστήριξη για αναγνώριση φωνής μέσω τηλεφώνου και επειδή δεν βρήκες άμεσα ελληνική υποστήριξη σκέφτηκες να το γυρίσεις σε αναγνώριση DTMF.

    Η απάντηση σε αυτή την ερώτηση είναι, Ναι. Υπάρχουν συστήματα ελληνικών call center εδώ και 10 χρόνια, δεν χρησιμοποιούν όμως το SAPI. Σε έργα τέτοιων μεγεθών είναι προτιμότερο να αγοράσει κανείς ένα έτοιμο ή σχεδόν έτοιμο σύστημα το οποίο θα εκπαιδεύσει να χρησιμοποιεί την ελληνική γλώσσα. Οι ελληνικές εταιρείες που δραστηριοποιούνται στο χώρο προσπαθούν να αναλάβουν οι ίδιες όσα έργα χρειάζονται αναγνώριση φωνής, όχι να δημιουργήσουν μηχανές για χρήση από τον οποιοδήποτε. Μία από τις μηχανές που χρησιμοποιούνται είναι το SpeechMagic και το Speech SDK της Philips. Ίσως εκεί να βρεις αυτό που θέλεις.

     


    Παναγιώτης Καναβός, Freelancer
    Twitter: http://www.twitter.com/pkanavos
  •  27-03-2006, 11:21 11203 σε απάντηση της 10298

    Απ: Speech Recognition

    Ευχαριστώ πολύ για το link.

    Συμφωνώ με τα σχόλιά σου για τα posts. Βέβαια το "παράπονο" για γρήγορη απάντηση δεν είχε συγκεκριμένο αποδέκτη και σίγουρα όχι την ομάδα του dotnetzone. Είχα ψάξει και το documentation από την Microsoft και στο Internet γενικότερα αλλά δεν βρήκα άκρη. Οπότε τι ποιό φυσικό να απευθυνθεί κανείς σε forum. Θα μπορούσε κάποιος να είχε ήδη ασχοληθεί με το θέμα και με δυο - τρία links να βοηθούσε.
Προβολή Τροφοδοσίας RSS με μορφή XML
Με χρήση του Community Server (Commercial Edition), από την Telligent Systems