Γιατί η κλωνοποίηση φωνής αποτελεί ξαφνικά πραγματικό κίνδυνο
Γεια! Σου έχει τύχει ποτέ να σηκώσεις το τηλέφωνο και να ακούσεις μια φωνή που ακούγεται ακριβώς σαν τον κολλητό σου ή κάποιο μέλος της οικογένειάς σου, μόνο και μόνο για να συνειδητοποιήσεις αργότερα ότι ήταν ένα έξυπνο κόλπο; Είναι απίστευτο το πόσο έχει προχωρήσει η τεχνολογία τελευταία. Παλιά ανησυχούσαμε για photoshopped εικόνες ή ψεύτικα emails, αλλά τώρα και τα αυτιά μας μπαίνουν σε δοκιμασία. Η κλωνοποίηση φωνής πήδηξε από τις οθόνες των sci-fi ταινιών κατευθείαν στην καθημερινότητά μας και κάνει τα πράγματα λίγο πιο ενδιαφέροντα για όλους μας. Το μεγάλο συμπέρασμα είναι ότι, ενώ πρόκειται για ένα καταπληκτικό εργαλείο για creators και ανθρώπους που λατρεύουν να πειραματίζονται με νέο tech, έχει γίνει επίσης ένας τρόπος για τους απατεώνες να προσποιούνται ότι είναι κάποιοι άλλοι. Φαίνεται πολύ πιο δύσκολο να το διαχειριστούμε γιατί τα εργαλεία έχουν γίνει τόσο φθηνά και εύκολα στη χρήση για τον καθένα. Δεν χρειάζεσαι πλέον έναν πανίσχυρο υπολογιστή, παρά μόνο λίγα δευτερόλεπτα ήχου από ένα clip στα social media και ένα βασικό app. Αυτή η αλλαγή σημαίνει ότι όλοι πρέπει να είμαστε λίγο πιο savvy σχετικά με το τι ακούμε στην άλλη άκρη της γραμμής.
Σκέψου την κλωνοποίηση φωνής σαν μια high-tech φωτοτυπία για τον λόγο σου. Στο παρελθόν, αν ήθελες να αντιγράψεις μια φωνή, χρειαζόσουν ώρες ηχογράφησης υψηλής ποιότητας και μια ομάδα από expert μηχανικούς. Τώρα, είναι σαν ένας ψηφιακός παπαγάλος που μπορεί να μάθει τον μοναδικό σου ρυθμό και τον τόνο σου στο πι και φι. Αντιλαμβάνεται τον τρόπο που λες ορισμένες λέξεις ή τις μικρές παύσεις που κάνεις ανάμεσα στις προτάσεις. Αυτό είναι υπέροχο για τη δημιουργία audiobooks ή για να βοηθήσει ανθρώπους που έχουν χάσει την ικανότητα να μιλούν λόγω ασθένειας. Όμως, επειδή είναι τόσο καλό, μπορεί επίσης να χρησιμοποιηθεί για να ακούγεται σαν να λες πράγματα που δεν είπες ποτέ. Δεν πρόκειται μόνο για τις λέξεις, είναι το vibe της φωνής που την κάνει τόσο πειστική για το ανθρώπινο αυτί. Οι άνθρωποι συχνά πιστεύουν ότι χρειάζεσαι μια μεγάλη ηχογράφηση για να δουλέψει αυτό, αλλά είναι μια μεγάλη παρανόηση. Ένα γρήγορο clip από ένα video που πόσταρες online είναι συχνά αρκετό για να δημιουργήσεις ένα ψηφιακό δίδυμο που ακούγεται ακριβώς σαν εσένα. Το tech δουλεύει σπάζοντας τη φωνή σου σε μικροσκοπικά patterns και μετά ξαναχτίζοντάς τα για να πουν ό,τι πληκτρολογήσει ο χρήστης. Είναι λίγο σαν να χτίζεις με ψηφιακά τουβλάκια που ακούγονται σαν τις φωνητικές σου χορδές.
Βρήκατε κάποιο λάθος ή κάτι που χρειάζεται διόρθωση; Ενημερώστε μας.Γιατί όλος ο κόσμος μιλάει για το Voice Tech
Αυτό είναι μεγάλο θέμα για όλους, από έναν φοιτητή στο Λονδίνο μέχρι έναν επιχειρηματία στη Σιγκαπούρη. Ο λόγος που είναι τόσο hot topic είναι ότι επηρεάζει τον πυρήνα του πώς εμπιστευόμαστε τους ανθρώπους. Όταν ακούς τη φωνή ενός αγαπημένου προσώπου, ο εγκέφαλός σου χαλαρώνει φυσικά τις άμυνές του. Γι’ αυτό αυτό το tech χρησιμοποιείται σε απάτες που στοχεύουν οικογένειες σε όλο τον κόσμο. Φαντάσου να δέχεσαι ένα τηλεφώνημα από ένα παιδί ή ένα εγγόνι που ακούγεται σαν να βρίσκεται σε μπελάδες. Το πρώτο σου ένστικτο είναι να βοηθήσεις, όχι να αναρωτηθείς αν ο ήχος είναι αληθινός. Αυτό συμβαίνει παντού γιατί το internet δεν γνωρίζει σύνορα και αυτά τα apps είναι διαθέσιμα σε σχεδόν κάθε γλώσσα. Η Federal Trade Commission έχει εκδώσει προειδοποιήσεις για το πώς αυτές οι απάτες μέσω φωνής γίνονται όλο και πιο συχνές. Οι κυβερνήσεις και οι tech εταιρείες εργάζονται σκληρά για να βρουν τρόπους να μαρκάρουν τον πραγματικό ήχο, αλλά οι απατεώνες κινούνται γρήγορα. Είναι μια παγκόσμια πρόκληση που απαιτεί να ξανασκεφτούμε τις συνήθειες της ψηφιακής μας ασφάλειας. Βλέπουμε όλο και περισσότερους ανθρώπους να μιλούν για κωδικές λέξεις ασφαλείας για τις οικογένειές τους, που είναι ένας απλός και ευφυής τρόπος προστασίας. Είναι καλά νέα ότι γινόμαστε πιο ενημερωμένοι, καθώς η ενημέρωση είναι η καλύτερη άμυνα που έχουμε ενάντια σε αυτά τα έξυπνα ψηφιακά κόλπα.
Πέρα από τον οικογενειακό κύκλο, αυτή η τεχνολογία κάνει πάταγο στον κόσμο του entertainment και του business. Οι creators μπορούν πλέον να κάνουν dub τα videos τους σε πολλές γλώσσες διατηρώντας τη δική τους μοναδική φωνή, κάτι που τους βοηθά να φτάσουν σε πολύ ευρύτερο κοινό. Αυτό είναι φανταστικό για την εκπαίδευση και την παγκόσμια επικοινωνία. Ωστόσο, σημαίνει επίσης ότι δημόσια πρόσωπα και ηγέτες πρέπει να είναι πιο προσεκτικοί από ποτέ. Ένα ψεύτικο audio clip θα μπορούσε να προκαλέσει μεγάλη σύγχυση αν δεν εντοπιστεί γρήγορα. Τα καλά νέα είναι ότι για κάθε άτομο που χρησιμοποιεί το tech για πλάκα, υπάρχουν χιλιάδες που το χρησιμοποιούν για να χτίσουν κάτι cool. Βλέπουμε νέα startup να ξεπηδούν που βοηθούν τους ανθρώπους να επαληθεύσουν αν μια φωνή είναι αληθινή ή παραγόμενη από μηχανή. Είναι λίγο σαν αγώνας δρόμου ανάμεσα στους δημιουργούς και τους hackers, αλλά η πρόοδος που βλέπουμε είναι πραγματικά εντυπωσιακή. Αυτή η παγκόσμια συζήτηση μας βοηθά να θέσουμε νέους κανόνες για την ψηφιακή εποχή, διασφαλίζοντας ότι μπορούμε όλοι να απολαμβάνουμε τα προνόμια της καινοτομίας χωρίς να χάνουμε το αίσθημα ασφάλειάς μας.
Παραμένοντας ασφαλείς σε έναν κόσμο ψηφιακών ηχώ
Ας δούμε μια τυπική Τρίτη για μια κοπέλα που τη λένε Sarah. Είναι στη δουλειά όταν δέχεται ένα τηλεφώνημα από τον αδερφό της. Ακούγεται πανικόβλητος και λέει ότι έχασε το πορτοφόλι του ενώ ταξίδευε και χρειάζεται μια γρήγορη μεταφορά χρημάτων για ένα ξενοδοχείο. Η φωνή έχει το ακριβές γέλιο του και τον συγκεκριμένο τρόπο που λέει το παρατσούκλι της. Η Sarah πάει να πατήσει αποστολή στο payment app, αλλά μετά θυμάται ότι εκείνος βρίσκεται σε έναν γάμο σε άλλη ζώνη ώρας όπου είναι αυτή τη στιγμή 3 π.μ. Αυτή είναι η πραγματικότητα της σύγχρονης απάτης. Δεν πρόκειται πλέον μόνο για ψεύτικα emails. Πρόκειται για συναισθηματικά triggers που χρησιμοποιούν τις φωνές που αγαπάμε περισσότερο. Οι άνθρωποι τείνουν να υποτιμούν το πόσο τα συναισθήματά μας καθοδηγούν τις αντιδράσεις μας στον ήχο. Από την άλλη πλευρά, ίσως υπερεκτιμάμε το πόσο δύσκολο είναι για τους απατεώνες να βρουν ένα δείγμα της φωνής μας. Αν έχεις ποτέ ποστάρει ένα video με ήχο σε ένα public profile, αυτό το δείγμα είναι ήδη εκεί έξω για να το βρει ο καθένας. Αυτό κάνει το πρόβλημα να φαίνεται πολύ πιο προσωπικό και επείγον από ό,τι ήταν ακόμα και πριν από έναν χρόνο.
Οι επιχειρήσεις νιώθουν επίσης την πίεση από αυτούς τους ρεαλιστικούς κλώνους. Μια ψεύτικη κλήση φωνής θα μπορούσε να ξεγελάσει έναν υπάλληλο ώστε να μοιραστεί έναν κωδικό ή να μεταφέρει εταιρικά κεφάλαια. Είναι πολλά για να τα επεξεργαστείς, αλλά το να είσαι ενημερωμένος είναι το πρώτο βήμα για να παραμείνεις ασφαλής. Βλέπουμε εταιρείες να εφαρμόζουν νέα πρωτόκολλα όπου μια κλήση φωνής δεν είναι ποτέ αρκετή για να εγκρίνει μια μεγάλη αλλαγή. Μπορεί να απαιτούν μια video κλήση ή έναν δευτερεύοντα κωδικό που στέλνεται σε μια mobile συσκευή. Αυτή είναι μια έξυπνη κίνηση που προσθέτει ένα επίπεδο προστασίας. Για τους creators, ο κίνδυνος είναι να χρησιμοποιηθεί η φωνή τους για την προώθηση προϊόντων που δεν υποστηρίζουν στην πραγματικότητα. Γι’ αυτό πολλοί εξετάζουν πλέον το digital rights management για τη φωνητική τους ταυτότητα. Είναι ένας ολόκληρος νέος κόσμος προστασίας που μαθαίνουμε όλοι μαζί. Μοιράζοντας αυτές τις ιστορίες, βοηθάμε ο ένας τον άλλον να αναγνωρίζει τα σημάδια μιας απάτης πριν γίνει οποιαδήποτε ζημιά. Όσο περισσότερο μιλάμε γι’ αυτό, τόσο λιγότερη δύναμη έχουν αυτά τα κόλπα πάνω μας.
Έχετε μια ιστορία, εργαλείο, τάση ή ερώτηση σχετικά με την τεχνητή νοημοσύνη που πιστεύετε ότι πρέπει να καλύψουμε; Στείλτε μας την ιδέα σας για άρθρο — θα χαρούμε να την ακούσουμε.Η περίεργη περίπτωση της ιδιωτικότητας και της προόδου
Ενώ είμαστε όλοι ενθουσιασμένοι με το δημιουργικό potential εδώ, μας βάζει σε σκέψεις για το μακροπρόθεσμο κόστος στην ιδιωτικότητά μας. Αν οι φωνές μας μπορούν να αντιγραφούν τόσο εύκολα, πώς κρατάμε την προσωπική μας ταυτότητα ασφαλή σε έναν κόσμο που πάντα ακούει; Είναι λίγο σαν ένα puzzle που προσπαθούμε ακόμα να λύσουμε μαζί. Πρέπει να αναρωτηθούμε αν οι εταιρείες που φτιάχνουν αυτά τα εργαλεία κάνουν αρκετά για να αποτρέψουν τη χρήση τους για κακό. Υπάρχει τρόπος να χτιστεί ένα ψηφιακό watermark σε κάθε clip που να μας λέει ότι φτιάχτηκε από AI; Αυτές δεν είναι σκοτεινές σκέψεις, αλλά μάλλον περίεργες που μας βοηθούν να πιέσουμε για καλύτερη και ασφαλέστερη τεχνολογία για όλους. Θέλουμε τη διασκέδαση χωρίς τη φασαρία, και η εύρεση αυτής της ισορροπίας είναι το επόμενο μεγάλο βήμα για την tech κοινότητα. Θα έχει ενδιαφέρον να δούμε πώς θα εξελιχθούν οι νόμοι για να προστατεύσουν τα φωνητικά μας αποτυπώματα τα επόμενα χρόνια.
Μέσα στην geeky πλευρά του Voice Synthesis
Για τους power users εκεί έξω, η μαγεία συμβαίνει μέσα από εξελιγμένα νευρωνικά δίκτυα που χαρτογραφούν τα φωνήματα και τις συναισθηματικές διακυμάνσεις ενός ομιλητή. Πολλά από αυτά τα εργαλεία προσφέρουν πλέον API integrations που επιτρέπουν στους developers να χτίζουν φωνητικά features απευθείας στα δικά τους apps. Μπορείς να τσεκάρεις πλατφόρμες όπως το ElevenLabs για να δεις πώς αυτά τα συστήματα διαχειρίζονται πολύπλοκα γλωσσικά patterns. Ένα πράγμα που πρέπει να προσέξεις είναι η στροφή προς το local storage και processing. Αντί να στέλνεις τα φωνητικά σου δεδομένα σε έναν μεγάλο server στα σύννεφα, κάποια νέα μοντέλα μπορούν να τρέξουν απευθείας στο κινητό ή το laptop σου. Αυτό είναι υπέροχο για την ιδιωτικότητα, αλλά σημαίνει επίσης ότι το tech είναι πιο δύσκολο να ελεγχθεί μόλις βγει εκεί έξω. Βλέπουμε περιορισμούς στο πόσους χαρακτήρες μπορείς να παράγεις ανά λεπτό για να αποτραπεί το μαζικό spamming, αλλά οι έξυπνοι χρήστες συχνά βρίσκουν τρόπους να παρακάμψουν αυτά τα throttles χρησιμοποιώντας πολλαπλά accounts ή custom scripts.
Αν χτίζεις κάτι με αυτά τα εργαλεία, θα θέλεις να δεις πώς να επαληθεύσεις την πηγή του ήχου. Χρησιμοποιώντας πόρους όπως αυτοί που βρίσκονται στο botnews.today μπορείς να παραμείνεις μπροστά από τις εξελίξεις. Οι απαιτήσεις αποθήκευσης για αυτά τα μοντέλα συρρικνώνονται επίσης, κάνοντάς τα πιο φορητά από ποτέ. Μπορεί να λαμβάνεις updates στα αγαπημένα σου apps που περιλαμβάνουν αυτά τα features πολύ σύντομα. Εδώ είναι μερικά πράγματα που πρέπει να έχεις κατά νου για το workflow σου:
- Χρησιμοποίησε πάντα τις πιο πρόσφατες εκδόσεις API για να διασφαλίσεις ότι έχεις τα καλύτερα security patches.
- Σκέψου να προσθέσεις ένα ξεκάθαρο disclaimer αν χρησιμοποιείς παραγόμενες φωνές στα projects σου.
- Έχε το νου σου στο latency των τοπικών σου μοντέλων για να διασφαλίσεις μια ομαλή εμπειρία χρήστη.
Η τεχνική πλευρά αυτού του πεδίου κινείται με ταχύτητα φωτός. Βλέπουμε μια κίνηση προς το zero-shot cloning, όπου το σύστημα χρειάζεται μόνο ένα μικρό απόσπασμα ήχου για να δημιουργήσει ένα πλήρες μοντέλο. Αυτό είναι ένα τεράστιο άλμα από πριν λίγους μήνες που χρειαζόσουν λεπτά δεδομένων. Είναι μια συναρπαστική εποχή για να είσαι στον dev χώρο, αρκεί να έχουμε την ασφάλεια στο μυαλό μας. Πρέπει επίσης να εξετάσουμε την ηθική πλευρά του πώς αποθηκεύουμε και χρησιμοποιούμε φωνητικά δεδομένα. Το μέλλον του ήχου γράφεται σε κώδικα αυτή τη στιγμή. Είναι ένα συναρπαστικό ταξίδι που αλλάζει τον τρόπο που αλληλεπιδρούμε με τις συσκευές μας και ο ένας με τον άλλον κάθε μέρα.
Το BotNews.today χρησιμοποιεί εργαλεία τεχνητής νοημοσύνης για την έρευνα, συγγραφή, επιμέλεια και μετάφραση περιεχομένου. Η ομάδα μας ελέγχει και επιβλέπει τη διαδικασία για να διατηρεί τις πληροφορίες χρήσιμες, σαφείς και αξιόπιστες.
Σημείωση συντάκτη: Δημιουργήσαμε αυτόν τον ιστότοπο ως έναν πολύγλωσσο κόμβο ειδήσεων και οδηγών τεχνητής νοημοσύνης για άτομα που δεν είναι φανατικοί των υπολογιστών, αλλά εξακολουθούν να θέλουν να κατανοήσουν την τεχνητή νοημοσύνη, να τη χρησιμοποιούν με μεγαλύτερη αυτοπεποίθηση και να παρακολουθούν το μέλλον που ήδη έρχεται.
Το λαμπρό μονοπάτι μπροστά
Στο τέλος της ημέρας, η κλωνοποίηση φωνής είναι απλώς ένα ακόμα εργαλείο στην ψηφιακή μας εργαλειοθήκη. Έχει μερικές εκπληκτικές χρήσεις που θα κάνουν τη ζωή μας πιο διασκεδαστική και συμπεριληπτική για όλους. Απλώς πρέπει να είμαστε λίγο πιο προσεκτικοί και να χρησιμοποιούμε λίγη κοινή λογική όταν τα πράγματα ακούγονται πολύ καλά ή πολύ επείγοντα για να είναι αληθινά. Παραμένοντας ενημερωμένοι και μιλώντας στους φίλους και την οικογένειά μας για αυτούς τους κινδύνους, μπορούμε να απολαμβάνουμε τα προνόμια του tech κρατώντας τους απατεώνες μακριά. Το μέλλον του ήχου είναι λαμπρό και όλοι μαθαίνουμε πώς να ακούμε με έναν εντελώς νέο τρόπο. Θα είναι μια τρελή διαδρομή, αλλά το έχουμε! Ας συνεχίσουμε να εξερευνούμε αυτά τα νέα εργαλεία με ένα χαμόγελο και ένα άγρυπνο βλέμμα.
Έχετε μια ερώτηση, πρόταση ή ιδέα για άρθρο; Επικοινωνήστε μαζί μας.