เทรนด์ Deepfake ที่อันตรายที่สุดในตอนนี้
ยุคสมัยของ Deepfake แบบภาพนั้นเป็นเพียงแค่การเบี่ยงเบนความสนใจเท่านั้น ในขณะที่สาธารณชนมัวแต่กังวลกับวิดีโอตัดต่อของผู้นำระดับโลก ภัยคุกคามที่แนบเนียนและมีประสิทธิภาพมากกว่ากำลังเติบโตอย่างเงียบๆ อยู่เบื้องหลัง การสังเคราะห์เสียง (Audio synthesis) ได้กลายเป็นเครื่องมือหลักสำหรับการฉ้อโกงมูลค่าสูงและการบ่อนทำลายทางการเมือง มันไม่ใช่เรื่องของหุบเขาแห่งความไม่น่าไว้วางใจ (Uncanny valley) ของใบหน้าที่ขยับได้อีกต่อไป แต่เป็นเรื่องของจังหวะการพูดที่คุ้นเคยของสมาชิกในครอบครัว หรือน้ำเสียงที่ดูน่าเชื่อถือของซีอีโอ การเปลี่ยนแปลงนี้มีความสำคัญมากเพราะเสียงใช้แบนด์วิดท์น้อยกว่า ใช้พลังประมวลผลน้อยกว่า และมีน้ำหนักทางอารมณ์สูงกว่าวิดีโอ ในโลกที่เรายืนยันตัวตนผ่านระบบไบโอเมตริกซ์ทางเสียงหรือการโทรศัพท์สั้นๆ ความสามารถในการโคลนเสียงมนุษย์ด้วยข้อมูลต้นฉบับเพียงสามวินาทีได้ทำลายความเชื่อมั่นพื้นฐานของระบบการสื่อสารสมัยใหม่ไปแล้ว เรากำลังเห็นการเปลี่ยนผ่านจากการหลอกลวงแบบภาพยนตร์ไปสู่การหลอกลวงที่ใช้งานได้จริงและมีเดิมพันสูง ซึ่งพุ่งเป้าไปที่กระเป๋าเงินขององค์กรและประสาทสัมผัสของคนทั่วไป ปัญหานี้ดูจะยากขึ้นกว่าเมื่อปีก่อน เพราะเครื่องมือต่างๆ ได้ย้ายจากห้องแล็บทดลองไปสู่ Cloud interfaces ที่ใช้งานง่ายแล้ว กลไกของอัตลักษณ์สังเคราะห์อุปสรรคทางเทคนิคในการเข้าถึงการโคลนเสียงคุณภาพสูงได้หายไปแล้ว ในอดีต การสร้างเสียงเลียนแบบที่น่าเชื่อถือต้องใช้เวลาบันทึกในสตูดิโอหลายชั่วโมงและใช้พลังประมวลผลมหาศาล แต่วันนี้ มิจฉาชีพสามารถดึงเสียงของคนๆ หนึ่งจากคลิปโซเชียลมีเดียสั้นๆ หรือการสัมมนาออนไลน์ที่บันทึกไว้ได้ Neural networks สมัยใหม่ใช้กระบวนการที่เรียกว่า zero-shot text-to-speech ซึ่งช่วยให้โมเดลสามารถเลียนแบบน้ำเสียง ระดับเสียง และอารมณ์ของผู้พูดได้โดยไม่ต้องฝึกฝนกับบุคคลนั้นเป็นเวลาหลายวัน ผลลัพธ์ที่ได้คือวิญญาณดิจิทัลที่สามารถพูดอะไรก็ได้แบบเรียลไทม์ นี่ไม่ใช่แค่การบันทึกเสียง แต่มันคือเครื่องมือโต้ตอบสดที่สามารถมีส่วนร่วมในการสนทนาสองทางได้ เมื่อรวมเข้ากับ Large language models โคลนเหล่านี้ยังสามารถเลียนแบบคำศัพท์และนิสัยการพูดเฉพาะตัวของเป้าหมายได้อีกด้วย ทำให้การหลอกลวงนี้แทบจะตรวจจับไม่ได้สำหรับผู้ฟังที่ไม่ทันระวังตัวซึ่งเชื่อว่าพวกเขากำลังสนทนาตามปกติกับคนที่พวกเขารู้จักการรับรู้ของสาธารณชนมักจะตามหลังความเป็นจริงนี้