Google ออกมาเผยว่า AudioLM สร้างเสียงได้จากการป้อนข้อมูล จนไม่สามารถแยกออกจากต้นฉบับได้

10 ตุลาคม 2565

Google ออกมาเผยว่า AudioLM สร้างเสียงได้จากการป้อนข้อมูล จนไม่สามารถแยกออกจากต้นฉบับได้

ล่าสุดเมื่อไม่นานมานี้ด้านนักวิจัยของ Google ได้ออกมาเปิดเผยรายละเอียดว่า AudioLM ซึ่งเป็น AI (ปัญญาประดิษฐ์ตัวใหม่) สามารถสร้างเสียงได้จากการป้อนข้อมูลเข้าไป โดยเสียงนั้นแทบแยกไม่ออกว่าเสียงไหนเป็นเสียงต้นฉบับ

ซึ่งเจ้า AudioLM สามารถสังเคราะห์เสียงที่ซับซ้อน เช่น เพลงที่ใช้เปียโนเล่น และเสียงที่คนนั้นสนทนากัน จากการทดลองผลที่ได้คือเสียงเหล่านั้นแทบไม่ต่างจากเสียงจริงๆ เลย

การใช้งานเจ้า AudioLM

เริ่มแรกสามารถป้อนเสียงด้วยความยาวไม่กี่วินาทีเข้าไปได้
ตัว AudioLM จะคาดเดาความต่อเนื่องของเสียงที่ควรจะมาหลังจากนั้น
AudioLM จะสังเคราะห์ได้ทั้งเสียงคนพูดหรือเสียงเครื่องดนตรี
จากเสียงต้นฉบับด้วยความยาวเพียง 3 วินาที ให้กลายเป็น 10 วินาที ได้โดยไม่ซ้ำรูปแบบกัน
สามารถใช้ AudioLM ผลิตเสียงได้โดยไม่ต้องป้อนเสียงเข้าไปก็ได้ แต่สามารถผลิตเสียงจากข้อมูลที่มีอยู่แทนได้

สำหรับเจ้า AudioLM นั้น Google ได้ทำการฝึกด้วยการป้อนฐานข้อมูลเสียงโดยเจ้า AudioLM จะใช้ Machine Learning ในการบีบอัดไฟล์เสียงให้เป็นไฟล์ข้อมูลชิ้นเล็กๆ ที่เรียกว่าโทเค็น หลังจากนั้นจะป้อนโทเค็นเข้าไปให้โมเดล Machine Learning ได้เรียนรู้แบบแผนและรายละเอียดปลีกย่อยของเสียงนั้นๆ

ตัวอย่างความคิดเห็นของนักวิจัยที่มีต่อ AudioLM

1. Rupal Patel (รูพัล พาเทล) ซึ่งเป็นนักวิจัยวิทยาศาสตร์สารสนเทศและการพูดจากมหาวิทยาลัยนอร์ทอีสเทิร์น ได้ให้ความคิดเห็นไว้ว่า AudioLM สามารถเรียนรู้ความแตกต่างเพียงน้อยนิดที่อยู่ในเสียงต้นฉบับ

2. Roger Dannenberg (โรเจอร์ แดนเนนเบิร์ก) ซึ่งเป็นนักวิจัยเสียงเพลงที่คอมพิวเตอร์สร้างขึ้นจากมหาวิทยาลัยคาร์เนกีเมลลอน ในสหรัฐอเมริกา ได้ให้ความเห็นไว้ว่า AudioLM สร้างเสียงที่มีคุณภาพมากกว่าโปรแกรมอื่นๆ ที่เคยมีมาทั้งหมด!

อย่างไรก็ตามจากตัวอย่างพบว่า AudioLM สามารถสังเคราะห์เสียงได้อย่างเป็นธรรมชาติ อีกทั้งยังสามารถรักษาลักษณะของเสียงต้นฉบับไว้ได้ โดยไม่มีความผิดปกติในลักษณะเสียงที่สังเกตได้ชัดเลย!

สามารถฟังตัวอย่างเสียงของเจ้า AudioLM ได้ที่ : google-research.github.io

ทั้งนี้มีหลายคนที่ตั้งข้อสังเกตไปในทิศทางที่แตกต่างกันว่า Ai ที่สามารถผลิตเสียงได้เสมือนจริงขนาดนี้อาจถูกนำไปใช้บิดเบือนคำพูดของคนจริงๆ ก็เป็นได้ และที่สำคัญอาจนำไปสู่การเผยแพร่ข้อมูลเท็จในอนาคตได้

--Wynnsoft Solution รับทำเว็บไซต์ รับทำ SEO รับทำการตลาดออนไลน์ รับทำโฆษณา Facebook รับทำเว็บไซต์ ขอนแก่น และรับทำเว็บไซต์ทั่วประเทศ—

ข้อมูลจาก : echnologyreview / beartai