10 ตุลาคม 2565 ครีเอทีฟด้านการสื่อสารทางการตลาดออนไลน์ และการออกแบบเว็บไซต์
GOOGLE ออกมาเผยว่า AUDIOLM สร้างเสียงได้จากการป้อนข้อมูล จนไม่สามารถแยกออกจากต้นฉบับได้

ล่าสุดเมื่อไม่นานมานี้ด้านนักวิจัยของ Google ได้ออกมาเปิดเผยรายละเอียดว่า AudioLM ซึ่งเป็น AI (ปัญญาประดิษฐ์ตัวใหม่) สามารถสร้างเสียงได้จากการป้อนข้อมูลเข้าไป โดยเสียงนั้นแทบแยกไม่ออกว่าเสียงไหนเป็นเสียงต้นฉบับ

 

ซึ่งเจ้า AudioLM สามารถสังเคราะห์เสียงที่ซับซ้อน เช่น เพลงที่ใช้เปียโนเล่น และเสียงที่คนนั้นสนทนากัน จากการทดลองผลที่ได้คือเสียงเหล่านั้นแทบไม่ต่างจากเสียงจริงๆ เลย

 

การใช้งานเจ้า AudioLM

  1. เริ่มแรกสามารถป้อนเสียงด้วยความยาวไม่กี่วินาทีเข้าไปได้
  2. ตัว AudioLM จะคาดเดาความต่อเนื่องของเสียงที่ควรจะมาหลังจากนั้น
  3. AudioLM จะสังเคราะห์ได้ทั้งเสียงคนพูดหรือเสียงเครื่องดนตรี
  4. จากเสียงต้นฉบับด้วยความยาวเพียง 3 วินาที ให้กลายเป็น 10 วินาที ได้โดยไม่ซ้ำรูปแบบกัน
  5. สามารถใช้ AudioLM ผลิตเสียงได้โดยไม่ต้องป้อนเสียงเข้าไปก็ได้ แต่สามารถผลิตเสียงจากข้อมูลที่มีอยู่แทนได้

 

สำหรับเจ้า AudioLM นั้น Google ได้ทำการฝึกด้วยการป้อนฐานข้อมูลเสียงโดยเจ้า AudioLM จะใช้ Machine Learning ในการบีบอัดไฟล์เสียงให้เป็นไฟล์ข้อมูลชิ้นเล็กๆ ที่เรียกว่าโทเค็น หลังจากนั้นจะป้อนโทเค็นเข้าไปให้โมเดล Machine Learning ได้เรียนรู้แบบแผนและรายละเอียดปลีกย่อยของเสียงนั้นๆ

 

ตัวอย่างความคิดเห็นของนักวิจัยที่มีต่อ AudioLM

1. Rupal Patel (รูพัล พาเทล) ซึ่งเป็นนักวิจัยวิทยาศาสตร์สารสนเทศและการพูดจากมหาวิทยาลัยนอร์ทอีสเทิร์น ได้ให้ความคิดเห็นไว้ว่า AudioLM สามารถเรียนรู้ความแตกต่างเพียงน้อยนิดที่อยู่ในเสียงต้นฉบับ

 

2. Roger Dannenberg (โรเจอร์ แดนเนนเบิร์ก) ซึ่งเป็นนักวิจัยเสียงเพลงที่คอมพิวเตอร์สร้างขึ้นจากมหาวิทยาลัยคาร์เนกีเมลลอน ในสหรัฐอเมริกา ได้ให้ความเห็นไว้ว่า AudioLM สร้างเสียงที่มีคุณภาพมากกว่าโปรแกรมอื่นๆ ที่เคยมีมาทั้งหมด!

 

อย่างไรก็ตามจากตัวอย่างพบว่า AudioLM สามารถสังเคราะห์เสียงได้อย่างเป็นธรรมชาติ อีกทั้งยังสามารถรักษาลักษณะของเสียงต้นฉบับไว้ได้ โดยไม่มีความผิดปกติในลักษณะเสียงที่สังเกตได้ชัดเลย!

 

สามารถฟังตัวอย่างเสียงของเจ้า AudioLM ได้ที่ : google-research.github.io

 

ทั้งนี้มีหลายคนที่ตั้งข้อสังเกตไปในทิศทางที่แตกต่างกันว่า Ai ที่สามารถผลิตเสียงได้เสมือนจริงขนาดนี้อาจถูกนำไปใช้บิดเบือนคำพูดของคนจริงๆ ก็เป็นได้ และที่สำคัญอาจนำไปสู่การเผยแพร่ข้อมูลเท็จในอนาคตได้


 

 

 

 

 

--Wynnsoft Solution รับทำเว็บไซต์ รับทำ SEO รับทำการตลาดออนไลน์ รับทำโฆษณา Facebook รับทำเว็บไซต์ ขอนแก่น และรับทำเว็บไซต์ทั่วประเทศ

ข้อมูลจาก : echnologyreview / beartai